不确定性校准
校准技术越来越多地应用于计算广告、医疗诊断和气象预报等领域。这是一个(不确定性)校准技术的研究和应用论文集。这些工作是从公开网站上总结的。如果有作者不希望他们的论文在此列出,请随时与我联系(邮箱:hsg01993@gmail.com,微信:coder_hh)。
1. 论文
后处理校准器
参数化方法
- Platt缩放: 支持向量机的概率输出及其与正则化似然方法的比较[J]. 作者:Platt J. 大间隔分类器进展,1999年。
- 温度缩放: 现代神经网络的校准. 作者:Chuan Guo等. ICML, 2017年。
- Beta校准: 二元分类器逻辑校准的一种有理论基础且易于实施的改进. 作者:Meelis Kull等. 人工智能与统计学会议,2017年。
- 注意力温度缩放: 注意力温度缩放:校准深度神经网络的实用方法. 作者:AzadehSadatMozafari等. arXiv, 2018年。
- 狄利克雷缩放: 使用狄利克雷校准获得良好校准的多类概率. 作者:Meelis Kull等. arXiv, 2019年。
非参数化方法
- 直方图分箱: 从决策树和朴素贝叶斯分类器获得校准的概率估计. 作者:Bianca Zadrozny等. ICML, 2001年。
- 保序回归: 将分类器分数转换为准确的多类概率估计. 作者:Bianca Zadrozny等. KDD, 2002年。
- 贝叶斯分箱: 使用贝叶斯分箱获得良好校准的概率. 作者:MahdiPakdamanNaeini等. AAAI, 2015年。
- 无需样本分割的直方图分箱分布无关校准保证 作者:Chirag Gupta等. ICML, 2021年。
混合方法
- 缩放-分箱:验证的不确定性校准. 作者:Ananya Kumar等. NeurIPS, 2020年。
- Mix-n-Match:深度学习中不确定性校准的集成和组合方法. 作者:Jize Zhang等. ICML 2020年。
- SIR:在线广告中用户响应预测的校准. 作者:Chao Deng等. PKKDD, 2020年。(我们的工作)
- MBCT:基于树的特征感知分箱用于个体不确定性校准. 作者:Siguang Huang等. WWW, 2022年。(我们的工作)
校准预测器
- 字段感知校准: 可靠概率预测的简单且经验上强大的方法. 作者:Feiyang Pan等. WWW 2020年(腾讯)。
- 后验概率很重要:在线广告中神经预测的双重自适应校准. 作者:Penghui Wei等. SIGIR 2022年。(阿里巴巴)
- 使用上下文混合模型联合优化排序和校准. 作者:Xiang-Rong Sheng等. KDD 2023年。(阿里巴巴)
校准理论分析
- 二元分类器校准:非参数方法。Mahdi Pakdaman Naeini等人著。arXiv 2014。
- 验证不确定性校准。Ananya Kumar等人著。NeurIPS,2020。
- 无分布二元分类:预测集、置信区间和校准。Chirag Gupta等人著。NeurIPS,2020。
- 深度学习中不确定性校准的集成和组合方法。Jize Zhang等人著。ICML 2020。
- 使用随机预测的个体校准。Shengjia Zhao等人著。ICML,2020。
- 神经网络的事后校准。Amir Rahimi等人著。arXiv 2020。(谷歌)
- 分类的非参数校准。Jonathan Wenger等人著。AISTATS 2020。
- 不要只是责怪过度参数化导致过度自信:二元分类中校准的理论分析 Yu Bai等人著。ICML,2021。
- 无需样本分割的直方图分箱分布自由校准保证 Chirag Gupta等人著。ICML,2021。
- Meta-Cal:通过排序实现良好控制的事后校准 Xingchen Ma等人著。ICML,2021。
2. 应用
广告
- 领域感知校准:一种简单且经验上强大的可靠概率预测方法。Feiyang Pan等人著。WWW 2020(腾讯)。
- 在线广告中用户响应预测的校准。Chao Deng等人著。PKKDD,2020(阿里巴巴)。
- MBCT:基于树的特征感知分箱用于个体不确定性校准。Siguang Huang等人著。WWW,2022。(阿里巴巴)
3. 校准指标
- 减轻校准误差估计中的偏差 Rebecca Roelofs等人著。arXiv 2020。(谷歌)
- 测量深度学习中的校准 Jeremy Nixon等人著。arXiv 2020。(谷歌)
- 使用样条函数校准神经网络 Kartik Gupta等人著。arXiv 2020。(谷歌)
4. 数据集和基准测试
- 阿里巴巴集团用于特征感知校准的数据集 Siguang Huang著。2022
- 阿里巴巴Pctr校准数据集 Chao Deng著。2019
- 阿里巴巴Pcvr校准数据集 Chao Deng著。2019
5. 其他链接
- 研究方向
- ICML:可信机器学习(问责、因果关系、公平性、隐私、鲁棒性等)