数据科学、机器学习和深度学习必读论文

精选的数据科学、机器学习和深度学习论文、综述和文章集合,属于必读清单。

注意：:construction: 正在更新中,如果您有其他需要添加的论文、文章或博客,请告诉我,我会将它们添加到这里。

如何使用

:point_right: 给这个仓库加 :star:

贡献

:point_right: :arrows_clockwise: 如果链接失效,或者我遗漏了任何重要的论文、博客或文章,欢迎提交拉取请求。

:point_down: 请阅读以下内容 :point_down:

:point_right: 阅读包含大量数学内容的论文很困难,需要时间和精力去理解,大部分取决于坚持和不放弃的动力,不要气馁,读一遍,读两遍,读三遍,...直到豁然开朗,让你眼前一亮。

:1st_place_medal: - 首先阅读

:2nd_place_medal: - 其次阅读

:3rd_place_medal: - 第三阅读

数据科学

:bar_chart: 预处理与探索性数据分析

:1st_place_medal: :page_facing_up:数据预处理 - 整洁数据 - 作者:Hadley Wickham

:notebook: 通用数据科学

:1st_place_medal: :page_facing_up: 统计建模:两种文化 - 作者:Leo Breiman

:2nd_place_medal: :page_facing_up: 罗生门曲线与体积研究:机器学习中泛化和模型简单性的新视角

:video_camera: KDD 2019 Cynthia Rudin的主题演讲

:1st_place_medal: :page_facing_up: 频率主义与贝叶斯主义:Python驱动的入门 - 作者:Jake VanderPlas

机器学习

:dart: 通用机器学习

:1st_place_medal: :page_facing_up: 机器学习中的模型评估、模型选择和算法选择 - 作者:Sebastian Raschka

:1st_place_medal: :page_facing_up: 机器学习简介 - 作者:Gunnar Ratsch

:3rd_place_medal: :page_facing_up: 共轭梯度法入门:无痛苦版 - 作者:Jonathan Richard Shewchuk

:3rd_place_medal: :page_facing_up: 模型稳定性作为随机种子的函数

:mag: 异常/离群值检测

:1st_place_medal: :newspaper: 离群值检测:综述

:rocket: 提升方法

:2nd_place_medal: :page_facing_up: XGBoost:可扩展的树提升系统

:2nd_place_medal: :page_facing_up: LightGBM:一种高效的梯度提升决策树

:2nd_place_medal: :page_facing_up: AdaBoost和分类器超级碗 - 自适应提升的入门教程

:3rd_place_medal: :page_facing_up: 贪婪函数逼近:梯度提升机

:book: 解析黑盒机器学习

:3rd_place_medal: :page_facing_up: 窥视黑盒内部:通过个体条件期望图可视化统计学习

:3rd_place_medal: :page_facing_up: 数据沙普利值:机器学习中的公平数据估值

:scissors: 降维

:1st_place_medal: :page_facing_up: 主成分分析教程

:2nd_place_medal: :page_facing_up: 如何有效使用t-SNE

:3rd_place_medal: :page_facing_up: 使用t-SNE可视化数据

:chart_with_upwards_trend: 优化

:1st_place_medal: :page_facing_up: 贝叶斯优化教程

:2nd_place_medal: :page_facing_up: 将人类从循环中移除:贝叶斯优化综述

知名博客

Sebastian Raschka Chip Huyen

:8ball: :crystal_ball: 推荐系统

综述

:1st_place_medal: :page_facing_up: 协同过滤技术综述

:1st_place_medal: :page_facing_up: 协同过滤推荐系统

:1st_place_medal: :page_facing_up: 基于深度学习的推荐系统:综述与新视角

:1st_place_medal: :page_facing_up: :thinking: :star: 可解释推荐:综述与新视角 :star:

案例研究

:2nd_place_medal: :page_facing_up: Netflix推荐系统:算法、商业价值和创新

:globe_with_meridians: Netflix Medium博客
- Netflix推荐:超越五星评分(第一部分)
- Netflix推荐:超越五星评分(第二部分) :2nd_place_medal: :page_facing_up: 亚马逊推荐系统二十年

:2nd_place_medal: :globe_with_meridians: Spotify是如何如此了解你的？

:point_right: 深入学习，:closed_book: 推荐系统手册

著名深度学习博客 :cowboy_hat_face:

:globe_with_meridians: 斯坦福UFLDL深度学习教程

:globe_with_meridians: Distill.pub

:globe_with_meridians: Colah的博客

:globe_with_meridians: Andrej Karpathy

:globe_with_meridians: Zack Lipton

:globe_with_meridians: Sebastian Ruder

:globe_with_meridians: Jay Alammar

:books: 神经网络与深度学习神经网络

:star: :1st_place_medal: :newspaper: 深度学习所需的矩阵微积分 - Terence Parr 和 Jeremy Howard :star:

:1st_place_medal: :newspaper: 深度学习 - Yann LeCun, Yoshua Bengio & Geoffrey Hinton

:1st_place_medal: :page_facing_up: 深度学习中的泛化

:1st_place_medal: :page_facing_up: 人工神经网络学习的拓扑结构

:1st_place_medal: :page_facing_up: Dropout：防止神经网络过拟合的简单方法

:2nd_place_medal: :page_facing_up: 多项式回归作为神经网络的替代方案

:2nd_place_medal: :globe_with_meridians: 神经网络动物园

:2nd_place_medal: :globe_with_meridians: 使用TensorFlow进行深度学习图像补全

:2nd_place_medal: :page_facing_up: 批量归一化：通过减少内部协变量偏移来加速深度网络训练

:3rd_place_medal: :page_facing_up: 卷积神经网络中类别不平衡问题的系统研究

:3rd_place_medal: :page_facing_up: 所有神经网络都是平等的

:3rd_place_medal: :page_facing_up: Adam：一种随机优化方法

:3rd_place_medal: :page_facing_up: AutoML：最新技术综述

:framed_picture: CNN

:1st_place_medal: :page_facing_up: 可视化和理解卷积网络 - Andrej Karpathy Justin Johnson Li Fei-Fei

:2nd_place_medal: :page_facing_up: 用于图像识别的深度残差学习

:2nd_place_medal: :page_facing_up:AlexNet - 使用深度卷积神经网络进行ImageNet分类

:2nd_place_medal: :page_facing_up:VGG Net - 用于大规模图像识别的超深度卷积网络

:3rd_place_medal: :page_facing_up: 用于特征提取的深度卷积神经网络的数学理论

:3rd_place_medal: :page_facing_up: 使用卷积神经网络进行大规模视频分类

:3rd_place_medal: :page_facing_up: 用于图像描述和视觉问答的自下而上和自上而下注意力

:black_circle: CapsNet :trident:

:1st_place_medal: :page_facing_up: 胶囊之间的动态路由

解释博客，"什么是CapsNet，或胶囊网络？"
Aureline Geron的胶囊网络教程

:national_park: :speech_balloon: 图像描述

:1st_place_medal: :page_facing_up: Show and Tell：神经图像描述生成器

:2nd_place_medal: :page_facing_up: 通过联合学习对齐和翻译的神经机器翻译

:2nd_place_medal: :page_facing_up: StyleNet：用风格生成有吸引力的视觉描述

:2nd_place_medal: :page_facing_up: Show, Attend and Tell：具有视觉注意力的神经图像描述生成

:2nd_place_medal: :page_facing_up: 在图像描述生成器中何处放置图像

:2nd_place_medal: :page_facing_up: Dank学习：使用深度神经网络生成表情包

:car: :walking_man: 目标检测 :eagle: :football:

:2nd_place_medal: :page_facing_up:ResNet - 用于图像识别的深度残差学习 :2nd_place_medal: :page_facing_up: YOLO-你只看一次：统一的实时目标检测

:2nd_place_medal: :page_facing_up: 微软COCO:上下文中的常见对象

COCO数据集

:2nd_place_medal: :page_facing_up: (R-CNN)用于精确目标检测和语义分割的丰富特征层次结构

:2nd_place_medal: :page_facing_up: 快速R-CNN

:computer: 论文代码实现

:2nd_place_medal: :page_facing_up: 更快速的R-CNN

:computer: 论文代码实现

:2nd_place_medal: :page_facing_up: Mask R-CNN

:computer: 论文代码实现

:car: :walking_man: :couple: 姿态检测 :runner: :dancer:

:2nd_place_medal: :page_facing_up: DensePose:野外环境下的密集人体姿态估计

:computer: 论文代码实现

:2nd_place_medal: :page_facing_up: 用于实例级人体分析的Parsing R-CNN

:computer: 论文代码实现

:abcd: :symbols: 深度自然语言处理 :currency_exchange: :1234:

:1st_place_medal: :page_facing_up: 自然语言处理神经网络模型入门

:1st_place_medal: :page_facing_up: 门控循环神经网络在序列建模上的实证评估

:1st_place_medal: :page_facing_up: 神经机器翻译的编码器-解码器方法的特性研究

:1st_place_medal: :page_facing_up: LSTM:搜索空间的奥德赛 - Klaus Greff等人著

:1st_place_medal: :page_facing_up: 用于序列学习的循环神经网络的批判性回顾

:1st_place_medal: :page_facing_up: 可视化和理解循环网络

:star: :1st_place_medal: :page_facing_up: 注意力就是一切 :star:

:1st_place_medal: :page_facing_up: 循环网络架构的实证探索

:1st_place_medal: :page_facing_up: OpenAI (GPT-2)语言模型是无监督的多任务学习器

:1st_place_medal: :page_facing_up: BERT:用于语言理解的深度双向Transformer预训练

Google BERT公告

:3rd_place_medal: :page_facing_up: NLP的参数高效迁移学习

:3rd_place_medal: :page_facing_up: 用于句子分类的卷积神经网络的敏感性分析(及从业者指南)

:3rd_place_medal: :page_facing_up: 深度学习模型在命名实体识别中的最新进展综述

:3rd_place_medal: :page_facing_up: 用于句子分类的卷积神经网络

:3rd_place_medal: :page_facing_up: 普遍注意力:用于序列到序列预测的2D卷积神经网络

:3rd_place_medal: :page_facing_up: 单头注意力RNN:停止用你的头思考

:alien: 生成对抗网络

:1st_place_medal: :page_facing_up: 生成对抗网络 - Goodfellow等人著

:books: GAN兔子洞 -> GAN论文

:o::heavy_minus_sign::o: 图神经网络(GNN)

:3rd_place_medal: :page_facing_up: 图神经网络综合调查

:man_health_worker: :syringe: 医疗AI :pill: :microscope:

机器学习分类器和fMRI:教程概述 - Francisco等人著

:point_down: 有趣的内容 :point_down:

:loud_sound: :page_facing_up: SoundNet:从未标记视频中学习声音表示

:art: :page_facing_up: CAN:通过学习风格并偏离风格规范来生成"艺术"的创造性对抗网络

:art: :page_facing_up: 深度绘画和谐化

Github代码

:man_dancing: :dancer: :page_facing_up: 人人都能跳舞

人人都能跳舞 - YouTube视频

:soccer: 桌面上的足球

:blonde_woman: :haircut_woman: :page_facing_up: SC-FEGAN:带有用户草图和颜色的人脸编辑生成对抗网络

Github代码

:camera_flash: :page_facing_up: 极低光照条件下的手持移动摄影 :japanese_castle: :mosque: :page_facing_up: 使用Places数据库学习深度特征进行场景识别

:bullettrain_front: :bullettrain_side: :page_facing_up: 使用核化相关滤波器进行高速跟踪

:clapper: :page_facing_up: 语义图像分割的最新进展

深入探索 -> :loud_sound: :globe_with_meridians: Analytics Vidhya十大音频处理任务及其相关论文

:blonde_man: -> :older_man: :page_facing_up: :page_facing_up: 使用条件生成对抗网络进行人脸老化

:blonde_man: -> :older_man: :page_facing_up: :page_facing_up: 使用双条件生成对抗网络进行人脸老化和年轻化

:balance_scale: :page_facing_up: BAGAN: 使用平衡生成对抗网络进行数据增强

labml.ai 带注释的PyTorch论文实现

:newspaper: 毕业设计项目 :newspaper:

更新日志

2019-10-28 创建"机器学习必读论文"仓库

2019-10-29 添加Analytics Vidhya用例研究文章链接

2019-10-30 添加异常/异常值检测论文，分离Boosting、CNN、目标检测、NLP论文，并添加图像标注论文

2019-10-31 添加知名深度学习和机器学习研究者的博客

2019-11-1 修复Markdown问题，添加贡献指南

2019-11-20 添加推荐系统综述和论文

2019-12-12 添加R-CNN变体、PoseNet、GNN

2020-02-23 添加GRU论文

must-read-papers-for-ml