Project Icon

must-read-papers-for-ml

精选机器学习和数据科学必读论文资源集

本项目汇集了数据科学、机器学习和深度学习领域的重要论文和综述文章。涵盖数据预处理、深度学习技术、推荐系统和计算机视觉等多个主题。资源按重要性分类,并提供链接,方便读者学习和追踪最新进展。项目持续更新,欢迎贡献新的学术资源。

数据科学、机器学习和深度学习必读论文

精选的数据科学、机器学习和深度学习论文、综述和文章集合,属于必读清单。


注意::construction: 正在更新中,如果您有其他需要添加的论文、文章或博客,请告诉我,我会将它们添加到这里。

如何使用

:point_right: 给这个仓库加 :star:

贡献

  • :point_right: :arrows_clockwise: 如果链接失效,或者我遗漏了任何重要的论文、博客或文章,欢迎提交拉取请求

维护状态

:point_down: 请阅读以下内容 :point_down:

  • :point_right: 阅读包含大量数学内容的论文很困难,需要时间和精力去理解,大部分取决于坚持和不放弃的动力,不要气馁,读一遍,读两遍,读三遍,...直到豁然开朗,让你眼前一亮。

:1st_place_medal: - 首先阅读

:2nd_place_medal: - 其次阅读

:3rd_place_medal: - 第三阅读


数据科学

:bar_chart: 预处理与探索性数据分析

:1st_place_medal: :page_facing_up:数据预处理 - 整洁数据 - 作者:Hadley Wickham

:notebook: 通用数据科学

:1st_place_medal: :page_facing_up: 统计建模:两种文化 - 作者:Leo Breiman

:2nd_place_medal: :page_facing_up: 罗生门曲线与体积研究:机器学习中泛化和模型简单性的新视角

:1st_place_medal: :page_facing_up: 频率主义与贝叶斯主义:Python驱动的入门 - 作者:Jake VanderPlas


机器学习

:dart: 通用机器学习

:1st_place_medal: :page_facing_up: 机器学习中的模型评估、模型选择和算法选择 - 作者:Sebastian Raschka

:1st_place_medal: :page_facing_up: 机器学习简介 - 作者:Gunnar Ratsch

:3rd_place_medal: :page_facing_up: 共轭梯度法入门:无痛苦版 - 作者:Jonathan Richard Shewchuk

:3rd_place_medal: :page_facing_up: 模型稳定性作为随机种子的函数

:mag: 异常/离群值检测

:1st_place_medal: :newspaper: 离群值检测:综述

:rocket: 提升方法

:2nd_place_medal: :page_facing_up: XGBoost:可扩展的树提升系统

:2nd_place_medal: :page_facing_up: LightGBM:一种高效的梯度提升决策树

:2nd_place_medal: :page_facing_up: AdaBoost和分类器超级碗 - 自适应提升的入门教程

:3rd_place_medal: :page_facing_up: 贪婪函数逼近:梯度提升机

:book: 解析黑盒机器学习

:3rd_place_medal: :page_facing_up: 窥视黑盒内部:通过个体条件期望图可视化统计学习

:3rd_place_medal: :page_facing_up: 数据沙普利值:机器学习中的公平数据估值

:scissors: 降维

:1st_place_medal: :page_facing_up: 主成分分析教程

:2nd_place_medal: :page_facing_up: 如何有效使用t-SNE

:3rd_place_medal: :page_facing_up: 使用t-SNE可视化数据

:chart_with_upwards_trend: 优化

:1st_place_medal: :page_facing_up: 贝叶斯优化教程

:2nd_place_medal: :page_facing_up: 将人类从循环中移除:贝叶斯优化综述


知名博客

Sebastian Raschka Chip Huyen


:8ball: :crystal_ball: 推荐系统

综述

:1st_place_medal: :page_facing_up: 协同过滤技术综述

:1st_place_medal: :page_facing_up: 协同过滤推荐系统

:1st_place_medal: :page_facing_up: 基于深度学习的推荐系统:综述与新视角

:1st_place_medal: :page_facing_up: :thinking: :star: 可解释推荐:综述与新视角 :star:

案例研究

:2nd_place_medal: :page_facing_up: Netflix推荐系统:算法、商业价值和创新

:2nd_place_medal: :globe_with_meridians: Spotify是如何如此了解你的?

:point_right: 深入学习,:closed_book: 推荐系统手册


著名深度学习博客 :cowboy_hat_face:

:globe_with_meridians: 斯坦福UFLDL深度学习教程

:globe_with_meridians: Distill.pub

:globe_with_meridians: Colah的博客

:globe_with_meridians: Andrej Karpathy

:globe_with_meridians: Zack Lipton

:globe_with_meridians: Sebastian Ruder

:globe_with_meridians: Jay Alammar


:books: 神经网络与深度学习神经网络

:star: :1st_place_medal: :newspaper: 深度学习所需的矩阵微积分 - Terence Parr 和 Jeremy Howard :star:

:1st_place_medal: :newspaper: 深度学习 - Yann LeCun, Yoshua Bengio & Geoffrey Hinton

:1st_place_medal: :page_facing_up: 深度学习中的泛化

:1st_place_medal: :page_facing_up: 人工神经网络学习的拓扑结构

:1st_place_medal: :page_facing_up: Dropout:防止神经网络过拟合的简单方法

:2nd_place_medal: :page_facing_up: 多项式回归作为神经网络的替代方案

:2nd_place_medal: :globe_with_meridians: 神经网络动物园

:2nd_place_medal: :globe_with_meridians: 使用TensorFlow进行深度学习图像补全

:2nd_place_medal: :page_facing_up: 批量归一化:通过减少内部协变量偏移来加速深度网络训练

:3rd_place_medal: :page_facing_up: 卷积神经网络中类别不平衡问题的系统研究

:3rd_place_medal: :page_facing_up: 所有神经网络都是平等的

:3rd_place_medal: :page_facing_up: Adam:一种随机优化方法

:3rd_place_medal: :page_facing_up: AutoML:最新技术综述

:framed_picture: CNN

:1st_place_medal: :page_facing_up: 可视化和理解卷积网络 - Andrej Karpathy Justin Johnson Li Fei-Fei

:2nd_place_medal: :page_facing_up: 用于图像识别的深度残差学习

:2nd_place_medal: :page_facing_up:AlexNet - 使用深度卷积神经网络进行ImageNet分类

:2nd_place_medal: :page_facing_up:VGG Net - 用于大规模图像识别的超深度卷积网络

:3rd_place_medal: :page_facing_up: 用于特征提取的深度卷积神经网络的数学理论

:3rd_place_medal: :page_facing_up: 使用卷积神经网络进行大规模视频分类

:3rd_place_medal: :page_facing_up: 用于图像描述和视觉问答的自下而上和自上而下注意力

:black_circle: CapsNet :trident:

:1st_place_medal: :page_facing_up: 胶囊之间的动态路由

:national_park: :speech_balloon: 图像描述

:1st_place_medal: :page_facing_up: Show and Tell:神经图像描述生成器

:2nd_place_medal: :page_facing_up: 通过联合学习对齐和翻译的神经机器翻译

:2nd_place_medal: :page_facing_up: StyleNet:用风格生成有吸引力的视觉描述

:2nd_place_medal: :page_facing_up: Show, Attend and Tell:具有视觉注意力的神经图像描述生成

:2nd_place_medal: :page_facing_up: 在图像描述生成器中何处放置图像

:2nd_place_medal: :page_facing_up: Dank学习:使用深度神经网络生成表情包

:car: :walking_man: 目标检测 :eagle: :football:

:2nd_place_medal: :page_facing_up:ResNet - 用于图像识别的深度残差学习 :2nd_place_medal: :page_facing_up: YOLO-你只看一次:统一的实时目标检测

:2nd_place_medal: :page_facing_up: 微软COCO:上下文中的常见对象

:2nd_place_medal: :page_facing_up: (R-CNN)用于精确目标检测和语义分割的丰富特征层次结构

:2nd_place_medal: :page_facing_up: 快速R-CNN

:2nd_place_medal: :page_facing_up: 更快速的R-CNN

:2nd_place_medal: :page_facing_up: Mask R-CNN

:car: :walking_man: :couple: 姿态检测 :runner: :dancer:

:2nd_place_medal: :page_facing_up: DensePose:野外环境下的密集人体姿态估计

:2nd_place_medal: :page_facing_up: 用于实例级人体分析的Parsing R-CNN

:abcd: :symbols: 深度自然语言处理 :currency_exchange: :1234:

:1st_place_medal: :page_facing_up: 自然语言处理神经网络模型入门

:1st_place_medal: :page_facing_up: 门控循环神经网络在序列建模上的实证评估

:1st_place_medal: :page_facing_up: 神经机器翻译的编码器-解码器方法的特性研究

:1st_place_medal: :page_facing_up: LSTM:搜索空间的奥德赛 - Klaus Greff等人著

:1st_place_medal: :page_facing_up: 用于序列学习的循环神经网络的批判性回顾

:1st_place_medal: :page_facing_up: 可视化和理解循环网络

:star: :1st_place_medal: :page_facing_up: 注意力就是一切 :star:

:1st_place_medal: :page_facing_up: 循环网络架构的实证探索

:1st_place_medal: :page_facing_up: OpenAI (GPT-2)语言模型是无监督的多任务学习器

:1st_place_medal: :page_facing_up: BERT:用于语言理解的深度双向Transformer预训练

:3rd_place_medal: :page_facing_up: NLP的参数高效迁移学习

:3rd_place_medal: :page_facing_up: 用于句子分类的卷积神经网络的敏感性分析(及从业者指南)

:3rd_place_medal: :page_facing_up: 深度学习模型在命名实体识别中的最新进展综述

:3rd_place_medal: :page_facing_up: 用于句子分类的卷积神经网络

:3rd_place_medal: :page_facing_up: 普遍注意力:用于序列到序列预测的2D卷积神经网络

:3rd_place_medal: :page_facing_up: 单头注意力RNN:停止用你的头思考

:alien: 生成对抗网络

:1st_place_medal: :page_facing_up: 生成对抗网络 - Goodfellow等人著

:books: GAN兔子洞 -> GAN论文

:o::heavy_minus_sign::o: 图神经网络(GNN)

:3rd_place_medal: :page_facing_up: 图神经网络综合调查


:man_health_worker: :syringe: 医疗AI :pill: :microscope:

机器学习分类器和fMRI:教程概述 - Francisco等人著


:point_down: 有趣的内容 :point_down:

:loud_sound: :page_facing_up: SoundNet:从未标记视频中学习声音表示

:art: :page_facing_up: CAN:通过学习风格并偏离风格规范来生成"艺术"的创造性对抗网络

:art: :page_facing_up: 深度绘画和谐化

:man_dancing: :dancer: :page_facing_up: 人人都能跳舞

:soccer: 桌面上的足球

:blonde_woman: :haircut_woman: :page_facing_up: SC-FEGAN:带有用户草图和颜色的人脸编辑生成对抗网络

:camera_flash: :page_facing_up: 极低光照条件下的手持移动摄影 :japanese_castle: :mosque: :page_facing_up: 使用Places数据库学习深度特征进行场景识别

:bullettrain_front: :bullettrain_side: :page_facing_up: 使用核化相关滤波器进行高速跟踪

:clapper: :page_facing_up: 语义图像分割的最新进展

深入探索 -> :loud_sound: :globe_with_meridians: Analytics Vidhya十大音频处理任务及其相关论文

:blonde_man: -> :older_man: :page_facing_up: :page_facing_up: 使用条件生成对抗网络进行人脸老化

:blonde_man: -> :older_man: :page_facing_up: :page_facing_up: 使用双条件生成对抗网络进行人脸老化和年轻化

:balance_scale: :page_facing_up: BAGAN: 使用平衡生成对抗网络进行数据增强

labml.ai 带注释的PyTorch论文实现


:newspaper: 毕业设计项目 :newspaper:

8个出色的数据科学毕业设计项目

数据科学中线性代数的10个强大应用

生成对抗网络的5个有趣应用

初学者可以在几分钟内构建的深度学习应用


更新日志

2019-10-28 创建"机器学习必读论文"仓库

2019-10-29 添加Analytics Vidhya用例研究文章链接

2019-10-30 添加异常/异常值检测论文,分离Boosting、CNN、目标检测、NLP论文,并添加图像标注论文

2019-10-31 添加知名深度学习和机器学习研究者的博客

2019-11-1 修复Markdown问题,添加贡献指南

2019-11-20 添加推荐系统综述和论文

2019-12-12 添加R-CNN变体、PoseNet、GNN

2020-02-23 添加GRU论文

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号