书籍和arXiv综述论文
(符号说明::orange_book: PDF文件 :earth_africa: HTML电子书)
数据探索分析、可视化和数据清洗
- :earth_africa: 《Python数据分析(第三版)》作者:Wes McKinney
- :earth_africa: 《缺失数据的灵活插补》作者:Stef van Buuren
- :earth_africa: 《数据可视化基础》作者:Claus O. Wilke
- :earth_africa: 《R图形cookbook》作者:Winston Chang
- :earth_africa: 《R语言现代数据可视化》作者:Robert Kabacoff
- :orange_book: 《统计思维:Python中的探索性数据分析》作者:Allen B. Downey
- :orange_book: 《SQL专业人士笔记》
数学
- :orange_book: 《机器学习数学基础》作者:Marc Peter Deisenroth、A. Aldo Faisal和Cheng Soon Ong
- :orange_book: 《矩阵分析》作者:Joel A. Tropp
- :orange_book: 《线性代数做错了》作者:Sergei Treil
- :orange_book: 《线性代数做对了》作者:Sheldon Axler
- :orange_book: 《线性代数:理论与应用》作者:Kenneth Kuttler
- :orange_book: 《计算机科学与机器学习的代数、拓扑、微积分和优化理论》作者:Jean Gallier和Jocelyn Quaintance
- :orange_book: 《矩阵手册》作者:Kaare Brandt Petersen和Michael Syskind Pedersen
- :orange_book: 《应用线性代数导论:向量、矩阵和最小二乘法》作者:Stephen Boyd和Lieven Vandenberghe
- :orange_book: 《数据科学线性代数》作者:Wanmo Kang和Kyunghyun Cho
- :earth_africa: 《数据科学线性代数及R语言示例》作者:Shaina Race Bennett
统计学和概率论
- :orange_book: 《概率与统计 - 不确定性的科学》作者:Michael J. Evans和Jeffrey S. Rosenthal
- :orange_book: 《高维概率论》作者:Joel A. Tropp
- :orange_book: 《概率论导论》作者:Joseph K. Blitzstein和Jessica Hwang
- :orange_book: 《中心极限定理的历史:从经典到现代概率论》作者:Hans Fischer
- :orange_book: 《贝叶斯思维:简明贝叶斯统计学》作者:Allen B. Downey
- :orange_book: 《贝叶斯统计学导论》作者:Brendon J. Brewer
- :orange_book: 《用jamovi学习统计学》作者:Danielle J. Navarro和David R. Foxcroft
- :orange_book: 《贝叶斯数据分析》作者:Andrew Gelman、John Carlin、Hal Stern、David Dunson、Aki Vehtari和Donald Rubin
- :orange_book: 《常见概率分布汇编》作者:Michael P. McLaughlin
- :orange_book: 《数据科学的概率与统计》作者:Carlos Fernandez-Granda
- :orange_book: 《统计建模:14个主题的探索》作者:Reinhard Furrer
线性回归
- :orange_book: Cosma Rohilla Shalizi 著《线性回归的真相》
- :orange_book: Wessel N. van Wieringen 著《岭回归讲义》
- :orange_book: Peng Ding 著《线性模型及其扩展》
- :orange_book: Andrew Gelman、Jennifer Hill 和 Aki Vehtari 著《回归与其他故事》
- :earth_africa: Stéphanie M. van den Berg 著《使用线性模型分析数据》
优化
- :orange_book: Stephen Boyd 和 Lieven Vandenberghe 著《凸优化》
- :orange_book: Nicolas Boumal 著《光滑流形上优化的入门》
机器学习
书籍
- :orange_book: James、Witten、Hastie、Tibshirani 和 Taylor 著《Python 应用中的统计学习导论》
- :orange_book: Hastie、Tibshirani 和 Friedman 著《统计学习的要素》
- :orange_book: Bradley Efron 和 Trevor Hastie 著《计算机时代的统计推断:算法、证据和数据科学》
- :orange_book: Christopher M. Bishop 著《模式识别与机器学习》
- :orange_book: Kevin Patrick Murphy 著《概率机器学习:入门》
- :orange_book: Kevin Patrick Murphy 著《概率机器学习:高级主题》
- :orange_book: Shai Shalev-Shwartz 和 Shai Ben-David 著《理解机器学习:从理论到算法》
- :orange_book: Mehryar Mohri、Afshin Rostamizadeh 和 Ameet Talwalkar 著《机器学习基础》
- :orange_book: Carl Edward Rasmussen 和 Christopher K. I. Williams 著《机器学习的高斯过程》
- :orange_book: David J. C. MacKay 著《信息理论、推理与学习算法》
- :orange_book: Tong Zhang 著《机器学习算法的数学分析》
- :orange_book: Soroush Nasiriany、Garrett Thomas、William Wang、Alex Yang、Jennifer Listgarten 和 Anant Sahai 著《机器学习综合指南》
- :orange_book: Hal Daumé III 著《机器学习课程》
- :orange_book: Andreas Lindholm、Niklas Wahlström、Fredrik Lindsten 和 Thomas B. Schön 著《机器学习 - 工程师和科学家的第一门课程》
- :orange_book: Frank Hutter、Lars Kotthoff 和 Joaquin Vanschoren 著《自动机器学习:方法、系统、挑战》
- :orange_book: Edouard Duchesnay、Tommy Löfstedt 和 Feki Younes 著《Python 中的统计和机器学习》
- :orange_book: David Barber 著《贝叶斯推理和机器学习》
- :orange_book: Robert E. Schapire 和 Yoav Freund 著《提升:基础和算法》
- :orange_book: Mykel J. Kochenderfer、Tim A. Wheeler 和 Kyle H. Wray 著《决策算法》
- :orange_book: Ilya Katsov 著《算法营销导论》
- :orange_book: Ian Langmore 和 Daniel Krasner 著《应用数据科学》
- :orange_book: Andrew Ng 和 Tengyu Ma 著《CS229 讲义》
- :orange_book: Romain Couillet 和 Zhenyu Liao 著《机器学习的随机矩阵方法》
- :orange_book: Carl McBride Ellis 著《机器学习橙皮书》
- :orange_book: Francis Bach 著《从基本原理学习理论》
- :orange_book: Cosma Rohilla Shalizi 著《从基础角度的高级数据分析》
- :orange_book: Tom Mitchell 著《机器学习》
- :earth_africa: Christoph Molnar 和 Timo Freiesleben 著《科学的监督机器学习》
- :earth_africa: Jake VanderPlas 著《Python 数据科学手册》
- :earth_africa: 《数据分析指南》,作者:Mike Nguyen
- :earth_africa: 《表格数据的应用机器学习》,作者:Max Kuhn 和 Kjell Johnson
arXiv
- :orange_book: Osvaldo Simeone 著《机器学习工程师简介》
- :orange_book: Alexander Jung 著《机器学习:基础知识》
- :orange_book: Pankaj Mehta、Marin Bukov、Ching-Hao Wang、Alexandre G.R. Day、Clint Richardson、Charles K. Fisher、David J. Schwab 著《为物理学家提供的高偏差、低方差机器学习入门》
- :orange_book: Sebastian Raschka 著《机器学习中的模型评估、模型选择和算法选择》
- :orange_book: Tong Yu 和 Hong Zhu 著《超参数优化:算法和应用综述》
- :orange_book: Michael A. Lones 著《如何避免机器学习陷阱:学术研究者指南》
- :orange_book: Steven C. H. Hoi、Doyen Sahoo、Jing Lu 和 Peilin Zhao 著《在线学习:综合调查》
R 相关
- :earth_africa: Oscar Baruffa 著《R语言大全》
- :earth_africa: Garrett Grolemund 著《R语言编程实战》
- :earth_africa: Bradley Boehmke 和 Brandon Greenwell 著《R语言机器学习实战》
- :earth_africa: Shaina Race Bennett 著《数据科学线性代数及R语言示例》
- :orange_book: Marek Gagolewski 著《深入R编程》
- :earth_africa: Colin Gillespie 和 Robin Lovelace 著《高效R编程》
- :earth_africa: Hadley Wickham、Mine Çetinkaya-Rundel 和 Garrett Grolemund 著《数据科学中的R语言》
- :earth_africa: Hadley Wickham 著《高级R》
- :earth_africa: Neale Batra 编《流行病学家R手册》
- :earth_africa: Konstantinos I. Bougioukas 著《医学实用统计与R》
- :earth_africa: Julia Silge 和 David Robinson 著《R语言文本挖掘:整洁方法》
- :earth_africa: Paula Moraga 著《空间统计学在数据科学中的理论与实践:R语言应用》
- :earth_africa: Winston Chang 著《R图形食谱》
- :earth_africa: Yigit Aydede 著《社会科学家和政策分析师工具箱:机器学习和R应用预测分析》
- :earth_africa: Gema Fernández-Avilés Calderón 和 José-María Montero 著《R语言数据科学基础》
- :earth_africa: Robert Kabacoff 著《R语言现代数据可视化》
- :earth_africa: Christoph Hanck、Martin Arnold、Alexander Gerber 和 Martin Schmelzer 著《R语言计量经济学导论》
- :orange_book: Patrick Burns 著《R地狱》
深度学习/神经网络
- :orange_book: Terence Parr 和 Jeremy Howard 的《深度学习所需的矩阵微积分》
- :orange_book: Julius Berner、Philipp Grohs、Gitta Kutyniok 和 Philipp Petersen 的《深度学习的现代数学》
- :orange_book: Daniel A. Roberts、Sho Yaida 和 Boris Hanin 的《深度学习理论原理》
- :orange_book: Bernhard Mehlig 的《神经网络机器学习》
- :orange_book: Aston Zhang、Zachary C. Lipton、Mu Li 和 Alexander J. Smola 的《深入深度学习》
- :orange_book: Yao Ma 和 Jiliang Tang 的《图深度学习》
- :orange_book: Nils Thuerey、Philipp Holl、Maximilian Mueller、Patrick Schnell、Felix Trost 和 Kiwon Um 的《基于物理的深度学习》
- :orange_book: Simon J. D. Prince 的《理解深度学习》
- :orange_book: François Fleuret 的《深度学习小书》
- :orange_book: Arnulf Jentzen、Benno Kuckuck 和 Philippe von Wurstemberger 的《深度学习的数学入门:方法、实现和理论》
- :orange_book: Sanjeev Arora 等人的《深度学习理论》
- :orange_book: Vicki Boykis 的《什么是嵌入》
- :earth_africa: Christopher M. Bishop 和 Hugh Bishop 的《深度学习:基础和概念》
强化学习
- :orange_book: Richard S. Sutton 和 Andrew G. Barto 的《强化学习导论》
- :orange_book: Stefano V. Albrecht、Filippos Christianos 和 Lukas Schäfer 的《多智能体强化学习》
- :orange_book: Marc G. Bellemare、Will Dabney 和 Mark Rowland 的《分布式强化学习》
- :orange_book: Shiyu Zhao 的《强化学习的数学基础》
推荐系统
- :orange_book: Linyuan Lü、Matus Medo、Chi Ho Yeung、Yi-Cheng Zhang、Zi-Ke Zhang 和 Tao Zhou 的《推荐系统》
- :orange_book: Pablo Castells 和 Dietmar Jannach 的《推荐系统入门》
异常检测
- :earth_africa: Rob J. Hyndman 的《太奇怪了!使用 R 进行异常检测》
计算机视觉
- :orange_book: Simon J. D. Prince 的《计算机视觉:模型、学习和推理》
- :orange_book: Richard Szeliski 的《计算机视觉:算法与应用》(第一版)
自然语言处理(NLP)和大型语言模型(LLM)
- 📙 Dan Jurafsky 和 James H. Martin 著《语音与语言处理:自然语言处理、计算语言学与语音识别导论》
- 📙 Michael R. Douglas 著《大型语言模型》
- 📙 Lingfei Wu、Yu Chen、Kai Shen、Xiaojie Guo、Hanning Gao、Shucheng Li、Jian Pei 和 Bo Long 著《图神经网络在自然语言处理中的应用:综述》
- 📙 Ryan Cotterell、Anej Svete、Clara Meister、Tianyu Liu 和 Li Du 著《语言建模的形式化方面》
- 📙 Wayne Xin Zhao 等人著《大型语言模型综述》
- 📙 Gerhard Paaß 和 Sven Giesselbach 著《自然语言处理的基础模型》
- 🌍 Julia Silge 和 David Robinson 著《R语言文本挖掘:整洁方法》
因果推断
- 📙 Jean Kaddour、Aengus Lynch、Qi Liu、Matt J. Kusner 和 Ricardo Silva 著《因果机器学习:综述与开放问题》
- 📙 Jennie E. Brand、Xiang Zhou 和 Yu Xie 著《因果推断和机器学习的最新进展》
- 📙 Peng Ding 著《因果推断入门》
- 📙 Marcos M. López de Prado 著《因果因子投资》
- 📙 Charles K. Assaad、Emilie Devijver 和 Eric Gaussier 著《时间序列因果发现方法的调查与评估》
- 📙 Victor Chernozhukov、Christian Hansen、Nathan Kallus、Martin Spindler 和 Vasilis Syrgkanis 著《机器学习和人工智能驱动的应用因果推断》
- 🌍 Uday Kamath、Kenneth Graham 和 Mitchell Naylor 著《应用因果推断》
- 🌍 Matheus Facure Alves 著《勇敢者的因果推断》
共形预测
- 📙 Glenn Shafer 和 Vladimir Vovk 著《共形预测教程》
- 📙 Matteo Fontana、Gianluca Zeni 和 Simone Vantini 著《共形预测:理论统一回顾与新挑战》
- 📙 Anastasios N. Angelopoulos 和 Stephen Bates 著《共形预测和无分布不确定性量化温和介绍》
特征工程
- 🌍 Max Kuhn 和 Kjell Johnson 著《特征工程与选择:预测模型的实用方法》
- 🌍 Emil Hvitfeldt 著《特征工程从A到Z》
时间序列:预测
- :earth_africa: Rob J Hyndman 和 George Athanasopoulos 所著的《预测:原理与实践》
- :orange_book: Fotios Petropoulos 等人所著的《预测:理论与实践》
- :earth_africa:《预测:理论与实践》(在线版),编辑:Fotios Petropoulos、Yanfei Kang 和 Feng Li
- :orange_book: Hansika Hewamalagea、Klaus Ackermannb 和 Christoph Bergmeir 所著的《数据科学家的预测评估:常见陷阱和最佳实践》
- :orange_book: Aryan Jadon、Avinash Patil 和 Shruti Jadon 所著的《基于回归的时间序列预测损失函数综合调查》
- :orange_book: Alexander Aue 所著的《时间序列分析》
- :orange_book: John H. Cochrane 所著的《宏观经济学和金融学的时间序列》
- :earth_africa: Stephan Kolassa、Bahman Rostami-Tabar 和 Enno Siemsen 所著的《面向高管和专业人士的需求预测》
可解释性/可解释性
- :earth_africa: Christoph Molnar 所著的《可解释机器学习:使黑箱模型可解释的指南》
- :earth_africa: Przemyslaw Biecek 和 Tomasz Burzykowski 所著的《解释性模型分析》
注:所有 arXiv 论文本质上是免费的,所有书籍均由各自的作者/出版商免费提供。