**模式分类、机器学习和数据挖掘相关的教程、示例、集合以及其他所有内容。**
章节
[下载PDF版本] 此流程图。
机器学习和模式分类简介
[返回顶部]
-
预测建模、监督机器学习和模式分类 - 大局观 [[Markdown](https://github.com/rasbt/pattern_classification/blob/master/./machine_learning/supervised_intro/introduction_to_supervised_machine_learning.md]
-
入门点:数据 - 使用Python的科学计算包为机器学习任务和其他数据分析准备数据 [IPython nb]
-
使用
scikit-learn
进行简单线性监督分类的介绍 [IPython nb]
预处理
[返回顶部]
-
特征提取
- 分类任务中编码分类特征的技巧 [IPython nb]
-
缩放和归一化
- 关于特征缩放:标准化和最小-最大缩放(归一化)[IPython nb]
-
特征选择
- 顺序特征选择算法 [IPython nb]
-
降维
- 主成分分析 (PCA) [IPython nb]
- PCA前变量缩放和均值中心化的影响 [PDF] [HTML]
- 基于协方差矩阵vs相关矩阵的PCA [IPython nb]
- 线性判别分析 (LDA) [IPython nb]
- 核技巧和通过PCA进行非线性降维 [IPython nb]
-
文本表示
- scikit-learn的Tf-idf演练 [IPython nb]
模型评估
[返回顶部]
- 二元分类器系统一般性能指标概述 [PDF]
- 交叉验证
- 简化你的交叉验证工作流程 - scikit-learn的Pipeline实践 [IPython nb]
- 机器学习中的模型评估、模型选择和算法选择 - 第一部分 [[Markdown](https://github.com/rasbt/pattern_classification/blob/master/evaluation/model-evaluation/model-evaluation-selection-part1.md]
- 机器学习中的模型评估、模型选择和算法选择 - 第二部分 [[Markdown](https://github.com/rasbt/pattern_classification/blob/master/evaluation/model-evaluation/model-evaluation-selection-part2.md]
参数估计
[返回顶部]
-
参数技术
- 最大似然估计(MLE)简介 [IPython nb]
- 如何为不同分布计算最大似然估计(MLE)[IPython nb]
-
非参数技术
- 通过Parzen窗技术进行核密度估计 [IPython笔记本]
- K近邻(KNN)技术
-
回归分析
- 线性回归
- 最小二乘拟合 [IPython笔记本]
- 非线性回归
- 线性回归
机器学习算法
[返回顶部]
贝叶斯分类
- 朴素贝叶斯和文本分类 I - 介绍和理论 [PDF]
逻辑回归
- 使用scikit-learn进行核外学习和模型持久化 [IPython笔记本]
神经网络
-
人工神经元和单层神经网络 - 机器学习算法工作原理第1部分 [IPython笔记本]
-
激活函数速查表 [IPython笔记本]
集成方法
- 在scikit-learn中实现加权多数规则集成分类器 [IPython笔记本]
决策树
- 决策树分类速查表 [IPython笔记本]
聚类
[返回顶部]
- 基于原型的聚类
- 层次聚类
- Python中的完全连接聚类和热图 [IPython笔记本]
- 基于密度的聚类
- 基于图的聚类
- 基于概率的聚类
收集数据
[返回顶部]
-
使用Python和Beautiful Soup收集幻想足球数据 [IPython笔记本]
-
下载你的Twitter时间线并用Python生成词云 [IPython笔记本]
-
将MNIST读入NumPy数组 [IPython笔记本]
数据可视化
[返回顶部]
- 星球大战API的探索性分析 [IPython笔记本]
- Matplotlib示例 - 鸢尾花数据集的探索性数据分析 [IPython笔记本]
- 各国人工智能出版物
[IPython笔记本] [[PDF](https://github.com/rasbt/pattern_classification/blob/master/./data_viz/ai_publication_chloropleth/images/ai_publication_chloropleth_small.pdf]
统计模式分类示例
[返回顶部]
-
监督学习
- 参数技术
- 单变量正态分布
- 示例1: 2类、方差相等、先验概率相等 [IPython笔记本]
- 示例2: 2类、方差不同、先验概率相等 [IPython笔记本]
- 示例3: 2类、方差相等、先验概率不同 [IPython笔记本]
- 示例4: 2类、方差不同、先验概率不同、损失函数 [IPython笔记本]
- 示例5: 2类、方差不同、先验概率相等、损失函数、柯西分布 [IPython笔记本]
- 单变量正态分布
- 参数技术
-
多元正态密度
-
示例5:2个类别,不同方差,相等先验概率,损失函数 [IPython 笔记本]
-
示例7:2个类别,相等方差,相等先验概率 [IPython 笔记本]
-
非参数技术
书籍
[返回顶部]
Python机器学习
演讲
[返回顶部]
监督机器学习和模式分类简介:全局视角
[下载PDF]
MusicMood - 基于歌词的自动音乐情绪预测中的机器学习
[下载PDF]
应用
[返回顶部]
MusicMood - 基于歌词的自动音乐情绪预测中的机器学习
这个项目是为想听快乐歌曲的用户构建一个音乐推荐系统。这样的系统不仅可以在雨天周末时振奋人心;特别是在医院、其他医疗诊所或餐厅等公共场所,MusicMood分类器可以用来在人群中传播积极情绪。
mlxtend - 一个用于Python数据分析和机器学习库的扩展和辅助模块库。
资源
[返回顶部]
-
可复制粘贴的 LaTeX 方程 [[Markdown](https://github.com/rasbt/pattern_classification/blob/master/./resources/latex_equations.md]
-
开源数据集 [[Markdown](https://github.com/rasbt/pattern_classification/blob/master/./resources/dataset_collections.md]
-
免费机器学习电子书 [[Markdown](https://github.com/rasbt/pattern_classification/blob/master/./resources/machine_learning_ebooks.md]
-
50字以内定义的数据科学术语 [[Markdown](https://github.com/rasbt/pattern_classification/blob/master/./resources/data_glossary.md]
-
Python中有用的数据科学库 [[Markdown](https://github.com/rasbt/pattern_classification/blob/master/./resources/python_data_libraries.md]
-
一般提示和建议 [[Markdown](https://github.com/rasbt/pattern_classification/blob/master/./resources/general_tips_and_advices.md]
-
Python、R、Julia和MATLAB的矩阵速查表 [HTML]