################################################### 深度学习 - 你需要知道的一切 ###################################################
.. image:: https://img.shields.io/badge/contributions-welcome-brightgreen.svg?style=flat :target: https://github.com/osforscience/deep-learning-all-you-need/pulls .. image:: https://badges.frapsoft.com/os/v2/open-source.png?v=103 :target: https://github.com/ellerbrock/open-source-badge/ .. image:: https://img.shields.io/pypi/l/ansicolortags.svg :target: https://github.com/osforscience/deep-learning-all-you-need/blob/master/LICENSE .. image:: https://img.shields.io/twitter/follow/machinemindset.svg?label=Follow&style=social :target: https://twitter.com/machinemindset
########################################################################## 赞助 ##########################################################################
为了支持维护和升级此项目,请您考虑赞助项目开发者 <https://github.com/sponsors/astorfi/dashboard>
_。
任何级别的支持都是一种巨大的贡献 :heart:
.. raw:: html
################################################### 免费下载Python机器学习书籍 ###################################################
.. raw:: html
################################################### Slack群组 ###################################################
.. raw:: html
################## 目录 ################## .. contents:: :local: :depth: 4
.. image:: _img/mainpage/logo.gif
简介
本项目的目的是为开发人员和研究人员介绍有关深度学习的有用资源的快捷方式。
============ 动机
对于这个开源项目有不同的动机。
.. -------------------- .. 为什么需要深度学习? .. --------------------
这个开源项目的意义是什么?
有其他类似这一存储库的存储库,非常全面且有用,说实话,它们使我思考是否有必要为这个存储库存在!
这个存储库的重点是资源的针对性。资源的组织方式使用户可以轻松找到他/她正在寻找的内容。 我们将资源分为大量的类别,起初可能会让人头疼!!!但是,如果有人知道要找什么,就非常容易找到最相关的资源。 即使有人不知道从何找起,起初提供的一般资源也是很好的选择。
.. ================================================ .. 如何最大化利用这一努力 .. ================================================
论文
.. image:: _img/mainpage/article.jpeg
本章与深度学习发表的论文相关。
==================== 模型
卷积网络
.. image:: _img/mainpage/convolutional.png
.. 为了连续的行,行必须从相同的位置开始。
-
使用深度卷积神经网络进行Imagenet分类: [
论文 <http://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks>
][代码 <https://github.com/dontfollowmeimcrazy/imagenet>
].. image:: _img/mainpage/star_5.png
-
用于句子分类的卷积神经网络: [
论文 <https://arxiv.org/abs/1408.5882>
][代码 <https://github.com/yoonkim/CNN_sentence>
].. image:: _img/mainpage/star_4.png
-
使用卷积神经网络进行大规模视频分类: [
论文 <https://www.cv-foundation.org/openaccess/content_cvpr_2014/html/Karpathy_Large-scale_Video_Classification_2014_CVPR_paper.html>
][项目页面 <https://cs.stanford.edu/people/karpathy/deepvideo/>
].. image:: _img/mainpage/star_4.png
-
使用卷积神经网络学习和迁移中层图像表示: [
论文 <https://www.cv-foundation.org/openaccess/content_cvpr_2014/html/Oquab_Learning_and_Transferring_2014_CVPR_paper.html>
_].. image:: _img/mainpage/star_5.png
-
用于LVCSR的深度卷积神经网络: [
论文 <https://ieeexplore.ieee.org/abstract/document/6639347/&hl=zh-CN&sa=T&oi=gsb&ct=res&cd=0&ei=KknXWYbGFMbFjwSsyICADQ&scisig=AAGBfm2F0Zlu0ciUwadzshNNm80IQQhuhA>
_].. image:: _img/mainpage/star_3.png
-
人脸识别:一种卷积神经网络方法: [
论文 <https://ieeexplore.ieee.org/abstract/document/554195/>
_].. image:: _img/mainpage/star_5.png
循环网络
.. image:: _img/mainpage/Recurrent_neural_network_unfold.svg
.. 为了连续的行,行必须从相同的位置开始。
-
循环网络结构的经验探索: [
论文 <http://proceedings.mlr.press/v37/jozefowicz15.pdf?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=revue>
][代码 <https://github.com/debajyotidatta/RecurrentArchitectures>
].. image:: _img/mainpage/star_4.png
-
LSTM:一个搜索空间的奥德赛: [
论文 <https://ieeexplore.ieee.org/abstract/document/7508408/>
][代码 <https://github.com/fomorians/lstm-odyssey>
].. image:: _img/mainpage/star_3.png
-
关于训练循环神经网络的难度: [
论文 <http://proceedings.mlr.press/v28/pascanu13.pdf>
][代码 <https://github.com/pascanur/trainingRNNs>
].. image:: _img/mainpage/star_5.png
-
学习遗忘:使用LSTM的连续预测: [
论文 <http://digital-library.theiet.org/content/conferences/10.1049/cp_19991218>
_].. image:: _img/mainpage/star_5.png
自编码器
.. image:: _img/mainpage/Autoencoder_structure.png
-
使用去噪自编码器提取和组合稳健特征: [
论文 <https://dl.acm.org/citation.cfm?id=1390294>
_].. image:: _img/mainpage/star_5.png
-
堆叠去噪自编码器:使用局部去噪标准在深度网络中学习有用的表示: [
论文 <http://www.jmlr.org/papers/v11/vincent10a.html>
][代码 <https://github.com/rajarsheem/libsdae-autoencoder-tensorflow>
].. image:: _img/mainpage/star_5.png
-
对抗性自编码器: [
论文 <https://arxiv.org/abs/1511.05644>
][代码 <https://github.com/conan7882/adversarial-autoencoders>
].. image:: _img/mainpage/star_3.png
-
自编码器、无监督学习和深度架构: [
论文 <http://proceedings.mlr.press/v27/baldi12a/baldi12a.pdf>
_].. image:: _img/mainpage/star_4.png
-
使用神经网络减少数据维度: [
论文 <http://science.sciencemag.org/content/313/5786/504>
][代码 <https://github.com/jordn/autoencoder>
].. image:: _img/mainpage/star_5.png
生成模型
.. image:: _img/mainpage/generative.png
-
在判别分类器中利用生成模型: [
论文 <http://papers.nips.cc/paper/1520-exploiting-generative-models-in-discriminative-classifiers.pdf>
_].. image:: _img/mainpage/star_4.png
-
带有深层生成模型的半监督学习: [
论文 <http://papers.nips.cc/paper/5352-semi-supervised-learning-with-deep-generative-models>
][代码 <https://github.com/wohlert/semi-supervised-pytorch>
].. image:: _img/mainpage/star_4.png
-
生成对抗网络: [
论文 <http://papers.nips.cc/paper/5423-generative-adversarial-nets>
][代码 <https://github.com/goodfeli/adversarial>
].. image:: _img/mainpage/star_5.png
-
作为生成模型的广义去噪自动编码器: [
论文 <http://papers.nips.cc/paper/5023-generalized-denoising-auto-encoders-as-generative-models>
_].. image:: _img/mainpage/star_5.png
-
使用深度卷积生成对抗网络进行无监督表示学习: [
论文 <https://arxiv.org/abs/1511.06434>
][代码 <https://github.com/carpedm20/DCGAN-tensorflow>
].. image:: _img/mainpage/star_5.png
概率模型
-
深层生成模型中的随机反向传播和近似推理: [
论文 <https://arxiv.org/abs/1401.4082>
_].. image:: _img/mainpage/star_4.png
-
认知的概率模型:探讨表征和归纳偏差: [
论文 <https://www.sciencedirect.com/science/article/pii/S1364661310001129>
_].. image:: _img/mainpage/star_5.png
-
关于具有识别应用的深层生成模型: [
论文 <https://ieeexplore.ieee.org/abstract/document/5995710/>
_].. image:: _img/mainpage/star_5.png
==================== 核心
优化
.. ################################################################################ .. 为了连续的行,行必须从相同的位置开始。
-
批量归一化:通过减少内部协变量偏移加速深层网络训练: [
论文 <https://arxiv.org/abs/1502.03167>
_].. image:: _img/mainpage/star_5.png
-
Dropout: 一种防止神经网络过拟合的简单方法 : [
论文 <http://www.jmlr.org/papers/volume15/srivastava14a/srivastava14a.pdf?utm_content=buffer79b43&utm_medium=social&utm_source=twitter.com&utm_campaign=buffer>
_].. image:: _img/mainpage/star_5.png
-
训练超深度网络 : [
论文 <http://papers.nips.cc/paper/5850-training-very-deep-networks>
_].. image:: _img/mainpage/star_4.png
-
深入研究整流器:在ImageNet分类上超越人类水平表现 : [
论文 <https://www.cv-foundation.org/openaccess/content_iccv_2015/papers/He_Delving_Deep_into_ICCV_2015_paper.pdf>
_].. image:: _img/mainpage/star_5.png
-
大规模分布式深度网络 : [
论文 <http://papers.nips.cc/paper/4687-large-scale-distributed-deep-networks>
_].. image:: _img/mainpage/star_5.png
表示学习
-
使用深度卷积生成对抗网络的无监督表示学习 : [
论文 <https://arxiv.org/abs/1511.06434>
][代码 <https://github.com/Newmu/dcgan_code>
].. image:: _img/mainpage/star_5.png
-
表示学习:回顾与新视角 : [
论文 <https://ieeexplore.ieee.org/abstract/document/6472238/>
_].. image:: _img/mainpage/star_4.png
-
InfoGAN:通过信息最大化生成对抗网络进行可解释表示学习 : [
论文 <http://papers.nips.cc/paper/6399-infogan-interpretable-representation>
][代码 <https://github.com/openai/InfoGAN>
].. image:: _img/mainpage/star_3.png
理解和迁移学习
-
使用卷积神经网络学习和迁移中层图像表示 : [
论文 <https://www.cv-foundation.org/openaccess/content_cvpr_2014/html/Oquab_Learning_and_Transferring_2014_CVPR_paper.html>
_].. image:: _img/mainpage/star_5.png
-
蒸馏神经网络中的知识 : [
论文 <https://arxiv.org/abs/1503.02531>
_].. image:: _img/mainpage/star_4.png
-
DeCAF:用于通用视觉识别的深度卷积激活特征 : [
论文 <http://proceedings.mlr.press/v32/donahue14.pdf>
_].. image:: _img/mainpage/star_5.png
-
深度神经网络中的特征有多可迁移? : [
论文 <http://papers.nips.cc/paper/5347-how-transferable-are-features-in-deep-n%E2%80%A6>
][代码 <https://github.com/yosinski/convnet_transfer>
].. image:: _img/mainpage/star_5.png
强化学习
-
通过深度强化学习实现人类水平的控制 : [
论文 <https://www.nature.com/articles/nature14236/>
][代码 <https://github.com/devsisters/DQN-tensorflow>
].. image:: _img/mainpage/star_5.png
-
使用深度强化学习玩Atari : [
论文 <https://arxiv.org/abs/1312.5602>
][代码 <https://github.com/carpedm20/deep-rl-tensorflow>
].. image:: _img/mainpage/star_3.png
-
使用深度强化学习进行连续控制 : [
论文 <https://arxiv.org/abs/1509.02971>
][代码 <https://github.com/stevenpjg/ddpg-aigym>
].. image:: _img/mainpage/star_4.png
-
使用双Q学习的深度强化学习 : [
论文 <http://www.aaai.org/ocs/index.php/AAAI/AAAI16/paper/download/12389/11847>
][代码 <https://github.com/carpedm20/deep-rl-tensorflow>
].. image:: _img/mainpage/star_3.png
-
深度强化学习的双网络架构 : [
论文 <https://arxiv.org/abs/1511.06581>
][代码 <https://github.com/yoosan/deeprl>
].. image:: _img/mainpage/star_3.png
==================== 应用
图像识别
-
图像识别的深度残差学习 : [
论文 <https://www.cv-foundation.org/openaccess/content_cvpr_2016/html/He_Deep_Residual_Learning_CVPR_2016_paper.html>
][代码 <https://github.com/gcr/torch-residual-networks>
].. image:: _img/mainpage/star_5.png
-
大规模图像识别的超深度卷积网络 : [
论文 <https://arxiv.org/abs/1409.1556>
_].. image:: _img/mainpage/star_5.png
-
用于图像分类的多列深度神经网络 : [
论文 <https://arxiv.org/abs/1202.2745>
_].. image:: _img/mainpage/star_4.png
-
DeepID3:使用超深度神经网络的人脸识别 : [
论文 <https://arxiv.org/abs/1502.00873>
_].. image:: _img/mainpage/star_4.png
-
深入卷积网络:可视化图像分类模型和显著图 : [
论文 <https://arxiv.org/abs/1312.6034>
][代码 <https://github.com/artvandelay/Deep_Inside_Convolutional_Networks>
].. image:: _img/mainpage/star_3.png
-
Deep Image:扩展图像识别 : [
论文 <https://arxiv.org/vc/arxiv/papers/1501/1501.02876v1.pdf>
_].. image:: _img/mainpage/star_4.png
-
用于视觉识别和描述的长期递归卷积网络 : [
论文 <https://www.cv-foundation.org/openaccess/content_cvpr_2015/html/Donahue_Long-Term_Recurrent_Convolutional_2015_CVPR_paper.html>
][代码 <https://github.com/JaggerYoung/LRCN-for-Activity-Recognition>
].. image:: _img/mainpage/star_5.png
-
用于跨视听匹配识别的3D卷积神经网络 : [
论文 <https://ieeexplore.ieee.org/document/8063416>
][代码 <https://github.com/astorfi/lip-reading-deeplearning>
].. image:: _img/mainpage/star_4.png
目标识别
-
使用深度卷积神经网络进行ImageNet分类 : [
论文 <http://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks>
_].. image:: _img/mainpage/star_5.png
-
使用Places数据库学习场景识别的深度特征 : [
论文 <http://papers.nips.cc/paper/5349-learning-deep-features>
_].. image:: _img/mainpage/star_3.png
-
使用深度神经网络的可扩展目标检测 : [
论文 <https://www.cv-foundation.org/openaccess/content_cvpr_2014/html/Erhan_Scalable_Object_Detection_2014_CVPR_paper.html>
_].. image:: _img/mainpage/star_4.png
-
Faster R-CNN:基于区域提案网络的实时目标检测 : [
论文 <http://papers.nips.cc/paper/5638-faster-r-cnn-towards-real-time-object-detection-with-region-proposal-networks>
][代码 <https://github.com/rbgirshick/py-faster-rcnn>
].. image:: _img/mainpage/star_4.png
-
OverFeat:使用卷积网络的集成识别、定位和检测 : [
论文 <https://arxiv.org/abs/1312.6229>
][代码 <https://github.com/sermanet/OverFeat>
].. image:: _img/mainpage/star_5.png
-
即用型CNN特征:令人惊讶的基准 : [
论文 <https://www.cv-foundation.org/openaccess/content_cvpr_workshops_2014/W15/html/Razavian_CNN_Features_Off-the-Shelf_2014_CVPR_paper.html>
_].. image:: _img/mainpage/star_3.png
-
哪种多阶段架构最适合目标识别? : [
论文 <https://ieeexplore.ieee.org/abstract/document/5459469/>
_].. image:: _img/mainpage/star_2.png
动作识别
-
用于视觉识别和描述的长期递归卷积网络 : [
论文 <https://www.cv-foundation.org/openaccess/content_cvpr_2015/html/Donahue_Long-Term_Recurrent_Convolutional_2015_CVPR_paper.html>
_].. image:: _img/mainpage/star_5.png
-
使用3D卷积网络学习时空特征 : [
论文 <https://www.cv-foundation.org/openaccess/content_iccv_2015/html/Tran_Learning_Spatiotemporal_Features_ICCV_2015_paper.html>
][代码 <https://github.com/DavideA/c3d-pytorch>
].. image:: _img/mainpage/star_5.png
-
通过挖掘时间结构来描述视频 : [
论文 <https://www.cv-foundation.org/openaccess/content_iccv_2015/html/Yao_Describing_Videos_by_ICCV_2015_paper.html>
][代码 <https://github.com/tsenghungchen/SA-tensorflow>
].. image:: _img/mainpage/star_3.png
-
用于视频动作识别的卷积双流网络融合 : [
论文 <https://www.cv-foundation.org/openaccess/content_cvpr_2016/html/Feichtenhofer_Convolutional_Two-Stream_Network_CVPR_2016_paper.html>
][代码 <https://github.com/feichtenhofer/twostreamfusion>
].. image:: _img/mainpage/star_4.png
-
时间段网络:朝着深度动作识别的良好实践迈进 : [
论文 <https://link.springer.com/chapter/10.1007/978-3-319-46484-8_2>
][代码 <https://github.com/yjxiong/temporal-segment-networks>
].. image:: _img/mainpage/star_3.png
字幕生成
-
Show, Attend and Tell:带视觉注意力的神经图像字幕生成 : [
论文 <http://proceedings.mlr.press/v37/xuc15.pdf>
][代码 <https://github.com/yunjey/show-attend-and-tell>
].. image:: _img/mainpage/star_5.png
-
心眼:用于图像字幕生成的递归视觉表示 : [
论文 <https://www.cv-foundation.org/openaccess/content_cvpr_2015/html/Chen_Minds_Eye_A_2015_CVPR_paper.html>
_].. image:: _img/mainpage/star_2.png
-
生成对抗文本到图像合成 : [
论文 <http://proceedings.mlr.press/v48/reed16.pdf>
][代码 <https://github.com/zsdonghao/text-to-image>
].. image:: _img/mainpage/star_3.png
-
生成图像描述的深度视觉语义对齐 : [
论文 <https://www.cv-foundation.org/openaccess/content_cvpr_2015/html/Karpathy_Deep_Visual-Semantic_Alignments_2015_CVPR_paper.html>
][代码 <https://github.com/jonkuo/Deep-Learning-Image-Captioning>
].. image:: _img/mainpage/star_4.png
-
看和说:一个神经图像字幕生成器 : [
论文 <https://www.cv-foundation.org/openaccess/content_cvpr_2015/html/Vinyals_Show_and_Tell_2015_CVPR_paper.html>
][代码 <https://github.com/DeepRNN/image_captioning>
].. image:: _img/mainpage/star_5.png
自然语言处理
-
单词和短语的分布式表示及其组成性 : [
论文 <http://papers.nips.cc/paper/5021-distributed-representations-of-words-and-phrases-and-their-compositionality.pdf>
][代码 <https://code.google.com/archive/p/word2vec/>
].. image:: _img/mainpage/star_5.png
-
在向量空间中高效估算单词表示 : [
论文 <https://arxiv.org/pdf/1301.3781.pdf>
][代码 <https://code.google.com/archive/p/word2vec/>
].. image:: _img/mainpage/star_4.png
-
使用神经网络进行序列到序列学习 : [
论文 <https://arxiv.org/pdf/1409.3215.pdf>
][代码 <https://github.com/farizrahman4u/seq2seq>
].. image:: _img/mainpage/star_5.png
-
通过联合学习对齐与翻译进行神经机器翻译 : [
论文 <https://arxiv.org/pdf/1409.0473.pdf>
][代码 <https://github.com/tensorflow/nmt>
].. image:: _img/mainpage/star_4.png
-
直入重点:使用指针生成网络进行总结 : [
论文 <https://arxiv.org/abs/1704.04368>
][代码 <https://github.com/abisee/pointer-generator>
].. image:: _img/mainpage/star_3.png
-
注意力机制是你所需的一切 : [
论文 <https://arxiv.org/abs/1706.03762>
][代码 <https://github.com/jadore801120/attention-is-all-you-need-pytorch>
].. image:: _img/mainpage/star_4.png
-
用于句子分类的卷积神经网络 : [
论文 <https://arxiv.org/abs/1408.5882>
][代码 <https://github.com/yoonkim/CNN_sentence>
].. image:: _img/mainpage/star_4.png
语音技术
-
用于语音识别的声学建模的深度神经网络:四个研究小组的共享观点 : [
论文 <https://ieeexplore.ieee.org/abstract/document/6296526/>
_].. image:: _img/mainpage/star_5.png
-
迈向端到端语音识别的循环神经网络 : [
论文 <http://proceedings.mlr.press/v32/graves14.pdf>
_].. image:: _img/mainpage/star_3.png
-
使用深度循环神经网络的语音识别 : [
论文 <https://ieeexplore.ieee.org/abstract/document/6638947/>
_].. image:: _img/mainpage/star_4.png
-
快速且精准的循环神经网络声学模型用于语音识别 : [
论文 <https://arxiv.org/abs/1507.06947>
_].. image:: _img/mainpage/star_3.png
-
深度语音2:英汉端到端语音识别 : [
论文 <http://proceedings.mlr.press/v48/amodei16.html>
][代码 <https://github.com/PaddlePaddle/DeepSpeech>
].. image:: _img/mainpage/star_4.png
-
使用语音感知深层神经网络的新颖说话人识别方案 : [
论文 <https://ieeexplore.ieee.org/abstract/document/6853887/>
_].. image:: _img/mainpage/star_3.png
-
使用3D卷积神经网络进行文本独立的说话人验证 : [
论文 <https://arxiv.org/abs/1705.09422>
][代码 <https://github.com/astorfi/3D-convolutional-speaker-recognition>
].. image:: _img/mainpage/star_4.png
数据集
==================== 图像
通用
- MNIST 手写数字:
[
链接 <http://yann.lecun.com/exdb/mnist/>
_]
人脸
-
人脸识别技术(FERET) FERET计划的目标是开发自动人脸识别功能,以帮助安全、情报和执法人员履行其职责: [
链接 <https://www.nist.gov/programs-projects/face-recognition-technology-feret>
_] -
CMU姿势、光照和表情(PIE)数据库 2000年10月至12月期间,我们收集了68人共41,368张图像的数据库: [
链接 <https://www.ri.cmu.edu/publications/the-cmu-pose-illumination-and-expression-pie-database-of-human-faces/>
_] -
YouTube人脸数据库 数据集包含1,595个不同人物的3,425个视频。所有视频均从YouTube下载。每个主题平均可用2.15个视频: [
链接 <https://www.cs.tau.ac.il/~wolf/ytfaces/>
_] -
语法面部表情数据集 开发用于辅助面部表情的自动分析: [
链接 <https://archive.ics.uci.edu/ml/datasets/Grammatical+Facial+Expressions>
_] -
FaceScrub 一个包含超过530人的100,000张人脸图像的数据集: [
链接 <http://vintage.winklerbros.net/facescrub.html>
_] -
IMDB-WIKI 超过500k的人脸图像,包含年龄和性别标签: [
链接 <https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/>
_] -
FDDB 人脸检测数据集和基准测试 (FDDB): [
链接 <http://vis-www.cs.umass.edu/fddb/>
_]
物体识别
-
COCO 微软COCO:上下文中的常见对象: [
链接 <http://cocodataset.org/#home>
_] -
ImageNet 著名的ImageNet数据集: [
链接 <http://www.image-net.org/>
_] -
开放图像数据集 Open Images 是一个包含约900万张图像的数据集,这些图像已通过图像级标签和对象边界框进行标注: [
链接 <https://storage.googleapis.com/openimages/web/index.html>
_] -
Caltech-256物体分类数据集 大型物体分类数据集: [
链接 <https://authors.library.caltech.edu/7694/>
_] -
Pascal VOC数据集 用于分类任务的大型数据集: [
链接 <http://host.robots.ox.ac.uk/pascal/VOC/>
_] -
CIFAR 10 / CIFAR 100 CIFAR-10数据集包含60000张32x32彩色图像,分为10个类别。CIFAR-100与CIFAR-10类似,但它有100个类别,每个类别包含600张图像: [
链接 <https://www.cs.toronto.edu/~kriz/cifar.html>
_]
动作识别
-
HMDB 大型人类运动数据库: [
链接 <http://serre-lab.clps.brown.edu/resource/hmdb-a-large-human-motion-database/>
_] -
MHAD 伯克利多模式人类动作数据库: [
链接 <http://tele-immersion.citris-uc.org/berkeley_mhad>
_] -
UCF101 - 动作识别数据集 UCF101是一个包含现实场景动作视频的数据集,来自YouTube,共有101个动作类别。该数据集是UCF50数据集的扩展,UCF50数据集包含50个动作类别: [
链接 <http://crcv.ucf.edu/data/UCF101.php>
_] -
THUMOS数据集 一个用于动作分类的大型数据集: [
链接 <http://crcv.ucf.edu/data/THUMOS.php>
_] -
ActivityNet 用于人类活动理解的大规模视频基准: [
链接 <http://activity-net.org/>
_]
====================================== 文本和自然语言处理
通用
-
10亿词语言模型基准:项目目的是为语言建模实验提供标准的训练和测试设置: [
链接 <http://www.statmt.org/lm-benchmark/>
_] -
通用抓取:Common Crawl语料库包含过去7年收集的PB级数据。它包含原始网页数据、提取的元数据和文本提取内容: [
链接 <http://commoncrawl.org/the-data/get-started/>
_] -
Yelp开放数据集:Yelp的企业、评论和用户数据子集,用于个人、教育和学术用途: [
链接 <https://www.yelp.com/dataset>
_]
文本分类
-
20个新闻组 20 Newsgroups数据集包含大约20,000个新闻组文档,几乎均匀地分布在20个不同的新闻组中: [
链接 <http://qwone.com/~jason/20Newsgroups/>
_] -
广播新闻 1996年广播新闻语料库包含来自ABC、CNN和CSPAN电视网络以及NPR和PRI广播网络的总共104小时的广播节目及相应的转录: [
链接 <https://catalog.ldc.upenn.edu/LDC97S44>
_] -
wikitext长依赖语言建模数据集: 一个从维基百科经过验证的优质和特色文章中提取的超过1亿个标记的集合。: [
链接 <https://einstein.ai/research/the-wikitext-long-term-dependency-language-modeling-dataset>
_]
问答
-
问答语料库 由Deep Mind和Oxford创建,包含大约一百万个来自CNN和Daily Mail网站的新闻故事及相关查询。 [
链接 <https://github.com/deepmind/rc-data>
_] -
斯坦福问答数据集 (SQuAD) 包含由众包工人在一组维基百科文章上提出的问题: [
链接 <https://rajpurkar.github.io/SQuAD-explorer/>
_] -
亚马逊问答数据 包含来自亚马逊的问答数据,总计约140万回答问题: [
链接 <http://jmcauley.ucsd.edu/data/amazon/qa/>
_]
情感分析
-
多领域情感数据集 多领域情感数据集包含来自Amazon.com的不同产品类型(领域)的产品评论: [
链接 <http://www.cs.jhu.edu/~mdredze/datasets/sentiment/>
_] -
斯坦福情感树库数据集 斯坦福情感树库是第一个包含完全标注解析树的语料库,允许对语言中情感的组成效应进行完整分析: [
链接 <https://nlp.stanford.edu/sentiment/>
_] -
大型电影评论数据集: 这是一个用于二元情感分类的数据集: [
链接 <http://ai.stanford.edu/~amaas/data/sentiment/>
_]
机器翻译
-
Align Hansards of the 36th Parliament of Canada 数据集包含 130 万对对齐的文本块: [
链接 <https://www.isi.edu/natural-language/download/hansard/>
_] -
欧盟议会:一个用于统计机器翻译的平行语料库 数据集从欧洲议会的会议记录中提取: [
链接 <http://www.statmt.org/europarl/>
_]
摘要生成
- 法律案例报告数据集 作为4000个法律案例的文本语料库,用于自动摘要生成和引用分析。:
[
链接 <https://archive.ics.uci.edu/ml/datasets/Legal+Case+Reports>
_]
====================================== 语音技术
-
TIMIT 声学-语音连续语料库 TIMIT 朗读语料库旨在提供语音数据用于声学-语音研究以及自动语音识别系统的开发与评估: [
链接 <https://catalog.ldc.upenn.edu/ldc93s1>
_] -
LibriSpeech LibriSpeech 是一个包含约 1000 小时的 16kHz 英语朗读语音的语料库,由 Vassil Panayotov 在 Daniel Povey 的协助下准备: [
链接 <http://www.openslr.org/12/>
_] -
VoxCeleb 一个大型视听数据集: [
链接 <http://www.robots.ox.ac.uk/~vgg/data/voxceleb/>
_] -
NIST 说话人识别: [
链接 <https://www.nist.gov/itl/iad/mig/speaker-recognition>
_]
课程
.. 图片:: _img/mainpage/online.png
-
斯坦福大学在Coursera上的机器学习课程: [
链接 <https://www.coursera.org/learn/machine-learning>
_] -
Coursera 的神经网络与深度学习专精课程: [
链接 <https://www.coursera.org/learn/neural-networks-deep-learning>
_] -
谷歌的深度学习入门课程: [
链接 <https://www.udacity.com/course/deep-learning--ud730>
_] -
卡内基梅隆大学的深度学习入门课程: [
链接 <http://deeplearning.cs.cmu.edu/>
_] -
英伟达深度学习学院: [
链接 <https://www.nvidia.com/en-us/deep-learning-ai/education/>
_] -
斯坦福大学的卷积神经网络用于视觉识别课程: [
链接 <http://cs231n.stanford.edu/>
_] -
斯坦福大学的自然语言处理的深度学习课程: [
链接 <http://cs224d.stanford.edu/>
_] -
fast.ai 的深度学习课程: [
链接 <http://www.fast.ai/>
_] -
IITKGP 的视觉计算深度学习课程: [
链接 <https://www.youtube.com/playlist?list=PLuv3GM6-gsE1Biyakccxb3FAn4wBLyfWf>
_]
书籍
.. 图片:: _img/mainpage/books.jpg
-
Ian Goodfellow 的深度学习: [
链接 <http://www.deeplearningbook.org/>
_] -
神经网络与深度学习: [
链接 <http://neuralnetworksanddeeplearning.com/>
_] -
用 Python 深度学习: [
链接 <https://www.amazon.com/Deep-Learning-Python-Francois-Chollet/dp/1617294438/ref=as_li_ss_tl?s=books&ie=UTF8&qid=1519989624&sr=1-4&keywords=deep+learning+with+python&linkCode=sl1&tag=trndingcom-20&linkId=ec7663329fdb7ace60f39c762e999683>
_] -
Hands-On Machine Learning with Scikit-Learn and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems: [
链接 <https://www.amazon.com/Hands-Machine-Learning-Scikit-Learn-TensorFlow/dp/1491962291/ref=as_li_ss_tl?ie=UTF8&qid=1519989725&sr=1-2-ent&linkCode=sl1&tag=trndingcom-20&linkId=71938c9398940c7b0a811dc1cfef7cc3>
_]
博客
.. 图片:: _img/mainpage/Blogger_icon.png
-
Colah 的博客: [
链接 <http://colah.github.io/>
_] -
Andrej Karpathy 的博客: [
链接 <http://karpathy.github.io/>
_] -
The Spectator Shakir 的机器学习博客: [
链接 <http://blog.shakirm.com/>
_] -
WILDML: [
链接 <http://www.wildml.com/about/>
_] -
Distill 博客 它更像是一个期刊,因为它有一个同行评审过程,只有被接受的文章才会发表在上面。: [
链接 <https://distill.pub/>
_] -
BAIR 伯克利人工智能研究: [
链接 <http://bair.berkeley.edu/blog/>
_] -
Sebastian Ruder 的博客: [
链接 <http://ruder.io/>
_] -
inFERENCe: [
链接 <https://www.inference.vc/page/2/>
_] -
i am trask 一个关于机器学习工艺的博客: [
链接 <http://iamtrask.github.io>
_]
教程
.. 图片:: _img/mainpage/tutorial.png
-
深度学习教程: [
链接 <http://deeplearning.net/tutorial/>
_] -
Pytorch 的用Pytorch进行自然语言处理的深度学习教程: [
链接 <https://pytorch.org/tutorials/beginner/deep_learning_nlp_tutorial.html>
_] -
Jon Krohn 的自然语言处理的深度学习教程:Jupyter Notebook: [
链接 <https://insights.untapt.com/deep-learning-for-natural-language-processing-tutorials-with-jupyter-notebooks-ad67f336ce3f>
_]
框架
-
Tensorflow: [
链接 <https://www.tensorflow.org/>
_] -
Pytorch: [
链接 <https://pytorch.org/>
_] -
CNTK: [
链接 <https://docs.microsoft.com/en-us/cognitive-toolkit/>
_] -
MatConvNet: [
链接 <http://www.vlfeat.org/matconvnet/>
_] -
Keras: [
链接 <https://keras.io/>
_] -
Caffe: [
链接 <http://caffe.berkeleyvision.org/>
_] -
Theano: [
链接 <http://www.deeplearning.net/software/theano/>
_] -
CuDNN: [
链接 <https://developer.nvidia.com/cudnn>
_] -
Torch: [
链接 <https://github.com/torch/torch7>
_] -
Deeplearning4j: [
链接 <https://deeplearning4j.org/>
_]
贡献
对于拼写错误,除非有重大变化,请不要创建拉取请求。相反,请在问题中声明或发送电子邮件给库所有者。请注意我们有行为规范,请在与项目的所有互动中遵守它。
======================== 拉取请求流程
为了更好地帮助我们,请考虑以下标准:
- 拉取请求主要是链接建议。
- 请确保你建议的资源不过时或损坏。
- 确保在执行构建和创建拉取请求时,在图层结束之前移除所有安装或构建依赖项。
- 添加有关接口更改的详细信息的评论,包括新的环境变量、暴露的端口、 有用的文件位置和容器参数。
- 一旦获得至少一位开发人员的批准,你可以合并拉取请求,或者如果你没有合并权限,你可以请求所有者为你合并,如果你认为所有检查都已通过。
======================== 最后说明
我们期待您的宝贵反馈。请帮助我们改进这个开源项目,使我们的工作更好。 要贡献,请创建拉取请求,我们会及时调查。再次感谢您的宝贵反馈和支持。