[![贡献者][contributors-shield]][contributors-url] [![分支][forks-shield]][forks-url] [![星标][stars-shield]][stars-url] [![问题][issues-shield]][issues-url] [][license-url]
AI系列 | 人工智能与深度学习实战
在本系列中,你可能会接触到数据挖掘、机器学习、深度学习、自然语言处理、人工智能等很多概念。值得说明的是,鉴于许多算法实现以文字结合代码介绍为最佳,因此工具实践篇中的大部分内容以Jupyter Notebook的形式放在该仓库中,并且在Colab中进行浏览、编辑与实验。
导航
本系列目前分为机器学习、自然语言处理等部分。如果您是新人,建议从机器学习开始阅读,也可以在数理统计篇中夯实理论基础。如果想了解更多实践操作,建议阅读深度学习、自然语言处理、工具与工程化(TensorFlow系列)等部分。
前言
1956年,几位计算机科学家在达特茅斯会议上提出了"人工智能"的概念,梦想着用当时刚刚出现的计算机来构造复杂的、拥有与人类智慧同样本质特性的机器。2012年以后,得益于数据量的增长、计算能力的提升和机器学习新算法(深度学习)的出现,人工智能开始大爆发。
机器学习是实现人工智能的一种方法,其基本做法是使用算法来解析数据、从中学习,然后对现实世界中的事件做出决策和预测。与传统的为解决特定任务而硬编码的软件程序不同,机器学习是用大量数据来"训练",通过各种算法从数据中学习如何完成任务。机器学习直接源自早期的人工智能领域,传统的模型算法包括决策树、聚类、贝叶斯分类、支持向量机、EM、Adaboost等。从任务类型上分,机器学习算法可以分为监督学习(如分类问题)、无监督学习(如聚类问题)、半监督学习、集成学习和强化学习等。
-
弱人工智能(ANI):擅长单个方面的人工智能。例如,能够战胜象棋世界冠军的人工智能,但它只会下象棋,无法回答如何更好地在硬盘上存储数据等问题。
-
强人工智能(AGI):人类级别的人工智能。指在各方面都能与人类比肩的人工智能,能完成人类能做的所有脑力工作。创造强人工智能比创造弱人工智能难度更大,目前我们还无法实现。Linda Gottfredson教授将智能定义为"一种广泛的心理能力,能够进行思考、计划、解决问题、抽象思维、理解复杂概念、快速学习和从经验中学习等操作。"强人工智能应该能像人类一样熟练地进行这些操作。
-
超人工智能(ASI):牛津哲学家、著名人工智能思想家Nick Bostrom将超级智能定义为"在几乎所有领域都比最聪明的人类大脑更聪明得多,包括科学创新、常识和社交技能。"超人工智能可能在各方面都比人类强一些,也可能在各方面都比人类强万亿倍。超人工智能也是人工智能这个话题如此热门的原因。
人工智能与数据科学
人工智能与深度学习
传统机器学习算法在指纹识别、基于Haar的人脸检测、基于HoG特征的物体检测等领域的应用基本达到了商业化要求或特定场景的商业化水平,但每前进一步都异常艰难,直到深度学习算法的出现。
深度学习是实现机器学习的一种技术,本身并非独立的学习方法,它也会使用有监督和无监督的学习方法来训练深度神经网络。最初,深度学习是利用深度神经网络来解决特征表达的学习过程。深度神经网络并非全新概念,可大致理解为包含多个隐含层的神经网络结构。为提高深层神经网络的训练效果,人们对神经元的连接方法和激活函数等方面进行了相应调整。许多想法早年间就已存在,但由于当时训练数据量不足、计算能力落后,最终效果不尽如人意。深度学习势如破竹地实现了各种任务,使得几乎所有机器辅助功能都成为可能。无人驾驶汽车、预防性医疗保健,甚至更好的电影推荐,都已近在眼前或即将实现。
人工智能的发展阶段
-
第一阶段(20世纪50年代中期到80年代初期):潜心耕耘,30年技术发展为人工智能产业化奠定基础。1956年之前,人工智能已开始孕育。神经元模型、图灵测试的提出以及SNARC神经网络计算机的发明,为人工智能的诞生奠定了基础。1956年的达特茅斯会议标志着人工智能正式诞生和兴起。此后人工智能快速发展,深度学习模型以及AlphaGo增强学习的雏形——感知器均在这个阶段被发明。随后由于早期系统在更广泛的问题选择和更难问题上效果不理想,美国、英国相继减少经费支持,人工智能进入低谷。
-
第二阶段(20世纪80年代初期至21世纪初期):急于求成,人工智能成功商用但跨越式发展失败。80年代初,人工智能逐渐成为产业,第一个成功的商用专家系统R1为DEC公司每年节省约4000万美元。到80年代末,近半数"财富500强"企业都在开发或使用"专家系统"。受此鼓舞,日本、美国等国投入巨资开发第5代计算机——人工智能计算机。90年代初,IBM、苹果推出的台式机进入普通家庭,确立了计算机产业的发展方向。第5代计算机项目因技术路线明显偏离计算机产业发展方向而失败,人工智能再次陷入低谷。尽管如此,支持向量机、Boosting和最大熵方法等浅层学习在90年代得到广泛应用。
-
第三阶段(21世纪初期至今):量变引发质变,人工智能有望实现规模化应用。摩尔定律和云计算带来的计算能力提升,以及互联网和大数据广泛应用积累的海量数据,使深度学习算法在各行业快速应用,推动语音识别、图像识别等技术迅速发展并产业化。2006年,Geoffrey Hinton及其学生在《Science》上提出基于深度信念网络(DBN)的非监督学习训练算法,使深度学习在学术界持续升温。2012年,DNN技术在图像识别领域的应用使Hinton的学生在ImageNet评测中取得优异成绩。深度学习算法的应用使语音识别、图像识别技术取得突破性进展,围绕语音、图像、机器人、自动驾驶等人工智能技术的创新创业大量涌现,人工智能迅速进入发展热潮。
不同模型、策略、算法的组合不断推动人工智能发展,可分为三个阶段:计算智能、感知智能和认知智能。
-
第一阶段的计算智能指快速计算和记忆存储,如机器人战胜围棋大师,靠的是超强的记忆能力和运算速度。人脑的逻辑能力再强,也比不过人工智能每天与自己下数百盘棋,通过强大的计算能力预测十几步后的结果。从这个角度看,人工智能多次战胜世界级围棋选手,足以证明该领域发展的成熟程度。
-
第二阶段的感知智能,即让机器拥有视觉、听觉、触觉等感知能力。自动驾驶汽车就是这方面研究的一个例子,通过传感器使机器能够感知和处理周围环境,从而实现自动驾驶。目前,感知智能技术在语音识别和图像识别领域发展较为成熟,如从事安全领域人脸识别技术的Face++,利用成熟的计算机视觉技术深耕电商、短视频等领域的Yi+,以及能够准确识别和翻译多种语言的科大讯飞等。
-
第三阶段的认知智能旨在让机器拥有自己的认知能力,能够理解和思考。认知智能是目前机器与人类差距最大的领域,因为它不仅涉及逻辑和技术,还涉及心理学、哲学和语言学等学科。
关于
版权与更多 | 延伸阅读
作者所有文章遵循知识共享 署名-非商业性使用-禁止演绎 4.0 国际许可协议,欢迎转载,请尊重版权。
您还可以访问NGTE Books主页,浏览包含知识体系、编程语言、软件工程、模式与架构、Web与大前端、服务端开发实践与工程架构、分布式基础架构、人工智能与深度学习、产品运营与创业等多个类别的书籍列表: