人工智能技术介绍PPT(人工智能概述、围棋、人工智能3.0等)一、背景2019年3月政府工作报告中指出,要促进新兴产业加快发展,深化大数据、人工智能等研发应用,培育新一代信息技术等新兴产业集群壮大数字经济。中国人工智能产业的发展起步较晚,但随着科技、制造等业界巨头公司布局深入,以及众多垂直领域的创业公司不断诞生和成长,中国人工智能产业进入高速发展阶段,目前已基本形成了基础层、技术层和应用层全覆盖的产业链结构,在教育,医疗健康、金融、机器人、商业智能家居和安防等多个领域得到应用。二、现状•经历了60多年的发展之后,人工智能已经开始走出实验室,进入到了产业化阶段。具体表现出以下几个方面的特点:•1、深度学习技术逐渐在各领域开始应用。•深度学习通过构建多隐层模型和海量训练数据,来学习更有用的特征,最终提升分析准确性。深度学习能够通过数据挖掘进行处理,自动学习数据特征,尤其适用于包含少量未标识数据的大数据集;采用层次网络结构进行逐层特征变换,将样本的特征表示变换到一个新的特征空间,从而使分类或预测更加容易。因此,深度学习自2006年由JefferyHinton实证以来,在云计算、大数据和芯片等的支持下,已经成功地从实验室中走出来,开始进入到了商业应用,并在机器视觉、自然语言处理、机器翻译、路径规划等领域取得了令人瞩目的成绩。二、现状•2、新型算法不断探索•在深度学习应用逐步深入的同时,学术界也在继续探索新的算法。一方面,继续深度学习算法的深化和改善研究,如深度强化学习、对抗式生成网络、深度森林、图网络、迁移学习等,以进一步提高深度学习的效率和准确率。另一方面,一些传统的机器学习算法重新受到重视,如贝叶斯网络、知识图谱等。另外,还有一些新的类脑智能算法提出来,将脑科学与思维科学的一些新的成果结合到神经网络算法之中,形成不同于深度学习的神经网络技术路线,如胶囊网络等。二、现状•3、基础数据集建设已经成为基本共识•自从李飞飞等在2009年成功创建ImageNet数据集以来,该数据集就已经成为了业界图形图像深度学习算法的基础数据集,通过举办比赛等方式极大地促进了算法的进步,使得算法分类精度已经达到了95%以上。这也使得一些大型研究机构和企业逐渐认识到了数据的价值,纷纷开始建立自己的数据集,以便进行数据挖掘和提升深度学习模型的准确率。如美国国家标准研究院的Mugshot、谷歌的SVHN、微软的MSCOCO等图像基础数据集,斯坦福大学的SQuAD、卡耐基梅隆大学的Q\/ADataset、Salesforce的WikiText等自然语言数据集以及2000HUB5English、CHiME、TED-LIUM等语音数据集。二、现状•4、新型计算基础设施陆续成为产业界发展目标•由于深度学习对算力有较高的需求,因此相继出现了一些专门的计算框架和平台,如伯克利大学的Caffe、微软的CNTK、Facebook的Torch、亚马逊的MXNet、百度的PaddlePaddle等,尤其是谷歌的TensorFlow能够支持异构设备的分布式计算,其平台API能力已经覆盖了CNN、RNN、LSTM等当前最流行的深度神经网络模型。除了从计算框架软件平台进行研发之外,产业界同时也从硬件方面探索计算能力的提升方法。最为直接的方法就是采用计算能力更强的GPU替代原有的CPU等。此外,谷歌、IBM等一些大型企业在大量采用GPU的同时,也在探索进行符合自身计算环境的芯片研发,从而进一步降低成本、提高效率,因此产生了TPU等性能更加卓越的新型芯片。三、面临的挑战•1、主流技术深度学习还具有较大局限性•一是在有限样本和计算单元的情况下,对复杂函数的表示能力有限,其针对复杂分类问题的泛化能力受限。•二是通过深度学习是一种基于概率统计的算法,机器系统学习到的是大概率内容,不是知识,无法像人类一样进行举一反三的应用。•三是深度学习存在黑箱问题,不能解释其自身做出决策的原因。三、面临的挑战•2、基础数据积累还远远不能满足模型训练需要•由于大数据技术的出现和使用时间还不长,各类基础数据不论从数量上还是从质量上来看,都尚需要较长时间的积累。一方面,某些关键领域和学术数据集还严重不足。另一方面,已有规模化的基础数据集不仅数据质量良莠不齐,而且基本...