首页 > 科技 > 人工智能七十载

人工智能七十载

孔祥宇 无往



科技创新是现代社会最本质的周期


整个人类文明史,就其经济本质而言,就是一部生产力发展史。大航海时代的船帆猎猎之声犹在耳畔,滚滚的蒸汽已挟裹着煤铁激荡起机器时代的大潮。蒸汽机车的悠长笛声仍未远去,大西洋的上空已悄然弥散着永不消逝的电波。伴随着科学技术的持续进步,人类自身的边界被不断延拓,文明的面貌被不断重写,个人的生活方式乃至社会的存在结构发生了深刻的变革,超过了任何可能的预言。经济的运行不可能脱离社会的演进,社会的演进受制于生产力的发展,生产力的变革服从于科学技术的进步。基于康德拉季耶夫与熊彼得对周期的洞见,我们可以大胆断言:科技才是现代社会最本质的周期。历经过往两百年数次变革浮沉,最近一次移动互联网的大潮也渐渐步入尾声,下一股增量动能将会于何处迸发?


每一次技术的兴衰,基本上都遵循着如下的范式:基础科学创新-应用技术创新-商业模式创新,每轮周期四十年左右。在过去的两个世纪中,我们次第经历了蒸汽革命、电气革命、信息革命。除了蒸汽革命直接从应用技术创新开始外,电气革命与信息革命都离不开基础科学的进步。这样的结论在强调重视基础科学之外,同样暗示了一种分析范式,使我们可以通过观察某一项技术所处在的节点来判断其未来的发展可能。


行业三落三起,深度学习大放异彩


回顾信息革命,早在上世纪四十年代,图灵便提出了图灵机与可计算理论,作为现代计算机的理论基石;在应用上,自DARPA出于军事用途研发TCP/IP这一互联网的基础协议,到互联网时代的盛放,也历经了二十余年的蛰伏。

人工智能不外如是。在过去的七十年中,人工智能行业三落三起,经历符号主义下的推理系统与专家系统时代,转向至连接主义下的机器学习时代,最终开枝散叶为如今的密林。1956年,达特茅斯会议第一次提出“人工智能”。纽厄尔和西蒙展示了他们的程序:“逻辑理论家”可以独立证明出《数学原理》第二章的38条定理;到了1963年,该程序已能证明该章的全部52条定理。阿瑟•萨缪尔(Arthur Samuel)研制了一个跳棋程序,该程序具有自学习功能,可以从比赛中不断总结经验提高棋艺。1965年,机器定理证明领域遇到了瓶颈,计算机推了数十万步也无法证明两个连续函数之和仍是连续函数。萨缪尔的跳棋程序也不再神气,它停留在了州冠军的层次,无法进一步战胜世界冠军。费根鲍姆认为,传统的人工智能之所以会陷入僵局,就是因为他们过于强调通用求解方法的作用,而忽略了具体的知识。于是研究转向赋予计算机知识,又名知识工程。1968年,第一个成功的专家系统DENDRAL问世,它可以根据质谱仪的数据推知物质的分子结构。然而,好景不长,在专家系统、知识工程获得大量的实践经验之后,弊端开始逐渐显现了出来,这就是知识获取。在专家系统模式下,需要由人将知识总结为计算机能理解的规则,再输入给计算机。面对更复杂的问题时,该方法显然难以胜任。且专家系统无法进行自发的知识获取。在这时,机器学习方法登上历史舞台。通过设计适当的算法,可以让计算机系统自行学习,这样就在一定程度上解决了知识获取的问题。而深度学习方法大大扩展了机器学习的能力,成为近年来最为火热的概念。

算力提升与大数据是核心驱动力


上述转型与发展的核心驱动力之一在于计算机算力的大幅提升与数据量的扩大。实际上,近年来大热的卷积神经网络算法,第一次出现于1987年Alexander Waibel等解决语音识别问题的论文;现代神经网络训练的根基——反向传播算法更是于上世纪70年代便被提出。但受限于当时计算机处理能力,神经网络方法没能得到工业化应用。当时更为受业界青睐的是以决策树等为代表的对计算资源要求更小的方法,1997年击败国际象棋世界冠军的超级计算机深蓝便是其中翘楚。近年来,受益于超大规模集成电路、分布式计算等技术的发展,计算机性能有了巨大的提高,同时,基于GPU训练神经网络(2005)与张量处理器TPU等技术的发展,训练神经网络的成本快速降低至业界可接受的水平,机器学习时代的帷幕方此拉开。

行业发展仍处于技术应用阶段中后期

回顾这些历史,是为了更好地判断人工智能行业所处在的发展阶段。总体而言,近年来兴起的机器学习热潮在思想和理论上并未显著超越上世纪八十年代中后期关于神经网络的基础研究,但受益于运算能力与数据规模的扩张,在应用技术层面上获得了长足的进步,并逐渐渗透进各个领域。就目前而言,商业模式创新仍在探索。因此,根据我们的三阶段模型,当前以机器学习方法为代表的人工智能行业仍处在第二阶段中后期,乐观情况下后续仍有约十到二十年的发展窗口期。

必须强调的是,本轮人工智能行业的繁荣应当称为“以机器学习方法为代表的人工智能行业的发展”,正如历史告诉我们的,围绕如何实现人工智能这一问题,学界有诸多的推想与理论,其中机器学习是近二十年来最具有产业化可能与前景的方案。但这并不意味着机器学习是唯一方案,也并不意味着真正像人类一样的智能体会由此诞生。要想理解这个论断,我们需要回到“什么是人工智能”以及“怎样实现人工智能”这两个最基本的问题上来。

人类对自身智能的复刻与延展

什么是人工智能?我们将之理解为人类对自身能力的复刻与延展在智能上的体现。古往今来,人类诸多的探索活动都绕不开对自身能力的复刻与延展,譬如自动化机器是对人类制造能力的复刻、飞机汽车是对人类行动能力的延展。就现阶段而言,可以给人工智能下定义为:“通过计算机实现甚至超越人的头脑思维所产生的效果,是对能够从环境中获取感知并执行行动的智能体的描述和构建”。人工智能复刻或延展了人类的感知、判断、推理、决策、情感等功能。将上述功能归纳为三个层面:一是运算智能,即快速计算和记忆存储能力,这也是被认为人工智能相较于人类最具优势之处。二是感知智能,即视觉、听觉、触觉等感知能力,并进行一定简单的判断,自动驾驶汽车,就是通过激光雷达等感知设备和AI算法实现这样的感知智能。三是认知智能,通俗讲是能理解会思考,以实现概念、意识、观念、文化、情感等人类智能特有表现为目的。从对上述智能的实现程度进行区分,可以将人工智能分为两个等级:弱人工智能和强人工智能。弱人工智能,又称专用人工智能,即在特定的领域或任务中实现与人类近似甚至有所超越的工作效能,如智能驾驶、图像语音识别等;强人工智能,或通用人工智能,是指具备与人类同等智慧、能表现正常人类所具有的所有智能行为的智能。我们目前所发展的人工智能技术,多集中于前者,而对通用人工智能的研究仍处于起步阶段。

算法、算力、数据构成AI三大基石

之前已经提到,在现阶段我们主要通过机器学习方法,特别是深度学习,实现上述专用人工智能。机器学习的基本过程是给学习算法提供训练数据。然后,学习算法基于数据的推论生成一组新的规则。这本质上就是生成一种新的算法,称之为机器学习模型。通过使用不同的训练数据,相同的学习算法可以生成不同的模型。从数据中推理出新的指令是机器学习的核心优势。它还突出了数据的关键作用:用于训练算法的可用数据越多,算法学习到的就越多。容易看出,数据、算法与实现算法的硬件构成了机器学习的三大基石。下面我将分别从这三个角度对机器学习方法进行更深入的阐述。

机器学习算法纷繁多样

首先是算法层面。按照不同的场景分类,主要可分为有监督学习、无监督学习、半监督学习、强化学习和迁移学习等。监督学习指需要给学习算法提供标记的数据和所需的输出,对于每一个输入,学习者都被提供了一个回应的目标。监督学习主要被应用于快速高效地教熟AI现有的知识,被用于解决分类和回归的问题。常见算法有线性回归、K近邻、决策树、支持向量机、朴素贝叶斯与神经网络等。无监督学习指给学习算法提供的数据是未标记的,并且要求算法识别输入数据中的模式,主要是建立一个模型,用其试着对输入的数据进行解释,并用于下次输入。现实情况下往往很多数据集都有大量的未标记样本,有标记的样本反而比较少。如果直接弃用,很大程度上会导致模型精度低。这种情况解决的思路往往是结合有标记的样本,通过估计的方法把未标记样本变为伪的有标记样本,所以无监督学习比监督学习更难掌握。主要用于解决聚类和降维问题,常见的算法有K-means、期望最大、AP聚类、主成分分析、LLE等,近年来备受吹捧的GAN生成式对抗网络也属于无监督学习。强化学习指算法与动态环境相互作用,把环境的反馈作为输入,通过学习选择能达到其目标的最优动作。我们所听闻的会打Dota的AI正是基于强化学习算法。迁移学习则解决了如何将学习到知识从一个场景迁移到另一个场景的问题。以图像识别为例,从白天到晚上,从冬天到夏天,从识别中国人到识别外国人…当我们所关注的场景缺少足够的数据来完成训练,在这种情况下需要通过迁移学习来实现模型本身的泛化能力。

上图展现了各场景与相关适用算法。其中神经网络类算法在各个场景下都有所运用,涌现了包括CNN、RNN、DNN、DBN、GAN等一批大家所耳熟能详的算法。神经网络的结构如下图所示,包括了输入层、隐藏层、输出层。每一层由若干个神经元构成。深度学习其实就是隐藏层数目更多的神经网络算法,因为隐藏层更多,所以泛化表示能力越强。训练时,主要依托反向传播算法,逐步优化各个神经元的参数。可以看到整个神经网络中的节点数目相当庞大,因此神经网络方法对于数据和算力的要求尤为高。

算法壁垒仍然高企,开源降低入门门槛

机器学习算法如此纷繁复杂,正是因为我们目前仍未找到一个通用方案来解决所有的问题,因而我们需要针对不同的场景作出不同的调整、设计不同的算法。算法与人才依然是人工智能行业较高的技术门槛。一方面,新算法的提出有赖于该行业中最顶尖的头脑,而任何行业的顶尖人才都属稀缺品;另一方面,针对特定场景恰当地使用、优化算法同样需要高层次的人才。可以说,对于前沿算法的突破创新以及算法在不同环境中的优化升级,不同公司的技术差异仍然很大。同样由于算法实现的复杂性,工业界和学术界推出了各种用于机器学习模型训练的开源工具和框架,包括Caffe, Theano, Torch, Tensorflow等等,这些开源环境和框架大幅降低了该领域的入门技术门槛。而对于推出这些框架的企业或组织来说,他们则在某种意义上获得了标准制定者的地位。如TensorFlow由Google推出,Torch由Facebook等企业支持,框架背后体现的其实是企业或组织的业界实力与地位。遗憾的是,中国企业在上述标准制定,或者说话语权的争夺中,似乎仍是有些缺席。

各类半导体元件适配不同场景

其次是硬件层面。之前我们已经提到机器学习方法分为训练和使用两个阶段,神经网络方法训练时主要依靠反向传播算法和前向传播算法,使用时主要依托前向传播算法。这两种算法都包含大量的矩阵运算和梯度运算,因而对硬件要求很高。根据不同场景,我们主要关注硬件的计算性能、功耗、通用性、灵活性、成本四个方面的问题。传统的CPU在矩阵运算或者说并行运算上速度较慢,在很多场景下都难以胜任。GPU依托其强大的并行计算能力成为训练神经网络的趁手武器,但整体功耗较大且单位成本高。FPGA(现场可编程阵列门)则灵活性非常高,且功耗低。ASIC(特殊用途集成电路)则以其高性能、低功耗著称,但其设计开发周期长、研发成本高、且设计完成后一般只能用于某些特定用途。下表展示了各类半导体优缺点。

一般而言神经网络训练过程比使用中推理过程的计算量更大,因此可以将训练过程和使用过程分离,由云端负责训练进行而边缘设备负责推理,推理所需要的参数可由云端训练完毕后下载至边缘设备更新。这是一个双赢的方案:对用户而言,可以提高算法效果、保护数据隐私,对厂家而言,可以提高后端效率和整体分析质两、实现复杂算法、简化错误排查流程等。这种趋势将进一步激发边缘设备IC需求,如手机端载TPU芯片、自动驾驶车载电脑芯片等等,ASIC和GPU将受此助益。

海量数据为AI提供支撑

然后是数据层面。近年来,得益于互联网和物联网的发展,可获得的数据量激增,为深度学习算法提供了海量的数据支撑。以影像数据为例,据Cisco评估,2021年单月上传至全球网络的视频总时长将超过500万年。而嵌入式感知系统的蓬勃发展,如各类物联网设备的广泛应用,也提供了曾经难以获得的结构化数据。这些都有利于行业的进一步发展。

人们对现阶段的人工智能的调侃:“有多少人工就有多少智能”,指出的主要矛盾也是在于数据。由于算法本身的特性,有监督的深度学习算法需要海量有标注的数据以供训练。以语音识别场景为例,需要对众多语音片段进行文字转写,而这都需要人工进行。业界领先的公司一般都会有数百人的标注团队(多为外包,但需要专业培训和实时指导)。需要注意的是,并非所有类型的数据都容易标注,例如医疗影像数据需要专业医师标注病灶。可以说,数据的获得与处理也构成了该行业的重要门槛。

AI+百花齐放,深度学习为各个行业赋能

探讨完算法、算力、数据这三大人工智能行业基础设施,我们终于可以将目光投向应用层。有人认为,当前人工智能在某种意义上和模式识别是同义词,这不无道理。应用人工智能算法,可以在各个领域快速实现性能优异的模式识别,计算机视觉、语音识别与合成、自然语言处理等常见的应用场景都都属于此列。而将这些应用置于更加细分的领域,就是我们如今所见蔚为大观的“AI+”了。在金融领域,可以通过人工智能与多维度大数据实现智能风控。在公共安全领域,可以通过生物特征识别与大数据增加公安预测和决策能力。在教育领域,可以通过人工智能实现拍照搜题、口语评测、作文批改等多种功能,实现更加个性化、高效化的学习环境。在医疗领域,可以通过人工智能实现辅助诊断,减少医生重复性工作,助力专家学者攻克医疗难关,改善医疗资源分布不均的问题。在工业制造领域,人工智能可以通过智能设备健康管理、智能质检、智能参数优化等助力优化生产制造、缩减人工成本。在零售领域,通过数据与商业逻辑结合、先进感知技术的成熟应用,人工智能可以切实提升零售全链条资产配置效率,助力企业精细化运营。在交通出行领域,人工智能可以通过交通信号灯智能配对、车辆智能调度等改善交通问题,实现智能化交通。AI作为一种通用的解决方案,赋予了各个行业解决复杂模式识别问题的能力。

但值得强调的是,对“AI+行业”而言,加号后面的内容同样重要。AI只是赋能的工具,而具体到行业问题解决方案时,也离不开对行业的深刻理解。我们相信,未来在应用层能真正有所作为的公司,一定是既具备领先技术实力、又拥有深刻行业洞见的企业。

反思与未来

如同报告开篇所提,我们将人工智能理解为人类对自身智能的复刻与延展。这种复刻与延展是否会对人类本身产生巨大影响?答案是肯定的。我们不妨从生产函数的视角来理解这个问题,观察Y=Af(K,L),作为人的智能的复刻,人工智能将不可逆转地补充、替代部分劳动力(L),而作为智能的延展,其赋能的本质又或将推动全要素生产率(A)的提高。人们也许会忧虑上述替代过程可能造成的失业,但我们认为,虽然替代效应不可避免,但从长期来看,技术革命也会促进创新,将人们从重复的劳动中解放,转而进行更具创造力的活动,使人们能追求更自由的工作与生活方式。另外,人工智能作为对于劳动力的部分替代也能在某种程度上缓解世界人口增长减速的冲击,提高社会的整体福利。综上所述,从微观层面来看,人工智能将部分替代传统劳动,带来新的生产方式,以提升生产效率并降低成本,进而实现企业效益提升、改善人们的工作与生活。从宏观层面来说,人工智能将大幅改善依赖劳动创造的劳动密集型、简单重复性的传统经济运行模式,并依托此经济模式构建万物互联、智能协同的产业体系,打造智能经济与智能社会。

子在川上曰:“逝者如斯夫,不舍昼夜”,历史裹挟着每一个个体或主动或被动地向前。面对大潮,拥抱,或许是最好的姿态。


本文来自投稿,不代表本人立场,如若转载,请注明出处:http://www.souzhinan.com/kj/254679.html