人工智能第三次浪潮以及若干认知
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
人工智能第三次浪潮以及若干认知
(来源:科学杂志,2017-06-02)
长期以来,智能一直用来表示大脑思维的能力。智能究竟是什么?这个问题至今没有公认的答案,不断有人试图从本质上给出一个简短而精确的定义。其实,早在60年前,就有一个接受度较高的提法——智能的本质是大脑的信息处理或计算能力。这比思维能力具体了一些,有信息理论和人造的计算机做参照,但仍太笼统,除了思辨没有多大用途。追求智能的简要精确定义可能是个迷思,因为大脑是一个非常复杂的系统,智能是该系统多种属性、功能和外在表现的综合。
大脑智能的外在描述和内在探索
对大脑智能的了解,可以通过对大脑智能外在描述的观察,及对其内在的进一步探索。
大脑智能的外在描述可以从广义和狭义两个角度来讨论。广义上,所有需要经过大脑的信息处理或计算都可以视作智能活动,主要包括心智方面的感知、注意、识别、反应、情绪、推理、理解、觉悟、发现、动机、意图、规划、搜索、评估、决策,以及更为一般的控制和通信活动等。狭义上,常用“智、慧、聪、能”等字描述大脑智能,多指人类大脑独有的、而非人类大脑所不具有的能力。随着时代发展,人们开始发现,过去被认为是“智、慧、聪、能”的能力,人造计算机以及某些动物的大脑也具备。换言之,这种狭义的智能概念是随着人们认识的扩展而不断发展的。
大脑智能的内在探索至少应该包含信息处理和神经科学两个方
面。
信息处理方面,率先探索的是大脑的最基本元件。回顾历史,对这方面存在一系列疑问,比如大脑系统究竟存在几个基本单元?每个单元担任什么样角色?这些基本元件将形成几种不同的基本通路并发挥什么作用?这些通路以怎样的结构形成不同功能的模块,并如何构成系统?更进一步,还想了解在这个系统里信息是如何流动的,有几种机制协调管理这些流动实现各种智能活动等。与由电阻、电容、电感、互补金属氧化物半导体(complementary metal oxide semiconductor,CMOS)等基本元件构成的电路系统相类似,脑信息系统也应该不止有一种元件。从1943年麦卡洛克(W. S. McCulloch)和皮茨(W. Pitts)提出的神经元模型,1959年罗森布拉特(F. Rosenblatt)的感知机,1985年美国加州大学圣迭戈分校的并行分布处理(parallel distributel processing, PDP)团队的多层神经网络,到2006年多伦多大学欣顿(G. Hinton)团队展示深度学习用的受限玻尔兹曼机,他们考虑的都是一种元件,数学上用逻辑斯谛(Logistic)线性模型来近似其多输入单输出的关系。另外,从1960年代初维塞尔(T. Wiesel)和休伯尔(D. H. Hubel)的特征检测理论,到现今深度学习中广为使用的卷积神经网络,采用的是称为S 元(simple cell,简单细胞)和C元(complex cell,复杂细胞)的两种基本单元。
神经科学方面,也有许多问题引起众人关注。例如神经元主要由哪些关键性物质构成?哪些物质调制神经元功能(神经科学称其为调质)?哪些物质作为信息流载体(神经科学称其为递质)?近年来,已被发现的递质和调质有近百种,有待鉴定的可能性更多,可分为胆碱类、单胺类、氨基酸和神经肽。随着时间的推移,还会发现更多种这样的物质。
然而智能的内在探索在上述两个方面的发展存在很大的不平衡,
投入的力量相差悬殊。尽管在关于神经元的结构和物质组成上,已有不少研究发现,但这些成果对弄清智能行为少有帮助。笔者认为应该将两方面的进展联系起来,并思考哪些生化物质对应哪种基本单元,哪些物质支撑信息流动,哪些物质可能影响神经元的生存和能耗,但并不直接起信息处理作用,找到这些问题的答案或许能加深对智能的理解。
近二三十年脑科学的研究进展与人工智能第三次浪潮关系不大,不过,1960年代的特征检测理论和1980年代的多层神经网络对第三次浪潮颇有影响。
智能研究历史回溯
冯·诺依曼结构的计算机诞生后,人们产生了种种期待,觉得计算机像人一样有智能,机器替代人完成各种工作的时代来临了。著名的图灵测试让机器模拟人类智能行为,以此来判别机器是否拥有人工智能。当时的研究兵分两路,一路是人按照特别设计的语言编程,机器通过乔姆斯基(N. Chomsky)形式语法系统和相应的树搜索技术读懂并完成可编程求解的问题或活动;另一路针对那些难以编程的问题,主要是语言理解、机器视觉、知识表示、推理规划等。智能研究的多个分支纷纷出现,并在1950年代掀起第一次研究浪潮。
巴洛(H. B. Barlow)、莱特温(J. Y. Lettvin)、维塞尔和休伯尔关于特征检测器及其理论的研究,开创了计算神经科学。基于麦卡洛克和皮茨神经元模型的罗森布拉特的感知机,既是人工神经网络研究的起始标志,也与统计决策理论、霍夫变换(Hough transform)一起成为模式识别和机器视觉的源头。乔姆斯基形式语法系统影响巨大,不仅是计算机程序编译和符号人工智能的源头,而且还推动心理学派生出计算心理学,令物理符号主义取代了起源于20世纪初的行为主义。
在其后一二十年里,这些分支分别自立门户。符号人工智能的发
展规模最大,形成了知识表示、规则推理、启发搜索的基本体系。但是符号人工智能的知识和规则的获取需要通过人工,然后才是机器进行演绎,整个流程其实是编程求解的“同宗兄弟”,因而有类似的局限。这一期间,人工神经网络的研究则受到符号人工智能中某些大师的错误排挤,发展停滞。
经历了那一段艰苦时期,曙光终于出现。1980年代中期,计算心理学逐步发展为认知科学,在加州大学圣迭戈分校PDP团队的倡导下,建立在人工神经网络模拟大脑神经元及其联结基础上的联结主义活跃起来,其部分主要旗手转而扛起人工神经网络的旗帜,推动神经网络学习在其后十余年间掀起高潮。同时,停滞了20余年的行为主义在萨顿(R. Sutton)等人的推动下,以强化学习(reinforcement learning)为主题,再现活力。另外,模式识别和机器视觉研究也开始沿着多条线发展。一时间,人工智能研究蓬勃发展,春色满园。这一时期可以认为是智能研究的第二次浪潮。我国相应地进行了各种跟踪研究,迎来了第一次浪潮[1]。
1990年代中末期开始,人工神经网络的一些主要研究力量转向推动人工智能发展。先以贝叶斯网络推理为主流,后又将神经网络学习研究进一步推广为研究各种机器学习方法,智能研究的第三波浪潮掀起。此次浪潮带动模式识别与机器视觉方向的研究再度趋热。而集成电路、无线通信、互联网、信息采集、传感控制、物联网等多种技术的积累,尤其海量数据和超级计算能力的提升,为辛顿团队在2006年重新审视深度神经网络创造了条件,他们很快在认识上有了新突破,由此推动人工神经网络急速升温,促进了神经科学、认知科学的繁荣和相互融入。经过60年,智能研究相关各分支再度大整合。AlphaGo 系统进一步成功整合深度学习和强化学习,并让人们再次关注到一甲子以前曾风靡了一甲子的行为主义。
第三次浪潮与前两次浪潮最为不同的是IBM、谷歌等科技巨头的