信息技术与人工智能
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信息技术与人工智能
□文/特约撰稿原野
人工智能正主导着全球企业的创
新一一无论是大型企业集团还是初创企
业。2018年中国AI 市场规模约48.5亿 美元,预计,中国人工智能的市场规模
足够使其成为下一轮科技创新红利的主
导力量。专家预测,至2025年全球人工
智能市场规模预计将增兵至1694.11亿
美元,复合年增长率达到55.6%o
真的来了,这将是最好的年代,也
将是最坏的年代,取决于你有没有更早
—步认识人工智能。
人工智能的发展回望
从1946年第一台计算机ENIAC 诞
生起,人类就梦想,计算机有一天拥有
智能甚至超越人类智能。在遭遇几次寒
冬后,人工智能在过去20年里慢慢复苏, 最近几年更是迎来鼎盛时期,正成为计 算机科学研究的最前沿。
1956年,在美国达特茅斯学院,约 翰•麦卡锡(1971年度图灵奖获得者)、 马文•李•闵斯基(1969年度图灵奖获
-19
•
得者)、克劳德•艾尔伍德•香农(信息理论之父)、纳撒尼尔•罗彻斯特(IBM 第一代通用计算机701主设计师)四位学者在美国达特茅斯发起举行“人工智能夏季研讨会”,指出“人工智能”研究目标是实现能模拟人类的机器,该机器能使用语言,具有概念抽象和理解能力,能够完成人类才能完成的任务并不断提高机器自身。
“人工智能”这一概念提出后,迅速发展成为一门广受关注的交叉和前沿学科,沿着“从符号主义走向联接主义”和“从逻辑走向知识'两个方向蓬勃发展,在象棋博弈、机器证明和专家系统等方面取得了丰富成果。在经历如上图曲线示意图显示的两次发展低谷期后,随着2006年科学家Hinton提出的深度学习模式,人工智能在近年获得良好的发展势头,尤其在图像识别和语音识别领域达到超越人的效果。特别是随着互联网的普及、传感网的渗透、大数据的涌现、信息社区的崛起,数据和信息在入类社会、物理空间和信息空间之间的交叉融合与相互作用,大众创业和万众创新等新技术、新产业和新业态不断涌现,使得对人工智能基本理论和方法的研究开始出现新的变化,这些变化也使得人工智能新的应用呈现勃勃生机。
从发展历史来看,形象地说,人工智能先后下赢了三盘棋,分别是跳棋、国际象棋和围棋,每一盘棋战胜人类棋手就代表人工智能迎来-次新发展机会。围棋场上出现的基于深度学习的AlphaGo(俗称“阿尔法狗”)就是人工智能近年来给人们带来震撼的产品。本轮人工智能腾飞受益于持续提升的AI算力对神经网络算法(仿生脑科学)的优化。
人工智能的重大突破是基于仿生脑科学
从生理学研究成果来看人工智能的理论基础,可以认为人工智能近年来在深度学习上获得良好发展是仿生学的成功案例。
1981年的诺贝尔医学奖,颁发给T David Hubei(出生于加拿大的美国神经生物学家)和Torsten Wiesel,以及Roger Sperry o前两位的主要贡献,是"发现了视觉系统的信息处理”:可视皮层是分级的。
人/:科能il:匸孑看仝球企业的创新—一无论是k蹙企业集团还是初创企业。2018年屮国A1市场规模约48.5亿屁,预计,中国人匕押能的巾场规模足够使冀成为卜••轮科技创新红利的I:导力伉匕家侦测.C2025年全球人V.秤能山场规模预计将增性金1694.11亿羌心复介年増长率达到55.6%。
1958年,DavidHubel和Torsten Wiesel在JohnHopkins University,利用实验猫来研究瞳孔区域与大脑皮层神经元的对应关系。经历了很多天反复的枯燥的试验,David Hubei和Torsten Wiesel发现了-种被称为“方向选择性细胞(Orientation Selective Cell)"的神经元细胞。当猫瞳孔发现了眼前的物体的边缘,而且这个边缘指向某个方向时,这种神经元细胞就会活跃。这个发现激发了人们对于神经系统的进一步思考。神经一中枢一大脑的工作过程,或许是一个不断迭代、不断抽象的过程。
人的视觉系统的信息处理是分级的。从低级的VI区提取边缘特征,再到V2区的形状或者目标的部分等,再到更高层,整个目标、目标的行为等。也就是说高层的特征是低层特征的组合,从低层到高层的特征表示越来越抽象,越来越能表现语义或者意图。而抽象层面越咼,存在的可能猜测就越少,就越利f"分类。
人工智能的深度学习仿照了哺乳动物猫的视觉类感知功能的神经细胞网络结构,从而近年来在图形识别等领域达到了令人满意的效果。
•20•
围棋之后的星际争霸竞技
2016年3月,DeepMind的团队通过AlphaGo击败世界围棋顶级棋手李世石,而如今该团队设计的新的AlphaStar 同样击败了《星际争霸2》的职业选手。2019年1月25日,DeepMind的Al AlphaStar首次亮相。DeepMind公布了其录制的AI在《星际争霸2>中与两位职业选手的比赛过程,AlphaStar 分别以5:0的成绩战胜了两位职业选手TLO和MaNa先生。而在直播节目里,AlphaStar以10:1的战绩,全面击溃了人类职业高手。唯一失利的那场,DeepMind团队限制了AlphaStar的游戏视角,并在没有测试的前提下与MANA 先生进行比赛,这才让人类终于赢了一场。
AlphaStar学会打星际,全靠深度神经网络,这个网络从原始游戏界面接收数据(输入),然后输岀一系列指令,组成游戏中的某一个动作。神经网络结构对星际里的那些单位,应用一个Transformer,再结合一个深度LSTM核心,一个自动回归策略(在头部),以及一个集中值基线(Centralised Value Baseline)。团队会使用一个称为"Alpha League"的方法。在这个方法中,Alpha League的第一个竞争对手就是从人类数据中训练出来的神经网络,然后进行一次又一次的迭代,产生新的agent和分支,用以壮大"Alpha League"o
然后,这些agent通过强化学习过程与“Alpha League”中的其他竞争对手进行比赛,以便尽可能有效地击败所有这些不同的策略,此外,还可以通过调整它们的个人学习目标来鼓励竞争对手朝着特定方式演进,比如说旨在获得特定的奖励。最后,团队在“Alpha League”中选择了最不容易被利用的agent,称之为"the nash of League"o 人工智能在《星际争霸2》上的进步
速度,远远超过了此前外界的预期。毕
竟与下围棋这件事相比,《星际争霸2》要难得多。
与国际象棋或围棋不同,星际玩家
面对的是“不完美信息博弈”。在玩家
做决策之前,围棋棋盘上所有的信息都
能直接看到。而游戏中的“战争迷雾”
却让你无法看到对方的操作、阴影中有
哪些单位。这意味着玩家的规划、决策、
行动,要一段时间后才能看到结果。这
类问题在现实世界中具有重要意义。
为了获胜,玩家必须在宏观战略和
微观操作之间取得平衡。平衡短期和长
期目标并适应意外情况的需要,对脆弱
和缺乏灵活性的系统构成了巨大挑战。
掌握这个问题需要在几个AI研究挑战中取得突破,包括:
博弈论:星际争霸没有单一的最佳策略。因此,AI训练过程需要不断探索和拓展战略知识的前沿。
不完美信息:不像象棋或围棋那样,
棋手什么都看得到,关键信息对星际玩
家来说是隐藏的,必须通过“侦察”来
主动发现。
长期规划:像许多现实世界中的问
题一样,因果关系不是立竿见影的。游
戏可能需要一个小时才能结束,这意味
着游戏早期采取的行动可能在很长一段
时间内都不会有回报。
实时:不同于传统的棋类游戏,星
际争霸玩家必须随着游戏时间的推移不
断地执行动作。
更大的操作空间:必须实时控制数
百个不同的单元和建筑物,从而形成可
能的组合空间。此外,操作是分层的,
可以修改和扩充。
AlphaStar在《星际争霸2》游戏上
战胜人类高手,这意味着,在2019年初AI已经学到长远的布局谋篇的策略能力。像AlphaStar这样所代表的人工智能已经初步具备了很强的泛化能力,假以时日即将作为工业产品在多领域辅助人类更
•21•