人工智能技术介绍 人工智能AI发展分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

验证集
预测目标
输出
预测目标 预测目标
评 价
改 进
特征提取
原始样本集
样本数据 样本数据 样本数据
统计分析
特征样本集 特征1 … … … n n n
目标 目标
特 征 提 取
变换 特征运算
特征1 特征1
目标
特征选取是成败的关键
人脑识别图像的过程
• 人脑是通过分级的、多层网络模型来识别 • 减少数据量,保留物体的有用信息
终正
结在
工业1.0 创造了机器工厂的 “蒸汽时代”
工业2.0 将人类带入分工明 确、大批量生产的 流水线模式和“电 气时代”
工业3.0 应用电子信息技术, 进一步提高生产自 动化水平
工业4.0 开始应用信息物理 融合系统(CPS)
复 杂 度
信息物联系统 蒸汽机
电力广泛应用
自动化、信息化
18世纪末
20世纪初
1970年代初
今天
时间
AI将催生“无用阶层”吗?
• 人工/脑力劳动:翻译、记者...
• 人工/体力劳动:保安、保姆...
什么是人工智能(AI)?
人工智能:国家战略(2017年政府工作报告)
• 全面实施战略性新兴产业发展规划,加快人工智能 等技术的研发和转化,做大做强产业集群 • 把发展智能制造作为主攻方向,推进国家智能制造 示范区、制造业创新中心建设
深度学习的神经网络训练方法
C1层:
输入图片大小: 32*32 卷积窗大小: 5*5
卷积窗种类:
6
(32-5+1) [(28*28)*6)]
LeNet-5:卷积神经网络手写数字识别的 应用
卷积过程包括:用一个可训练的滤波器fx去卷 积一个输入的图像,然后加一个偏置bx,得到 卷积Βιβλιοθήκη BaiduCx。 子采样过程包括:每邻域四个像素求和变为 一个像素,加权再增加偏置,通过一个激活函 数,产生一个缩小四倍的特征映射图
• 在著名的ImageNet问题上将错误率从26 %降低到了15%,并且输入没有用到其 他任何人工特征,仅仅是图像的像素
强化学习
类似人类与环境交互的方式,智能系 统从环境到行为映射的学习,以使奖 励信号函数值最大。环境对产生动作 的好坏通过奖励信号作评价,而不是 告诉强化学习系统如何去产生正确的 动作。强化学习不能立即得到标记, 而只能得到一个反馈,因此可以说强 化学习是一种具有“延迟标记信息” 的监督学习 典型案例:AlphaGo
人工智能相关技术介绍
目录 content
第一节
第二节 第三节 人工智能概述 深度学习与智能围棋 人工智能3.0
第一节
人工智能的新革命
• 人工智能简述 • 深度学习算法 • 知识图谱
人工智能将引领人类第四次工业革命 – 智能化
互联网时代
• 人工智能 • 机器人
来悄
临悄
• 交通工具(即无人机、无人驾驶等) • VR(虚拟现实)
• 神经网络的学习过程就是神经网络参数的设定过程 • 一个神经元网络结构确定之后,需要对一系列参数(权重、阈值等)进行有效的设定。这个过 程叫做学习或训练过程,此时的方法叫学习算法
深度学习的训练方法
监督学习
通过已有的训练样本(即已知数据以 及其对应的输出)训练得到一个最优 模型(这个模型属于某个函数的集合, 最优则表示在某个评价准则下是最佳 的),再利用这个模型将所有的输入 映射为相应的输出,对输出进行简单 的判断从而实现分类的目的,从而也 就具有了对未知数据进行分类的能力
神经网络第二个高潮 NP(non-deterministic polynomial-time)难题 中获重大进展 助力大 量现实问题
基于符号知识表示 通过演绎推理技术
人工智能的三个研究阶段 1950s
推理期 1970s
知识期 1980s
机器学习期 90s中期 2017
深度学习算法简介:机器学习
用数据优化 计算机程序 的模型参数
有关学科 教学、科学和 工程辅助
图论
博弈
AI的几大门派
模拟人的心智 模拟脑的结构 模拟人的行为
进化学派 类推学派 贝叶斯学派 符号学派 联结学派 行为学派
感知
知识表示 神经网络 机器人
深度学习
聪明的AI
有学识的AI
识别 判断
思考 语言 推理
知识图谱
AI生态逐步形成:基础资源+技术+应用
人工智能产业生态的三层基本架构
• 对效果影响极大 • 手动化特征工程 • 非常耗时
低层信息
预处理
特征提取
识别分类
图像识别的一般流程
深度学习算法简介:数学基础
经过算法预测的结果是一个连续的值, 我们称这样的问题为回归问题。 算法能够学会如何将数据分类到不同的类 里,我们称这样的问题为分类问题。
第一个模型是一个线性模型,低度拟合,不能很好地适应训练集;第三个模型是一个四次方的 模型,过度拟合,虽然能非常好地适应我们的训练集,但在新输入变量进行预测时可能会效果 不好;中间的模型似乎最合适
脑容量:历史上的“尼安德特人”和我们 的祖先脑容量是一样的。但后来尼安德特 人就没留下来,只有我们这一支留下来了
AI学科结构
计算原理 算法分析 自动程序设计 逻辑 数学 逻辑学 图示学 自动定理证明 运筹学 启发式 搜索 系统程序设计 心理学 图示学 认识论 心理学 机器视觉 知识的模型化 和表示 计算机语言 AI系统 和语言 系统程序设计 信息处理心理学 心理学 基本方法和技术 逻辑 近期主要应用领域 光学 自然语言系统 心理学 符号操作 管理科学 现代控制理论 逻辑 近期主要应用领域 常识性推理演 绎、问题求解 语言学 控 制 理 论 模式识别 声学 语音学 控制理论 空间研究 机器人 工业自动化
知识和创新是推动人类发展的动力
基因:人和大猩猩的基因,有98.4%都是完 全一样的,只有1.6%有区别
“符号语言”(口头语言和书面文
字):传递、保存、共享知识
“集体知识”:人类的大脑可以相互
共享信息,交换知识
人类个体比其他动物没有多大优势,掌握 了符号语言,人类社会的结构发生了突变, 有了一个连接在一起的集体大脑。这种物 种之间相互关联、相互作用的方式,才是 我们和其他物种的真正区别
深度学习算法简介:感知器
• 是一个由线性阈值元件组成的单层(或多层)神经元的神经网络
• 当输入的加权和大于或等于阈值时,输出为1,否则为0 • 模型假定神经元中间的耦合程度(即加权系数W)可变,这样,该模型可以学习
• 当感知器用于两类模式的分类时,相当于在高维样本空间中,用一个超平面将两类样本分开
人工智能有那些类型?
• 弱人工智能,包含基础的、特定场景下角色型的任 务,如Siri等聊天机器人和AlphaGo等下棋机器人;
• 通用人工智能,包含人类水平的任务,涉及机器的 持续学习; • 强人工智能,指比人类更聪明的机器;
人工智能发展历程
AI的诞生
1956达特矛斯 会议,“人工智 能”正式诞生 搜索式推理 聊天机器人 专家系统 知识工程 五代机 神经网络重生 摩尔定律 统计机器学习 AI广泛应用 深度学习
机器学习&深度学习
• 从以“推理”为重点到以“知识”为重点,再 到以“学习”为重点 • 机器可以自动“学习”的算法,即从数据中自 动分析获得规律,并利用规律对未知数据进行 预测的算法。目前,机器学习=“分类” • 人工智能 > 机器学习 > 深度学习
统计学的研究成果经由机器学习 研究,形成有效的学习算法 统计学习登场并占据主流,支 持向量机、核方法为代表性技术 神经网络以深度学 习之名再次崛起 大幅提升感知智能 准确率
机器学习实施过程
原始样本集 样本数据 样本数据 样本数据 训练集 特征1 特征1 特征1 … … … 验证集 n n n
目标 目标 目标
特 征 提 取
特征样本集 特征1 特征1 特征1 … … … n n n
目标 目标 目标
预 处 理
训练
特征1
特征1 特征1
… … …
n n n
目标 目标
目标
预测
机 器 学 习 算 法
提出支持向量、VC维等概念 神经网络 第一个高潮期 联结学派对大脑进行逆向分析 灵感来自于神经科学和物理学 产生的是“黑箱”模型 神经 网络可归置此类
符号学派将学习看作逆向演绎 并从哲 学、心理学、逻辑学中寻求洞见 代表 包括决策树和基于逻辑的学习 基于符号知识表示 通过 获取和利用领域知识 建 立专家系统
LeNet-5
• Yann Lecun,1989年用美 国邮政系统提供的近万个 手写数字的样本来训练神 经网络系统,在独立的测 试样本中,错误率只有5%
• 进一步运用CNN,开发出 LeNet-5用于读取银行支票 上的手写数字,这个支票 识别系统在九十年代末占 据了美国接近20%的市场
基础资源支 撑
基础资源层:主要是计 算平台和数据中心,属于 计算智能; 技术层:通过机器学习 建模,开发面向不同领域 的算法和技术,包含感知 智能和认知智能; 应用层:主要实现人工 智能在不同场景下的应用。
人工智能系统的技术架构
智能终端
智能云平台
第一节
人工智能的新革命
• 人工智能简述 • 深度学习算法 • 知识图谱
乐观思潮
人工智能
孕育期
电子计算机 机
器翻译与NLP 图灵测试 计算 机下棋 早期神
1956
1974
1980
1987
1993
2006
2016
所有的AI程序 都只是“玩具” 运算能力 计算复杂性 常识与推理
未达预期
大数据 计算能力
削减投入
应用增多
经网络
手机中的AI
AI处于什么阶段?
• 人工智能相关技术刚刚越过曲线高峰(处于狂热期),是推动透明化身临其境体验技术发展的 主要动力
通过经验自 动改进的计 算机算法
• 机器学习的基本定理 模型的出错率 ∝ 推论: 模型复杂-》大样本 样本小-》简化模型
x
F ( x)
y

Class label (Classification) Vector (Estimation)
• 深度学习是使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法 • 深度学习是一种基于对数据进行表征学习的方法。观测值(例如一幅图像)可以使用多种方式来表 示,如每个像素强度值的向量,或者更抽象地表示成一系列边、特定形状的区域等。而使用某些特 定的表示方法更容易从实例中学习任务(例如,人脸识别或面部表情识别)。深度学习的好处是用 非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征
2006年,Geoffrey Hinton在《科学》上发 表论文提出深度学习主要观点:
• 多隐层的人工神经网络具有优异的特征 学习能力,学习得到的特征对数据有更 本质的刻画,从而有利于可视化或分类
• 深度神经网络在训练上的难度,可以通 过“逐层初始化”(layer-wise pretraining)来有效克服,逐层初始化可 通过无监督学习实现的
什么是人工智能?
• 人工智能(Artificial Intelligence),英文缩写 为AI。它是研究、开发用于模拟、延伸和扩展人的 智能的理论、方法、技术及应用系统的一门新的技 术科学。 • 它企图了解智能的实质,并生产出一种新的能以人 类智能相似的方式做出反应的智能机器,该领域的 研究包括机器人、语言识别、图像识别、自然语言 处理和专家系统等。 • 人工智能是对人的意识、思维的信息过程的模拟。 人工智能不是人的智能,但能像人那样思考、也可 能超过人的智能。
• 涉及透明化身临其境体验的人本技术(如智能工作空间、互联家庭、增强现实、虚拟现实、脑 机接口)是拉动另外两大趋势的前沿技术 • 数字平台在曲线上处于快速上升期,其中的量子计算和区块链将在今后5—10年带来变革性的 影响
AI Roadmap
国人为什么要关注AI?
为什么人类能成为地球的主宰?
《时间地图:大历史导论》
输出特征图数量:6 输出特征图大小:28*28 神经元数量: 4707
连接数:
可训练参数:
12304 [(5*5+1)*6]*(28*28)
156 [(5*5+1)*6]
局部感受 - 卷积
Feature Map
池化
• 原理:根据图像局部相关的原理,图像某个邻域 内只需要一个像素点就能表达整个区域的信息 • 常见的方法: 最大值池化(max-pooling) L2池化(L2 pooling) 均值池化(Mean Pooling)
迁移学习
各种神经网络类型
Logistic RBM Auto Encoder Sparse Coding Convolutional(卷积)
将从拥有大数据的源领域上学习到的 东西应用到仅有小数据的目标领域上 去,实现个性化迁移,即举一反三、 触类旁通。
典型案例:斯坦福学者使用卫星图像 获取的灯光信息来分析非洲大陆的贫 穷情况
相关文档
最新文档