机器学习-01引言

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

21
最终设计
实验生成器 新问题 假设
执行系统 解答路线 鉴定器
泛化器 训练样例
22
西洋跳棋学习的更多讨论
图1-2 第13章理论上的保证 更复杂的目标函数 其他学习算法
这种学习技术是否确保发现一个非常接近的近似。
最近邻算法,存储训练样例,寻找保存的最接近的情 形来匹配新的情况 遗传算法,产生大量候选的西洋跳棋程序,让它们相 互比赛,保留最成功的程序并进一步用模拟进化的方 式来培育或变异它们 基于解释的学习,分析每次成败的原因
11
选择目标函数(2)
ChooseMove的评价
另一个目标函数V
学习问题很直观地转化成这个函数 这个函数的学习很困难,因为提供给系统的是间接训 练经验 一个评估函数,V: BR,它为任何给定棋局赋予一个 数值评分,给好的棋局赋予较高的评分 优点,学习简单 V的应用
选择目标函数(3)
V的设计,对于集合B中的任意棋局b,V(b)定义如下
如果b是一最终的胜局,那么V(b)=100 如果b是一最终的负局,那么V(b)=-100 如果b是一最终的和局,那么V(b)=0 如果b不是最终棋局,那么V(b)=V(b’),其中b’是从b开 始双方都采取最优对弈后可达到的终局
8
选择训练经验
第一个关键属性,训练经验能否为系统的决策提供 直接或间接的反馈 第二个重要属性,学习器在多大程度上控制样例序 列 第三个重要属性,训练样例的分布能多好地表示实 例分布,通过样例来衡量最终系统的性能
9
选择训练经验(续)
西洋跳棋学习问题
任务T,下西洋跳棋 性能标准P,击败对手的百分比 训练经验E,和自己进行训练对弈
训练过程
从学习器可得到的间接训练经验中导出上面的训练样 例 调整系数wi,最佳拟合这些训练样例
19
选择函数逼近算法(2)
估计训练值
困难处 一个简单的方法,Vtrain(b)=V’(Successor(b))
调整权值
最佳拟合的定义,比如误差平方和最小
E
b ,Vtrain ( b ) training examples
4
学习问题的标准描述
定义
如果一个计算机针对某类任务T的用P衡量的性能根据 经验E来自我完善,那么我们称这个计算机程序在从经 验E中学习,针对某类任务T,它的性能用P来衡量。
西洋跳棋学习问题的解释
任务T:参与比赛 性能标准P:比赛成绩(或赢棋能力,击败对手的百分 比) 经验E:和自己下棋
什么是机器学习
• 什么是机器学习
计算机程序如何随着经验积累自动提高性能 系统自我改进的过程
• 成功应用
学习识别人类讲话 学习驾驶车辆 学习分类新的天文结构 学习对弈西洋双陆棋
2
相关学科
人工智能
学习概念的符号表示 作为搜索问题的机器学习 作为提高问题求解能力的学习 利用先验知识和训练数据来引导学习
选择目标函数的表示
函数的表示
一张大表,对于每个唯一的棋盘状态,表中有唯一的 表项来确定它的状态值 规则集合 二项式函数 人工神经网络
15
选择目标函数的表示(2)
重要的权衡过程
希望选取一个非常有表现力的描述,以最大可能地逼 近理想的目标函数 越有表现力的描述需要越多的训练数据,使程序能从 它表示的多种假设中选择
第2章,基于符号和逻辑表示的概念学习 第3章,决策树 第4章,人工神经网络 第5章,统计和估计理论的基础概念 第6章,贝叶斯理论 第7章,计算学习 第8章,基于实例的学习 第9章,遗传算法 第10章,规则学习 第11章,基于解释的学习 第12章,近似知识与现有数据的结合 第13章,增强学习

Vtrain (b) V '(b)
2
寻找算法,比如最小均方方法,LMS Least Mean Squares
20
LMS权值更新法则
对于每个训练样本<b,Vtrain(b)> 使用当前的权计算V ’(b) 对每个权值wi 进行如下更新
wi wi Vtrain (b) V '(b) xi
6
学习问题的标准描述(3)
定义太广泛
甚至包括了以非常直接的方式通过经验自我提高的计算机程 序
科技型定义
通过经验提高性能的某类程序
目的
定义一类问题 探索解决这类问题的方法 理解学习问题的基本结构和过程
7
设计一个学习系统
基本设计方法和学习途径
(以西洋跳棋为例) 选择训练经验 选择目标函数 选择目标函数的表示 选择函数逼近算法 最终设计
28
小结和补充读物
涉及学科 搜索的观点 相关杂志、会议、国际组织
29
Discussion for introduction
针对下面的学习任务,给出它们的学习系统设计方 案
手写识别学习问题 机器人驾驶学习问题 。。。 (自定义)
30
31
设 计 过 程
V’(b)=w0+w1x1+w2x2+…+w6x6 其中,w0…w6是权值,表示不同棋局特征的相对重要 性
至此,问题转化为学习目标函数中的系数(即权值)
18
选择函数逼近算法
每个训练样例表示成二元对
<b,Vtrain(b)> b是棋盘状态,Vtrain(b)是训练值 比如,<<x1=3,x2=0,x3=1,x4=0,x5=0,x6=0>,100>
26
机器学习的问题
关于选择有效的后验训练经验,什么样的策略最好? 这个策略的选择会如何影响学习问题的复杂性。 怎样把学习任务简化为一个或多个函数逼近问题? 换一种方式,系统该试图学习哪些函数?这个过程 本身能自动化吗? 学习器怎样自动地改变表示法来提高表示和学习目 标函数的能力?
27
全书内容简介
计算复杂性理论
复杂性的理论边界 计算量、训练数据量、错分量
3
相关学科
控制论
为了优化预定目标,学习对各种处理过程进行控制, 学习预测被控过程的下一状态
信息论
熵和信息内容的度量 学习最小描述长度方法
统计学
根据有限数据样本,给定精度时,估计误差 置信区间、统计检验
学习系统需要选择
要学习的知识的确切类型 对于这个目标知识的表示 一种学习机制
10
选择目标函数
目标函数ChooseMove
ChooseMove: BM,接受合法棋局集合中的棋盘状态 作为输入,并从合法走子集合中选择某个走子作为输 出
问题转化
我们把提高任务T的性能P的问题转化(或简化)为学 习像ChooseMove这样某个特定的目标函数
13
选择目标函数(4)
上面设计的缺陷
递归定义 运算效率低 不可操作
简评
学习任务简化成发现一个理想目标函数V的可操作描述 通常要完美地学习这样一个V的可操作的形式是非常困 难的 一般地,我们仅希望学习算法得到近似的目标函数V’, 因此学习目标函数的过程常称为函数逼近
14
16
选择目标函数的表示(3)
简单表示法——对于任何给定的棋盘状态,函数V可 以通过以下棋盘参数的线性组合来计算
x1,黑子的数量 x2,红子的数量 x3,黑王的数量 x4,红王的数量 x5,被红子威胁的黑子数量 x6,被黑子威胁的红子数量
17
选择目标函数的表示(4)
目标函数
5
学习问题的标准描述(2)
手写识别学习问题
机器人驾驶学习问题
任务T: 识别和分类手写文字 性能标准P:分类的正确率 经验E: 已知类别的手写体文字数据库 任务T:通过视觉传感器在四车道高速公路上行使 性能标准P:平均无差错行使里程(差错由人来监督 裁定) 训练经验E:注视人类驾驶时录制的一系列图像和驾驶 指令
24
机器学习的一个观点
一个有效的观点
机器学习问题归结于搜索问题
本书给出了对一些基本表示定义的假设空间的搜索 算法 通过搜索策略和搜索空间的内在结构来刻画学习方 法
25
机器学习的问题
存在什么样的算法能从特定的训练数据学习一般 的目标函数呢?如果提供了充足的训练数据,什 么样的条件下,会使特定的算法收敛到期望的函 数?哪个算法对哪些问题和表示的性能最好? 多少训练数据是充足的?怎样找到学习到假设的 置信度与训练数据的数量及提供给学习器的假设 空间特性之间的一般关系? 学习器拥有的先验知识是怎样引导从样例进行泛 化的过程的?当先验知识仅仅是近似正确时,它 们会有帮助吗?
相关文档
最新文档