神经网络控制1模型总结
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2018/11/30 9
• •
1.1.2 人脑神经网络
脑神经系统主要组成部分
大脑皮层由许多功能区组成(运动、听觉、
神经元群 其区域性结构:遗传 其功能:后天对环境的适应于学习得来 (自组织特性Self-Organization) 视觉等)
子功能模块的并行关系
a) 连接形式 b) 大脑处理信息的特点 C) 生物学研究成果
2018/11/30 21
神经元模型(1)
• 神经元是人工神经网络的基本处理单元, 它一般是一个多输入/单输出的非线性 元件。神经元输出除受输入信号的影响 之外,同时也受到神经元内部其他因素 的影响,所以在人工神经元的建模中, 常常还加有一个额外输入信号,称为偏 差(bias),有时也称为阈值或门限值。
57
20世纪80年代 第二次高潮 Reasons: 1)AI理论、 Neumann计算机功能受 挫(智能、视觉处理等) 2)ANN有新成果、脑科学、神经科 学 、 VLSI、光电技术的发展
1. 神经元分层排列,可又多层
2. 层间无连接
3. 方向由入到出
感知网络(perceptron即为此) 应用最为广泛
•
2018/11/30 39
全反馈结构图
2018/11/30 40
Inner RNN结构图
2018/11/30
41
回归网络特点
• Output 与 Input相连(全反馈) 特点:1. 内部前向 2. 输出反馈到输入 例: Fukushima网络
2018/11/30
15
大脑处理信息的特点
• 分布存储与冗余性:记忆在大量元中,每个元存 在许多信息的部分内容,信息在神经网络中的记 忆反映在神经元间的突触连接强度上(weights); • 并行处理:NN既是处理器又是存储器(并行处理 不同于并行机); • 信息处理与存储合一:每个元兼有二者功能; • 可塑性与自组织性:可塑性是学习记忆的基础; • 鲁棒性:高连接度导致一定的误差和噪声不会使 网络性能恶化。是智能演化的重要因素。
2018/11/30 19
单个神经元特性
•神经元的膜电位与时间关系如下
spike
2018/11/30
20
BNN 脉冲,
ANN 模拟电压
• ANN等效模拟电压近似BNN脉冲密度, 仅有空间累加无时间累加(可认为时间 累加已隐含于等效模拟电压之中) • ANN中未考虑时延、不应期及疲劳等 可建立更为精确的模型,但一般NN研究 无此必要(方法论)
2018/11/30 8
突触传递信息特点
• • • • • • • • • 1 时延性 : (0.3~1ms) 2 综合性 : 时间与空间的累加 3 类型: 兴奋与抑制 4 脉冲与电位转换: (D/A功能) 5 速度: 1~150m/s 6 不应期(死区): 3~5ms 7 不可逆性(单向) 8 可塑性 : 强度可变 ,有学习功能 脉冲
55
20世纪60年代,低潮
• 1969年 Minsky和Papert编写的 《Perceptron》 出版,使NN的研究进入低潮 Problems:single lager P.仅可解线性问题, NL XOR无法求解; 求解XOR 应该是MLP, 但MLP是否有意义,理论上不能得到有力证明 当时现状:数字计算机发达,认为可解决一切 问题 工业水平上,NNC不存在 但工作并未停止。
2018/11/30
31
S型函数(Sigmoid) a) 对数正切 y=1/(e-n+1)
2018/11/30
32
b)双曲正切 y=tanh(n)
2018/11/30
33
4.辐射基函数
a) 高斯函数
2018/11/30
34
b)三角波函数
2018/11/30
35
人工神经网络的构成
• 基本模型 • 连接的几种基本形式
• 前向网络(feed-forward Networks)
• 回归网络(recurrent Networks) • 互联网络(全互连与局部互连) • 也可是以上几种形式的组合
2018/11/30 36
神经网络基本模型
2018/11/30
37
前向网络
• 结构图
2018/11/30
38
前向网络特点
2018/11/30
16
1.2 人工神经网络
• 研究大脑的目的: a)揭示功能造福人类 b)构造ANN用于工程及其他领域 • (生物神经网络的模型化:ANN) BNN modeling ANN ANN非BNN模型,而是对结构及功能大 大简化后保留主要特性的某种抽象与模型。
2018/11/30
17
神经网络直观理解
• 学习规则简介
2018/11/30
45
关于学习问题
• 学习:实例学习 举一反三的能力 • 机器学习: 从数据中归纳出规律,进行预 测或者对其性质作出判断
• 神经网络—启发式学习 • 支持向量机---统计学习理论
2018/11/30
46
学习规则
• 1)直接设计计算 e.g. Hopfield 作优化计算 • 2)学习得到,即通过训练(training)
ij i j
2018/11/30
54
20世纪50年代 , 第一次高潮
1957年:F.Rosenblatt提出感知网络 (Perceptron)模型,这是第一个完整 的ANN
基本构成为阀值单元、网络 初具并行处理、分布存储、学习等功能 用于模式识别、联想记忆 引起NN研究的第一次高潮
2018/11/30
2018/11/30
47
常用学习规则
a) Hebb学习 D.Hebb1949年提出:两元同时兴奋,则突触 连接加强 b)δ学习规则 误差校正规则 梯度方法 (BP即为其中一种)
ij i j
j F yi y j
2018/11/30 48
ij ji
c) 相近学习规则
2018/11/30 2
1.1 生物神经元网络
• 1.1.1生物神经元 • 1.1.2人脑神经网络
2018/11/30
3
1.1.1 生物神经元。
• 人的大脑由1012个神经元构成,神经元互相
连接成神经网络
• • • • • •
神经元组成:细胞体为主体 神经元功能:刺激、兴奋、传导、效应 形状图 神经元类型 原则 突触传递信息特点
Part2 Artificial Neural Network 第二部分 人工神经网络
之一 --神经网络基础
2018/11/30
1
一、神经网络概论
• 神经网络种类
• 生物神经网络(Biological Neural Networks)
• 人工神经网络(Artificial Neural Networks)
2018/11/30 53
ANN的发展史
20世纪40年代:兴起与萧条
1943年 M-P model 心理学家W.S.McCulloch和 数学家W.Pitts提出: 形式神经元的数学描述与构造方法 与阈值神经元model基本相同,权值固定 1949年 心理学家D.O.Hebb提出突触强度可调的 假设: 学习过程发生在突触上 Hebb规则:
2018/11/30 4
形状图
2018/11/30
5
2018/11/30
6
类型
• 单极——无脊椎动物 • 双极——视网膜神经元neuron • 多极——脊椎、锥体、小脑蒲根
2018/11/30
7
原
则
• 神经元间信息传递的理论基础 • 原则1 动态极化原则(即信号沿确定 方向流动) 树突 轴突 突触 其他神经元 • 原则2 连接的专一性原则 神经元之间元细胞质的连续 神经元不构成随机网络 每一神经元与一些神经元形成特 殊的精确的联系
R
i
b
y f ( s)
• i 数值(weights) • b 阈值(threshold) • f (s) 作用函数(activated transfer function)
2018/11/30 25
作用函数的基本作用
• 1、控制输入对输出的激活作用; • 2、对输入、输出进行函数转换; • 3、将可能无限域的输入变换成指定的有 限范围内的输出。
2018/11/30
22
神经元模型(2)
• 。
2018/11/30
23
神经元模型数学描述
x1 w1 w2 · · · xn wn y
x2
y( t ) f 2018/11/30
i 1
n
wi xi ( t )
24
抽象可得数学表达式:
s
w x
i 1 i
2018/11/30
26
几种常用的作用函数
1、阀值型(硬限制型)
2、线性型 3、S型函数(Sigmoid) 4、辐射基函数
2018/11/30 27
1、阀值型(硬限制型)
1 A f (W * P b) 0 W *P b 0 W *P b 0
2018/11/30
28
1 A f (W * P b) 1
W *P b 0 W *P b 0
2018/11/30
29
2、线性型 a) 全线性
A f (W * P b) W * P b
•
2018/11/30
30
b) 正线性
0 A f (W * P b ) n W* Pb 0 W* Pb 0
• Inner recurrent 特点:层间元互相连接
2018/11/30
42
互联网络
• 结构图
2018/11/30
43
互联网络特点
• 每个元都与其它元相连 例: Hopfield Boltzmann机
2018/11/30
44
ANN研究中的核心问题 How to determine the weights(加权系数)
ij i ij
使
ij i
ART SOFM 自组织竞争用此规则
2018/11/30
49
ANN 与BNN比较
数学观点
ANN与BNN的比较
2018/11/30
50
数学观点
• ANN使一个以处理单元(PE: process element)为节点,用加权有向弧连接而成 的有向图。 (1)每个节点有一个状态变量;(2)节点i到 节点j有一个连接权值;(3)每个节点有一个 阈值;(4)每个节点定义一个变换函数。 • PE是对BN的模拟,有向弧是对“轴突—树 突”对的模拟。 • 综合全部有向弧形成的互连矩阵强度对应于 人脑中信息的长期记忆。 • PE由NL函数实现单元I/O的NL映射,即时 活跃值对应于人脑中的短期记忆。
2018/11/30 51
ANN与BNN的比较
BNN
单元上差别 信息上差别 规模及智能
2018/11/30
ANN
忽略了影响 关系简单 模拟电压 小<
影响因素多 脉冲 大, 高
10 个元
低
52
4
1.3 ANN的发展
• ANN的发展史 • ANN的现状 1)NN研究学术机构 2)NN研究的主要问题方向: 1. 理论研究 2. 应用研究
2018/11/30 56
• 1975年 Albus提出CMAC网络(Cerebella Model Articulation Controller) • 1977年 英国 Grossberg提出ART网络 (Adaptive Resonance Theory) Kohonen提出自组织映射理论 福岛邦彦(K.Fukushima)提出认 识 机(Neocognitron)模型 甘利俊(S.Amari):NN数学理论 • 其它NL系统理论 Prigogine 非平衡系统的自组织理论 Haken 协同学 2018/11/30
2018/11/30 10
连接形式
• • • • 辐射式:一到多 聚合式:多到一 链锁式:空间上加强与扩大作用 环式:反馈作用(可正可负)
2018/11/30
11
辐射式:一到多
2018/11/30
12
聚合式:多到一
2018/11/30
13
链锁式:空间上加强与扩大作用
2018/11/30
14
环式:反馈作用(可正可 负)
神经网络是一个并行和分布式的信息处理 网络结构,它一般由许多个神经元组成, 每个神经元只有一个输出,它可以连接 到很多其他的神经元,每个神经元输入 有多个连接通道,每个连接通道对应于 一个连接权系数。
2018/11/30
18
1.2.1 人工神经元模型
BNN 信息传递过程 为 MISO 系统, 信号为脉冲,当脉冲到达突 触前膜时,前膜释放化学物质,结 果在突触后产生突触后电位,其大 小与脉冲密度有关(时间总合效 应)。 各通道都对电位产生影响(空 间总合效应)。
• •
1.1.2 人脑神经网络
脑神经系统主要组成部分
大脑皮层由许多功能区组成(运动、听觉、
神经元群 其区域性结构:遗传 其功能:后天对环境的适应于学习得来 (自组织特性Self-Organization) 视觉等)
子功能模块的并行关系
a) 连接形式 b) 大脑处理信息的特点 C) 生物学研究成果
2018/11/30 21
神经元模型(1)
• 神经元是人工神经网络的基本处理单元, 它一般是一个多输入/单输出的非线性 元件。神经元输出除受输入信号的影响 之外,同时也受到神经元内部其他因素 的影响,所以在人工神经元的建模中, 常常还加有一个额外输入信号,称为偏 差(bias),有时也称为阈值或门限值。
57
20世纪80年代 第二次高潮 Reasons: 1)AI理论、 Neumann计算机功能受 挫(智能、视觉处理等) 2)ANN有新成果、脑科学、神经科 学 、 VLSI、光电技术的发展
1. 神经元分层排列,可又多层
2. 层间无连接
3. 方向由入到出
感知网络(perceptron即为此) 应用最为广泛
•
2018/11/30 39
全反馈结构图
2018/11/30 40
Inner RNN结构图
2018/11/30
41
回归网络特点
• Output 与 Input相连(全反馈) 特点:1. 内部前向 2. 输出反馈到输入 例: Fukushima网络
2018/11/30
15
大脑处理信息的特点
• 分布存储与冗余性:记忆在大量元中,每个元存 在许多信息的部分内容,信息在神经网络中的记 忆反映在神经元间的突触连接强度上(weights); • 并行处理:NN既是处理器又是存储器(并行处理 不同于并行机); • 信息处理与存储合一:每个元兼有二者功能; • 可塑性与自组织性:可塑性是学习记忆的基础; • 鲁棒性:高连接度导致一定的误差和噪声不会使 网络性能恶化。是智能演化的重要因素。
2018/11/30 19
单个神经元特性
•神经元的膜电位与时间关系如下
spike
2018/11/30
20
BNN 脉冲,
ANN 模拟电压
• ANN等效模拟电压近似BNN脉冲密度, 仅有空间累加无时间累加(可认为时间 累加已隐含于等效模拟电压之中) • ANN中未考虑时延、不应期及疲劳等 可建立更为精确的模型,但一般NN研究 无此必要(方法论)
2018/11/30 8
突触传递信息特点
• • • • • • • • • 1 时延性 : (0.3~1ms) 2 综合性 : 时间与空间的累加 3 类型: 兴奋与抑制 4 脉冲与电位转换: (D/A功能) 5 速度: 1~150m/s 6 不应期(死区): 3~5ms 7 不可逆性(单向) 8 可塑性 : 强度可变 ,有学习功能 脉冲
55
20世纪60年代,低潮
• 1969年 Minsky和Papert编写的 《Perceptron》 出版,使NN的研究进入低潮 Problems:single lager P.仅可解线性问题, NL XOR无法求解; 求解XOR 应该是MLP, 但MLP是否有意义,理论上不能得到有力证明 当时现状:数字计算机发达,认为可解决一切 问题 工业水平上,NNC不存在 但工作并未停止。
2018/11/30
31
S型函数(Sigmoid) a) 对数正切 y=1/(e-n+1)
2018/11/30
32
b)双曲正切 y=tanh(n)
2018/11/30
33
4.辐射基函数
a) 高斯函数
2018/11/30
34
b)三角波函数
2018/11/30
35
人工神经网络的构成
• 基本模型 • 连接的几种基本形式
• 前向网络(feed-forward Networks)
• 回归网络(recurrent Networks) • 互联网络(全互连与局部互连) • 也可是以上几种形式的组合
2018/11/30 36
神经网络基本模型
2018/11/30
37
前向网络
• 结构图
2018/11/30
38
前向网络特点
2018/11/30
16
1.2 人工神经网络
• 研究大脑的目的: a)揭示功能造福人类 b)构造ANN用于工程及其他领域 • (生物神经网络的模型化:ANN) BNN modeling ANN ANN非BNN模型,而是对结构及功能大 大简化后保留主要特性的某种抽象与模型。
2018/11/30
17
神经网络直观理解
• 学习规则简介
2018/11/30
45
关于学习问题
• 学习:实例学习 举一反三的能力 • 机器学习: 从数据中归纳出规律,进行预 测或者对其性质作出判断
• 神经网络—启发式学习 • 支持向量机---统计学习理论
2018/11/30
46
学习规则
• 1)直接设计计算 e.g. Hopfield 作优化计算 • 2)学习得到,即通过训练(training)
ij i j
2018/11/30
54
20世纪50年代 , 第一次高潮
1957年:F.Rosenblatt提出感知网络 (Perceptron)模型,这是第一个完整 的ANN
基本构成为阀值单元、网络 初具并行处理、分布存储、学习等功能 用于模式识别、联想记忆 引起NN研究的第一次高潮
2018/11/30
2018/11/30
47
常用学习规则
a) Hebb学习 D.Hebb1949年提出:两元同时兴奋,则突触 连接加强 b)δ学习规则 误差校正规则 梯度方法 (BP即为其中一种)
ij i j
j F yi y j
2018/11/30 48
ij ji
c) 相近学习规则
2018/11/30 2
1.1 生物神经元网络
• 1.1.1生物神经元 • 1.1.2人脑神经网络
2018/11/30
3
1.1.1 生物神经元。
• 人的大脑由1012个神经元构成,神经元互相
连接成神经网络
• • • • • •
神经元组成:细胞体为主体 神经元功能:刺激、兴奋、传导、效应 形状图 神经元类型 原则 突触传递信息特点
Part2 Artificial Neural Network 第二部分 人工神经网络
之一 --神经网络基础
2018/11/30
1
一、神经网络概论
• 神经网络种类
• 生物神经网络(Biological Neural Networks)
• 人工神经网络(Artificial Neural Networks)
2018/11/30 53
ANN的发展史
20世纪40年代:兴起与萧条
1943年 M-P model 心理学家W.S.McCulloch和 数学家W.Pitts提出: 形式神经元的数学描述与构造方法 与阈值神经元model基本相同,权值固定 1949年 心理学家D.O.Hebb提出突触强度可调的 假设: 学习过程发生在突触上 Hebb规则:
2018/11/30 4
形状图
2018/11/30
5
2018/11/30
6
类型
• 单极——无脊椎动物 • 双极——视网膜神经元neuron • 多极——脊椎、锥体、小脑蒲根
2018/11/30
7
原
则
• 神经元间信息传递的理论基础 • 原则1 动态极化原则(即信号沿确定 方向流动) 树突 轴突 突触 其他神经元 • 原则2 连接的专一性原则 神经元之间元细胞质的连续 神经元不构成随机网络 每一神经元与一些神经元形成特 殊的精确的联系
R
i
b
y f ( s)
• i 数值(weights) • b 阈值(threshold) • f (s) 作用函数(activated transfer function)
2018/11/30 25
作用函数的基本作用
• 1、控制输入对输出的激活作用; • 2、对输入、输出进行函数转换; • 3、将可能无限域的输入变换成指定的有 限范围内的输出。
2018/11/30
22
神经元模型(2)
• 。
2018/11/30
23
神经元模型数学描述
x1 w1 w2 · · · xn wn y
x2
y( t ) f 2018/11/30
i 1
n
wi xi ( t )
24
抽象可得数学表达式:
s
w x
i 1 i
2018/11/30
26
几种常用的作用函数
1、阀值型(硬限制型)
2、线性型 3、S型函数(Sigmoid) 4、辐射基函数
2018/11/30 27
1、阀值型(硬限制型)
1 A f (W * P b) 0 W *P b 0 W *P b 0
2018/11/30
28
1 A f (W * P b) 1
W *P b 0 W *P b 0
2018/11/30
29
2、线性型 a) 全线性
A f (W * P b) W * P b
•
2018/11/30
30
b) 正线性
0 A f (W * P b ) n W* Pb 0 W* Pb 0
• Inner recurrent 特点:层间元互相连接
2018/11/30
42
互联网络
• 结构图
2018/11/30
43
互联网络特点
• 每个元都与其它元相连 例: Hopfield Boltzmann机
2018/11/30
44
ANN研究中的核心问题 How to determine the weights(加权系数)
ij i ij
使
ij i
ART SOFM 自组织竞争用此规则
2018/11/30
49
ANN 与BNN比较
数学观点
ANN与BNN的比较
2018/11/30
50
数学观点
• ANN使一个以处理单元(PE: process element)为节点,用加权有向弧连接而成 的有向图。 (1)每个节点有一个状态变量;(2)节点i到 节点j有一个连接权值;(3)每个节点有一个 阈值;(4)每个节点定义一个变换函数。 • PE是对BN的模拟,有向弧是对“轴突—树 突”对的模拟。 • 综合全部有向弧形成的互连矩阵强度对应于 人脑中信息的长期记忆。 • PE由NL函数实现单元I/O的NL映射,即时 活跃值对应于人脑中的短期记忆。
2018/11/30 51
ANN与BNN的比较
BNN
单元上差别 信息上差别 规模及智能
2018/11/30
ANN
忽略了影响 关系简单 模拟电压 小<
影响因素多 脉冲 大, 高
10 个元
低
52
4
1.3 ANN的发展
• ANN的发展史 • ANN的现状 1)NN研究学术机构 2)NN研究的主要问题方向: 1. 理论研究 2. 应用研究
2018/11/30 56
• 1975年 Albus提出CMAC网络(Cerebella Model Articulation Controller) • 1977年 英国 Grossberg提出ART网络 (Adaptive Resonance Theory) Kohonen提出自组织映射理论 福岛邦彦(K.Fukushima)提出认 识 机(Neocognitron)模型 甘利俊(S.Amari):NN数学理论 • 其它NL系统理论 Prigogine 非平衡系统的自组织理论 Haken 协同学 2018/11/30
2018/11/30 10
连接形式
• • • • 辐射式:一到多 聚合式:多到一 链锁式:空间上加强与扩大作用 环式:反馈作用(可正可负)
2018/11/30
11
辐射式:一到多
2018/11/30
12
聚合式:多到一
2018/11/30
13
链锁式:空间上加强与扩大作用
2018/11/30
14
环式:反馈作用(可正可 负)
神经网络是一个并行和分布式的信息处理 网络结构,它一般由许多个神经元组成, 每个神经元只有一个输出,它可以连接 到很多其他的神经元,每个神经元输入 有多个连接通道,每个连接通道对应于 一个连接权系数。
2018/11/30
18
1.2.1 人工神经元模型
BNN 信息传递过程 为 MISO 系统, 信号为脉冲,当脉冲到达突 触前膜时,前膜释放化学物质,结 果在突触后产生突触后电位,其大 小与脉冲密度有关(时间总合效 应)。 各通道都对电位产生影响(空 间总合效应)。