量子神经计算模型研究
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
图1 Chrisley 非叠加态量子神经计算模型
(如特征串、图象、查询等)到栅板狭缝结构的映射( I) ,另一个则是由干涉模式到输出(如分类、 v v v v 存储数据等)的映射(O) 。假设输入为 x ,输出为 a ,权值为 ω ,干涉模式为 p ,这样可得 v r v r v v v 2 v v S ( x ,ω ) = p ,此处 S (•) 为 sigmoid 函数,而 a = O(S (x , ω )) ,再定义系统的误差函数为 E = ∑i (d − a ) ,其中 d 为期望输出,这样,该系统就可以利用类似于经典的 BP 算法来学习任意映射关系。 Chrisley 模型巧妙地将量子实验的结构与神经计算的方式结合起来,改造了传统的神经网络模型, 并从中产生出一些新的特点,主要体现在: ( 1)权值更新。它不同于传统神经网络中每个权值仅调节 与之相联的节点的连接关系,在这里,每改变权值区中的任何一个权值(即权值区狭缝的结构) ,将会 影响到所有输入节点的连接; ( 2)输出。该模型的输出是几率幅的叠加,本质上是复值的,它增加了 网络的信息容量; (3)物理实现。它具有很直观的物理意义,易于物理系统实现。 但是,该模型存在以下几点问题: (1 )其前端未考虑量子态的叠加,本意是为了避免相干态的维 持,但现实中量子态的叠加是客观存在的,仅仅利用上述理论框架,将会失去由量子态叠加而产生的 计算优势,如量子超并行、量子纠缠等等; ( 2)虽然 Chrisley 给出了学习算法的大致框架,但很难实 现,因为在该模型中很难设计出神经网络的量子对照物,比如说输入量的表示,由于粒子源是单一的, 它对于每个狭缝应是等同的,仅靠狭缝的不同位置不宜表征不同的输入量,若用粒子的入射角度或相 位表示,就会导致计算复杂度的大幅提高甚至无解。正是上述两点严重地制约了 Chrisley 模型的应用。 考虑到上述模型的缺陷,我们可以从网络的输入量着手,通过设计量子实验来寻找合适的神经网 络对照物。因为由量子理论可知,当微观粒子进入不同介质后,其运动轨迹会发生改变,我们可以选 取不同介质的介电常数矢量作为网络的输入量,以粒子穿越栅板到达探测器的实际运动轨迹作为网络 的权值(实际上它最终由狭缝的位置和栅板间距所决定) ,取探测器所测得点的强度(即几率)作为网 络的输出,以此来构造一个多狭缝 -多栅板结构的量子神经计算模型。特殊地,该模型的单层结构可以 完成类似逻辑异或(XOR)运算,这是传统神经网络所无法实现的。 3.2 具有量子力学特性的人工神经元模型 Ventura 和 Martinez 于 1997 年给出了具有量子力学特性的人工神经元模型的框架[12] ,他们针对传 统人工神经网络模型中最简单的感知机研究其量子对照物。在量子神经元模型中,原来的单个连接权 矢被一个波函数 ψ (ω , t ) 所取代,这里的波函数处于 Hilbert 空间,其基态为经典模型的权矢, ψ (ω , t ) 代 表了权矢空间中所有可能权矢的概率幅度(广义上为复数) ,在任意时刻 t 满足归一化条件,即
, 庄镇泉
1
(1. 中国科技大学 量子通讯与量子计算实验室,安徽 合肥 230026 ; 2. 合肥工业大学 应用物理系,安徽 合肥 230009 )
摘要:量子神经计算(Quantum Neural Computation)是传统神经计算与量子理论相结合而产生的一种新的计算 模式。本文论述了量子神经计算出现的原因及其特征,着重分析了几种典型的计算模型,并就其中存在的问题提出相 应的解决方案,最后进行相关讨论。 关键词:量子神经计算;量子计算;量子信息处理 中图分类号:TP3, TP18 文献标识码:A
第7卷 第2 期 2002 年 6 月
文章编号:1007-0249 (2002) 02-0083-06
电路与系统学报 JOURNAL OF CIRCUITS AND SYSTEMS
Vol.7 No.2 June, 2002
量子神经计算模型研究
解光军
1,2
*
2
量子神经计算
导致量子神经计算研究的直接原因有两个:其一,是有关人脑中存在量子效应的假设,早在 1989
*
收稿日期:2002-03-13 修订日期:2002-05-27 基金项目:国家自然科学基金资助项目(60171029 )
wk.baidu.com
84
电路与系统学报
第7卷
年 Penrose 就讨论了量子理论与人脑意识之间的关系问题,他指出解决量子测量问题是最终解决人脑 意识问题的先决条件 [6, 7] ; Hameroff 则认为,在神经元内骨骼支架的微管(Cytoskeletal Microtubule ) 之中或周围,意识是作为一个宏观量子态由量子级事件相干的一个临界级突现( Emerge)出来的[8]; 最近 Perus 指出,量子波函数的坍缩(Collapse )十分类似于人脑记忆中的神经模式重构现象[9] 等等。 虽然目前神经科学界尚无法确认人脑中确实存在量子效应,但是用量子理论来解释大脑现象(所谓量 子思维)的确富有创见和一定的合理性;其二,由于量子理论是经典物理发展到微观层次的产物,它 具有更普遍更本质的特征,由此可知,量子神经计算应该是传统神经计算系统的自然进化,它势必会 利用量子计算的巨大威力,提升神经计算的信息处理能力。 真正将量子理论与神经计算结合起来的是美国 Louisiana 州立大学的 Kak 教授 ,他在 1995 年发表 的"On Quantum Neural Computing "一文中首次提出量子神经计算的概念,开创了该领域的先河[10] , 之后出现了诸如量子联想记忆、非叠加态量子神经网络、多感知机模型等多种量子神经计算模型(这 些随后进行讨论) ,可以说,最近特别是近两年来量子神经计算领域的研究日趋活跃,正因为此,在 2000 年 3 月召开的第四届国际计算智能和神经科学会议上专门设立了量子计算与神经量子信息处理的 专题会议,并出版了论文特辑[14],此举引起了国际理论界的广泛关注。 神经计算与量子理论的结合可以有多种形式,由此产生的计算模型也各有特点,我们将二者结合 所对应的主要概念对照如表 1 所示。 当然,上述的对应并非一成不变,但建立如此的对应 关系是构成量子神经计算模型的前提,而且合理的定义有 利于模型和算法的设计与实现。 值得注意的是,上述对应中存在一个关键问题,即如 何调和神经计算非线性特征与量子系统中线性幺正变换之
1
引言
人工神经网络是对人脑工作机理的简单模仿,它建立在简化的神经元模型和学习规则的基础上, 由此产生了许多计算上的优势,并且已拥有非常成功的应用,不过随着应用的深入推广,神经计算的 局限与不足也逐渐显现出来, 特别表现在: (1) 传统意义上的学习在信息量大的情况下处理速度过慢, 不符合人脑实时反应、大容量作业的特征; ( 2)神经网络的记忆容量有限; (3 )神经网络需要反复训 练,而人脑却具有一次学习的能力; ( 4 )神经网络在接受新信息时会发生灾变性失忆( Catastrophic Forgetting)现象等等。这些本质上的缺陷促使人们产生发展传统神经计算理论的强烈要求,由此出现 了神经计算与其它理论相结合的研究,其中神经计算与量子理论的结合是一个极富前景的尝试。 量子理论自诞生 100 多年以来已取得了巨大的成功,但之前它与计算机科学、信息理论一直是作 为不同的学科并行发展,很少有人注意到它们之间有联系和交叉的可能性,这一局面一直维持到 1982 , 年, Beniof 和 Feynman 发现了将量子力学系统用于推理计算的可能 [1 2] ,1985 年 Deutsch 提出第一个 量子计算模型[3] ,由此,量子计算(Quantum Computation)迅速成为一门引人入胜的新学科,特别是 近年来由 Shor 提出的大数质因式分解算法[4] 和 Grover 提出的量子查询算法[5] ,他们对传统算法实现 了近乎指数级的改进,更是极大地推动了该领域的发展。随后便出现了以量子计算机、量子通讯以及 量子编码为代表的量子信息科学,使人们越来越清楚地认识到,其实信息理论、计算机科学和量子物 理学之间存在着密切而又深刻的内在联系。 量子计算与传统意义上的计算有着质的不同, 它的特点主要体现在量子态的叠加 ( Superposition) 、 纠缠( Entanglement )以及干涉 ( Interference )等性质上,许多计算上的优势如量子并行 ( Quantum Parallelism)等皆由此而产生。量子计算所表现出的惊人潜力和异乎寻常的特征皆是源于对传统计算 进行了量子改造,而神经计算则是对生物行为以信息处理方式的模拟,同时它的动力学特征与量子系 统有着许多相似之处,那么自然可以推断:量子理论与神经计算相结合就会构建出新的量子神经计算 模式。从理论上分析,这种结合将有助于理解人脑和意识的本质,有助于求解 NP-hard 问题,同时也 有助于深入理解神经计算理论和量子理论本身。因此,近年来国际上已有少数先行者在此领域展开了 诸如量子联想、并行学习、经验分析等问题的研究,虽然目前还只是处于初始阶段,但是他们构筑了 人工神经网络中量子计算的基础。
3
计算模型研究
几种典型的量子神经计算模型的设计要点见表 2。下面就其中几类主要的模型分别进行讨论。
第2期
解光军等:量子神经计算模型研究
85
3.1 基于量子双缝干涉实验的计算模型 1995 年 Chrisley 提出量子学习(Quantum Learning) 的概念,结合量子双缝干涉实验结构给出非叠加态量子神 经计算模型[11],此模型具有前馈网络的拓扑结构,见图 1 。 粒子 G 首先入射栅板 B,之后是一个光敏接收盘 P ,在 栅板 B 上有许多狭缝,其中上面部分组成输入区,下面部分 组成权值区, 调节狭缝的不同位置便可以在接收盘 P 上产生 不同的干涉模式,这样就可以实现两组映射:一个是由输入
中包含有非线性关系(表现为上式中 的势函数 V(x) 和指数函数) ,所以利 用该理论可进行非线性推导;
神经元 量子神经元 狭缝位置 时间片段 经典神经元 经典神经元 量子位
(3 ) Everett 的 多 宇 宙 ( Many Universes )观点。它认为量子态波函数始终满足 Schr ö dinger 方程,但测量的结果是将观测值分为 互不察觉的若干部分,而每个部分(即宇宙)只可能有一个结果,该理论特别适合于设计多感知机 类的网络结构。 虽然目前量子神经计算的研究还处于萌芽阶段,其理论远未成熟,但已有的理论分析和应用已有 证明,与传统的神经计算比较,量子神经计算模型至少在以下几个方面具有明显的优势: (1 )指数级 的记忆容量和回忆速度; (2 )较小的规模和简洁的网络拓扑结构,因此理论上有更好的稳定性和有效 性; (3)快速学习和一次学习的能力; (4)消除灾变性失忆的能力; (5)高的信息处理速度等。
表1 量子理论与神经计算模型的对应概念
量子理论 波函数 态叠加(相干) 测量(消相干或坍缩) 态纠缠 幺正变换 神经计算模型 神经元 内部连接(连接权) 趋向吸引子的演化 学习规则 增益函数(变换)
间的关系,我们认为可以通过以下三种途径来加以解决: (1 ) 利用量子坍缩原理。虽然量子系统中的演化算子是幺正的,但在结果的测量时(即坍缩过程) 所发生的消相干却是一个非幺正过程,我们可以把它视为量子系统趋向某个吸引子的非线性演化, 从而在量子系统中实现非线性映射; (2 ) 根据 Feynman 路径积分理论,由于在路径积分公式
| ψ (t )〉 =
all − paths
∑
t & 2 (τ ) i mx [ −V ( x (τ ))]dτ ∫ h 2 0 e
表2
模型 Perus Chrisley Behrman Goertzel Menneer Ventura
典型量子神经计算模型的设计要点
连接 Green 函数 经典连接权 光子作用 量子连接 经典连接权 态纠缠 变换 线性 非线性 非线性 非线性 非线性 非线性 网络类型 时域 多层 BP 时、空域 经典 多感知机 多感知机 动力学特性 坍缩 非叠加 路径积分 路径积分 多宇宙 非幺正变换
(如特征串、图象、查询等)到栅板狭缝结构的映射( I) ,另一个则是由干涉模式到输出(如分类、 v v v v 存储数据等)的映射(O) 。假设输入为 x ,输出为 a ,权值为 ω ,干涉模式为 p ,这样可得 v r v r v v v 2 v v S ( x ,ω ) = p ,此处 S (•) 为 sigmoid 函数,而 a = O(S (x , ω )) ,再定义系统的误差函数为 E = ∑i (d − a ) ,其中 d 为期望输出,这样,该系统就可以利用类似于经典的 BP 算法来学习任意映射关系。 Chrisley 模型巧妙地将量子实验的结构与神经计算的方式结合起来,改造了传统的神经网络模型, 并从中产生出一些新的特点,主要体现在: ( 1)权值更新。它不同于传统神经网络中每个权值仅调节 与之相联的节点的连接关系,在这里,每改变权值区中的任何一个权值(即权值区狭缝的结构) ,将会 影响到所有输入节点的连接; ( 2)输出。该模型的输出是几率幅的叠加,本质上是复值的,它增加了 网络的信息容量; (3)物理实现。它具有很直观的物理意义,易于物理系统实现。 但是,该模型存在以下几点问题: (1 )其前端未考虑量子态的叠加,本意是为了避免相干态的维 持,但现实中量子态的叠加是客观存在的,仅仅利用上述理论框架,将会失去由量子态叠加而产生的 计算优势,如量子超并行、量子纠缠等等; ( 2)虽然 Chrisley 给出了学习算法的大致框架,但很难实 现,因为在该模型中很难设计出神经网络的量子对照物,比如说输入量的表示,由于粒子源是单一的, 它对于每个狭缝应是等同的,仅靠狭缝的不同位置不宜表征不同的输入量,若用粒子的入射角度或相 位表示,就会导致计算复杂度的大幅提高甚至无解。正是上述两点严重地制约了 Chrisley 模型的应用。 考虑到上述模型的缺陷,我们可以从网络的输入量着手,通过设计量子实验来寻找合适的神经网 络对照物。因为由量子理论可知,当微观粒子进入不同介质后,其运动轨迹会发生改变,我们可以选 取不同介质的介电常数矢量作为网络的输入量,以粒子穿越栅板到达探测器的实际运动轨迹作为网络 的权值(实际上它最终由狭缝的位置和栅板间距所决定) ,取探测器所测得点的强度(即几率)作为网 络的输出,以此来构造一个多狭缝 -多栅板结构的量子神经计算模型。特殊地,该模型的单层结构可以 完成类似逻辑异或(XOR)运算,这是传统神经网络所无法实现的。 3.2 具有量子力学特性的人工神经元模型 Ventura 和 Martinez 于 1997 年给出了具有量子力学特性的人工神经元模型的框架[12] ,他们针对传 统人工神经网络模型中最简单的感知机研究其量子对照物。在量子神经元模型中,原来的单个连接权 矢被一个波函数 ψ (ω , t ) 所取代,这里的波函数处于 Hilbert 空间,其基态为经典模型的权矢, ψ (ω , t ) 代 表了权矢空间中所有可能权矢的概率幅度(广义上为复数) ,在任意时刻 t 满足归一化条件,即
, 庄镇泉
1
(1. 中国科技大学 量子通讯与量子计算实验室,安徽 合肥 230026 ; 2. 合肥工业大学 应用物理系,安徽 合肥 230009 )
摘要:量子神经计算(Quantum Neural Computation)是传统神经计算与量子理论相结合而产生的一种新的计算 模式。本文论述了量子神经计算出现的原因及其特征,着重分析了几种典型的计算模型,并就其中存在的问题提出相 应的解决方案,最后进行相关讨论。 关键词:量子神经计算;量子计算;量子信息处理 中图分类号:TP3, TP18 文献标识码:A
第7卷 第2 期 2002 年 6 月
文章编号:1007-0249 (2002) 02-0083-06
电路与系统学报 JOURNAL OF CIRCUITS AND SYSTEMS
Vol.7 No.2 June, 2002
量子神经计算模型研究
解光军
1,2
*
2
量子神经计算
导致量子神经计算研究的直接原因有两个:其一,是有关人脑中存在量子效应的假设,早在 1989
*
收稿日期:2002-03-13 修订日期:2002-05-27 基金项目:国家自然科学基金资助项目(60171029 )
wk.baidu.com
84
电路与系统学报
第7卷
年 Penrose 就讨论了量子理论与人脑意识之间的关系问题,他指出解决量子测量问题是最终解决人脑 意识问题的先决条件 [6, 7] ; Hameroff 则认为,在神经元内骨骼支架的微管(Cytoskeletal Microtubule ) 之中或周围,意识是作为一个宏观量子态由量子级事件相干的一个临界级突现( Emerge)出来的[8]; 最近 Perus 指出,量子波函数的坍缩(Collapse )十分类似于人脑记忆中的神经模式重构现象[9] 等等。 虽然目前神经科学界尚无法确认人脑中确实存在量子效应,但是用量子理论来解释大脑现象(所谓量 子思维)的确富有创见和一定的合理性;其二,由于量子理论是经典物理发展到微观层次的产物,它 具有更普遍更本质的特征,由此可知,量子神经计算应该是传统神经计算系统的自然进化,它势必会 利用量子计算的巨大威力,提升神经计算的信息处理能力。 真正将量子理论与神经计算结合起来的是美国 Louisiana 州立大学的 Kak 教授 ,他在 1995 年发表 的"On Quantum Neural Computing "一文中首次提出量子神经计算的概念,开创了该领域的先河[10] , 之后出现了诸如量子联想记忆、非叠加态量子神经网络、多感知机模型等多种量子神经计算模型(这 些随后进行讨论) ,可以说,最近特别是近两年来量子神经计算领域的研究日趋活跃,正因为此,在 2000 年 3 月召开的第四届国际计算智能和神经科学会议上专门设立了量子计算与神经量子信息处理的 专题会议,并出版了论文特辑[14],此举引起了国际理论界的广泛关注。 神经计算与量子理论的结合可以有多种形式,由此产生的计算模型也各有特点,我们将二者结合 所对应的主要概念对照如表 1 所示。 当然,上述的对应并非一成不变,但建立如此的对应 关系是构成量子神经计算模型的前提,而且合理的定义有 利于模型和算法的设计与实现。 值得注意的是,上述对应中存在一个关键问题,即如 何调和神经计算非线性特征与量子系统中线性幺正变换之
1
引言
人工神经网络是对人脑工作机理的简单模仿,它建立在简化的神经元模型和学习规则的基础上, 由此产生了许多计算上的优势,并且已拥有非常成功的应用,不过随着应用的深入推广,神经计算的 局限与不足也逐渐显现出来, 特别表现在: (1) 传统意义上的学习在信息量大的情况下处理速度过慢, 不符合人脑实时反应、大容量作业的特征; ( 2)神经网络的记忆容量有限; (3 )神经网络需要反复训 练,而人脑却具有一次学习的能力; ( 4 )神经网络在接受新信息时会发生灾变性失忆( Catastrophic Forgetting)现象等等。这些本质上的缺陷促使人们产生发展传统神经计算理论的强烈要求,由此出现 了神经计算与其它理论相结合的研究,其中神经计算与量子理论的结合是一个极富前景的尝试。 量子理论自诞生 100 多年以来已取得了巨大的成功,但之前它与计算机科学、信息理论一直是作 为不同的学科并行发展,很少有人注意到它们之间有联系和交叉的可能性,这一局面一直维持到 1982 , 年, Beniof 和 Feynman 发现了将量子力学系统用于推理计算的可能 [1 2] ,1985 年 Deutsch 提出第一个 量子计算模型[3] ,由此,量子计算(Quantum Computation)迅速成为一门引人入胜的新学科,特别是 近年来由 Shor 提出的大数质因式分解算法[4] 和 Grover 提出的量子查询算法[5] ,他们对传统算法实现 了近乎指数级的改进,更是极大地推动了该领域的发展。随后便出现了以量子计算机、量子通讯以及 量子编码为代表的量子信息科学,使人们越来越清楚地认识到,其实信息理论、计算机科学和量子物 理学之间存在着密切而又深刻的内在联系。 量子计算与传统意义上的计算有着质的不同, 它的特点主要体现在量子态的叠加 ( Superposition) 、 纠缠( Entanglement )以及干涉 ( Interference )等性质上,许多计算上的优势如量子并行 ( Quantum Parallelism)等皆由此而产生。量子计算所表现出的惊人潜力和异乎寻常的特征皆是源于对传统计算 进行了量子改造,而神经计算则是对生物行为以信息处理方式的模拟,同时它的动力学特征与量子系 统有着许多相似之处,那么自然可以推断:量子理论与神经计算相结合就会构建出新的量子神经计算 模式。从理论上分析,这种结合将有助于理解人脑和意识的本质,有助于求解 NP-hard 问题,同时也 有助于深入理解神经计算理论和量子理论本身。因此,近年来国际上已有少数先行者在此领域展开了 诸如量子联想、并行学习、经验分析等问题的研究,虽然目前还只是处于初始阶段,但是他们构筑了 人工神经网络中量子计算的基础。
3
计算模型研究
几种典型的量子神经计算模型的设计要点见表 2。下面就其中几类主要的模型分别进行讨论。
第2期
解光军等:量子神经计算模型研究
85
3.1 基于量子双缝干涉实验的计算模型 1995 年 Chrisley 提出量子学习(Quantum Learning) 的概念,结合量子双缝干涉实验结构给出非叠加态量子神 经计算模型[11],此模型具有前馈网络的拓扑结构,见图 1 。 粒子 G 首先入射栅板 B,之后是一个光敏接收盘 P ,在 栅板 B 上有许多狭缝,其中上面部分组成输入区,下面部分 组成权值区, 调节狭缝的不同位置便可以在接收盘 P 上产生 不同的干涉模式,这样就可以实现两组映射:一个是由输入
中包含有非线性关系(表现为上式中 的势函数 V(x) 和指数函数) ,所以利 用该理论可进行非线性推导;
神经元 量子神经元 狭缝位置 时间片段 经典神经元 经典神经元 量子位
(3 ) Everett 的 多 宇 宙 ( Many Universes )观点。它认为量子态波函数始终满足 Schr ö dinger 方程,但测量的结果是将观测值分为 互不察觉的若干部分,而每个部分(即宇宙)只可能有一个结果,该理论特别适合于设计多感知机 类的网络结构。 虽然目前量子神经计算的研究还处于萌芽阶段,其理论远未成熟,但已有的理论分析和应用已有 证明,与传统的神经计算比较,量子神经计算模型至少在以下几个方面具有明显的优势: (1 )指数级 的记忆容量和回忆速度; (2 )较小的规模和简洁的网络拓扑结构,因此理论上有更好的稳定性和有效 性; (3)快速学习和一次学习的能力; (4)消除灾变性失忆的能力; (5)高的信息处理速度等。
表1 量子理论与神经计算模型的对应概念
量子理论 波函数 态叠加(相干) 测量(消相干或坍缩) 态纠缠 幺正变换 神经计算模型 神经元 内部连接(连接权) 趋向吸引子的演化 学习规则 增益函数(变换)
间的关系,我们认为可以通过以下三种途径来加以解决: (1 ) 利用量子坍缩原理。虽然量子系统中的演化算子是幺正的,但在结果的测量时(即坍缩过程) 所发生的消相干却是一个非幺正过程,我们可以把它视为量子系统趋向某个吸引子的非线性演化, 从而在量子系统中实现非线性映射; (2 ) 根据 Feynman 路径积分理论,由于在路径积分公式
| ψ (t )〉 =
all − paths
∑
t & 2 (τ ) i mx [ −V ( x (τ ))]dτ ∫ h 2 0 e
表2
模型 Perus Chrisley Behrman Goertzel Menneer Ventura
典型量子神经计算模型的设计要点
连接 Green 函数 经典连接权 光子作用 量子连接 经典连接权 态纠缠 变换 线性 非线性 非线性 非线性 非线性 非线性 网络类型 时域 多层 BP 时、空域 经典 多感知机 多感知机 动力学特性 坍缩 非叠加 路径积分 路径积分 多宇宙 非幺正变换