智能科学技术导论 第05讲 视觉感知
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
推断,才能获得更全面的意 义领会,其中包括那只鸬鹚 正在捕鱼的鸬鹚
随时将会捕捉水中小鱼的预
期意义。
福建省仿脑智能系统重点实验室
8
第5.1节 视觉机制
有时,视觉图案的意义 往往存在多重选择性,对其 含义的确切把握不仅依赖于 主观心理定势,而且也依赖 于图案本身所提供视觉刺激 的微小变化。例如对于图 右,你可以看作是一位标致 的年轻女子微微转过脸去的 侧身像,又可以看作是一位 老妇人的侧身像。
福建省仿脑智能系统重点实验室
6
第5.1节 视觉机制
无 中 生 有 的 视 觉 示 例
福建省仿脑智能系统重点实验室
7
第5.1节 视觉机制
不仅如此,对于一幅视
觉图案,含义的理解还存在 着画面意义和画外之音的区 分。例如就以右图而言,光
凭图案本身的识别并不能得
出其所要发生的一切内容,
只有根据知识和经验并加以
福建省仿脑智能系统重点实验室
4
第5.1节 视觉机制
坐在长椅上的男人
一条觅食的鬣狗
福建省仿脑智能系统重点实验室
5
第5.1节 视觉机制
说明这种“无中生意”的极好例子是“坐在长椅 上的男人”幻像。如图所示,除了一些在黑背景中 的白斑块外,原本什么也没有画,但您却能从这 幅图中看出意义来:一位坐在长椅上的男人形 象。其实这也不是什么新鲜事,读者或许在生活 中早有这样的经验:从天上的飘云中看出各种你 所熟悉的造形;在斑驳的墙上看到了人物肖像、 各种动作各异的动物形体;甚至还会为自然界形 成的奇石怪峰,牵强附会地来冠以石猴、石龟、 二郎探母等名号,等等。
福建省仿脑智能系统重点实验室
猫头鹰简笔画
19
第5.1节 视觉机制
的确,就我们的视觉系统而言,对视觉对象 的识认并不是通过部分分析,而是通过全局整体 性特征的把握得以完成。对这一认识,著名的瑞 士心理学家皮亚杰看得更为深刻,他在《结构主 义》一书中指出:“在任何既定情境里,一种因素 的本质就其本身而言是没有意义的,它的意义事 实上由它和既定情境中的其他因素之间的关系所 决定。总之,任何实体或经验的完整意义除非它 被结合到结构中去,否则便不能被人们感觉到。”
福建省仿脑智能系统重点实验室
3
第5.1节 视觉机制
对于人类视觉系统这种关注事物意义而忽略 无意义的视觉信息的功能,几乎发展到了无以复 加的地步。美国心理学家卡洛琳·布鲁墨在《视 觉原理》一书的开头就强调指出:“人的头脑从 外来的刺激中“毫无节制”地产生着含意。这是 一个事实,你所无法逃脱的过程,不管你愿意或 不愿意都在发生着的活动。你的头脑不断赋予外 界事物以含意——以致有时候这些含意本不存 在,完全是你的幻想创造出来的。”
周昌乐教授教学课件 dozero@xmu.edu.cn
智能科学技术导论
第05讲 视觉感知
主讲:周昌乐教授 福建省仿脑智能系统重点实验室 www.bliss.xmu.edu.cn 厦门大学智能科学与技术系
导语
在人类心智的机器模似研究中,恐怕没有 那个方面像在视觉上那样取得如此巨大的实际 应用性成功了。 不仅如此,视觉感知能力是人 类获取环境信息的主要渠道,在人类感知外部 世界中起者举足轻重的作用。因此,作为对人 类心智模拟的首要方面,也作为机器感知的典 型代表,我们就从机器视觉方面来还是我们智 能科学研究的讲述。为此,首先还是让我们具 体先来看一看人类丰富的视觉现象吧!
e.简单律:最后,整体知觉的一般规律还告 诉我们,在其它因素相同时,人们将把视觉对象 看成有组织的简单规则图形,就是说,看作是倾 向于对称、整齐、匀称、惯常的图形,这就是知 觉的简单律。
福建省仿脑智能系统重点实验室
26
第5.1节 视觉机制
实际上,视觉过程中,整体知觉就是把部分 整合为一个与以往经验相关联的完整形象,而简 单律就意味着这一过程遵循着经济原则,得出一 个最简单可能的形象去与刺激模式相匹配。从这 个意义上讲,整体知觉一方面体现了部分只有在 整体中才有意义这一原则;另一方面也体现了经 验形成的完形在知觉中的作用是以经济原则为基 础的。
福建省仿脑智能系统重点实验室
27
第5.1节 视觉机制
现代认知神经科学研究已经告诉我们,我们 这种复杂的整体知觉能力完全是大脑视觉皮层中 许多离散分布的特异化神经组织功能活动的产 物。那么人类的视觉系统又是如何如此复杂的视 觉功能的呢?让我们走进人类的视觉神经系统之 中,一探究竟。
福建省仿脑智能系统重点实验室
福建省仿脑智能系统重点实验室
18
第5.1节 视觉机制
请观看右图,我想人们 总是将其看作为一个猫头鹰 而不是有字母、线条、圆点 部分构成的拼图,这就是整 体知觉效果的结果。也就是 说,人们在把握视觉刺激 时,并不是以自下而上逐个 分析来获得生动的形象的, 而是同时将整幅图案进行整 合感知为有意义的形象。我 们具有整体知觉能力。
第5.1节 视觉机制
在人类视觉认知活动中,对图案观察的深度 和详细程度往往是依赖于所要完成的任务的,一 旦任务完成,观看者就不再会去费思耗神作额外 的分析理解去把握不必要的意义。对于给定视觉 认知任务,你会发现,当观看者完成任务后(正 确报告了要求回答的结果),对图形本身的形状 和布局依然知之甚少,这说明一旦达到了目的, 观察者是不会再作任何进一步的观看理解的。
28
第5.1节 视觉机制
人类的视觉系统
福建省仿脑智能系统重点实验室
29
第5.1节 视觉机制
在人类视觉系统中,第一个起到收集视觉刺激信息的 器官是眼睛。如图所示,眼睛是一种精巧万分的球状器 官,光线由外射入可以在眼睛的底部内侧形成一个倒立的 像,这一点很象我们生活中使用的照相机;所不同的是, 照相机的底片是由被动感光材料构成的胶片,而眼睛的 “底片”则是大脑神经外围组织的神经细胞群构成的视网 膜,并具有主动跟踪获取和能动解释信息的能力。
钉子缺,蹄铁卸;蹄铁卸,战马蹶; 战马蹶,骑士绝;骑士绝,战事折; 战事折,国家灭。 形象生动地讲的也就是这个道理。
福建省仿脑智能系统重点实验室
12
第5.1节 视觉机制
图案多重理解的困难还不仅于此,有时对于歧义图
案的多重选择也存在歧义。也就是说不是所有的歧义图 案都具有确定的几种含义可供选择,有时连有几种意义 本身也是含糊不清的。下一页给出了三种不同类型的歧 义图案,其中(a)图属于“含糊不清”型歧义图,你无法 知道应该将此图案理解为几个人脸;(b)图则属于“多 重选择”型歧义图,其具有二个相互独立的并且是排他性 的含义,主观理解了其一种含义就不会产生第二种含 义;(c)图属于“一图双关”型歧义图,就象一语双关的 句子一样,其同时给出了二个以上含义。于此可见,歧 义图案的理解问题远远要比我们想象的还要复杂,而这 一切又不过只是我们全部视觉思维机制的一部分。
福建省仿脑智能系统重点实验室
2
第5.1节 视觉机制
在漫长的进化历程中,我们发展了精妙的视
觉系统,使得我们的视觉能力适应在复杂环境中 获取有益于更好生存的视觉信息。因此,对于视 觉而言,捕捉环境变化中的意义是第一位的,而 没有意义的视觉信息是可以被忽略的,事实上也 确实被忽略了。英国心理学家Gregrory在《eyes and Brains》一书中指出:“感官接受的是生动的 图案,但是我们很少看图案,我们看的是事物。 相对来说,图案是无意义的标记的组合,而事物 除了具有感官特征以外,还有许多其它特征。”
第5.1节 视觉机制
除了形基规律外,整体知觉的组织规律还其
他一些规律,分别是: a.接近律:也就是说,我们的视觉易于根
据部分彼此之间的邻近或接近关系而组合起来并
因此而得出整体形象。
b.相似律:指具有某种特征(形状、颜
色、朝向、动向等)相似的项目,只要不被接近
因素掩盖,则倾向于联合在一起。
c.连续律:如果一套点子中有些点子显得
连续或完成一个有规律的系列、或者扩展成一条
简单的曲线,这套点子往往易于组织起来 。
福建省仿脑智能系统重点实验室
24
第5.1节 视觉机制
接近律
பைடு நூலகம்封闭律
连续律
简单律
福建省仿脑智能系统重点实验室
相似律
25
第5.1节 视觉机制
d.封闭律:有时,各种视觉组织律会在知 觉过程中产生竞争甚至冲突现象,此时最终知觉 的结果形象往往取决于哪种因素更为重要了,其 中封闭的图案往往有较大的优势。
福建省仿脑智能系统重点实验室
13
第5.1节 视觉机制
a.有多少张 人脸?
b.大号演奏家 还是美女
福建省仿脑智能系统重点实验室
c.既是箭头 又是小人
14
第5.1节 视觉机制
在视觉图案的理解把握
中,除了对意义本身理解困难 外,在视觉思维中还有一个机 器所要面临的更大困难,那就 是机器如何能象人类那样具备 观看图案的意图。很明显,图 案隐含着一定的含义这是意义 把握问题;而观察者愿意不愿 意以及基于什么样的目的去理 解图案则是观察者的意图问 题,这种观察意图直接影响了 对图案的理解结果。
福建省仿脑智能系统重点实验室
20
第5.1节 视觉机制
其实,早在20世纪初,发韧于德国而成熟于 美国的格式塔心理学派就对这种整体知觉及其规 律有过全面的论述。格式塔理论认为,形式知觉 产生于该形式部分之间的关系中,而部分特性就 人们所能确定的内容来说,依赖于它们所处整体 的全部关系,部分只有在整体中起作用,离开了 整体的部分是没有意义的。基于这样的认识,格 式塔心理学派将反映这种整体知觉的规律归纳为 一些普遍性规则,称为知觉组织律。
福建省仿脑智能系统重点实验室
17
第5.1节 视觉机制
归纳起来,人类视觉机制涉及整体知觉、主 观意念,多重选择和意图行为等问题。就感知层 面而言,即使不考虑主观意念,多重选择和意图 行为等这些高级思维层次的认知机制,其中的整 体知觉也是不可回避的核心机制。那么,人类视 觉又是如何实现这种整体知觉机制的呢?机器视 觉从中又能获得哪些启示呢?下面,我们就围绕 着视觉整体知觉能力,来展开分析。
福建省仿脑智能系统重点实验室
形基关系
22
第5.1节 视觉机制
不过,有时图形与背景会相互交替,你可以 将图形当作背景,而将背景当作图形,这就是在 可以互为形基关系图例中取得的效果。甚至有时 你很难正确区分出图形与背景,但这并不影响总 是存在图形与背景关系这一总的原则。
福建省仿脑智能系统重点实验室
23
产生一个意图
福建省仿脑智能系统重点实验室
15
第5.1节 视觉机制
有时即使遇到像右 图那样具有不可整合的 认知图例,在无法完成 有意义形象的感知时, 我们的视觉系统也不会 一味地死心眼陷于困境 而不能自拔,而是会产 生一个新的意图跳出任务,干脆不再去作无谓 的观看了。
福建省仿脑智能系统重点实验室
16
福建省仿脑智能系统重点实验室
21
第5.1节 视觉机制
首先,格式塔理论认为, 在整体知觉中,人们的视觉所 作出的最基本的区分乃是图形 与背景之间的区分,图形在背 景中显现出来反映的正是整体 性知觉机制。很明显,图形倾 向于轮廓更加鲜明、更好定 位、更加紧密和完整,一句话 更具有整体统一性;反之,背 景就显得不那么整齐规范,没 有什么结构可言。
环带上凹凸的小球
福建省仿脑智能系统重点实验室
11
第5.1节 视觉机制
遗憾的是,我们对人类的这种视觉理解的发
生机制的规律还知之不多,但有一点可以肯定 的,这其中包含了非线性突变的因素,即微小的 扰动可以引起完全不同的理解结果。这种现象我 们也称之为蝴蝶效应,指的是对初始条件的敏感 依赖性,是不可预测性的。所谓“差之毫厘,失之 千里”指的就是这种效应。西方有一首民谣唱到:
福建省仿脑智能系统重点实验室
少女与老妇
9
第5.1节 视觉机制
但如果给图案稍稍改变;那么你就不再会有 这种二难选择的困难了,参下面的兔鸭图 (b)。此时图(a)只能被理解为鸭子而图 (c)也只能被理解为兔子。
a
b
c
兔鸭图
福建省仿脑智能系统重点实验室
10
第5.1节 视觉机制
当然,对于有多
种理解的情形,有时主 观意向或意念也会起到 重要作用。只有当一个 意念,在一定的环境因 素触动之下,被动的图 案及其环境与其发生关 系时,才会突现出来, 成为最终理解的结果含 义。
福建省仿脑智能系统重点实验室
30
第5.1节 视觉机制
眼睛中的晶状体是一种可调节焦距的透明物 质,而通过头/眼运动系统,则可以完成主动跟 踪被视物体;另外视网膜中神经细胞的自主活动 与相互作用又为能动解释视觉信息提供了可能。 视网膜,复盖在眼睛底部的网状薄膜,是由多层 神经细胞相互交错连接而成的,如图所示。最底 层的那层细胞称为感光细胞,其上附着一定的色 素,不匀均地分布在中央凹的周围。