视觉视觉研究的准备基本原理与方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
终归失败
结构的理解不能启迪了解运动系统,不能指导写程 序 已有的研究重点在描述细胞行为而不解释为什么有 这样的行为
• 视区在做什么工作?哪些问题需要解释? 应该在哪个层面上解释?
– Barlow, Hubel and Wiesel: 特征检测器 – 当时视觉工作者们:从图像中提取边缘和线条 非常棘手
• 英国神经科学家、心理学家 • 教育背景
– Trinity College, Cambridge mathematics BA – Trinity College, Cambridge physiology PH.D.
• 把心理学、神经生理学、人工智能融入到 视觉处理模型 • 开创了计算神经这门学科 • 1945-1980
视觉研究的背景
• 早期阶段
– 牛顿(1704) :颜色视觉 – 亥姆霍兹(1910):生理光学 – Wertheimer(1923):在像电影那样依次呈现 的图像中发生的不是单个点的运动,而是整体 的(即“场”的)视运动 – 心理学格式塔学派:描述整体的性质(共同性、 差异性),阐明这些整体发生的“法则”
信息处理的观点
• 应信息处理任务和信息处理机器的需求而生 • 与我们周围很多现象相关(进化,思想等) • 特点:完整的理解需要多个层次的解释
普通人的直接经验
视觉
脑科学家、生理学家和 解剖学家细胞级的认识
计算机工作者的程序实 现
计算和计算机—不同层次
• 计算
– 具体的信息处理任务
• 计算机
– 能在程序控制下进行运算的机器
• 正在执行某一特殊信息处理任务的机器 • 人脑
– 不仅仅是一台计算机,而且是一台习惯于执行 某些相当特殊的计算的计算机
哲学依据--意识的表象理论
• 假设意识可以利用内部表象系统 • 心理状态
– 判断内部表象当前正在说明的是哪些内容
• 心理过程
– 如何得到这样的内部表象 – 这些内部表象怎样相互作用
信息处理系统
----表象和描述
• 表象
– 一种能把某些实体或某几类信息表达清楚地形式 系统,以及说明该系统如何行使其职能的规则
• 描述
– 使用某一种表象描述一个给定实体的结果
• 表象的特点
– 使某些信息明确而另一些隐藏
• 举例
– 阿拉伯数制、二进制
信息处理系统
---- 处理
• 从超级市场收银机入手
• 表象的提出及解释
– Shepard and Metzler(1971) : 意识的移动实验
• 电生理学方法(还原论方法)
盛极一时
放大技术使记录单个神经元的活动成为可能 细胞“感受野”的概念 Barlow :对单个神经细胞的活动以及它对其他神经 细胞影响的反应的描述是理解神经系统功能的足够 完整的描述
• 构成视觉基础的计算的本质 • 研究神经元与理解视觉 = 研究羽毛与理解 飞行 • 执行某个任务的程序与任务的理论的混淆
– 特殊机制解决特殊问题的解释的发展
• 做什么与怎么做的理论差别的模糊
– 阻碍了人工智能和语言学的交流(Chomsky 转 移语法学的定位)
信息处理系统
----J.J.Gibson的方法
• 观点
– 脑是从我们置身于其中的流动着的能量的阵列中寻找 并提取与环境有关的信息,神经系统以某种方式与这 些不变量谐振
• 优点
– 知觉问题:从感觉信息恢复外部世界有效性质的问题
• 缺点
1. 未能认识到像图像表面这种物理不变因子的检测是信 息处理问题 2. 低估了这种检测的困难
信息处理系统
----哲学上探讨知觉问题的传统
• 知觉心理学研究者,研究知觉的各种性质 和实现情况
– 颜色视觉的三原色理论 – 运动知觉 知觉的独立模块
Miles(1931) &Wallach and O’Connell(1953) B.Julesz 双眼随机点立体图
• 心理物理学
– Campbell & Robson(1968) :在我们的知觉器官的 前级,存在着若干个独立的空间频率调谐通道, 即对图像中以一个特定尺度或空间间隔出现的 光强度变化敏感的通道。
提纲
• • • • • • 作者介绍 视觉是什么—导言 视觉研究的背景 信息处理系统 视觉的表象框架 总结
视觉是什么?
• 普通人(包括亚里士多德)
– 视觉是一处理过程:通过观看,认知有什么东 西在什么地方
• Marr 等人
– 视觉
信息处理
表象
Marr 方法论的要旨在于认为视觉是一种复杂的信息处理任务, 其目的是要把握对我们有用的外部世界的各种情况,并把他 们表达出来。 -------- T. Poggio
视觉
视觉研究的准备:基本原理与方法
视觉建模组 狄晓斐 2010.09.08
提纲
• • • • • • 作者介绍 视觉是什么—导言 视觉研究的背景 信息处理系统 视觉的表象框架 总结
提纲
• • • • • • 作者介绍 视觉是什么—导言 视觉研究的背景 信息处理系统 视觉的表象框架 总结
David Marr
1. 经验方法:边缘提取算子 2. 分析受限场景(比如:积木世界) 3. Land, McCann and Horn颜色视பைடு நூலகம்的锐化处理理论 和 Horn 从明暗恢复形状 4. Marr and Poggio 存在一个层次独立的对知觉过程 中所完成的信息处理任务进行分析和理解
提纲
• • • • • • 作者介绍 视觉是什么—导言 视觉研究的背景 信息处理系统 视觉的表象框架 总结
视知觉研究的有用框架,本理论的出发点
本书的内容安排
• 第一部分
– 导言(阐明思想方法)、研究方法、表象框架 以及如何得到这个框架
• 第二部分
– 研究方法和理论框架在视觉中的体现
• 第三部分
– 自问自答,阐明研究方法背后的思想方法
提纲
• • • • • • 作者介绍 视觉是什么—导言 视觉研究的背景 信息处理系统 视觉的表象框架 总结
– – – – 这个装置做什么? 为什么会这样做? 怎么做? 物理实现 加法(加法的性质) 约束条件 加法规则 晶体管等器件
信息处理系统
---- 三个层次
联系 与 区别
三个层次间存在着一定的逻辑的因果关系,
这种关系很松散 某些现象可以只在其中一个或两个层次上进行解释
信息处理系统
----计算理论的重要性