《机器视觉及其应用》部分课后习题

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章机器视觉系统构成与关键技术

1、机器视觉系统一般由哪几部分组成?机器视觉系统应用的核心目标是什么?主要的分成几部分实现?

用机器来延伸或代替人眼对事物做测量、定位和判断的装置。组成:光源、场景、摄像机、图像卡、计算机。

用机器来延伸或代替人眼对事物做测量、定位和判断。三部分:图像的获取、图像的处理和分析、输出或显示。

2、图像是什么?有那些方法可以得到图像?

图像是人对视觉感知的物质再现。光学设备获取或人为创作。

3、采样和量化是什么含义?

数字化坐标值称为取样,数字化幅度值称为量化。采样指空间上或时域上连续的图像(模拟图像)变换成离散采样点(像素)集合的操作;量化指把采样后所得的各像素的灰度值从模拟量到离散量的转换。采样和量化实现了图像的数字化。

4、图像的灰度变换是什么含义?请阐述图像反色算法原理?

灰度变换指根据某种目标条件按照一定变换关系逐点改变原图像中每一个像素灰度值,从而改善画质,使图像的显示效果更加清晰的方法。对于彩色图像的R、G、B各彩色分量取反。

第二章数字图像处理技术基础

1、对人类而言,颜色是什么?一幅彩色图像使用RGB色彩空间是如何定义的?24位真彩色,有多少种颜色?

对人类而言,在人类的可见光范围内,人眼对不同波长或频率的光的主观感知称为颜色。一幅图像的每个像素点由24位编码的RGB 值表示:使用三个8位无符号整数(0 到255)表示红色、绿色和蓝色的强度。

256*256*256=16,777,216种颜色。

2、红、绿、蓝三种颜色为互补色,光照在物体上,物体只反射与本身颜色相同的色光而吸收互补色的光。一束白

光照到绿色物体上,人类看到绿色是因为?

该物体吸收了其他颜色的可见光,而主要反射绿光,所以看到绿色。

3、成像系统的动态范围是什么含义?

动态范围最早是信号系统的概念,一个信号系统的动态范围被定义成最大不失真电平和噪声电平的差。而在实际用途中,多用对数和比值来表示一个信号系统的动态范围,比如在音频工程中,一个放大器的动态范围可以表示为:

D = lg(Power_max / Power_min)×20;

对于一个底片扫描仪,动态范围是扫描仪能记录原稿的灰度调范围。即原稿最暗点的密度(Dmax)和最亮处密度值(Dmin)的差值。

我们已经知道对于一个胶片的密度公式为D = lg(Io/I)。那么假设有一张胶片,扫描仪向其投射了1000单位的光,最后在共有96%的光通过胶片的明亮(银盐较薄)部分,而在胶片的较厚的部分只通过了大约4%的光。那么前者的密度为:

Dmin=lg(1000/960)= 0.02;

后者的密度为:

Dmax=lg(1000/40)= 1.40

那么我们说动态范围为:D=Dmax-Dmin=1.40-0.02=1.38。

只要是扫描仪的动态范围能够大于胶片的动态范围,就可以真实的表现原稿上的信息,包括真实的反映出一些细微的暗部细节。

动态范围(Dynamic Range),最早是信号系统的概念,一个信号系统的动态范围被定义成最大不失真电平和噪声电平的差。而在实际用途中,多用对数和比值来表示一个信号系统的动态范围,对于底片扫描仪来说,动态范围是指扫描仪能记录原稿的色调范围,即原稿最暗点的密度(Dmax)和最l亮处密度值(Dmin)的差值。而对于胶片和感光元件来说,动态范围表示图像中所包含的从“最暗”至“最亮”的范围。动态范围越大,所能表现的层次越丰富,所包含的色彩空间也越广。

相机的动态范围越大,它能同时记录的暗部细节和亮部细节越丰富。请注意,动态范围与色调范围(tonal range)是不同的。

当我们采用JPEG格式拍摄照片时,相机的图像处理器会以明暗差别强烈的色调曲线记录图像信息。在这个过程中,处理器常常会省去一部分RAW数据上的暗部细节和亮部细节。而使用RAW格式拍摄,则能图像保持感光元件的动态范围,并且允许用户以一条合适的色调曲线压缩动态范围和色调范围,使照片输出到显示器或被打印出来后,获得适当的动态范围。

相机的感光元件是由数以百万个像素组成的,这些像素在像素曝光的过程中吸收光子,转化成数字信号,然后成像。这个过程就像我们拿数百万个水桶到户外收集雨水。感光区域越光亮,收集的光子量自然越多。感光元件曝光后,按照每个像素收集的光子量不同,赋予它们不连续的值,并转化为数字信号。没有吸收光子和吸收光子至满载的像素值分别显示为"0"和"255",即代表纯黑色和纯白色。

一旦这些像素满载,光子便会溢出,溢出会导致信息(细节)损失。以红色为例,高光溢出使满载红色的像素附近的其它象素的值都变成255,但其实它们的真实值并没有达到255。换句话说,画面的细节发生了损失,这样会造成高光部分的信息缺失。如果我们以减少曝光时间来防止高光溢出,很多用来描述昏暗环境的像素则没有足够的时间接收光子量,得出的像素值为0,这样就会导致昏暗部分的信息缺失。

通过上面的说明,我们现在就可以理解为什么采用大尺寸感光元件的数码单反会拥有更大的动态范围。原因很简单:数码单反的感光元件尺寸一般是消费级相机的4~10倍,允许承载更多的像素而不至于缩小像点之间的距离,而产生噪点。更多的像素不会很快被“填满”,因此表现昏暗环境的像素在表现光亮环境的像素“满载”之前,有更多时间吸收光子,从而画面细节便会更加丰富。

数字相机DSLR、DC等等的动态范围表示方法目前似乎并没有统一的约束,各个厂家也只是在他们的宣传内容上提到了“大的动态范围”之类的话,并未给出具体的指标。所以有时我们用比值来描述DSLR的动态范围,或者换算成光圈数,而较少用到密度值概念。

因为数字图象设备也可以看作一个信号系统,所以动态范围可以分为两个部分,即光学动态范围和输出动态范围。

光学动态范围(DR_Optical) = 饱和曝光量 / 噪声曝光量(暗电流)

输出动态范围(DR_Electrical) = 饱和输出振幅 / 随机噪声

前者主要是由CCD/CMOS等感应器决定的,后者主要由A/D、DSP来决定。其中饱和曝光量相当于传统胶片的肩部范围,噪声曝光量相当于传统胶片的趾部范围。

对于数字相机,因为其最终还是以数字量输出,所以输出动态范围公式并不适用。我们提到的动态范围主要指的是输入部分的动态范围,也就相当于胶片的宽容度。

4、图像的位深度是什么含义?

用于指定图像中的每个像素可以使用的颜色信息数量。每个像素使用的信息位数越多,可用的颜色就越多,颜色表现就更逼真。

5、图像分辨率是什么含义?

指图像中存储的信息量,是每英寸图像内有多少个像素点,分辨率的单位为PPI(Pixels Per Inch),通常叫做:像素每英寸。

6、图像的直方图是如何定义的?其反映了什么信息?请绘制下图像的直方图。

灰度直方图是灰度级的函数,描述图像中该灰度级的像素个数(或该灰度级像素出现的频率):其横坐标是灰度级,纵坐标表示图像中该灰度级出现的个数(频率)。反映了图像灰度的分布情况。

相关文档
最新文档