数据挖掘技术与应用-图像分析-图像大数据

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第九章 图像大数据

目 录图像分类face_recognition 0102

图像大数据

图像分类

n图像数据分析的内容是什么?内容分析,内容识别,检测都离不开图像的分类

n分类目标:所谓图像分类问题,就是已有固定的分类标签集合,然后对于输入的图像,从分类标签集合中找出一个分类标签,最后把分类标签分配给该输入图像。

图像大数据

图像分类的例子

图像大数据

图像分类的例子

n图像分类模型读取该图片,并生成该图片属于集合 {cat, dog, hat, mug}中各个标签的概率

图像大数据

图像分类在别的领域

n虽然看起来挺简单的,但这可是计算机视觉领域的核心问题之一,并且有着各种各样的实际应用。

n卫星影响

n医学领域

图像大数据

卫星领域

“空间考古学家”Sarah使用卫星影像定位过许多遗失的埃及城市、古庙和陵墓。

图像大数据

医学领域

基于海量的放射影像,准确识别疾病病灶并量化,为医生提供最专业的诊断依据

图像大数据

图像在计算机中的结构

n在进行图像分类前我们了解一下图像在计算机中的结构

n对于计算机来说,图像是一个由数字组成的巨大的3维数组。

图像大数据

图像在计算机中的结构

图像大数据

图像在计算机中的结构

n在这个例子中,猫的图像大小是宽248像素,高400像素,有3个颜色通道,分别是红、绿和蓝(简称RGB)。如此,该图像就包含了

248X400X3=297600个数字,每个数字都是在范围0-255之间的整型,其中0表示全黑,255表示全白。

图像大数据

图像与机器学习

n我们发现了图像是以数组形式进行的表达n能否将这些数组放入机器学习算法中

n通过比较数组的距离进行分类

图像大数据

图像与机器学习

图像大数据

图像分类的简单实现

n我们在进行线性分类前,先了解一下将会使用到的工具OpenCV

n OpenCV是一个用于图像处理、分析、机器视觉方面的开源函数库

n该库包含了横跨工业产品检测、医学图像处理、安防、用户界面、摄像头标定、三维成像、机器视觉,该

库也包含了比较常用的一些机器学习算法

图像大数据

OpenCV

n OpenCV功能非常强大,我们在此只对常用功能做介绍

n更多的详情参考:https:///

图像大数据

最简单的线性划分

>>>import cv2

# Load input image -- 'table.jpg' >>>input_file = 'D:/ml/flower.jpg' >>>img = cv2.imread(input_file)

图像大数据

最简单的线性划分

>>>input_file2 = 'D:/ml/flower.jpg' >>>img2 = cv2.imread(input_file2) >>>print(img2-img))

图像大数据

图像分类困难和挑战

n计算机是机械的,即使非常细微的变化在图像矩阵中也会变为巨大的差异

图像大数据

图像分类困难和挑战

n视角变化(Viewpoint variation):同一个物体,摄

像机可以从多个角度来展现。

n大小变化(Scale variation):物体可视的大小通常是会变化的(不仅是在图片中,在真实世界中大小也是变化的)。

n形变(Deformation):很多东西的形状并非一成不变,会有很大变化。

图像大数据

图像分类困难和挑战

n遮挡(Occlusion):目标物体可能被挡住。有时候只有物体的一小部分(可以小到几个像素)是可见的。

n光照条件(Illumination conditions):在像素层面上,光照的影响非常大。

n背景干扰(Background clutter):物体可能混入背

景之中,使之难以被辨认。

图像大数据

图像分类的光照

图像大数据图像分类的变形

图像大数据图像分类的遮挡

图像大数据

图像分类困难和挑战

n思考:为什么人可以快速识别?你是如何快速判断的一个事物的呢?

图像大数据

图像分类困难和挑战

n答案:特征,人们通过物体的特征来确定,回想一下我们是否通过尾巴和尖尖的耳朵确定了躲在窗帘后的猫?

图像大数据

图像分类的特征提取

n SIFT算法,尺度不变特征转换(Scale-invariant feature transform或SIFT)算法是一种特征提取的方法。它在尺度空间中寻找极值点,并提取出其位置、尺度、旋转不变量,并以此作为特征点并利用特征点的邻域产生特征向量

图像大数据

图像分类的特征提取

n FAST特征点检测是公认的比较快速的特征点检测方法,只利用周围像素比较的信息就可以得到特征点,简单,有效。该方法多用于角点检测。

图像大数据

图像分类的特征提取

图像大数据

图像分类的特征提取实现

>>>import cv2

>>>sift = cv2.xfeatures2d.SIFT_create()

图像识别案例

人脸识别

n人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术

n人脸与人体的其它生物特征(指纹、虹膜等)一样与生俱来,它的唯一性和不易被复制的良好特性为身份鉴别提供了必要的前提

相关文档
最新文档