数据挖掘技术与应用-图像分析-图像大数据
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第九章 图像大数据
目 录图像分类face_recognition 0102
图像大数据
图像分类
n图像数据分析的内容是什么?内容分析,内容识别,检测都离不开图像的分类
n分类目标:所谓图像分类问题,就是已有固定的分类标签集合,然后对于输入的图像,从分类标签集合中找出一个分类标签,最后把分类标签分配给该输入图像。
图像大数据
图像分类的例子
图像大数据
图像分类的例子
n图像分类模型读取该图片,并生成该图片属于集合 {cat, dog, hat, mug}中各个标签的概率
图像大数据
图像分类在别的领域
n虽然看起来挺简单的,但这可是计算机视觉领域的核心问题之一,并且有着各种各样的实际应用。
n卫星影响
n医学领域
图像大数据
卫星领域
“空间考古学家”Sarah使用卫星影像定位过许多遗失的埃及城市、古庙和陵墓。
图像大数据
医学领域
基于海量的放射影像,准确识别疾病病灶并量化,为医生提供最专业的诊断依据
图像大数据
图像在计算机中的结构
n在进行图像分类前我们了解一下图像在计算机中的结构
n对于计算机来说,图像是一个由数字组成的巨大的3维数组。
图像大数据
图像在计算机中的结构
图像大数据
图像在计算机中的结构
n在这个例子中,猫的图像大小是宽248像素,高400像素,有3个颜色通道,分别是红、绿和蓝(简称RGB)。如此,该图像就包含了
248X400X3=297600个数字,每个数字都是在范围0-255之间的整型,其中0表示全黑,255表示全白。
图像大数据
图像与机器学习
n我们发现了图像是以数组形式进行的表达n能否将这些数组放入机器学习算法中
n通过比较数组的距离进行分类
图像大数据
图像与机器学习
图像大数据
图像分类的简单实现
n我们在进行线性分类前,先了解一下将会使用到的工具OpenCV
n OpenCV是一个用于图像处理、分析、机器视觉方面的开源函数库
n该库包含了横跨工业产品检测、医学图像处理、安防、用户界面、摄像头标定、三维成像、机器视觉,该
库也包含了比较常用的一些机器学习算法
图像大数据
OpenCV
n OpenCV功能非常强大,我们在此只对常用功能做介绍
n更多的详情参考:https:///
图像大数据
最简单的线性划分
>>>import cv2
# Load input image -- 'table.jpg' >>>input_file = 'D:/ml/flower.jpg' >>>img = cv2.imread(input_file)
图像大数据
最简单的线性划分
>>>input_file2 = 'D:/ml/flower.jpg' >>>img2 = cv2.imread(input_file2) >>>print(img2-img))
图像大数据
图像分类困难和挑战
n计算机是机械的,即使非常细微的变化在图像矩阵中也会变为巨大的差异
图像大数据
图像分类困难和挑战
n视角变化(Viewpoint variation):同一个物体,摄
像机可以从多个角度来展现。
n大小变化(Scale variation):物体可视的大小通常是会变化的(不仅是在图片中,在真实世界中大小也是变化的)。
n形变(Deformation):很多东西的形状并非一成不变,会有很大变化。
图像大数据
图像分类困难和挑战
n遮挡(Occlusion):目标物体可能被挡住。有时候只有物体的一小部分(可以小到几个像素)是可见的。
n光照条件(Illumination conditions):在像素层面上,光照的影响非常大。
n背景干扰(Background clutter):物体可能混入背
景之中,使之难以被辨认。
图像大数据
图像分类的光照
图像大数据图像分类的变形
图像大数据图像分类的遮挡
图像大数据
图像分类困难和挑战
n思考:为什么人可以快速识别?你是如何快速判断的一个事物的呢?
图像大数据
图像分类困难和挑战
n答案:特征,人们通过物体的特征来确定,回想一下我们是否通过尾巴和尖尖的耳朵确定了躲在窗帘后的猫?
图像大数据
图像分类的特征提取
n SIFT算法,尺度不变特征转换(Scale-invariant feature transform或SIFT)算法是一种特征提取的方法。它在尺度空间中寻找极值点,并提取出其位置、尺度、旋转不变量,并以此作为特征点并利用特征点的邻域产生特征向量
图像大数据
图像分类的特征提取
n FAST特征点检测是公认的比较快速的特征点检测方法,只利用周围像素比较的信息就可以得到特征点,简单,有效。该方法多用于角点检测。
图像大数据
图像分类的特征提取
图像大数据
图像分类的特征提取实现
>>>import cv2
>>>sift = cv2.xfeatures2d.SIFT_create()
图像识别案例
人脸识别
n人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术
n人脸与人体的其它生物特征(指纹、虹膜等)一样与生俱来,它的唯一性和不易被复制的良好特性为身份鉴别提供了必要的前提