机器学习方法在图像分类中的应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
者数 学公 式 的形式 给 出。
方 图的不 同来分 析两 幅 图像 之 间在 颜色 分布 上 的差 异 ,但 是 由于对 于 其他 的一 些特 点 如形 状等 不敏 感 ,因 此效 果 并不 是十 分 的理 想 。 上 世 纪 八十 年 代P a w l a k . z 等人 提 出 的粗糙 集 理论 ,通过 引入 代 数 中 的等价 关 系来 解 读 知识 ,通 过对 一 些知 识 的处 理 ,从而 获得 了更好 的分 类效 果 。 另外 基 于机 器学 习方 法 的分 类 主要 由贝叶 斯方 法和 神经 网络方
S V M 自从提 出后 ,虽然 有 非常 多的 不同版 本 ,但是 在神 经 网络 大 规模 应用 之前 ,一直 是效 果最好 的 图像分 类方 法之 一 。 S V M是针对 线性可 分的问题提 出的一种分类算 法,首先模 型需要 保 证支持 向量与分 类标准之 间的最大 间隔 ,即在保证所 有的样 本都被 分 类正确 的前提 下,满足 两类 之 间的分类 间隔最大 。对 于图像分 类来 说 ,我们将 图像的每 一个像素 点都当做是 图像的一个属 性 ,在S V M中 我 们将 一幅 图像展 开成一 个 向量 作为 模型 的输 入 ,如果 图像是3 2 * 3 2
法等。
模型 预测 :首先 运用 “ 测 试集 ”对 分类 模 型进 行评 估 ,若模 型 预测 的准 确性 足够 高 ,就 可 以用该 模 型对未 知类 别 属性 值 的图像 进
行 分类 预测
贝 叶斯 分类 方 法 的主 要 过 程 是 :首 先 计 算 每 一 个 训 练集 的类 分 布 ,把 这种 分布 作 为每 一 个类 别 的概 率分 布 ,然 后再 利用 概 率论
中 的贝 叶斯 定理 和数 理 统计 学 去估 算某 个特 质样 本 属于 那一 类 的概
3 . 图像分类方法
3 . 1 支持 向量 机
率 大 小 。贝 叶斯方 法 又可 具体 分 为 贝叶 斯信 念 网络和 朴 素 贝叶斯 方
法 ,但 是 根 据 目前 状 况 来 看 , 该方 法 应 用 较 多 的 是 贝 叶 斯信 念 网
【 关键词 】机器学习;图像分类 ;S V M;深度学习
1 . 概述
1 . 1 研 究 背景 与意 义 随 着社 会 的发 展 ,尤 其是 智 能手机 的普及 ,人们 获 取 图像 的方
2 . 图像分类
2 . 1什 么是 图像 分 类 分类 是根据训 练数据集 中的数据 所表现 出来的类特 征,给每一 类 确定 一种准确 地描述 方式 ,由此生成类描 述或模 型,并运 用这种描 述 方式对 新 的数 据集进 行分类 。图像分类 是指针对 原始 的图片数据 ,对 数据进行过 滤、提取特征 等操作 ,然后 根据 图像特征进 行分类 。 2 . 2 图像分 类 的过 程 图像 数 据 的预处 理 :首 先我 们需 要针 对相 应 的图像 做 一部分 预 处理 ,这 一 步 的主要 目的是 处理 原始 的 图片数 据 ,使其 符合 我们 的 模型 的 需要 ,有 一些 对 图像 的基 础操 作也 在这 一步 骤 中进行 。比如 将 图片裁 剪 成特 定 的大 小 ,将 彩 色 图转换 成灰度 图,将 数据 处理 成
E L E C T R ON I C S WO R L D・ 探 索与观察
相器 学 习方 法在 图像 分 类 【 l 】 硇 应用
河南省郑 州 中学 虞 达飞
【 摘要 】 近 年来 ,随着硬件技 术的发展 ,尤其是 G P u计算能 力的提 升 ,机 器学 习方法在 图像 分类领域取得 了一 系列的进展 ,特 别是 卷积神 经网络 对 于提 高 图像分 类的效果有 着显著 的作 用。综述 图像 分类 的基 本概念 ,以及 近机器 学习,深度 学习方法在 图像分 类领 域的进展和典 型模 型。
S wa i n 和B a l l a r d 提 出 了基 于 色彩 直 方 图的 方法 , 通 过 比较 颜 色直
们 的训 练数 据是 非常 不 足的 ,但 是像 是神 经 网络这 种算 法往 往 需要 非常 大量 的 训练 数据 , 如果 训练数 据 不足 的话 ,很 容 易造成 网络 的 过拟 合 。这 样模 型的 泛化 误差 就会 非 常 的大 ,得不 到 良好 的分类 效 果 。因此 我们 需 要对 图像 进 行一 些随机 裁剪 ,随机 翻转 ,旋 转随 机 角度 等操作 ,增 加 数据 的复 杂性 ,提 高模 型 的泛化 能力 。 构建 分类 模 型 :首先 需要 一个 类 别属 性值 己知 的数 据集 作为 训 练 集 ,经 过特 征提 取 和离 散化 后 ,进行 训练 样本 集 的监 督学 习 ,去 建立 一个 分 类模 型 。最后 我们 的分 类模 型 一般 是 以规则 ,决 策树 或
统一 的格 式等 。 数 据增 强 : 由于 我 们 的 数 据存 在 着 很 大 的 差 异 ,很 多 时 候 我
式越 来 越方 便 、快 捷 。因此 网络上 存储 的图片 数据 越 来越 多 ,不仅 仅给 图像数 据 的存 储带 来 了很 大 的 困难 ,并且 图像 数 据 中存储 的 信 息 也是 十分 丰 富 的,要 获取 图像 中的信 息 也变 得越 来越 重 要 。图像 中 的信 息对 于 我们 来说 也 是非 常重 要 的 ,这些 信 息不仅 可 以帮 助 我
在 进 行 图像 分类 之前 ,必 须 对 它 们 进 行 高 效 的 分 类 管 理 , 并 且 ,想要 让 计算 机像 人 类一 样 灵活 地对 图像 数 据进 行分 类 ,具 有非 常大 的挑 战 性 ,其 中所 要面 临 的难 题不 仅 是 图像数 据 的不 规则 性 , 还 包 括 图像 的数 量 级 ,不 同 图像 数 据 的表示 方 法等 等 ,因此 ,图像 分类 问题 向来 都是 一 个具 有挑 战性 的研 究 热点 。 1 . 2 图像 分 类 的当前 研 究现 状
们 获 得人 们 的想 法 ,还为 我们 提供 了很 多 人类 的行 为数 据 。
图像 分 类是 一 个基 础性 的 工作 ,它 的应 用 非 常广 泛 ,不仅 应用 在 图像 分类 管 理和 信息 提取 方 面 ,还应 用于 目标识 别 ,人脸 识 别 ,
图像检 索 等 方面 ,并且 在 其他 研 究领域 有 Hale Waihona Puke Baidu要 的价 值和 意义 。
方 图的不 同来分 析两 幅 图像 之 间在 颜色 分布 上 的差 异 ,但 是 由于对 于 其他 的一 些特 点 如形 状等 不敏 感 ,因 此效 果 并不 是十 分 的理 想 。 上 世 纪 八十 年 代P a w l a k . z 等人 提 出 的粗糙 集 理论 ,通过 引入 代 数 中 的等价 关 系来 解 读 知识 ,通 过对 一 些知 识 的处 理 ,从而 获得 了更好 的分 类效 果 。 另外 基 于机 器学 习方 法 的分 类 主要 由贝叶 斯方 法和 神经 网络方
S V M 自从提 出后 ,虽然 有 非常 多的 不同版 本 ,但是 在神 经 网络 大 规模 应用 之前 ,一直 是效 果最好 的 图像分 类方 法之 一 。 S V M是针对 线性可 分的问题提 出的一种分类算 法,首先模 型需要 保 证支持 向量与分 类标准之 间的最大 间隔 ,即在保证所 有的样 本都被 分 类正确 的前提 下,满足 两类 之 间的分类 间隔最大 。对 于图像分 类来 说 ,我们将 图像的每 一个像素 点都当做是 图像的一个属 性 ,在S V M中 我 们将 一幅 图像展 开成一 个 向量 作为 模型 的输 入 ,如果 图像是3 2 * 3 2
法等。
模型 预测 :首先 运用 “ 测 试集 ”对 分类 模 型进 行评 估 ,若模 型 预测 的准 确性 足够 高 ,就 可 以用该 模 型对未 知类 别 属性 值 的图像 进
行 分类 预测
贝 叶斯 分类 方 法 的主 要 过 程 是 :首 先 计 算 每 一 个 训 练集 的类 分 布 ,把 这种 分布 作 为每 一 个类 别 的概 率分 布 ,然 后再 利用 概 率论
中 的贝 叶斯 定理 和数 理 统计 学 去估 算某 个特 质样 本 属于 那一 类 的概
3 . 图像分类方法
3 . 1 支持 向量 机
率 大 小 。贝 叶斯方 法 又可 具体 分 为 贝叶 斯信 念 网络和 朴 素 贝叶斯 方
法 ,但 是 根 据 目前 状 况 来 看 , 该方 法 应 用 较 多 的 是 贝 叶 斯信 念 网
【 关键词 】机器学习;图像分类 ;S V M;深度学习
1 . 概述
1 . 1 研 究 背景 与意 义 随 着社 会 的发 展 ,尤 其是 智 能手机 的普及 ,人们 获 取 图像 的方
2 . 图像分类
2 . 1什 么是 图像 分 类 分类 是根据训 练数据集 中的数据 所表现 出来的类特 征,给每一 类 确定 一种准确 地描述 方式 ,由此生成类描 述或模 型,并运 用这种描 述 方式对 新 的数 据集进 行分类 。图像分类 是指针对 原始 的图片数据 ,对 数据进行过 滤、提取特征 等操作 ,然后 根据 图像特征进 行分类 。 2 . 2 图像分 类 的过 程 图像 数 据 的预处 理 :首 先我 们需 要针 对相 应 的图像 做 一部分 预 处理 ,这 一 步 的主要 目的是 处理 原始 的 图片数 据 ,使其 符合 我们 的 模型 的 需要 ,有 一些 对 图像 的基 础操 作也 在这 一步 骤 中进行 。比如 将 图片裁 剪 成特 定 的大 小 ,将 彩 色 图转换 成灰度 图,将 数据 处理 成
E L E C T R ON I C S WO R L D・ 探 索与观察
相器 学 习方 法在 图像 分 类 【 l 】 硇 应用
河南省郑 州 中学 虞 达飞
【 摘要 】 近 年来 ,随着硬件技 术的发展 ,尤其是 G P u计算能 力的提 升 ,机 器学 习方法在 图像 分类领域取得 了一 系列的进展 ,特 别是 卷积神 经网络 对 于提 高 图像分 类的效果有 着显著 的作 用。综述 图像 分类 的基 本概念 ,以及 近机器 学习,深度 学习方法在 图像分 类领 域的进展和典 型模 型。
S wa i n 和B a l l a r d 提 出 了基 于 色彩 直 方 图的 方法 , 通 过 比较 颜 色直
们 的训 练数 据是 非常 不 足的 ,但 是像 是神 经 网络这 种算 法往 往 需要 非常 大量 的 训练 数据 , 如果 训练数 据 不足 的话 ,很 容 易造成 网络 的 过拟 合 。这 样模 型的 泛化 误差 就会 非 常 的大 ,得不 到 良好 的分类 效 果 。因此 我们 需 要对 图像 进 行一 些随机 裁剪 ,随机 翻转 ,旋 转随 机 角度 等操作 ,增 加 数据 的复 杂性 ,提 高模 型 的泛化 能力 。 构建 分类 模 型 :首先 需要 一个 类 别属 性值 己知 的数 据集 作为 训 练 集 ,经 过特 征提 取 和离 散化 后 ,进行 训练 样本 集 的监 督学 习 ,去 建立 一个 分 类模 型 。最后 我们 的分 类模 型 一般 是 以规则 ,决 策树 或
统一 的格 式等 。 数 据增 强 : 由于 我 们 的 数 据存 在 着 很 大 的 差 异 ,很 多 时 候 我
式越 来 越方 便 、快 捷 。因此 网络上 存储 的图片 数据 越 来越 多 ,不仅 仅给 图像数 据 的存 储带 来 了很 大 的 困难 ,并且 图像 数 据 中存储 的 信 息 也是 十分 丰 富 的,要 获取 图像 中的信 息 也变 得越 来越 重 要 。图像 中 的信 息对 于 我们 来说 也 是非 常重 要 的 ,这些 信 息不仅 可 以帮 助 我
在 进 行 图像 分类 之前 ,必 须 对 它 们 进 行 高 效 的 分 类 管 理 , 并 且 ,想要 让 计算 机像 人 类一 样 灵活 地对 图像 数 据进 行分 类 ,具 有非 常大 的挑 战 性 ,其 中所 要面 临 的难 题不 仅 是 图像数 据 的不 规则 性 , 还 包 括 图像 的数 量 级 ,不 同 图像 数 据 的表示 方 法等 等 ,因此 ,图像 分类 问题 向来 都是 一 个具 有挑 战性 的研 究 热点 。 1 . 2 图像 分 类 的当前 研 究现 状
们 获 得人 们 的想 法 ,还为 我们 提供 了很 多 人类 的行 为数 据 。
图像 分 类是 一 个基 础性 的 工作 ,它 的应 用 非 常广 泛 ,不仅 应用 在 图像 分类 管 理和 信息 提取 方 面 ,还应 用于 目标识 别 ,人脸 识 别 ,
图像检 索 等 方面 ,并且 在 其他 研 究领域 有 Hale Waihona Puke Baidu要 的价 值和 意义 。