一种通用的图像分类方法

合集下载

一种通用的图像分类方法

这篇文章介绍了作者在Kaggle植物幼苗分类比赛使用的方法，该方法连续几个月排名第一，最终排名第五。该方法非常通用，也可以用于其他图像识别任务。

任务概述

你能区分杂草和作物幼苗吗?

有效做到这一点的能力意味着更高的作物产量和更好的环境管理。

奥尔胡斯大学信号处理小组与南丹麦大学合作发布了一个数据集，其中包含大约960种不同生长阶段的植物的图像，这些植物属于12个物种。

样本植物之一：繁缕样本[3]

该数据集包含有标注的RGB图像，物理分辨率约为每毫米10个像素。

为了规范对数据集获得的分类结果的评价，研究者提出了基于F1分数的基准。

下面的图是数据集中所有12个类的样本：

图像分类任务可以分为5个步骤：

步骤1

机器学习中的第一个也是最重要的任务是在继续使用任何算法之前对数据集进行分析。这对于理解数据集的复杂性非常重要，最终将有助于设计算法。

图像和类的分布如下：

如前所述，共有12个类，4750张图像。但是，从上面的图中可以看出，数据的分布不均匀，类的分布从最大有654张图像到最小只有221张图像。这表明数据不均衡，数据需要均衡才能获得最佳结果。我们将在第3个步骤讲这一点。

每个类的图像分布