图文数据标注处理

合集下载

图文数据标注处理
在数据采集的时候，一定要注意采集设备的稳定性，手持是非常不稳的。

我们试过很多很多次，即使我们固定了手腕，也不能够避免人体本身的抖动。

包括刚开始视角的调整。

使用固定支架能够很好避免这些问题。

我们做的是红外采集，视频和图片同时写入本地时并不会影响整个采集过程的速度，再384*288大小图片背景下，我们写入视频和图片使用当前时间时分秒作为名称，结果显示，每100毫秒30帧频下，有两张图像采集偏差3毫秒。

几乎无延迟。

采集对象一定要确定提前确定好，数据样本的偏差性，会导致目标检测的对象存在不同的识别精度。

在采集的时候一定考虑特定对象的采集。

我们采集的是运动过程中的车辆，前期由于为了数据量大，因此就一直采集，一直采集，没有考虑特定目标，比如摩托车数量很少，因此后期做了很多特定的采集工作，专门采集摩托车。

在数据标注部分，这是我们最需要注意的。

遮挡对象是否要标注；模糊对象是否要标注；只有一半大小的对象是否要标注；大目标包含小目标，大目标是否要标注；标注时标签的确定；一定要提前确定好，不然会做很多重复功。

在自动标注部分，我们做了几个工作，首先使用YOLO V5做多目标检测的自动标注。

（需要我们训练一部分之后，再用新weights去检测图像。

这里出现最多的一个问题就是重复框问题，很奇怪的是我们已经在YOLO中使用了一定的,然后使用NMS 去掉了多余Anchors, 为什么同一个对象仍然有多个框，调节
threshold也没有太多的用处，当然会有一定的效果，置信度变了之后框多框少异常。