图文数据标注处理

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

图文数据标注处理
在数据采集的时候,一定要注意采集设备的稳定性,手持是非常不稳的。

我们试过很多很多次,即使我们固定了手腕,也不能够避免人体本身的抖动。

包括刚开始视角的调整。

使用固定支架能够很好避免这些问题。

我们做的是红外采集,视频和图片同时写入本地时并不会影响整个采集过程的速度,再384*288大小图片背景下,我们写入视频和图片使用当前时间时分秒作为名称,结果显示,每100毫秒30帧频下,有两张图像采集偏差3毫秒。

几乎无延迟。

采集对象一定要确定提前确定好,数据样本的偏差性,会导致目标检测的对象存在不同的识别精度。

在采集的时候一定考虑特定对象的采集。

我们采集的是运动过程中的车辆,前期由于为了数据量大,因此就一直采集,一直采集,没有考虑特定目标,比如摩托车数量很少,因此后期做了很多特定的采集工作,专门采集摩托车。

在数据标注部分,这是我们最需要注意的。

遮挡对象是否要标注;模糊对象是否要标注;只有一半大小的对象是否要标注;大目标包含小目标,大目标是否要标注;标注时标签的确定;一定要提前确定好,不然会做很多重复功。

在自动标注部分,我们做了几个工作,首先使用YOLO V5做多目标检测的自动标注。

(需要我们训练一部分之后,再用新weights去检测图像。

这里出现最多的一个问题就是重复框问题,很奇怪的是我们已经在YOLO中使用了一定的,然后使用NMS 去掉了多余Anchors, 为什么同一个对象仍然有多个框,调节
threshold也没有太多的用处,当然会有一定的效果,置信度变了之后框多框少异常。

相关文档
最新文档