图文数据标注处理
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
图文数据标注处理
在数据采集的时候,一定要注意采集设备的稳定性,手持是非常不稳的。
我们试过很多很多次,即使我们固定了手腕,也不能够避免人体本身的抖动。
包括刚开始视角的调整。
使用固定支架能够很好避免这些问题。
我们做的是红外采集,视频和图片同时写入本地时并不会影响整个采集过程的速度,再384*288大小图片背景下,我们写入视频和图片使用当前时间时分秒作为名称,结果显示,每100毫秒30帧频下,有两张图像采集偏差3毫秒。
几乎无延迟。
采集对象一定要确定提前确定好,数据样本的偏差性,会导致目标检测的对象存在不同的识别精度。
在采集的时候一定考虑特定对象的采集。
我们采集的是运动过程中的车辆,前期由于为了数据量大,因此就一直采集,一直采集,没有考虑特定目标,比如摩托车数量很少,因此后期做了很多特定的采集工作,专门采集摩托车。
在数据标注部分,这是我们最需要注意的。
遮挡对象是否要标注;模糊对象是否要标注;只有一半大小的对象是否要标注;大目标包含小目标,大目标是否要标注;标注时标签的确定;一定要提前确定好,不然会做很多重复功。
在自动标注部分,我们做了几个工作,首先使用YOLO V5做多目标检测的自动标注。
(需要我们训练一部分之后,再用新weights去检测图像。
这里出现最多的一个问题就是重复框问题,很奇怪的是我们已经在YOLO中使用了一定的,然后使用NMS 去掉了多余Anchors, 为什么同一个对象仍然有多个框,调节
threshold也没有太多的用处,当然会有一定的效果,置信度变了之后框多框少异常。