LUNA16数据集(三)预处理

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

LUNA16数据集(三)预处理

在(⼀)和(⼆)中简单介绍了LUNA16数据集的组成,以及肺结节的可视化,有了对数据集的基本了解后,还要对数据集进⾏预处理,计算机视觉中原始数据⼀般不会直接送⼊神经⽹络,这⾥也是如此。

这篇博客想写已经有好久了,迟迟没有动笔,还是因为⾃⼰看过⼏个版本的预处理,有些地⽅有些混淆,有些地⽅犹豫该采取哪种⽅法,最近思路逐渐理清,遂决定动笔。

⾸先说⼀个前提,LUNA16数据集附带了⼀个seg-lungs-LUNA16的⽂件夹,⾥⾯是所有case(此处case指⼀个病例,也就是⼀张CT图像,由好多张切⽚组成)的mask,⽤来剔除与肺部⽆关的区域,但是通常来讲拿过来⼀个case,是不会有mask的,LUNA16还是为参赛选⼿降低了难度,不过在DSB2017中就没有mask,选⼿需要⾃⾏⽣成mask。

前提说完,就说说预处理需要哪些步骤吧。

⼤致来讲,共有以下三步。

1. 将CT图像灰度数值转为HU值,HU值指的是⼈体组织器官对辐射的透光性,越是不透光,值越⾼,⽐如⾻头的值就⾮常⾼。这⾥附⼀

张HU值表,⾥⾯有常见的组织器官的透光性。顺便说⼀句,LUNA16的数据已经处理成HU值,真是很⼈性化了。

2. ⽣成mask,这⼀步的处理⽅法我看过两种,⼀种训练⼀个分割⽹络,然后对每张切⽚进⾏分割,另⼀种是阈值化,第⼆种更简单些,

我倾向于使⽤第⼆种,这也是DSB2017第⼀名的⽅案。下⾯就说⼀下⽅案⼆,阈值化采取的阈值不是随便定的,这⾥采取-600,这样⽔,空⽓基本就被过滤掉了,剩下的部分,进⾏以下膨胀处理,将肺部内部的⼩孔洞填上,这样,⼀张mask就完成了,简洁⾼效。3. 归⼀化,⾸先将所有体素的值截取到-1200~600这个范围,⼩于-1200的设为-1200,⼤于600的设为600,然后再缩放⾄0~255,最后

再加上mask。

完结撒花~

相关文档
最新文档