深度学习下的医学图像分析(四)

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

深度学习下的医学图像分析（四）

本周内（截止至7月23日晚24点）本公众号本周发布的所有文章，留言获赞最多者AI研习社送西瓜书（《机器学习》周志华）一本AI研习社按：本文由图普科技编译自《Medical Image Analysis with Deep Learning Part4》，是最近发表的《深度学习下的医学图像分析（三）》的后续文章。对与深度学习相关的医疗保障工作而言，2017 年的“Nvidia GTC 大会”绝对是一个绝佳的信息来源。在大会上，有诸如Ian GoodFellow 和Jeremy Howard 的深度学习专家分享了他们对深度学习的见解；还有一些顶级医学院（例如西奈山医学院、纽约大学医学院、麻省综合医院等）和Kaggle 在大会上介绍他们的建模战略。在上一篇文章中，我们谈论了深度学习相关的基本内容。本文，我们将关注于医学图像及其格式。本文分为三个部分——医学图像及其组成、医学图像格式和医学图像的格式转换。本文希望通过对深度学习的相关知识的介绍，最终达到医学图像分析的目的。医学图像及其组成由Michele Larobina 和Loredana Murino 发表的论文，对本文即将展开的讨论来说是一个很好的信息参考。Michele Larobina 和Loredana Murino 二人是意大利“生物架构和生物成像协会”（IBB）的成员。IBB 是意大利“国家研究委员会”的组成部分，同时也是意大利最大的

公共研究机构。我们的另一个参考信息资源是一篇题为《Working with the DICOM and NIfTI data standards in R》的论文。什么是医学图像？医学图像是反映解剖区域内部结构或内部功能的图像，它是由一组图像元素——像素（2D）或立体像素（3D）——组成的。医学图像是由采样或重建产生的离散性图像表征，它能将数值映射到不同的空间位置上。像素的数量是用来描述某一成像设备下的医学成像的，同时也是描述解剖及其功能细节的一种表达方式。像素所表达的具体数值是由成像设备、成像协议、影像重建以及后期加工所决定的。医学图像的组成医学图像组成医学图像有四个关键成分——像素深度、光度表示、元数据和像素数据。这些成分与图像大小和图像分辨率有关。图像深度（又称比特深度或颜色深度）是用来编码每个像素信息的比特数。比如说，一个8 比特的光栅可以有256 个从0 到255 数值不等的图像深度。“光度表示”解释了像素数据如何以正确的图像格式（单色或彩色图片）显示。为了说明像素数值中是否存在色彩信息，我们将引入“每像素采样数”的概念。单色图像只有一个“每像素采样”，而且图像中没有色彩信息。图像是依靠由黑到白的灰阶来显示的，灰阶的数目很明显取决于用来储存样本的比特数。在这里，灰阶数与像素深度是一致的。医疗放射图像，比如CT 图像和磁共振（MR）图像，是一个灰阶的“光度表示”。而核医学图像，

比如正电子发射断层图像（PET）和单光子发射断层图像（SPECT），通常都是以彩色映射或调色板来显示的。“元数据”是用于描述图形象的信息。它可能看起来会比较奇怪，但是在任何一个文件格式中，除了像素数据之外，图像还有一些其他的相关信息。这样的图像信息被称为“元数据”，它通常以“数据头”的格式被储存在文件的开头，涵盖了图像矩阵维度、空间分辨率、像素深度和光度表示等信息。“像素数据”是储存像素数值的位置。根据数据类型的不同，像素数据使用数值显示所需的最小字节数，以整点或浮点数的格式储存。图像大小= 数据头大小（包括元数据）+ 行数栏数* 像素深度*（图像帧数）医学图像格式放射图像有 6 种主要的格式，分别为DICOM（医学数字成像和通讯）、NIFTI（神经影像信息技术）、PAR/REC （Philips 磁共振扫描格式）、ANALYZE（Mayo 医学成像）、NRRD（近原始栅格数据）和MNIC。2017 年5 月的医学图像格式在上图的五个格式中，DICOM 和NIFTI 是接受度最高的。DICOM 格式的基本内容DICOM 表示“医学数字成像和通讯”。DICOM 是由“美国国家电气制造商协会”（NEMA）发布的标准，这一标准规范了医学成像的管理、储存、打印和信息传输，这些都是扫描仪或医院“医疗影像储传系统”（PACS）中的文件格式。DICOM 包括了一个文件格式和一个网络通讯协议，其中的网络通讯协议是医疗

实体间使用TCP/IP 进行沟通的一个规范和准则。一个DICOM 文件由一个数据头和图像数据组成的。数据头的大小取决于数据信息的多少。数据头中的内容包括病人编号、病人姓名等等。同时，它还决定了图像帧数以及分辨率。这是图片查看器用于显示图像的。即使是一个单一的图像获取，都会有很多DICOM 文件。Pydicom 是用于读取DICOM 文件的Python 库，详情请参阅文本第一部分的代码示例。“oro.dicom”是用于读取DICOM 数据的

R-package。使用oro.dicom 工具包来读取未压缩的DICOM 文件NIFTI 格式的基本内容“神经成像信息技术创新”将NIFTI 格式视为ANALYZE7.5 格式的替代品。NIFTI 最初是用于神经成像的，但它也适用于一些其他的领域。NIFTI 中一个主要的特点在于它包含了两个仿射坐标定义，这两个仿射坐标定义能够将每个立体元素指标（i,j,k）和空间位置（x,y,z）联系起来。Nibabel 是用于读取nifti 文件的一个朋友Python 库，“oro.nifti”是用于读取nifti 数据的一个R 工具包。DICOM 和NIFTI 间的区别DICOM 和NIFTI 之间最主要的区别在于NIFTI 中的原始图像数据是以3D 图像的格式储存的，而DICOM 是以3D 图像片段的格式储存的。这就是为什么在一些机器学习应用程序中NIFTI 比DICOM 更受欢迎，因为它是3D 图像模型。处理一个单个的NIFTI 文件，与处理上百个DICOM 文件

相比要轻松得多。NIFTI 的每一张3D 图像中只需储存两个文件，而在DICOM 中则要储存更多文件。NRRD 格式的基本内容灵活的NRRD 格式中包含了一个单个的数据头

文件和既能分开又能合并的图像文件。一个NRRD 数据头能够为科学可视化和医学图像处理准确地表示N 维度的栅格信息。“国家医学图像计算联盟”（NA-MIC）开发了一种用NRRD 格式来表示“扩散加权图像”（DWI）和“扩散张量图像”（DTI）的方法。NRRD 的“扩散加权图像”和“扩散张量图像”数据可以被解读为一个“3D 切片机”，能够直观地确定张量图像的方向与神经解剖的预期是一致的。一个NRRD 文件的大致格式（带有数据头）如下图所示：来源/nrrd/format.html#general.1 MINC 代表的是“医学成像NetCDF 工具包”。MINC 文件格式的开发始于1992 年“蒙特利神经研究所”（MNI）。目前，McGill 的“脑成像中心”（BCI）正积极地对MINC 进行进一步开发。MINC 格式的第一个版本（Minc1）是建立在标准的“网络常见格式”（NetCDF）之上的；而第二个版本的MINC 格式，即Minc2，则是以“分级数据格式第五版”（HDF5）为基础建立的。HDF5 支持无限制的多种数据类型，它适用于灵活高效的I/O 和高容量、复杂的数据。正是有了这些新的特性和功能，Minc2 才能处理大量的、复杂的数据库。以下是一些研究性论文针对这些格式数据头