基于信息熵的CT图像目标自动提取实验研究以恐龙蛋壳化石切片CT图像为例
CT(Computed Tomography)技术应用范围十分广泛,主要应用于医学诊断领域,其次应用于工业无损检测、工程检测、安全检查以及探测地球内部结构等方面[
在医学领域,翟伟明等[
由于在处理大量恐龙蛋壳化石CT图像方面可借鉴的经验过于稀少,而手动分割导致分离工作难度较大、效率较低,为了达到自动分离恐龙蛋壳化石CT图像目标与背景的目的,本文提出了一种基于信息熵的CT图像目标与背景自动分离提取方法。实验结果表明,使用该方法取得了理想的分离效果,目标提取有效率高达98.89%,并且处理时间也大幅缩短,提高了古生物恐龙蛋壳化石CT图像处理效率。该方法能精确地提取出恐龙蛋壳气孔与边界,为后续重建恐龙蛋三维立体结构提供了可靠的基础,也为其他目标为方解石的古生物CT图像自动分离提取提供了新的技术解决方案。
2 数据与方法
2.1 图像数据集
本文选取广东河源晚白垩世地层发现的一类蜂窝蛋类(恐龙蛋的一种类型)进行了蛋壳结构的计算机断层扫描,采用的设备为GEphoenix vtomex m 180 kV/300 kV,测试电压为70 kV,测试电流为130 μA,得到了3 329张16位的恐龙蛋壳原始切片CT图像样品数据,空间分辨率为3.896 μm/像素,图像保存为tif格式。由于样品数据头部和尾部CT图像的目标区域太小(目标区域像元比率小于3%),为提高处理速度,仅选取切片样号483~2 599作为样本数据集。
图1 原始图像示例。(a)切片704;(b)切片1 668;(c)切片2 595。
Fig.1 Raw images.(a) Slice 704;(b) Slice 1 668;(c) Slice 2 595.
2.2 信息熵
信息熵(Imformation Entropy)最早是由Shannon借鉴热力学中熵的概念在1948年提出的,它描述了信息来源的不确定性,本质上是对不确定信息的数学化度量,其大小描述了信息的有序程度及包含的信息量。将信息熵引入到图像中可以度量图像信息量,评判图像信息有序与丰富程度[
假设一张CT图像的灰度级分布范围为[0,n],t∈[0,n],t代表灰度级,p(t)代表概率;各灰度级像素出现的概率为p0,p1…pn,各灰度级像素具有的信息量则分别为-log2p0,-log2p1,…,-log2pn。其中H(t)值越高,图像所含信息量越大,图像灰度变化的不确定性程度越大,图像也就越混乱[
(1) |
2.3 信息熵参数提取
由于CT图像是16位的,所以需要将其转换为8位,以便进行后续图像处理。首先从训练数据集里的前、中、后三段中随机选取3张CT图像切片,分别为切片编号704,1 668,2 595,通过 Adobe Photoshop软件进行人工手动分离CT图像目标与背景,获得分离后的图像(
图2 手动分离后的图像。(a)切片704;(b)切片1 668;(c)切片2 595。
Fig.2 Images after manual separation.(a) Slice 704;(b)Slice 1 668;(c)Slice 2 595.
样号 | 分割阈值 | 信息熵 |
---|---|---|
704 | 152 | 0.65 |
1 668 | 90 | 0.54 |
2 595 | 140 | 0.43 |
2.4 分割算法步骤
本文主要针对CT图像来分离目标与背景从而提取目标,通过信息熵的方法使分离得到的目标在完整性和边缘细节保留方面都得到了较好的效果。具体分割算法步骤和流程如
图3 目标智能提取技术流程示意图
Fig.3 Schematic diagram of intelligent target extraction technology
步骤1:将转换后的8位图像进行信息熵计算,再训练信息熵参数。
步骤2:统计灰度图像的亮度直方图。用lambda函数根据亮度值进行排序,输出hisR1(根据像素亮度值从小到大排序)、hisR2(根据像素亮度值统计个数从大到小排序)两个列表。
步骤3:把hisR2统计结果中像素亮度值统计个数最多时的亮度值作为分割阈值,根据该阈值分离原始灰度图像的目标与背景,输出分割阈值。
步骤4:分割单个图像目标与背景。创建一个大小与原图像一样的空白图像矩阵,根据输入的阈值对原图像进行分离,若像素亮度值大于阈值,则认为是图像的目标,则将该像素对应的位置输出到新图像并将亮度值赋值为255,遍历原灰度图像的所有像素值,输出新图像。
步骤5:计算分离后图像的信息熵值。将信息熵0.54这个样本参数值作为处理训练数据集中第一张CT图像的输入值,得到一个新的信息熵值,然后将新信息熵值作为下一个图像运算的参考值,由此循环运算直到最后一张图像运行结束。
步骤6:设置信息熵误差范围为20%,判断误差是否不大于20%,若是说明分离的结果是可靠的,则结束分离并输出当前信息熵;若不是则回到步骤5,直到误差在20%以下。
步骤7:对训练数据集里所有图像遍历进行自动分割,最后输出分割后的图像文件以及表格文件。
3 实验结果与分析
本文实验环境为Windows10系统下安装的PyCharm开发环境,通过Python编程语言实现自动分离实验,分割对象为数量较多的恐龙蛋壳化石切片CT图像。上述算法运行后最终的结果包括两部分:分割后的图像和输出的表格。其中图像内容可以明显提取出目标和边缘,而表格内容包括CT图像的样号、分割阈值以及信息熵值。
3.1 分离效果定量分析
本研究为了符合恐龙蛋壳化石CT图像数据的特点,将样本数据集样号483~2 599的切片CT图像作为测试集。鉴于信息熵已用于CT图像目标与背景的自动分离与提取中,本文也给出了该方法对恐龙蛋壳化石切片CT图像的自动分离结果,包括训练集和测试集中2 117张切片CT图像的分割阈值和信息熵。由于通过以上方法获得的从483~2 599的每个样号都有一个分割阈值和信息熵值,导致数据量很大。通过观察输出的结果表格,发现信息熵的范围和分割阈值的范围都并不宽泛,因此将其分拆成两个部分,即信息熵结果的频次统计(
信息熵 | 频次 | 信息熵 | 频次 | 信息熵 | 频次 |
---|---|---|---|---|---|
0.43 | 3 | 0.51 | 26 | 0.59 | 217 |
0.44 | 14 | 0.52 | 54 | 0.6 | 236 |
0.45 | 29 | 0.53 | 45 | 0.61 | 223 |
0.46 | 20 | 0.54 | 99 | 0.62 | 186 |
0.47 | 26 | 0.55 | 129 | 0.63 | 124 |
0.48 | 18 | 0.56 | 156 | 0.64 | 76 |
0.49 | 17 | 0.57 | 176 | 0.65 | 15 |
0.5 | 26 | 0.58 | 202 | 总计 | 2 117 |
分割阈值 | 频次 | 分割阈值 | 频次 | 分割阈值 | 频次 | 分割阈值 | 频次 |
---|---|---|---|---|---|---|---|
66 | 2 | 94 | 48 | 121 | 15 | 148 | 31 |
67 | 2 | 95 | 77 | 122 | 16 | 149 | 32 |
68 | 1 | 96 | 85 | 123 | 13 | 150 | 20 |
70 | 2 | 97 | 98 | 124 | 16 | 151 | 17 |
71 | 6 | 98 | 73 | 125 | 8 | 152 | 11 |
72 | 3 | 99 | 88 | 126 | 13 | 153 | 15 |
73 | 1 | 100 | 59 | 127 | 20 | 154 | 11 |
74 | 4 | 101 | 44 | 128 | 19 | 155 | 16 |
75 | 2 | 102 | 57 | 129 | 12 | 156 | 10 |
76 | 5 | 103 | 56 | 130 | 17 | 157 | 11 |
77 | 9 | 104 | 41 | 131 | 5 | 158 | 13 |
78 | 3 | 105 | 25 | 132 | 23 | 159 | 10 |
79 | 3 | 106 | 26 | 133 | 15 | 160 | 12 |
80 | 4 | 107 | 43 | 134 | 11 | 161 | 14 |
81 | 6 | 108 | 32 | 135 | 16 | 162 | 10 |
82 | 1 | 109 | 19 | 136 | 10 | 163 | 5 |
83 | 6 | 110 | 29 | 137 | 10 | 164 | 4 |
84 | 5 | 111 | 16 | 138 | 25 | 165 | 5 |
85 | 10 | 112 | 23 | 139 | 25 | 166 | 3 |
86 | 8 | 113 | 17 | 140 | 30 | 169 | 3 |
87 | 12 | 114 | 20 | 141 | 28 | 170 | 1 |
88 | 16 | 115 | 23 | 142 | 26 | 174 | 2 |
89 | 14 | 116 | 18 | 143 | 26 | 175 | 2 |
90 | 17 | 117 | 22 | 144 | 40 | 178 | 1 |
91 | 20 | 118 | 21 | 145 | 36 | 186 | 2 |
92 | 29 | 119 | 13 | 146 | 31 | 188 | 1 |
93 | 36 | 120 | 15 | 147 | 34 | 总计 | 2 117 |
根据
图4 信息熵统计直方图
Fig.4 Information entropy statistical histogram
图5 分割阈值统计直方图
Fig.5 Segmentation threshold statistical histogram
3.2 分离效果定性分析
由于进行自动分离的CT图像数量较多,因此本文仅从样本数据集原始图像与自动分离后图像的前、中、后3段各自随机选取3张进行分离效果分析。前段选取的是切片520,668,770;中段选取的是切片1 526,1 655,1 731;后段选取的是切片2 322,2 481,2 576。图
图6 前段原始图像与分离后图像。(a)、(b)、(c)原图像;(d)、(e)、(f)分离后图像。
Fig.6 The first segment of the original images and the separated images.(a),(b),(c)Original image; (d),(e),(f)Separated image.
图7 中段原始图像与分离后图像。(a)、(b)、(c)原图像;(d)、(e)、(f)分离后图像。
Fig.7 The middle part of the original images and the separated images.(a),(b),(c)Original image; (d),(e),(f) Separated image.
图8 后段原始图像与分离后图像。(a)、(b)、(c)原图像;(d)、(e)、(f)分离后图像。
Fig.8 The last part of the original images and the separated images.(a),(b),(c)Original image; (d),(e),(f) Separated image.
原始图像仅以肉眼无法对目标进行有效提取,且存在很大的主观性,导致误差过大;而且从原始图像中并不能清晰辨认目标边缘轮廓,也不能分辨哪些是气孔哪些是目标,这对我们的目标分离提取工作带来了很大的困难(图
根据信息熵理论可知,图像所含内容越多就越混乱,信息熵值就越高。由
位置 | 样号 | 分割阈值 | 信息熵 | 信息熵均值 |
---|---|---|---|---|
前段 | 520 | 141 | 0.56 | 0.59 |
668 | 147 | 0.61 | ||
770 | 101 | 0.60 | ||
中段 | 1 526 | 104 | 0.60 | 0.60 |
1 655 | 95 | 0.59 | ||
1 731 | 125 | 0.60 | ||
后段 | 2 322 | 108 | 0.53 | 0.51 |
2 481 | 140 | 0.53 | ||
2 576 | 144 | 0.47 |
4 讨论
关于CT图像分割处理的研究多集中在医学领域上,如研究内脏器官和其他病变位置[
与目前广泛使用的医学CT图像分割方法相比,在恐龙蛋壳化石的CT图像研究上可借鉴的对象和参考的实例较少。由于恐龙蛋壳化石不同于人体组织或者动物组织,其成分属于不同的物质类型,两者的CT图像信号特征差异较大,因此不能完全照搬前人在医学领域的CT图像分割方法,并且医学图像中物体或结构的分割通常比其他类型的图像更为复杂。所以针对恐龙蛋壳化石CT图像,需要选择一种针对性强且运算效率更高的方法。本实验采用信息熵作为提取目标的一个参数,在信息熵误差范围设置为20%的情况下,经过多次尝试,分割阈值与信息熵的选定使分离效果明显,达到了大量CT图像的目标与背景自动分离的研究目标。实验证明本文方法是十分有效的,该方法不仅能清晰分离出目标,而且实现了自动化处理,大幅提高了操作效率,同时提供了类似CT图像处理情况中使用该信息熵范围直接作为处理的参数。
由于在评价不同方法时使用的数据集以及处理的对象复杂程度不同,直接比较不同的方法是困难的,不能简单地认为哪一个更好。但值得注意的是,本研究方法可以处理大量CT图像样本数据并且效果都不错,不需要过多的人机交互,真正实现了自动化、智能化。总之,本研究的主要贡献是提出了一种CT图像在新领域的处理方法。该方法可用于研究类似恐龙蛋壳化石一样由方解石构成的其他物体CT图像的分类处理,以该信息熵范围参数来进行自动分离并提取目标,为快速重构物体三维空间结构奠定了数据基础。
5 结论
针对大量恐龙蛋壳化石CT图像手动分割步骤繁琐、分割精度不高、处理时间长、误差较大等问题,在阈值分割的基础上,提出了一种基于信息熵的自动分离CT图像方法。利用手动分割CT图像获取到的信息熵值作为自动分离图像的参数,通过阈值分割和信息熵的方法进行大量图像目标与背景的自动分离研究,并进行了广泛的测试与实验,其中所获分割阈值范围为66~188,信息熵值范围为0.43~0.65。实验结果表明,所设计的方法在CT图像数量较多时,在自动分离图像目标与背景上可取得很好的效果,其有效分离率高达98.89%,并且该方法能在正确提取目标的同时还能保留完整目标与边缘细节,还可以对恐龙蛋壳中保存的气孔与蛋壳边界进行有效且精确地提取,提高了操作效率。但是,本研究仅探讨了如何处理大量恐龙蛋壳CT图像的方法,对于恐龙蛋壳本身以及如何重建恐龙蛋的三维立体结构的研究仍有不足,这是作者需要进一步研究的方向。
- 2025年中科院分区表已公布!Scientific Reports降至三区
- 官方认定!CSSCI南大核心首批191家“青年学者友好期刊名单”
- 2023JCR影响因子正式公布!
- 国内核心期刊分级情况概览及说明!本篇适用人群:需要发南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的学者
- 我用了一个很复杂的图,帮你们解释下“23版最新北大核心目录有效期问题”。
- 重磅!CSSCI来源期刊(2023-2024版)最新期刊目录看点分析!全网首发!
- CSSCI官方早就公布了最新南核目录,有心的人已经拿到并且投入使用!附南核目录新增期刊!
- 北大核心期刊目录换届,我们应该熟知的10个知识点。
- 注意,最新期刊论文格式标准已发布,论文写作规则发生重大变化!文字版GB/T 7713.2—2022 学术论文编写规则
- 盘点那些评职称超管用的资源,1,3和5已经“绝种”了