基于信息熵的CT图像目标自动提取实验研究以恐龙蛋壳化石切片CT图像为例

作者：陈春玉黄映聪王强黎广荣何月顺来源：《液晶与显示》日期：2022-09-14人气：401

CT（Computed Tomography）技术应用范围十分广泛，主要应用于医学诊断领域，其次应用于工业无损检测、工程检测、安全检查以及探测地球内部结构等方面^［1］。近年来，随着图像技术的发展以及各种功能软件的开发，其应用范围还在不断拓宽。传统的图像分割方法依赖于人工处理，需要花费大量时间和精力。由于图像的多变性和各种突发情况的发生（设备、人工、环境等），从图像中自动分离目标与背景非常具有挑战性，因此这一难题引起国内外学者的广泛研究。目前图像分割方法包括基于阈值分割^［2-3］、基于像素值分割^［4］以及基于神经网络分割^［5-6］的方法等。

在医学领域，翟伟明等^［7］提出了一个动态自适应的体素生长的算法，对肺部CT图像进行三维分割，解决了肺部分割时左右肺难以区分的问题；宋红等^［8］提出一种基于动态自适应区域生长的算法进行肿瘤分割，成功提取出人体肝脏CT图像中的肿瘤区域；张丽娟等^［9］也提出区域生长与全卷积神经网络相结合的方法对肝脏CT图像进行交互式分割。近年来，一些学者也开始对CT图像的自动分割方法进行一些探索。Reboucas等^［10］提出了专门用于分割复杂物体的三维自适应清晰主动轮廓法，它是一种在胸部CT扫描中自动分割肺部的新技术。Men等^［11］基于深度反卷积神经网络算法对鼻咽癌CT图像进行目标自动分割，但需要仔细的人工审查和大量的编辑；Athertya等^［12］提出了一种基于模糊特征点的轮廓自动初始化方法，该方法在脊柱CT图像医学图像分割中有较大的适用性，在模拟高斯噪声的情况下具有良好的鲁棒性；Vania等^［13］将卷积神经网络和全卷积网络结合，利用类冗余作为软约束从CT图像中分割脊柱，显著提高了分割结果的准确性和系统处理时间。而在古生物恐龙蛋壳化石的显微结构研究领域，CT图像智能处理技术尚处在探索阶段。古生物学家处理的数据量随着各种技术的进步也在迅速增加，但海量古生物方面的数据依然需要依赖人进行手动处理，并且虽然在古生物学的研究中使用了众多数字化手段，如CT扫描等，但如何在这些数据中找到所需要的信息依然是一项充满挑战的工作^［14］。

由于在处理大量恐龙蛋壳化石CT图像方面可借鉴的经验过于稀少，而手动分割导致分离工作难度较大、效率较低，为了达到自动分离恐龙蛋壳化石CT图像目标与背景的目的，本文提出了一种基于信息熵的CT图像目标与背景自动分离提取方法。实验结果表明，使用该方法取得了理想的分离效果，目标提取有效率高达98.89%，并且处理时间也大幅缩短，提高了古生物恐龙蛋壳化石CT图像处理效率。该方法能精确地提取出恐龙蛋壳气孔与边界，为后续重建恐龙蛋三维立体结构提供了可靠的基础，也为其他目标为方解石的古生物CT图像自动分离提取提供了新的技术解决方案。

2 数据与方法

2.1　图像数据集

本文选取广东河源晚白垩世地层发现的一类蜂窝蛋类（恐龙蛋的一种类型）进行了蛋壳结构的计算机断层扫描，采用的设备为GEphoenix vtomex m 180 kV/300 kV，测试电压为70 kV，测试电流为130 μA，得到了3 329张16位的恐龙蛋壳原始切片CT图像样品数据，空间分辨率为3.896 μm/像素，图像保存为tif格式。由于样品数据头部和尾部CT图像的目标区域太小（目标区域像元比率小于3%），为提高处理速度，仅选取切片样号483~2 599作为样本数据集。图1展示了样本数据集里随机选取的前、中、后3段的原始图像，分别为切片样号704，1 668，2 595，每个切片目标范围大小不一，其中亮度值高且呈现较明亮的区域为目标区域，其余为背景区域。

图1 原始图像示例。（a）切片704；（b）切片1 668；（c）切片2 595。

Fig.1 Raw images.（a） Slice 704；（b） Slice 1 668；（c） Slice 2 595.

2.2　信息熵

信息熵（Imformation Entropy）最早是由Shannon借鉴热力学中熵的概念在1948年提出的，它描述了信息来源的不确定性，本质上是对不确定信息的数学化度量，其大小描述了信息的有序程度及包含的信息量。将信息熵引入到图像中可以度量图像信息量，评判图像信息有序与丰富程度^［15-16］。CT图像由大量不同灰度级的像素构成，在CT图像处理过程中，熵一般度量图像像素亮度值的均匀程度，CT图像的信息熵清晰地反映了其信息量的多少，它与图像灰度变化的不确定性程度密切相关^［15］。

假设一张CT图像的灰度级分布范围为［0，n］，t∈［0，n］，t代表灰度级，p（t）代表概率；各灰度级像素出现的概率为p₀，p₁…p_n，各灰度级像素具有的信息量则分别为-log₂p₀，-log₂p₁，…，-log₂p_n。其中H（t）值越高，图像所含信息量越大，图像灰度变化的不确定性程度越大，图像也就越混乱^［16-18］。图像的信息熵计算公式如式（1）所示：

（1）

2.3　信息熵参数提取

由于CT图像是16位的，所以需要将其转换为8位，以便进行后续图像处理。首先从训练数据集里的前、中、后三段中随机选取3张CT图像切片，分别为切片编号704，1 668，2 595，通过 Adobe Photoshop软件进行人工手动分离CT图像目标与背景，获得分离后的图像（图2）；然后计算所选分离后图像各自的信息熵，分别是0.65，0.54，0.43（表1）。从图2可以看到，图2（b）所含信息量相较而言更大，更具代表性，因此最后选取中间图像切片（样号1 668）的信息熵0.54作为本文方法的信息熵参数初始经验值。最后计算切片样号704和样号2 595的信息熵值与样号1 668的信息熵值0.54的误差都为20%，因此，后续进行CT图像的自动分离时，设置信息熵的误差范围为20%。

图2 手动分离后的图像。（a）切片704；（b）切片1 668；（c）切片2 595。

Fig.2 Images after manual separation.（a） Slice 704；（b）Slice 1 668；（c）Slice 2 595.

表1 信息熵参数训练结果

Tab.1 Training results of information entropy parameters

样号	分割阈值	信息熵
704	152	0.65
1 668	90	0.54
2 595	140	0.43

2.4　分割算法步骤

本文主要针对CT图像来分离目标与背景从而提取目标，通过信息熵的方法使分离得到的目标在完整性和边缘细节保留方面都得到了较好的效果。具体分割算法步骤和流程如图3所示。

图3 目标智能提取技术流程示意图

Fig.3 Schematic diagram of intelligent target extraction technology

步骤1：将转换后的8位图像进行信息熵计算，再训练信息熵参数。

步骤2：统计灰度图像的亮度直方图。用lambda函数根据亮度值进行排序，输出hisR1（根据像素亮度值从小到大排序）、hisR2（根据像素亮度值统计个数从大到小排序）两个列表。

步骤3：把hisR2统计结果中像素亮度值统计个数最多时的亮度值作为分割阈值，根据该阈值分离原始灰度图像的目标与背景，输出分割阈值。

步骤4：分割单个图像目标与背景。创建一个大小与原图像一样的空白图像矩阵，根据输入的阈值对原图像进行分离，若像素亮度值大于阈值，则认为是图像的目标，则将该像素对应的位置输出到新图像并将亮度值赋值为255，遍历原灰度图像的所有像素值，输出新图像。

步骤5：计算分离后图像的信息熵值。将信息熵0.54这个样本参数值作为处理训练数据集中第一张CT图像的输入值，得到一个新的信息熵值，然后将新信息熵值作为下一个图像运算的参考值，由此循环运算直到最后一张图像运行结束。

步骤6：设置信息熵误差范围为20%，判断误差是否不大于20%，若是说明分离的结果是可靠的，则结束分离并输出当前信息熵；若不是则回到步骤5，直到误差在20%以下。

步骤7：对训练数据集里所有图像遍历进行自动分割，最后输出分割后的图像文件以及表格文件。

3 实验结果与分析

本文实验环境为Windows10系统下安装的PyCharm开发环境，通过Python编程语言实现自动分离实验，分割对象为数量较多的恐龙蛋壳化石切片CT图像。上述算法运行后最终的结果包括两部分：分割后的图像和输出的表格。其中图像内容可以明显提取出目标和边缘，而表格内容包括CT图像的样号、分割阈值以及信息熵值。

3.1　分离效果定量分析

本研究为了符合恐龙蛋壳化石CT图像数据的特点，将样本数据集样号483~2 599的切片CT图像作为测试集。鉴于信息熵已用于CT图像目标与背景的自动分离与提取中，本文也给出了该方法对恐龙蛋壳化石切片CT图像的自动分离结果，包括训练集和测试集中2 117张切片CT图像的分割阈值和信息熵。由于通过以上方法获得的从483~2 599的每个样号都有一个分割阈值和信息熵值，导致数据量很大。通过观察输出的结果表格，发现信息熵的范围和分割阈值的范围都并不宽泛，因此将其分拆成两个部分，即信息熵结果的频次统计（表2）和分割阈值的频次统计（表3）。从表2和表3中发现，样本数据集中CT图像的信息熵值范围在0.43~0.65之间，最大信息熵值为0.6，出现频次有236次；分割阈值范围是66~188，最大分割阈值为97，出现频次有98次。其中分割阈值范围即为CT图像目标的亮度值范围，由于恐龙蛋壳是由方解石构成的，故所提取的目标即为方解石。

表2 信息熵结果频次分布

Tab.2 Frequency distribution of information entropy results

信息熵	频次	信息熵	频次	信息熵	频次
0.43	3	0.51	26	0.59	217
0.44	14	0.52	54	0.6	236
0.45	29	0.53	45	0.61	223
0.46	20	0.54	99	0.62	186
0.47	26	0.55	129	0.63	124
0.48	18	0.56	156	0.64	76
0.49	17	0.57	176	0.65	15
0.5	26	0.58	202	总计	2 117

表3 分割阈值结果频次分布

Tab.3 Frequency distribution of segmentation threshold results

分割阈值	频次	分割阈值	频次	分割阈值	频次	分割阈值	频次
66	2	94	48	121	15	148	31
67	2	95	77	122	16	149	32
68	1	96	85	123	13	150	20
70	2	97	98	124	16	151	17
71	6	98	73	125	8	152	11
72	3	99	88	126	13	153	15
73	1	100	59	127	20	154	11
74	4	101	44	128	19	155	16
75	2	102	57	129	12	156	10
76	5	103	56	130	17	157	11
77	9	104	41	131	5	158	13
78	3	105	25	132	23	159	10
79	3	106	26	133	15	160	12
80	4	107	43	134	11	161	14
81	6	108	32	135	16	162	10
82	1	109	19	136	10	163	5
83	6	110	29	137	10	164	4
84	5	111	16	138	25	165	5
85	10	112	23	139	25	166	3
86	8	113	17	140	30	169	3
87	12	114	20	141	28	170	1
88	16	115	23	142	26	174	2
89	14	116	18	143	26	175	2
90	17	117	22	144	40	178	1
91	20	118	21	145	36	186	2
92	29	119	13	146	31	188	1
93	36	120	15	147	34	总计	2 117

根据表2、表3进行的信息熵与分割阈值统计，获得图4、图5两个直方图。如图4所示，样本数据集CT图像的信息熵分布范围在0.43~0.65之间，只有一个峰，其中信息熵峰值为0.6；同时信息熵在0.43~0.51之间分布比较均匀但很少且起伏不大，而其他主要集中分布在0.51~0.65之间且大致呈正态分布，说明样本数据集分割后CT图像的信息熵主要集中在0.6左右。而在图5中，CT图像分割阈值范围在66~188之间，且有两个峰，一个是94~104，另一个是138~150，但主要集中在前一个峰，其中分割阈值最高峰值为97，说明样本数据集中CT图像的分割阈值大部分都集中在97左右。

图4 信息熵统计直方图

Fig.4 Information entropy statistical histogram

图5 分割阈值统计直方图

Fig.5 Segmentation threshold statistical histogram

3.2　分离效果定性分析

由于进行自动分离的CT图像数量较多，因此本文仅从样本数据集原始图像与自动分离后图像的前、中、后3段各自随机选取3张进行分离效果分析。前段选取的是切片520，668，770；中段选取的是切片1 526，1 655，1 731；后段选取的是切片2 322，2 481，2 576。图6、7、8给出了CT图像样本数据集中前、中、后段选取切片各自的原始图像及自动分离图像。图中左边列（a）、（b）、（c）为原始图像，右边列（d）、（e）、（f）为自动分离目标与背景后提取的目标图像，即去除了背景后的参考标准图像。

图6 前段原始图像与分离后图像。（a）、（b）、（c）原图像；（d）、（e）、（f）分离后图像。

Fig.6 The first segment of the original images and the separated images.（a），（b），（c）Original image；（d），（e），（f）Separated image.

图7 中段原始图像与分离后图像。（a）、（b）、（c）原图像；（d）、（e）、（f）分离后图像。

Fig.7 The middle part of the original images and the separated images.（a），（b），（c）Original image；（d），（e），（f） Separated image.

图8 后段原始图像与分离后图像。（a）、（b）、（c）原图像；（d）、（e）、（f）分离后图像。

Fig.8 The last part of the original images and the separated images.（a），（b），（c）Original image；（d），（e），（f） Separated image.

原始图像仅以肉眼无法对目标进行有效提取，且存在很大的主观性，导致误差过大；而且从原始图像中并不能清晰辨认目标边缘轮廓，也不能分辨哪些是气孔哪些是目标，这对我们的目标分离提取工作带来了很大的困难（图6、7、8的左边列原始图像）。从图6、7、8的右边列分离后的图像可以看出，自动分离提取目标的结果与手动分离的结果（图2）相差并不大。本文方法用于自动分离提取目标时获得了较好的效果，在将目标从背景中正确提取出来的同时保留了完整的目标轮廓，边缘也十分清晰，并且还可以从图中分辨出气孔，为构建恐龙蛋壳三维立体结构提供了基础。

根据信息熵理论可知，图像所含内容越多就越混乱，信息熵值就越高。由表2可知，样本数据集分割后CT图像的最大信息熵为0.60，而在表4中也可以看出，前、中、后3段信息熵均较高，但中段信息熵均值为0.60，是前、中、后3段图像里最高的，这与最大信息熵值相同，这说明在样本数据集中段位置的CT图像相较其他位置的信息熵更高一些，其内容相对来说也更多。而从图6、7、8也可看出，中段图像相较于前、后两段而言，它所含信息量更多。上述方法用于CT图像的目标与背景自动分离和提取目标时均获得了较好的效果，这证明了信息熵用于恐龙蛋壳化石切片CT图像目标与背景分离提取是可行且有效的。

表4 不同位置分离后图像结果

Tab.4 Image results after different positions separation

位置	样号	分割阈值	信息熵	信息熵均值
前段	520	141	0.56	0.59
	668	147	0.61
	770	101	0.60
中段	1 526	104	0.60	0.60
	1 655	95	0.59
	1 731	125	0.60
后段	2 322	108	0.53	0.51
	2 481	140	0.53
	2 576	144	0.47

4 讨论

关于CT图像分割处理的研究多集中在医学领域上，如研究内脏器官和其他病变位置^{［7-8，10-11］}，以及研究脊柱^{［12-13，19］}等，这些方法中有些方法相对而言更复杂并且不能处理大量的样本。如宋红等^［8］提出的基于动态自适应区域生长分割肿瘤的算法，需要对图像先预分割而获得感兴趣区域，然后再提取肿瘤区域。此外，Chu等^［19］提出了一个基于学习的统一随机森林回归和分类方法，解决了从CT图像中全自动定位和分割脊柱三维椎体的问题，该方法可以完全自动化，但也需要先用随机森林回归方法定义脊柱感兴趣区域。两者在进行提取目标之前都有先获得感兴趣区域这一步，而本研究并不需要如此，直接就可以通过信息熵与分割阈值进行自动分离并提取目标，方法更加简便快速。

与目前广泛使用的医学CT图像分割方法相比，在恐龙蛋壳化石的CT图像研究上可借鉴的对象和参考的实例较少。由于恐龙蛋壳化石不同于人体组织或者动物组织，其成分属于不同的物质类型，两者的CT图像信号特征差异较大，因此不能完全照搬前人在医学领域的CT图像分割方法，并且医学图像中物体或结构的分割通常比其他类型的图像更为复杂。所以针对恐龙蛋壳化石CT图像，需要选择一种针对性强且运算效率更高的方法。本实验采用信息熵作为提取目标的一个参数，在信息熵误差范围设置为20%的情况下，经过多次尝试，分割阈值与信息熵的选定使分离效果明显，达到了大量CT图像的目标与背景自动分离的研究目标。实验证明本文方法是十分有效的，该方法不仅能清晰分离出目标，而且实现了自动化处理，大幅提高了操作效率，同时提供了类似CT图像处理情况中使用该信息熵范围直接作为处理的参数。

由于在评价不同方法时使用的数据集以及处理的对象复杂程度不同，直接比较不同的方法是困难的，不能简单地认为哪一个更好。但值得注意的是，本研究方法可以处理大量CT图像样本数据并且效果都不错，不需要过多的人机交互，真正实现了自动化、智能化。总之，本研究的主要贡献是提出了一种CT图像在新领域的处理方法。该方法可用于研究类似恐龙蛋壳化石一样由方解石构成的其他物体CT图像的分类处理，以该信息熵范围参数来进行自动分离并提取目标，为快速重构物体三维空间结构奠定了数据基础。

5 结论

针对大量恐龙蛋壳化石CT图像手动分割步骤繁琐、分割精度不高、处理时间长、误差较大等问题，在阈值分割的基础上，提出了一种基于信息熵的自动分离CT图像方法。利用手动分割CT图像获取到的信息熵值作为自动分离图像的参数，通过阈值分割和信息熵的方法进行大量图像目标与背景的自动分离研究，并进行了广泛的测试与实验，其中所获分割阈值范围为66~188，信息熵值范围为0.43~0.65。实验结果表明，所设计的方法在CT图像数量较多时，在自动分离图像目标与背景上可取得很好的效果，其有效分离率高达98.89%，并且该方法能在正确提取目标的同时还能保留完整目标与边缘细节，还可以对恐龙蛋壳中保存的气孔与蛋壳边界进行有效且精确地提取，提高了操作效率。但是，本研究仅探讨了如何处理大量恐龙蛋壳CT图像的方法，对于恐龙蛋壳本身以及如何重建恐龙蛋的三维立体结构的研究仍有不足，这是作者需要进一步研究的方向。

关键字：优秀论文

上一篇：基于YOLOv5和重识别的行人多目标跟踪方法
下一篇：融合细节特征与混合注意力机制的火灾烟雾检测