论文部分内容阅读
乳腺癌是女性癌症死亡的重要原因之一,并且其发病率呈逐年递增和年轻化的趋势。以病理图像为基础的诊断在乳腺癌诊断中被视为“金标准”。目前乳腺癌病理图像的良恶性分类存在以下问题:(1)病理图像的获得需经历组织制备、扫描、标注等一系列复杂的过程,成本高,因而清晰且标注完整的乳腺癌病理图像数据集较少。(2)诊断结果往往基于病理医生主观判断,工作量较大。与此同时,病人对精确诊断和治疗的需求也在增加。(3)乳腺癌病理图像存在形态结构复杂,染色不均,细胞核粘连等情况,使乳腺癌识别难度进一步加大。计算机自动辅助诊断系统有助于降低诊断成本,提高诊断效率以及客观性。基于数字化病理图像成像技术,病理图像分类方法一般分为基于人工特征提取的分类和基于深度学习的分类。本论文以西方数据库为基础,针对以上两种乳腺癌病理图像分类方法中的一些关键问题进行了深入研究。论文主要完成的工作及创新点有:(1)针对乳腺癌病理图像细胞核分割中染色质稀疏、染色不均、细胞核粘连等问题,设计了一种基于3类输出的卷积神经网络(Convolutional Neural Network,CNN)分割方法。以多个小卷积核代替大卷积核,减少了参数数量,降低了计算复杂度。利用概率生长法对CNN模型输出概率图进行后处理,进一步提高细胞核分割准确性。实验结果表明相比现有方法,该方法对于细胞核分割更有效。(2)针对纹理特征提取中不同颜色空间分类判别能力不同的情况,结合多种颜色空间图像采集特点,提出了一种基于H&E(Hematoxylin&Eosin,苏木精&伊红)模型的纹理特征提取方法。针对乳腺癌良恶性细胞核形态、结构多样性导致的丰富几何结构以及复杂纹理等问题,综合形态特征、空间特征和纹理特征对乳腺癌图像特性进行表达,提高了乳腺癌良恶性分类性能。(3)针对乳腺癌病理图像数据集较小的问题,结合迁移学习的知识迁移特性和深层网络模型强大的特征表示能力,对比分析了将CNN模型作为特征提取器和微调CNN模型的分类方式。实验结果表明,在未提供分割标注的数据库中,微调CNN模型的方法对于乳腺癌良恶性分类更有效。