基于卷积神经网络的中医舌象辨识人工智能方法学研究

来源 :北京中医药大学 | 被引量 : 1次 | 上传用户:xiaoyuerlga
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究目的:本研究以全面、准确、客观的舌象图片采集为基础,以齿痕舌、腻苔两大舌象特征为切入点,专家共识为舌象特征判定金标准,构建舌象分类标准数据集;基于深度学习卷积神经网络(CNN)算法,构建齿痕舌、腻苔特征的人工智能检测模型,提出一种适宜中医舌象处理的人工智能技术,初步探索建立客观化的中医辅助诊断新方法。研究方法:本研究中我们对课题组前期采集的1760例舌象图片(1680例标准设备拍摄,80例智能手机拍摄)进行筛选并交由中医专家对其特征进行判断,将舌象图片按其特征进行分类。通过Colabeler(Ver.2.0.2)软件对舌部轮廓进行标注,形成包含不同舌象特征及其舌部轮廓的舌象数据集,构建中医舌象的标准舌象数据库。随后,以齿痕舌为切入点,将基于深度学习卷积神经网络(CNN)的人工智能网络框架——ResNet34应用于此数据集,来自动化地提取图像特征,实现齿痕舌分类;同时,使用迁移学习和数据扩增技术来提高样本训练效率、优化数据样本,防止模型过拟合。通过三种方式验证齿痕舌识别模型有效性:将在分类任务中热门的VGG16网络框架应用于本研究数据集,比较分类效果;将本研究模型同其他学者所做的齿痕舌分类模型作比较,比较分类效果;使用通过手机相机采集的舌象图片作为验证集,验证模型的泛化能力。最后,使用同样的方法应用于腻苔数据集,对非腻苔、腻苔和厚腻苔进行三分类任务训练和验证,建立人工智能腻苔识别模型。本研究采用准确率(accuracy,Acc)、灵敏度(sensitivity,Sens)和特异性(specificity,Spec)指标对模型效果进行评价。研究结果:(1)通过对采集到的舌象图片进行数据整理、图片标注,最终形成了 4个齿痕舌相关数据集,包括标准设备齿痕舌原始舌象数据集(672例齿痕舌,876例非齿痕舌)及其对应的舌部轮廓数据集、智能手机齿痕舌原始舌象数据集(27例齿痕舌,23例非齿痕舌)及其对应的舌部轮廓数据集;4个腻苔相关数据集,包括标准设备腻苔原始舌象数据集(642例厚腻苔,759例腻苔,85例非腻苔)及其对应的舌部轮廓数据集、智能手机腻苔原始舌象数据集(19例厚腻苔,25例腻苔,6例非腻苔)及其对应的舌部轮廓数据集。这些数据集为我们研究齿痕舌及腻苔人工智能识别模型奠定了基础。(2)齿痕舌识别结果:齿痕舌识别模型在原始舌象图片上的识别准确率为90.50%,灵敏度为87.25%,特异性为93.00%,说明了本研究提出的的齿痕舌识别模型性能相对较好、鲁棒性强,具有较高的灵敏度和特异性,可以较好地识别不同仪器、不同拍摄环境的齿痕舌;该模型在舌部轮廓数据集上的准确率达91.47%,比直接使用舌象图片进行特征识别的平均准确率提高了0.97%,提示除舌体外的其他面部区域掺杂确实会对齿痕舌人工智能模型识别准确率造成一定影响。模型在智能手机拍摄的测试集上的平均准确性分别为83.20%和88.80%,模型总体准确率为85.00%,证明模型泛化能力较强,日后可推广应用于不同设备。ResNet34齿痕舌识别模型对原始舌象图片数据集和舌部轮廓数据集的平均准确性分别为89.41%和90.96%,准确性比VGG16分别提升1.10%和0.52%,由此可见,ResNet34算法架构在两种数据集上的表现优秀、性能较高,说明ResNet34架构能够更好地胜任齿痕舌特征识别任务。本研究中提出的齿痕舌识别模型同现有研究中相似学习任务相比,准确率高出10%以上,这一结果提示本研究中提出的CNN算法能更加准确有效地区分齿痕舌。(3)腻苔识别结果:腻苔识别模型总体识别准确率为88.36%,在舌部轮廓上总体准确率为87.08%,这一结果提示我们,在腻苔的识别上,舌体外的其他面部区域对人工智能模型识别准确率可能影响不大;该模型在测试集上平均准确率分别为62.80%和76.80%,提示该场景下模型受到面部其他区域以及拍摄背景等客观条件影响较大;使用VGG16算法架构构建腻苔识别模型的平均准确率分别为79.48%和80.89%,ResNet34算法架构与之相比准确率更高,分别高出8.80%和6.19%,表明ResNet34算法架构能够更好地胜任腻苔特征识别任务。结论及意义:本研究采用了一种基于深度学习的卷积神经网络模型,该模型可以在实现自动提取舌象特征的同时,减少人工参与预处理数据的步骤,能够更为快捷、方便地进行舌象特征提取,这是此类舌象识别系统转换为临床实践的关键所在;与此同时,我们所提出的模型架构表现优秀且泛化能力强,可以为日后从中医信息学的角度追踪疾病进展和通过观察舌象变化的中药药效评估提供更为客观、便捷的计算机辅助新方法。
其他文献
全球钾矿床分布极不均匀,主要分布在欧洲、北美、中亚和东南亚等地。中国境内目前已探明的钾盐储量较少,主要局限在特提斯域的盆地。塔里木盆地位于特提斯东部,发育着巨厚层
第一章文献研究目的:系统评价中药地龙在高血压治疗中的疗效及安全性。方法:计算机检索Pu Med、EMbase、The Cochrane Library、CBM、知网和万方数据库,检索时限均为从建库至
目的:通过分析干扰素诱导跨膜蛋白3(Interferon-induced Transmembrane Protein 3,IFITM3)基因rs12252位点C/T多态性的分布特点,初步探讨IFITM3基因多态性与乙型肝炎病毒感染易感性的相关性,探索IFITM3 rs12252不同基因型与HBV相关肝硬化及HBV相关肝癌的关联性,揭示影响乙型肝炎病毒致病性的宿主遗传因素。方法:(1)收集暨南大学第
急性肾损伤(acute kidney injury,AKI)已成为全世界范围内的公共卫生问题,它起病急、发病率高且无特效治疗药物,具有很高的死亡风险,而其预后不良则可进展至慢性肾脏病,给我们
尤金·奥尼尔(Eugene O’Neill,1888-1953)是20世纪美国首屈一指的表现主义戏剧巨匠、民族戏剧的奠基人和世界文学史上里程碑式的人物。作为一名多产的剧作家,他在近40年的戏
背景:内镜粘膜下剥离术(endoscopic submucosal dissection,ESD)是早期胃癌、胃腺瘤等胃粘膜病变内镜下治疗的标准方法,出血是其术后最为常见的并发症之一。ESD术后出血的发
研究背景骨关节炎(Osteoarthritis,OA)是最常见的一种与年龄相关的慢性关节疾病,并且随着人群寿命逐渐延长和老龄化逐渐加重,在全球范围内变得越来越流行。以往研究表明骨性关
研究背景与目的:脓毒症(sepsis)是由各种致病菌,尤其是革兰阴性菌进入血液生长繁殖引起的全身性系统性过度炎症反应,其常伴发血压骤降,寒战高热及呼吸循环衰竭等严重并发症。
在东北滨海边疆地区,即以黑龙江下游流域与库页岛为中心的广大疆域上,分散居住着无数以渔猎为生的少数族群,他们有着自己的交流语言与独特的民族文化、社会风俗。明廷依托奴
背景及目的:胶质瘤为颅内最常见的原发脑肿瘤,占成人恶性原发性脑肿瘤的75%,五年总生存率不超过35%,仍然是最难治疗的肿瘤之一。胶质瘤的分子分型有助于制定治疗方案及预测患