【摘 要】
:
病理语音是发声系统异常所产生的语音,可由多种疾病引起,其中构音障碍是由于神经病变导致发音器官出现肌肉功能减弱或不协调的一种疾病,它会导致发音困难和吐字不清。随着人们对语音信号的产生原理和传输过程进一步解析,针对病理语音的分析识别能够对患者病情的诊断和治疗起到明显作用,特征的分析进一步加深了人们对构音障碍和正常语音间区别的认识,因此对于病理语音特征分析的关键技术研究具有极大的社会意义。目前对各种疾病
论文部分内容阅读
病理语音是发声系统异常所产生的语音,可由多种疾病引起,其中构音障碍是由于神经病变导致发音器官出现肌肉功能减弱或不协调的一种疾病,它会导致发音困难和吐字不清。随着人们对语音信号的产生原理和传输过程进一步解析,针对病理语音的分析识别能够对患者病情的诊断和治疗起到明显作用,特征的分析进一步加深了人们对构音障碍和正常语音间区别的认识,因此对于病理语音特征分析的关键技术研究具有极大的社会意义。目前对各种疾病引起的构音障碍的诊断评估主要还是依赖人工检查,以及相关计算机技术加以辅助,但过程复杂繁琐,结果主观性较强。为了克服以上问题,许多研究者将目光放在了深度学习领域,利用人工神经网络进行特征学习,为进一步分析病理语音开辟了新的道路。本文对深度学习和病理语音特征分析相关技术进行了一系列研究,提出了利用深度学习模型进行病理语音特征分析的方法,将梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)和语谱图两种特征作为研究对象,探究病理语音和正常语音之间的特征差异,本文主要开展了如下工作。(1)提取语谱图和MFCC两种不同特征,并通过观察和计算相关评估指标对两种特征进行初步分析,描述患者和正常人语音特征之间存在的差异。(2)以语谱图作为输入,对不同的卷积神经网络(CNN)进行建模训练,依据各项分类指标评估实验结果。采用了完全随机和说话人这两种数据集划分方法,对音节级的病理分类结果进一步分析和整理,进而上升到说话人级别的病理分类进行比较。(3)以MFCC特征作为输入,训练一维CNN、长短期记忆网络(Long Short-Term Memory,LSTM)和二者混合模型完成病理语音和健康语音之间的分类,依然用不同的方式划分数据,统计说话人个体的患病几率,并分析结果。(4)最后对病理语音模型进行综合分析比较,搭建三层CNN、CNN+LSTM-2和CNN+SVM三种不同的模型,对说话人个体划分数据集进行实验,并分析不同特征在同一模型下的病理分类结果,综合分析对比各模型之间的差异得出结论。实验结果表明,在使用语谱图作为CNN的输入时,Xception网络的分类各项评估指标效果达到最好。使用MFCC作为输入时,CNN联合LSTM网络模型能够得到最好的分类效果。随机划分音节作为数据集的病理分类效果较好,但是不能进一步讨论说话者个人的患病状况,说话人级别划分时的音节级效果相比随机较差,但是通过上升到说话人个体,分类效果得到了提升,并且更具实际意义。
其他文献
人口老龄化是21世纪世界各国正在经历或者即将经历并被广泛关注的问题。我国于20世纪末进入老龄社会。但是由于我国属于“未富先老”,养老服务本身压力就很大,再加之工业化、城镇化的推进,大量青壮年从农村流动或迁移到城市,导致农村老龄化比城市更为严重。而且随着社会的发展、观念的转变,传统家庭养老观念在逐渐淡化,这都对养老保障提出了巨大挑战。而就大多数农村而言,老人的养老观念还停留在依靠传统家庭养老,但是随
随着高光谱遥感技术的高速发展,高光谱遥感影像逐像素分类成为了遥感领域的研究热点。近年来,基于卷积神经网络的分类算法大大推进了高光谱影像分类技术的发展。然而,其发展趋势为通过不断加深网络或增加模型结构复杂度来提高分类精度,由此带来了算法的高时耗问题,阻碍了分类算法的应用。同时,现有的分类模型都假定高光谱影像分类环境为闭集场景,将所有像素点都分为训练过程中出现过的已知类别,忽略了现实情况下普遍存在的未
近年来,中央越来越重视投资的作用,投资是推动国民经济发展的一个重要环节,如何高效的投资,如何达到收益的最大化一直是国家经济的重要课题,对此,中央出台了一系列扩大投资、拉动内需的政策,以发展经济为目标,推动了一系列的国家专项资金项目的建设项目,尤其是基础性设施的建设,每年投资金额达上千亿元。而如今投资规模的急剧扩大,给投资监管带来了新的考验。投资金额越来越大,项目数量越来越多,并且如今还面临着投融资
1917年俄国爆发十月革命,给救亡图存、积极探索中国出路的先进国人送来了马克思主义。在马克思主义在全国范围内开始传播的大背景下,地理位置上与俄国毗邻的新疆,马克思主义的传播情况如何?本文试就这一问题展开历史研究,特别聚焦于新民主主义革命时期马克思主义在新疆的传播开展专门探究。文章从结构上分为三大部分,引言、正文和结语。引言就选题来源和意义、研究综述、研究方法和思路以及本文的重点与难点、创新点做了相
电子皮带秤是工业生产过程中对输送带传送的散状固体物料进行连续称重的计量设备,在火电厂中经常被用于锅炉制粉系统的前端,它能够调节进入下端磨煤机煤料的瞬时流量,并且计
传统村落是我国宝贵的文化遗产,也是一种不可再生、潜在的旅游资源。其保护和发展存在多种方式,其中旅游开发是重要和常见的一种。20世纪90年代以来,一些传统村落通过旅游开发,一定程度实现了现代化转型。在其转型过程中,文化的稳定性、延续性是相对的,变迁是常态和永恒的。作为中国传统村落、中国历史文化名村、国家文物保护单位,鱼木寨依托自身的区位优势以及得天独厚的自然资源和人文资源,自20世纪90年代开始发展
相对于显热储热材料而言,相变储热材料由于其能量密度高、体积小、储放热能时温度稳定的特点而备受关注。近年来以有机相变储能材料为主的各种相变材料被广泛应用于建筑节能保温、工业节能、电力调峰平谷等多个领域。本研究旨在尝试使用通过原位添加无机纳米颗粒以及小分子有机物添加剂来对低温有机相变材料进行改性和性能调控,同时尝试建立相变材料导热性能的快速评价方法,并在此基础上进一步研究低温有机复合相变储能材料并探究
目前随着人工智能与移动互联网应用技术的发展,以及结合幼儿园对于儿童成长信息管理的需求。因此结合AI(Artificial Intelligence)大数据的儿童成长信息化系统的研究,不仅能够实现儿童成长数据的自动采集,大幅提高效率。还能基于采集的数据在云端进行大数据分析,让家长对孩子的健康成长产生更直观的感受和有针对性的帮助。该研究成果还可扩展应用在幼教、社区医院、特殊教育学校等机构场所中,有助于
伊犁芦草沟镇地处霍城县东北方向,其方言具有自身的复杂性和独特性。本文在马克思主义理论指导下,以伊犁芦草沟话为研究对象,综合运用汉语方言学和社会语言学的研究理论与方法,通过田野调查法和问卷调查法收集语料,并利用SPSS19.0进行数据分析,探究伊犁芦草沟话语音变异的特点和机制。本文共6个部分,说明了研究目的、意义,总结国内外语言变异研究概况并阐释了本文的理论依据、研究方法等内容;介绍伊犁芦草沟镇相关
目的:肺癌的发病率和死亡率都位居全球最高,我国拥有世界三分之一的肺癌患者。目前肺癌的主要治疗方法为外科手术、放化疗和靶向治疗,但预后并不理想,五年存活率仍然很低。因此,深入了解肺癌发生发展的机制显得尤为重要。细胞叠套结构(Cell-in-cell structure,CICs)是近年发现的一种新的非凋亡的细胞死亡方式,肿瘤组织的细胞叠套结构中,内化细胞的命运主要有分裂、逃逸、死亡和长时间滞留,其中