【摘 要】
:
近年来,随着生活压力的增大,人们面临精神上的压力越来越大,随之而来的是具有精神疾病风险的人群的数量与日俱增,尤其是抑郁风险群体。目前,机器学习(Machine Learning)已经开始被广泛引入到抑郁症识别中,依据采集数据的类型可分为音视频识别、文本识别和生理信号识别等。虽然上述研究已经有了可喜的进展,但是依然存在不同缺陷,如需要专业的数据采集设备、需要被试高度配合、对被试有干扰等。上述缺陷会导
论文部分内容阅读
近年来,随着生活压力的增大,人们面临精神上的压力越来越大,随之而来的是具有精神疾病风险的人群的数量与日俱增,尤其是抑郁风险群体。目前,机器学习(Machine Learning)已经开始被广泛引入到抑郁症识别中,依据采集数据的类型可分为音视频识别、文本识别和生理信号识别等。虽然上述研究已经有了可喜的进展,但是依然存在不同缺陷,如需要专业的数据采集设备、需要被试高度配合、对被试有干扰等。上述缺陷会导致这些方法的成本居高不下,并且难以适用于各种复杂场景。因此,这些方法难以进行大范围的抑郁症的早期筛查。针对上述问题,研究人员希望找到一种无刺激低成本的无扰式抑郁风险识别方法。考虑到抑郁症的特点和步态的优势,本文采用步态的多模态信息进行抑郁风险群体的无扰式的早期筛查。步态是一种对人体步行过程中连续的姿势和行为的描述,其具有难伪装、采集距离远的特点。步态的特点使得步态数据的采集是无扰式而且不需要被试高度配合。相关的研究表明,人类负责情绪的脑部区域和负责运动的脑部区域是存在关联的,所以,抑郁症会引起患者步态的改变并且我们可以通过步态识别进行对健康群体和抑郁风险群体的识别。此外,在不同的场景中,不同模态的数据的有效性和精确度是不一样,通过多模态融合的方法,我们可以有效利用各模态之间的优势从而提高分类模型的泛用性和准确率。综上,为了更好描述步态和提高模型的泛用性,本文决定采集步态的骨架数据、轮廓信息和光流信息等多个模态的数据进行抑郁风险识别。为了更好进行步态数据的采集,本文采用Kinect摄像机采集上述多模态数据,并且设计了一个步态数据无扰式采集和骨架数据可视化系统。基于该系统采集的数据,本文进行有效的步态特征的提取并分别对单一模态提出了对应的分类模型。最后,本文利用多模态融合将骨架、轮廓和光流三模态进行融合,进而构建有效的无扰式抑郁症识别模型。本文的主要工作及创新点主要有以下四点:(1)步态数据收集与数据可视化系统的建立。该系统可收集被试人员的步态信息,并能将步态骨架数据加以可视化显示。利用该系统,课题组成员一共收集了86名有抑郁风险的群体以及114名健康人群的步态信息,这些信息中包含了三维骨架坐标、RGB视频图片、深度信号以及近红外信息等数据。随后,本文又按照这些数据分别建立了原始数据集,以及经过进行骨架数据可视化后、人工筛选和预处理之后的数据集。(2)骨架特征图的提取和分类。本文提出了一种新的骨架数据特征的提取方法并提出了一种注意力多流CNN分类网络模型。本文通过将三维骨架数据映射分解成10组二维数据,然后将其转换成10种二维的骨架特征图,这些特征图包含了骨架关节点之间、时间和空间、骨架关节点和时间、骨架关节点和空间的关系。结果表明,这种特征具有有效的分类效果,单一骨架特征图最高准确率可达75.73%。(3)光流信息和轮廓信息的抑郁风险评估的分类。本文分别提取了包含时空信息的光流信息特征和轮廓信息特征。针对轮廓信息,我们提出了一种新的卷积神经网络进行分类。针对光流信息,我们提出了一种交叉注意力卷积神经网络的网络模型进行分类。结果表明两种模态数据和对应的分类模型都能有效提高分类的准确率。(4)多模态决策层融合模型。为了利用骨架模态、轮廓模态和光流模态的协同性和相关性,本文提出基于加权融合策略的决策层融合分类模型,该模型在决策层融合了骨架、轮廓和光流模态的分类结果从而得到最终结果。然后,本文在该模型中使用不同融合策略并且对不同结果进行对比,结果表明,加权融合策略在整体的分类效果中最好。此外,本文对比了不同模态的分类结果,结果表明,相比较单一模态,三种模态的决策层的融合更能提高抑郁风险评估的分类效果并且三个模态数据能做到优势互补。基于以上的主要工作,本文提出的一种多模态无扰式抑郁风险评估为大范围的抑郁症早期筛查做出了一定的贡献并对展望了未来的研究方向。
其他文献
目的:介绍运用DSA引导下行选择性神经根造影与阻滞,治疗顽固性神经根型颈椎病,并评估临床疗效、并发症。方法:32例顽固性神经根型颈椎病患者,在三维DSA类CT重建引导下经椎间孔穿刺行选择性神经根造影成功后,注入利多卡因与得宝松混合镇痛液。分别测定患者治疗前、治疗后3d、1月、6月、12月、24月视觉模拟评分(VAS),同时按照改良MacNab评估临床疗效。结果:32例治疗前VAS评分平均值为(8.
情感在人们的日常生活中扮演着至关重要的角色,它影响着人类的决策、感知和理解过程,因此情感是人际交往中必不可少的因素。由于情感是人类最重要的认知活动之一,将这种认知能力应用到人工智能中能够促进和提高人机之间的交互与协作。情感计算的目标是发展具有能够感知、理解和调节情感能力的人工智能。作为情感计算中最重要的一环,情感识别为将人类情感赋予智能机器提供了一种可能的途径,这是研究具有情感能力的人工智能的第一
目的:应用光学相干断层扫描血管成像技术(Optical coherence tomography angiography,OCTA)检测黄斑区浅层血管密度并分析其在原发性青光眼早期诊断中的应用。方法:选取2020年7月至2022年1月就诊于惠州市中心人民医院并确诊为原发性青光眼的患者31例(共55眼)以及正常对照组33例(共65眼)。所有受试者均进行OCTA扫描并计算黄斑区浅层血管密度,同时测量黄
目的 探讨中医药防治糖皮质激素不良反应的用药规律。方法 检索中国知网(CNKI)、万方数据知识服务平台(Wanfang Data)、维普中文期刊服务平台(VIP)、中国生物医学文献服务系统(SinoMed)建库至2022年11月有关中医药防治糖皮质激素不良反应的文献,文献剔重并筛选后建立方药数据库,借助Excel2019对涉及中医证型、药物频次及其性味归经进行统计分析,SPSS Modeler 1
目的:探讨配戴角膜塑形镜对眼表的影响以及不同设计类型的角膜塑形镜对眼表影响的差别。方法:本研究为前瞻性研究,选取青少年近视患者41例,平均年龄(10.51±1.76)岁,每名患者均选用右眼作为受试眼。所有对象根据不同类型塑形镜分为两组。配戴VST型镜者为21例,平均年龄(10.67±1.74)岁;配戴CRT型镜者为20例,平均年龄(10.35±1.81)岁。分别于戴镜前和戴镜后1月、3月对所有研究
目的:N6腺苷甲基化(m6A)是RNA上的一类普遍性修饰,在癌症的发生发展中起着至关重要的作用。这种修饰是动态可逆的,主要由三种类型的m6A相关调节因子调控(甲基化转移酶、去甲基化酶、RNA结合蛋白)。迄今,这些m6A相关调节因子在头颈鳞癌的功能与角色仍不明晰,具有广阔的研究空间。本文旨在探讨m6A相关调节因子在头颈鳞癌中的角色及功能,并识别出其中最关键的预后相关的m6A相关调节因子进行进一步研究
视频头脉冲实验(Video Head Impulse Test,VHIT)是临床上用于检测人体前庭功能的重要试验,是急性眩晕患者必备的检测项目。医生通过对比这项检查中产生的眼动曲线和头动曲线对患者的病情进行诊断。眼动曲线的获取分为瞳孔中心定位和曲线校准两个步骤。然而获取精确的眼动曲线有以下几个难点:首先,VHIT不同于其它的眼动实验,因为实验速度较快,为了清楚的观察眼球运动,必须提高眼动视频的采样
目的:使用卷积神经网络(Convolutional Neural Network,CNN),建立基于眼底彩照的糖尿病黄斑水肿(Diabetic Macular Edema,DME)的分类识别模型,并通过3D-OCT测试此模型诊断DME的敏感性和特异性。方法:本研究收集了2016年1月至2021年12月在汕头大学医学院第二附属医院内分泌科住院部进行糖尿病视网膜病变筛查、年龄≥18岁的糖尿病患者的眼底
聚类分析作为一种常用的数据挖掘技术被人们熟知,它根据数据对象之间的相似性将其划分至不同的组或簇。随着聚类分析的不断发展,越来越多的聚类算法被提出,与其他类型的聚类算法相比,基于密度的聚类算法不仅可以有效地区分噪声对象和非噪声对象,而且可以识别任意形状的类簇。因此,该类算法成为了聚类分析领域中的一个研究热点。基于密度的聚类算法将数据对象的密度信息作为聚类的重要依据。随着数据集规模以及维度的不断增加,
目的:利用眼前节光学相干断层扫描仪(Anterior Segment Optical Coherence Tomography,CASIA2 AS-OCT)探究角膜裂伤缝合术后,角膜拆线后的角膜散光的稳定时间。方法:对在2021年2月至2022年4月于汕头国际眼科中心住院的患有角膜裂伤并已行一期角膜裂伤缝合的30位患者定期随访,在一期缝合术后约三个月时行角膜缝线拆除。采用CASIA2 AS-OCT