【摘 要】
:
近两年,随着新冠肺炎防疫逐渐常态化、医疗资源短缺与地区不平衡现象愈发突出,线上问诊研究逐渐成为热点。医院内医患问诊对话文本蕴含大量诊断指导信息,如何挖掘问诊对话数据中的逻辑,并以此实现对话自动诊断是一个具有科学研究价值和实际应用场景的研究方向。当前对话策略研究将患者的症状、检查信息标准化,和疾病信息共同构成医生的动作集合,将整个对话过程建模为序列决策过程,使用强化学习来模拟医生诊断过程。这种建模方
论文部分内容阅读
近两年,随着新冠肺炎防疫逐渐常态化、医疗资源短缺与地区不平衡现象愈发突出,线上问诊研究逐渐成为热点。医院内医患问诊对话文本蕴含大量诊断指导信息,如何挖掘问诊对话数据中的逻辑,并以此实现对话自动诊断是一个具有科学研究价值和实际应用场景的研究方向。当前对话策略研究将患者的症状、检查信息标准化,和疾病信息共同构成医生的动作集合,将整个对话过程建模为序列决策过程,使用强化学习来模拟医生诊断过程。这种建模方式下需要同时学习症状问询策略和疾病判别策略,难以设计合适的奖励,导致现有方法症状询问不充分;另外现有模型仅使用布尔表示作为输入,没有充分利用到症状文本信息。为此,本文分别研究了基于实时诊断指导和基于表示增强的两阶段自动诊断对话策略,并设计实验进行了验证。针对症状询问不充分的问题,本文探索了基于实时诊断指导的两阶段对话策略。通过把动作空间拆分为症状空间和疾病空间,从而将对话过程划分为症状问询部分和疾病判别部分的管道结构,其中症状问询部分建模为序列决策问题,使用基于价值函数的无模型强化学习进行学习,疾病判别部分建模为分类问题,使用梯度提升决策树进行学习。模型同时使用实时诊断信息对症状询问模型进行指导,利用问询到的症状关于目标疾病的预测概率提升值来对强化学习奖励函数进行约束。在数据集上的实验结果显示,基于实时诊断指导的两阶段对话策略相比于基准线方法有一定性能提升,在症状召回率指标上平均提升了15.0%,在疾病准确率指标上平均提升了1.7%。考虑到现有方法存在模型表示层没有充分提取文本信息,表征能力不足的问题,本文提出了一种基于表示增强的对话策略,从模型结构和辅助任务两方面对模型表示能力进行提升。提出了面向集合文本的表示模型对症状集合进行表示,并使用二次预训练-微调策略,在模型结构方面增强模型表征能力;同时新增了实时诊断辅助任务,与症状预测主任务一同构成多任务学习范式,利用在辅助任务上学习得到的文本表示对主任务文本表示进行增强。实验结果显示,该对话策略在症状召回率指标上有13.8%的提升,在疾病准确率指标上有3.0%的提升,达到了目前已知最好效果。
其他文献
目的描述大学生睡眠时型和抑郁症状的流行状况,分析睡眠时型与抑郁症状的关联强度。采用生物学指标暗光褪黑素初始释放时间(dim light melatonin onset,DLMO)验证大学生睡眠时型与抑郁症状的关联效应,并从表观遗传学角度进一步探讨生物钟基因DNA甲基化在睡眠时型与抑郁症状纵向关联中的调节效应。方法2019年4—5月,采用整群随机抽样方法在安徽省合肥市某医科大学2个专业和江西省上饶市
金融要素抽取,旨在应用信息抽取技术,从合同、计划书中提取出能够反映金融文档关键性信息的实体和短语等要素,实现对金融文档的结构化处理。与现有抽取任务相比,金融要素抽取任务存在长尾分布、细粒度、长文本长要素以及上下文受限等复杂问题,现有模型在此类复杂环境下的抽取效果不佳,无法完全满足任务需求。因此,探索具备复杂场景抽取能力并能解决实际应用需求的金融要素抽取模型,是一项具有学术与应用价值的研究。针对长文
气旋气象作为极端的灾害性气象现象,能够在短时间内造成剧烈的气候变化,最典型的例子是极地涡旋气象与台风气旋气象。气旋气象的发生会对人类生产生活造成巨大的影响,甚至会影响整个大气系统的正常运转。随着卫星遥感技术的快速发展,使用卫星遥感监测数据对气旋气象进行监测识别与分析,及时采取防护措施,是降低该类灾害性气象影响的重要方式。目前基于卫星遥感图像的气旋监测研究方法普遍存在监测精度较低和算法鲁棒性不足等问
目的基于医学生童年期不良经历(Adverse childhood experiences,ACEs)暴露类型和时相探索ACEs暴露模式,分析ACEs暴露模式与医学生抑郁、焦虑症状发展轨迹的关联。方法以安徽省两所医学专科学校大一学生为调查对象,2019年11月-12月进行基线调查,之后每半年进行一次随访,共随访两次,收集有效问卷3662份。使用儿童期虐待问卷、家庭功能不全问卷、WHO社区暴力与同伴欺
目的依托出生队列,分析孕早期妊娠相关焦虑(pregnancy-related anxiety,PrA)对3~7岁儿童饮食行为的影响,并探讨3~7岁儿童近半年情绪和行为问题在其中的作用。方法2008年10月至2010年10月在安徽省马鞍山市妇幼保健院招募孕早期建档并同意加入中国安徽出生队列的孕妇,随访至子代学龄前期。采用自编《孕产期母婴健康记录表一》在孕早期收集孕妇及其丈夫人口学特征和孕期等相关信息
目的评估亲子分离经历对学龄前儿童情绪与认知发育影响的敏感期和累积效应,探索端粒长度在亲子分离经历与学龄前儿童情绪与认知发育关联中的作用,为预防早期亲子分离带来的健康危害提供理论指导和干预框架。方法于2021年5月采用整群抽样方法招募芜湖市南陵县9所幼儿园2729名学龄前儿童,其中2447名儿童(1266名男童,占比51.7%)有完整问卷信息,平均年龄为(4.88±0.96)岁。采用父母问卷(电子问
目的探讨母体孕早、中、晚期及脐血血清中7种炎症因子浓度与学龄前儿童智力发育水平之间的关联,揭示关联的敏感期及其性别差异,为预防儿童智力发育损伤和发育起源性疾病的发生提供理论依据。方法本研究依托马鞍山优生优育队列(MABC),最终纳入1 641对母子对进行分析。在母亲孕早、中及晚期产检时采集空腹外周静脉血,并在分娩时采集脐血,使用Luminex液相悬浮蛋白技术检测样本血清中7种炎症因子浓度,包括干扰
购物小票票据是线下消费过程由商户提供给消费者留存的购物凭证。由于线下零售销售系统的独立性,海量线下消费数据被不同品牌、商铺形成的“信息孤岛”所隔离。在此背景下,对购物小票票据进行数字化信息结构抽取可以为智能零售提供针对商品运营和供应链优化的精准数据分析。传统光学字符识别(Optical Character Recognition,OCR)系统在扫描文档图像的文本检测和识别任务上表现优秀。但是,由于
中长期的天气预报主要是指两小时以上的天气预报,其在灾害预警、降水估计、农业灌溉和交通规划等领域都有着重要的应用价值。而中长期的天气预报主要依赖于卫星云图预测任务,它是时空序列预测的一种应用场景。但由于卫星云图序列运动规律计算困难且预测时间长,该预测任务具有极大的困难与挑战。传统的光流法和交叉相关法都是建立在理想的条件下,对卫星云图的复杂运动系统难以预测。而近年来基于深度学习的时空序列预测算法在处理
近年来,微软小冰、天猫精灵等聊天机器人的研究与运用得到快速发展,并开始扮演着重要的角色。除了进行正常的自然语言理解与生成外,拥有情感理解与同理心对话能力是聊天机器人的重要特征。合理有效的同理心回复可以带来更好的用户体验。现有的同理心对话方法主要采用多任务学习框架,在情感分类的同时进行回复生成,取得了不错的效果,但仍存在一些问题。一方面现有方法通常只利用了部分情感信息,却忽视了其他与对话相关的状态信