【摘 要】
:
随着移动互联网时代的到来,手机、电子邮件和社交网络应用程序的普及,网络社交已经成为人们日常生活工作中重要得沟通方式之一,尤其是在新冠在全球蔓延的大环境下,人们更加依赖网络在线交流,越来越多地以对话的形式来交换思想、制定计划和共享信息。然而,对于复杂的对话内容,复述和掌握所有核心内容是很费时间的,如何让移动互联网时代保留下来的海量对话数据,更高效的辅佐人们解决日常工作生活中的需求正是本文研究的出发点
论文部分内容阅读
随着移动互联网时代的到来,手机、电子邮件和社交网络应用程序的普及,网络社交已经成为人们日常生活工作中重要得沟通方式之一,尤其是在新冠在全球蔓延的大环境下,人们更加依赖网络在线交流,越来越多地以对话的形式来交换思想、制定计划和共享信息。然而,对于复杂的对话内容,复述和掌握所有核心内容是很费时间的,如何让移动互联网时代保留下来的海量对话数据,更高效的辅佐人们解决日常工作生活中的需求正是本文研究的出发点。模型仅从主题视角编码对话信息,可能会无法全面捕捉对话的细节信息,并且编码阶段任意数量信息的丢失都会导致解码阶段出现更大的错误级联,从而影响最后的生成摘要的质量。针对上述问题,本文提出了一种结合多视角的序列到序列模型用于对话摘要生成,该模型不仅仅从主题视角编码对话信息,还从对话发展阶段视角编码会话信息,然后在解码阶段将两种不用视角下得到的信息结合用于生成最后的对话总结。技术路线如下:首先利用预训练模型获得对话的向量编码,然后分别使用无监督的TSF算法以及CRF算法将非结构化日常聊天的会话以主题和对话阶段两种视角进行对话分割,分割后的每个语句块都包含若干连续的话语,在主题视角下意味着这几句描述的是同一主题,阶段视角同理。再将不同视角下的语句块送入模型编码器中提取不同视角下的会话表示,然后利用多视角解码器将不同的视图结合起来生成对话摘要。文本分割从对话主题以及对话发展变化两个方面考量对话内容与结构之间的关联,在编码阶段覆盖了原文更多的信息,再以多视角结合的方式生成摘要,提高了模型对于文本的理解能力。最后,本文在目前抽象对话总结任务最全面的SAMSum数据集上分别从基于抽取式以及生成式两个方面进行了实验,结果表明本文模型在融入多视角的对话信息后有了更高的ROUGE的得分,可以更好的理解语句对话,得到了更高质量的总结。
其他文献
基于RGB-D相机的即时定位与建图(Simultaneous Localization and Mapping,SLAM)技术是增强现实(Augmented Reality)的核心技术之一。然而,现有的RGB-D SLAM系统几乎只针对静态场景设计,当场景中出现动态物体时,现有系统的位姿估计会出现较大偏差,从而造成估计位姿的漂移。本文提出了一个能在动态场景中准确估计相机位姿的RGB-D SLAM系
随着深度学习的发展,人工智能热潮兴起,自动驾驶、移动机器人等技术成为当前的研究热点。这些智能化应用中,双目视觉技术被广泛使用,而立体匹配是双目视觉技术的关键。近年来,卷积神经网络在立体匹配任务中表现出了良好的性能。然而,基于深度学习的立体匹配方法通常使用空间共享的卷积权值,这导致现有方法面临着一个困境,即适合于在平滑区域聚合上下文信息的权值往往会模糊纹理区域的局部匹配细节,反之亦然。本文旨在设计一
近些年来深度学习在不断地发展,它在人脸检测、语音识别等领域都发挥出了重要作用。在现在的大数据时代,越来越多的数据可以被建模成图关系,例如化合物分子、社交网络等。图结构数据中的每个节点都包含其特征与其他节点的联系关系,图神经网络则可以利用这些信息来完成例如节点分类、图分类、链路预测等任务。但现有的应用于图分类任务的图池化模型大多是通过复杂的度量方法来计算节点重要性,但这相应的会导致计算复杂度的提升。
交通事故无时无刻不威胁着人们的生命以及财产安全,特别是近年来,由交通事故造成的损失已经不容忽视。为尽量避免由于行车环境复杂与驾驶员处于非正常行车状态而导致交通事故的产生,基于计算机视觉技术来实现辅助驾驶已经成为一个热点的研究问题,开发安全可靠的车载辅助变道系统和驾驶员状态实时监测系统就有着重要的实用价值。本文主要研究了实时场景车辆变道安全提醒算法设计和驾驶员状态监测算法设计以及它们在嵌入式AI芯片
【目的】本实验拟通过静电纺丝技术制备一种负载碱性成纤维细胞生长因子(b FGF)的胶原-氧化石墨烯纳米纤维电纺膜,给创面提供一个良好的愈合微环境,并观察其促进创面愈合的效果,拟为临床创面愈合提供新思路。【方法】首先通过傅里叶红外光谱、拉曼光谱、扫描电镜(SEM)和拉力测试等材料学检测,来对比不同浓度的胶原(COL)及氧化石墨烯(GO)所制备的纳米纤维电纺膜的理化性能,选择最适合创面愈合的配比;然后
工业互联网当中多节点传感器数据融合是重要发展趋势,但随之而来的问题是数据量的增大与通信带宽的限制之间的矛盾,同时工业检测的实时性要求也难以保障。在数据产生的上游端口对数据进行压缩从而降低通信系统的压力是解决该问题一种行之有效方法。本论文基于实际工程项目中的该问题进行了相关研究,搭建了一个基于嵌入式平台的图像压缩系统,其压缩性能达到预期设计目标。具体工作如下:(1)在对经典无损压缩算法两种主要类型进
医学影像分割是计算机辅助诊疗应用中的关键任务。随着深度学习技术的飞速发展,基于深度学习的医学影像分割方法已经取得了显著的成效。然而,医学影像分割任务中由于数据的获取设备、标准等差异性,来自不同中心、不同设备的影像之间往往存在严重的领域漂移问题,从而导致分割模型在不同域数据上的性能下降。为了解决这一问题,医学影像中无监督域自适应研究逐渐兴起。尽管近期的无监督域自适应工作在医学影像分析领域已经取得了一
随着科技发展,无线通信设备的使用范围越来越广,在为人们生活带来便捷的同时,给无线电监管工作带来了严峻的挑战。信号接收机作为无线电监管设备中的接收前端,其性能对于监测效果至关重要。本文根据实际需求,分析和实现了宽带超外差阵列接收机,主要工作内容包含以下几点:(1)基于接收机的常见结构,针对接收机性能指标要求,选择了一种超外差式结构,作为本文设计和研究的基础。在此基础上,分析了如何实现抗干扰能力较强、
随着遥感卫星技术的不断发展,社会进入了遥感大数据时代。高维数据的存储和检索成为海量遥感数据应用的瓶颈,如何实现对大规模遥感图像的准确、快速搜索,在灾难预警、农业检测、城市规划等遥感应用领域具有重要意义。哈希方法作为一种高效的索引方式,为每幅图像生成较短的二进制序列表示,大幅度地提高了检索效率,同时减少了内存消耗。然而传统的哈希方法依赖人工设计的特征描述符作为哈希编码的输入,人工提取的低层视觉特征难
在天文学研究中,光谱最主要的研究领域之一,多目标光纤光谱仪作为天文光谱测量仪器,是大视场光谱巡天望远镜最重要的科学仪器。多目标光纤光谱仪的光学性能直接决定了大视场光谱巡天能够实现的科学目的。但对于此类用途单一的光学仪器,目前可供参考的光学设计报告很少,且均没有提供初始结构计算,优化约束条件等对于光学系统设计过程十分重要的信息。因此,建立一套包含系统性能指标制定,初始结构搭建,系统优化过程,性能评价