【摘 要】
:
随着移动互联网技术的飞速发展,公众可以通过网络随意针对社会热点事件进行转发和点评,从而导致网络舆情事件爆发。近年来,舆情事件信息的主体逐渐由文本数据转变为视听化程度更高的音视频数据,由于音视频数据存在时长差异且极有可能出现超长时的情况,针对这类音频数据无法直接进行识别分析,同时现有的语音识别系统未融合舆情领域知识和音频情感因素,无法针对音视频数据进行有效的舆情研判。针对以上问题,本文设计并实现了基
论文部分内容阅读
随着移动互联网技术的飞速发展,公众可以通过网络随意针对社会热点事件进行转发和点评,从而导致网络舆情事件爆发。近年来,舆情事件信息的主体逐渐由文本数据转变为视听化程度更高的音视频数据,由于音视频数据存在时长差异且极有可能出现超长时的情况,针对这类音频数据无法直接进行识别分析,同时现有的语音识别系统未融合舆情领域知识和音频情感因素,无法针对音视频数据进行有效的舆情研判。针对以上问题,本文设计并实现了基于多特征输入的音频端点检测算法,实现超长时单文件音频数据按照语义间隔进行切分,切分处理后的短音频可以直接进行分析识别。本文设计并实现了结合智能纠错的音频语义识别模型,将音频数据转化为文本描述,并实现针对识别结果中存在的识别错误进行自动纠正。本文设计并实现融合音频情感的舆情研判模型,结合舆情领域知识构建舆情分类体系,参考舆情分类体系和音频情感因素进行音频舆情研判。最后,本文按照异构神经网络的思想将多个模型进行整合设计并实现基于异构神经网络的音频舆情分析系统,提供从音视频数据采集、数据分布式传输到音频舆情分析和结果前端可视化呈现的完整功能。实验通过系统采集模块获取网络社区和开源语音数据库音视频数据,分别针对音频端点检测算法、音频语义识别模型、音频情感识别模型和舆情研判模型进行实验验证。本文提出的音频端点检测算法在混合场景下的效果优于参照的三种算法;本文提出的音频语义识别模型与基线模型RCNN相比,字错误率降低了 5.22%;音频情感识别模型与3D-ACRNN模型相比,未加权精度提升了 4.06%;本文提出的舆情指数计算模型和Fasttext舆情研判模型与特定舆情事件检测方法相比,F值分别有所提升。实验结果表明,本文提出的基于异构神经网络的音频舆情系统可以有效的针对网络中音视频数据进行舆情分析。
其他文献
计算全息技术是一种较为理想且灵活的三维显示技术,它使记录虚拟物体和全息数字存储成为可能。然而,计算机可以输入的物体种类繁多,虚拟对象多样类型的表达与庞大的计算负荷成为了计算全息领域正在面临的问题。体数据包含场景的三维数据场原始数据,蕴含信息丰富,本课题以体数据为研究对象,探究可以表现体数据多种信息的计算全息图生成方法。具体内容如下:第一,对传统的基于体数据的计算全息图生成方法进行了深入研究,包括基
经济社会的发展对电力的依赖日益明显,电力光纤通信线路大规模增加,对光缆线路监测管理的需求在不断增长。在光缆监测技术中,光纤传感器具有质量小、灵敏度高、传输距离远等多种优势,近年来在光缆线路监测中获得了广泛应用。布拉格光纤光栅(FBG)技术因具有无源化、实时性强、高精度等特点,如今已成为应用最广泛的光缆监测技术之一。然而FBG是一种点式传感器,无法实现对整条输电线路进行大范围无盲区的测量。采用布里渊
基于集成成像的光场显示因其与其他几种裸眼三维显示技术相比,具有不存在辐辏调节矛盾且不需要相干光的要求,以及全彩色全视差的特点,从而成为目前最具潜力的裸眼三维显示技术之一。然而其中有限的景深限制了光场显示真正应用到实际场景中的发展。光场显示景深主要包括景深范围和离屏深度这两个指标,本文主要通过对这两个指标的分析和改进方法的提出,对光场显示景深这一方面做出研究。论文的主要研究内容和创新点如下:(1)基
近二十年来,中国的软件产业蓬勃发展,并在国民经济中占据着越来越重要的地位。但是由于软件项目的多变性及不可控性,导致软件项目的成功率无法保证。这就导致了软件项目经常会出现产品延期交付的情况,甚至有的项目在中途就会被取消。针对这个现象,人们设计了许多软件开发模型来提高项目的成功率。其中,瀑布开发模型由于其自身的易操作性和易理解性,使其在很多大型软件开发项目中被采用。但是由于瀑布模型本身存在的缺点,导致
随着科技的发展,医疗领域逐渐走向智能化,越来越多的研究人员开始医疗图像研究。医疗图像的研究离不开医疗图像数据集的构建,所以医疗图像标注系统的研究与开发应运而生,然而,医疗图像的特异性对医疗图像标注系统提出了更高的要求,如何利用医疗图像的特点,设计合理的标注方法,成为标注系统设计的一大挑战。本文针对医疗图像具有特异性的特点,设计并开发了多模态医疗图像标注系统。其针对医疗图像多模态的特点,设计了多种标
随着科学技术的发展以及人们需求的增加,拥有丰富资源的海洋倍受关注。海面的三维可视化一直是计算机图形学研究的热点和难点之一。海浪的模拟和可视化可用在军事、影视以及虚拟现实等领域。由于研究水平的不断提升,对海洋的模拟要求也更高,不仅需要提升模拟的真实感,还需要保证模拟的效率。现阶段对海洋的模拟无法兼顾真实感和实时性。本文基于此背景对高真实感海面进行研究和仿真。本论文的主要研究内容以及创新性成果如下:1
光探测器作为光通信系统中的关键器件,其高速性能的优化对整个光通信系统未来发展有着至关重要的作用。单行载流子光探测器(Uni-Traveling-Carrier Photodector,UTC-PD)中电子作为单行载流子进行输运,极大减少了载流子的渡越时间并有效抑制了空间电荷效应,是高速光电子器件领域的研究热点之一。本文从UTC光探测器的入射光束光场分布以及器件吸收层横向高斯掺杂入手,重点围绕光探测
大气激光通信利用激光承载信息,具有带宽高、容量大、成本低、抗电磁干扰能力强等优点,是光通信领域的研究热点之一。实际的大气信道存在大气衰减、大气湍流效应,会对信号传输造成强烈干扰,而对抗湍流干扰最基本的方法就是采用高能效比的调制编码技术。PPM作为一种高能效比的调制方式,在大气激光通信中展现出显著优势,但其在传输过程中容易出现符号串扰、时钟失步等问题。因此,研究稳定高效的PPM调制解调技术对其在大气
硅(Si)基光电子技术可以将光子技术的高带宽、低功耗、高速率优点和微电子成熟的加工技术相结合实现光电集成,它具有低成本、高集成度、高可靠性的优势。目前,Si基光电探测器、Si基光调制器以及Si基光波导方面都已经成功得到广泛的应用,但是Si基激光器还有不足之处。尽管已有基于晶片键合技术的Si基光电集成的商用芯片,然而晶片键合技术存在着成本高、无法大规模生产等问题。Si基直接外延Ⅲ-Ⅴ族半导体材料技术
近年来,随着互联网、移动互联网的发展,通信等基础设施的不断完善,传统的教育机构和新兴的互联网企业都在尝试探索在线教育的最佳模式,教育逐渐从线下走向线上,在线教育行业受到大数据的影响。传统的数据分析系统已经不能满足教育大数据环境下的分析场景,特别是从海量用户数据中预测未来教育行业的发展趋势。目前国内外在线教育平台都在打造自己的数据分析系统,本论文以某在线教育平台为基础,搭建综合数据分析系统,使之能够