【摘 要】
:
随着互联网技术和社交网络的快速发展,各种网络平台生成了大量用户针对不同领域的评论文本。这些文本包含着丰富的情感倾向,从中可以发掘互联网用户或消费者对于该事物态度,这些信息无论对个人用户、商家或国家监管部门都有重大意义。在大数据时代,随着技术和硬件设施的不断升级,各种平台的评论文本数据量都以爆炸性增长,只依赖统计学方法已经无法满足日益增长的评论文本情感分析需求,所以如何通过人工智能技术精准高效挖掘评
论文部分内容阅读
随着互联网技术和社交网络的快速发展,各种网络平台生成了大量用户针对不同领域的评论文本。这些文本包含着丰富的情感倾向,从中可以发掘互联网用户或消费者对于该事物态度,这些信息无论对个人用户、商家或国家监管部门都有重大意义。在大数据时代,随着技术和硬件设施的不断升级,各种平台的评论文本数据量都以爆炸性增长,只依赖统计学方法已经无法满足日益增长的评论文本情感分析需求,所以如何通过人工智能技术精准高效挖掘评论文本中的情感倾向已成为目前工学两界的主要研究问题。情感分析属于人工智能领域中的观点挖掘,通过人工智能技术进行情感倾向挖掘有助于及时了解网络舆情,其研究对于获取评论情感趋势具有重要意义。本文主要研究内容如下:(1)为了更加真实模拟中文复杂语言环境下的评论文本情感分析场景,通过数据采集技术分别从京东和豆瓣两个网站获取了大量用户评论文本,对其进行文本预处理后分别按照数据量分为五千、两万和五万三种不同大小的数据集,以验证不同情感分析模型在不同类型、不同大小的数据集上的分析效果。针对传统Word2vec和Glo Ve文本表示模型无法精准表达词语之间的语义问题,本文提出使用BERT预训练模型对语料进行文本表示,经过和Word2vec与Glo Ve文本表示的结果进行实验对比验证了BERT生成的词向量能够取得更好地分析效果。然后基于CNN和RNN分别构建了五种基本深度学习模型,使用本文搭建的数据集验证模型情感分析效果。(2)在五种基本深度学习模型的基础上提出了一种融合双向门控循环网络、多头自注意力机制和多粒度卷积胶囊网络(Bi GRU-AMCaps Net)的情感分析模型,首先使用双向门控循环网络对文本序列特征进行初步提取,之后使用多头自注意力机制对关键特征进行注意力加权,最后通过多粒度卷积胶囊网络进行特征融合,输出分类结果。实验结果表明,在BERT词向量的基础上,本文提出的模型在豆瓣电影评论文本三种数据集准确率分别达到87.29%、89.62%、91.88%,在京东电商评论文本三种数据集准确率分别达到82.19%、85.63%、87.46%,相比该领域其他模型效果更好,证明了本文提出的模型的应用价值。
其他文献
不同的云型反映了不同的大气情况及发展变化,预示着未来的天气变化过程,例如直展云通常与危害性天气相关。气象卫星具有时间连续、空间分辨率高、覆盖范围广等优点,可提供更多光谱信息。因此,自动识别卫星云图是遥感领域的研究热点之一。早期的云分类方法都以光谱通道的特征数据为主进行云分类。然而,仅使用光谱特征对卫星云图分类时,存在不同云类的光谱特征相同、同一云类光谱特征不同的问题,分类效果不太理想。考虑使用卷积
异常是指各种不符合估计或违反常规条件的数据或行为,广泛存在于如信用卡消费中欺诈行为、数据库中数据泄露、网络入侵以及工业控制系统等各应用领域中。异常往往比正常所携带的信息更多也更为重要,比如设备运行异常则意味着系统可能存在故障或被人为恶意攻击。因此,快速准确地检测出系统异常,对保障信息基础设施的安全,有着重要的现实意义。针对当前无监督异常检测算法对于不同类型的高维数据检测效果差的问题,本文在通过深入
智能交通系统(Intelligent Transportation System,简称ITS)作为智慧城市建设的重要一环,将多种高科技技术融入到交通诱导等领域中,例如,人工智能技术、传感器技术等。加强车联网(Internet of Vehicles,简称Io V)与用户之间的联系,从而形成安全、高效、节能的综合运输体系。车辆检测,跟踪及预测是智慧交通系统中一个重要研究热点,然而在实际应用的环境中,
近年来,随着电子计算机系统的不断发展,在处理一些大数据时,出现了能耗高、并行处理能力不足以及计算率低的问题。而三值光学计算机具有能耗低、巨位数可并行运算以及可按位重构的特点,这些特点使得它在处理大规模数据的计算问题时具有一定的优势。基于三值光学计算机具有以上的这些优势,本文将研究采用三值光学计算机求解大规模的最短路径问题。本文的研究内容包括:利用三值光学计算机数据位易扩展和巨位数并行的特点提出全并
人群流量的准确预测对于政府部门有效且合理的管理交通资源、提高群众出行体验、改善道路交通安全环境等来说具有重要意义。然而,由于人群流量数据具有特殊性,它是一种复杂的时空数据,建立人群流量预测模型时必须同时考虑其时间依赖关系和空间依赖关系。此外,人群流量还受事件、天气等外部因素的影响。因此,想要准确的预测人群流量绝非易事。传统人群流量预测方法的研究对象通常是单一区域的人群流动模式,而这些方法只考虑人群