【摘 要】
:
随着互联网与通信技术的不断发展,人们已经从PC互联网时代进入了移动互联网时代,智能手机已经在人们的日常生活中占据了重要地位。手机应用商店是一个应用分发平台,用以展示、下载应用软件,方便人们根据需求选择合适的应用,而应用商店的软件评论是人们在选择软件时较为看中的参照标准,给用户提供了许多参考价值。但由于互联网的开放性,有些用户会发表一些垃圾评论,这些评论不仅仅影响用户体验,还不利于信息资源的整合,因
论文部分内容阅读
随着互联网与通信技术的不断发展,人们已经从PC互联网时代进入了移动互联网时代,智能手机已经在人们的日常生活中占据了重要地位。手机应用商店是一个应用分发平台,用以展示、下载应用软件,方便人们根据需求选择合适的应用,而应用商店的软件评论是人们在选择软件时较为看中的参照标准,给用户提供了许多参考价值。但由于互联网的开放性,有些用户会发表一些垃圾评论,这些评论不仅仅影响用户体验,还不利于信息资源的整合,因此维护好软件评论区的良好环境十分重要。为了解决上述问题,本文综合利用网络爬虫、深度学习技术以及实验对比等手段进行研究,论文的主要工作如下:(1)针对中文垃圾评论数据集匮乏的问题,本文构建了可用于垃圾评论识别任务的中文应用商店评论数据集,为后续深度学习技术的研究做准备。针对服务器的反爬虫机制,本文提出了基于Request的闭环爬虫架构,解决了服务器的反爬虫限制,提高了数据采集效率。(2)针对传统的敏感词过滤以及人工审核等识别手段效率低的问题,本文结合BERT模型以及Attention注意力机制,构建了 Bert-AtFnn垃圾评论识别模型,不仅提高了垃圾评论识别效率,还提高了垃圾评论识别效果。针对单预训练模型可用信息较为单一的情况,进一步融合多个预训练模型的优点构建了双通道融合Bert-AtFnn垃圾评论识别模型,较好地提取上下文信息,更好地实现垃圾评论的识别。(3)为了测试本文提出的Bert-AtFnn垃圾评论识别模型以及双通道融合Bert-AtFnn垃圾评论识别模型的性能,设计了模型有效性实验以及模型横向对比实验,与LSTM模型和BiLSTM-Attention模型进行对比。本文选取了 3组不同类别应用的软件评论作为数据集进行模型训练。在对比实验中,Bert-AtFnn模型以及双通道融合Bert-AtFnn模型在3组数据中准确率和F1值都高于LSTM以及BiLSTM-Attention 模型,从而证明了本文构建的垃圾评论识别模型能够较好地识别垃圾评论,为后续的研究以及实际场景应用提供了一定的参考意义。
其他文献
随着网络发展,人们对网络的需求丰富,路由器需要对数据包完成更复杂的处理从而为用户提供更多的功能和更好的服务质量(QoS)。而高性能路由器单端口速率越来越快,为处理链路拥塞时缓存的海量数据包,通过无限增大路由器存储空间,对于路由器工艺设计来说难以实现,且因更复杂处理流程而增加的端处理延时无法改善。可以从路由器存储体系入手,增加路由器存储体系带宽,使单位时间内能够处理更多网络数据包,以进一步提升路由器
随着信息化时代的高速发展,网络上的数据得到爆炸式增长,呈现种类繁多、结构复杂等特点,传统推荐算法逐渐不能有效解决信息过载的问题。伴随各类社交应用的涌现,融合社交信息的推荐技术开始成为学术界和工业界的研究重点。社交推荐算法在评分数据的基础上引入了用户社交网络的信任信息,可以有效缓解数据稀疏和冷启动问题。但是,大多数社交推荐算法仅对用户自身的购买偏好建模,忽略了用户信任朋友的偏好信息,且没有充分挖掘用
近年来,在人口老龄化趋势逐渐显现的同时,年轻人猝死和患癌的新闻也层出不穷。随着亚健康人群比例的逐年增高,我们的医疗资源却远远不能满足人们现有的需求,让每个人都经常去正规医疗机构检测是不现实的,与此同时,我国2019年在国家规划层面也将医疗物联网的发展政策纳入了基于健康中国总体规划的智慧医疗互联网医疗政策体系。故而结合物联网技术的智慧医疗平台的设计不管是对个人还是对国家都是具有重大意义的。论文针对以
近年来,随着信息技术的快速发展和国际化交流的不断深入,多语言交流需求在不断增大,语种识别技术在智能语音领域中的重要性也在不断提高。然而,当前的语种识别技术主要停留在算法研究阶段,已有的语种识别系统也主要依赖用户上传的语音文件进行识别,交互方式单一且繁琐。若能实现一个方便高效的语种识别系统,能使语种识别技术向应用化更近一步。本文针对目前语种识别系统级实现较少且已有系统交互方式单一且繁琐的问题,设计并
随着智能家居在实际生活中的应用普及,使用智能浇灌系统养殖花草成为众多居家养花养草人群的新需求。本文通过系统调研,分析总结了现有自动浇灌系统的不足,设计实现了个性化家居植物浇灌系统。本文的主要内容包括:一、研究了机器学习回归算法的原理,在Linux操作系统环境训练得到预测植物土壤湿度模型,并应用在ESP8266单片机,支撑边缘侧浇灌电子设备的离线自治。二、提出在家居植物自动浇灌系统运用边缘计算与云计
近年来,随着生活水平的提高以及饮食结构的改变,心脑血管疾病在人群中的发病率不断提高。同时我国医疗资源分布不均,许多人不能享受到良好的医疗资源,无法很好地了解自身的健康状况。随着我国移动互联网的发展,智能手机进入我们的生活,手机的功能日益丰富,与医疗相关的APP、小程序层出不穷,如何在有限的医疗资源下,利用移动互联网为广大民众提供心脑血管健康管理服务成为当前研究的热点。因此,本文根据软件项目开发的相
在学生学习过程中,学生的注意力是否集中在教学活动上是研究学生学习效率和教学质量的一个重要指标。传统意义上的教师观察学生们状态的方式因为学生数量众多而不能对每个学生面面俱到,而且教师的个人主观因素和学生的故意的行为可能会导致一些错误评判的现象发生。随着人工智能、机器学习等相关互联网技术的飞速发展,利用互联网实现自动检测分析学生学习中的专注度情况成为了可能。因此,本文基于深度学习相关的检测算法,设计并
近年来国内地铁行业发展迅速,大量地铁线路不断的开始投入运营使用。一些开通较早的地铁线路中部分设备即将到达使用寿命,再加上为提高运营维护效率而在信号系统中不断引入新设备和新技术,导致地铁运营线路信号设备面临着大量的局部更新改造工程。而信号系统作为控制列车运行的安全关键系统,对于地铁运营有着不可替代的作用。因此,针对地铁信号设备的更新改造项目,需要加强风险管理,保证项目可以安全顺利的实施。本文将项目风
农业是我国传统的基础行业,在传统农业中试验田规划是农业育种环节中的重要一环,科学合理的试验田规划有利于减少农业耕地的浪费、提高农作物生产量、促进经济的可持续发展,如何将传统农业规划与计算机信息技术相结合,以此推动传统行业的发展是当前我国建设社会主义的重要问题。传统的农田规划大多采用人工现场操作,在纸上进行作业,工作人员需要亲自到农田中,根据试验田实际情况,在纸上完成本年度的种植规划工作。此外,对于