基于依存句法规则的产品评论观点挖掘研究

来源 :吉林大学 | 被引量 : 1次 | 上传用户:pigyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务的飞速发展,“网购”已然成为了一种全新的消费模式。各个在线购物平台的评论功能,鼓励人们在消费后对使用感受进行评价。数以万计的评论数据包含着消费者对产品不同方面的不同看法,由于每条评论在句子结构、表达方式上有所不同,想要人工进行处理和分析十分耗费时间,面对这样的问题,诞生了针对评论文本的观点挖掘技术。对产品评论的观点挖掘,不管是对消费者还是商家,都是非常重要的决策依据:对于消费者,挖掘评论中的观点信息可以在购买时提供参考,及时掌握产品的口碑和优劣情况,从而做出最优的购买决策;对于商家,通过观点挖掘技术,可以直观迅速地了解消费者对某一产品甚至具体产品特征的观点倾向,及时掌握市场动态,从而有针对性地做出优化决策,提升市场竞争力。目前,对于评论的观点挖掘研究大致分为了基于机器学习的有监督方法和基于句法词典的无监督方法。尽管机器学习方法表现突出,但模型对于结构复杂的句子拟合效果不好;而无监督方法主要借助了观点元素间的语法语义搭配关系,通用性和解释性都更强。目前大部分无监督的观点挖掘采用了依存句法分析方式,通过构建句法规则或模板,从评论中提取出与观点有关的文本片段并分析。本文针对目前通过依存句法规则提取观点的研究中存在的问题,提出了从评价对象、情感词、核心谓词三个角度为中心建立17条依存句法规则来提取<评价对象,情感词>这种观点搭配二元组的方法,增加观点挖掘的准确率与覆盖范围。为扩展评价对象与情感词的语义边界,本文在17个前序规则后提出ATT链和COO链两个后序句法规则,使得观点语义更加完整。实验结果在精确率P、召回率R和F1值上表现良好,有效证明了本文方法的可行性和应用在不同领域产品评论上的适应性。另外,针对观点挖掘中对于副词的提取不完整的情况,本文在提取出观点搭配二元组后提出了4种针对不同情况的ADV句法规则来提取程度副词或否定词,形成<评价对象、情感词、程度词>的观点搭配三元组,扩展观点挖掘工作。为了整合并分析所提取的观点,本文通过Word2Vec词向量技术构建了不同领域的产品特征词典,形成更加完整的<产品特征,具体特征描述,情感词,程度词>的观点搭配四元组。最后根据情感量化公式,为每一个观点计算情感倾向值,将属于同一产品特征的观点得分整合并以图表的方式可视化,为消费者购买产品、商家改良产品提供决策依据。
其他文献
2030年达到“碳达峰”、2060年实现“碳中和”的“双碳”目标提出,标志着我国对二氧化碳排放带来的环境问题有了更进一步的重视与相应的举措。自2013年在试点地区启动了碳排放权交易市场,到2021年7月全国碳排放权交易市场正式开放,我国碳排放权交易市场仍处于开放初期。党的十九大指出,要以保持环境与经济并行的模式推进可持续发展,这是碳排放权交易市场发展和完善的重要推动力。作为生态文明建设和经济社会可
学位
阿尔茨海默病(AD)已被广泛认为是一种无法治愈的神经退行性疾病,其早期几乎没有出现严重症状,并逐渐恶化到晚期,伴有加重的语言障碍,认知能力下降,情绪不稳定和失去方向(容易迷失)。阿尔茨海默病具有两个广泛认可的病理特征:异常量的β淀粉样蛋白(积聚为细胞外的淀粉样蛋白斑块)和tau(积聚为细胞内的神经原纤维缠结)。根据其错误折叠的聚集程度,β淀粉样蛋白(Aβ)肽可分为单体,低聚物和聚集体,其中Aβ低聚
学位
目的:高血压是诱发冠心病的主要危险因素,可伴有明显的冠状动脉血流动力学改变,炎症会贯穿冠脉粥样硬化的病变过程。机械敏感性离子通道Piezo1能将压力信号转化为细胞内Ca2+信号,而Ca2+调控异常与炎症密切相关,然而,Piezo1在高静水压引起的冠脉平滑肌细胞炎症表型转化中的作用尚不明确。此外,JAK2/STAT3信号通路在多种炎症发生中起重要作用。因此,本研究拟探讨Piezo1能否调控JAK2/
学位
随着科技进步与经济发展,人类迈入移动数字化时代,智能手机早已成为人们必不可少的物品。研究智能手机新的用途,开拓智能手机新的应用领域,变得越来越有价值。基于智能手机传感器的人类行为识别是一个较新的研究方向,被广泛用于工厂管理、人机交互、跌倒监测、健康检测、信息安全等各个领域。同时,卷积神经网络(CNN)也是近年来的热门的研究对象,不仅在各种图像处理问题上大放异彩,也能够很好地处理多维度时间序列问题。
学位
创业板市场自2009年10月成立以来就备受追捧,可以为中小企业提供了融资的机会与渠道,尤其是可以为那些暂时还不能在主板市场上市且具有高成长性的中小企业解决融资难的问题。同时,创业板市场具有高发行价、高募集资金、高市盈率的特点,使得创业板市场展现出了高于主板的收益与波动,吸引了大量投资者和投机者参与其中,有效市场理论认为,在完美的市场中,股票基础资产的价值可以通过股票价格正确及时地反应,但现存的资本
学位
淀粉样变是一种因蛋白本身而产生的异常物质——淀粉体,在身体组织内异常沉积而导致的罕见性疾病。目前已知会形成淀粉样变的人体蛋白约有20多种,常见的有免疫球蛋白、β-淀粉样蛋白和转甲状腺素蛋白。转甲状腺素蛋白(TTR蛋白)主要由肝脏产生,通常是维生素A的转运蛋白。转甲状腺素蛋白淀粉样变性(ATTR),主要表现为可导致神经损伤的多发性神经病(ATTR-PN),或可导致心力衰竭的心肌病(ATTR-CM);
学位
阿尔茨海默症(Alzheimer’s disease,AD)是一种神经退行性疾病,严重影响着患者和家属的生活,同时也给社会带来沉重的负担。但目前用于AD的治疗药物都不能减缓或阻止导致AD症状的神经元的损伤和破坏,大多数AD患者确诊时神经元受到损伤和破坏已达到不可治愈的地步,所以开发一种用于AD早期诊断的工具及其重要。Aβ斑块是目前公认的可用于AD早期诊断的生物标志物。此外,有研究表明AD患者出现线
学位
随着“十三五”规划目标圆满完成,我国经济社会发展迈上了新的台阶,居民收入稳健增长。但与此同时,我国收入不平等却呈现扩大趋势,基尼系数从2015年的0.462上升到2020年的0.568。我国居民的主要经济来源是工资收入,工资收入的差距是我国居民收入差距的重要组成部分。一些研究发现,工资不平等上升的主要原因是高技能劳动力与低技能劳动力之间不断扩大的工资差距。因此,探究技能工资差距的影响因素对经济社会
学位
菲利普斯曲线一直是宏观经济领域内的经典议题,它系统性刻画了通胀与产出的同向变动关系,这为宏观经济形势分析、经济下行风险预警与经济复苏政策设计提供了重要的理论基础。然而,自2008年全球金融危机以来,接连触底的经济增速与严重的结构通胀共存,一系列事实向菲利普斯曲线的有效性发起挑战,甚至不少研究认定,菲利普斯曲线发生了结构改变,曲线呈现“扁平化”特征。但有趣的是,在2020年新冠疫情后的经济复苏过程中
学位
胰腺癌是人类最致命的癌症之一,恶性程度极高,是预后较差的消化系统肿瘤之一。由于胰腺癌发病隐匿,病情发展迅速,临床就诊时大部分患者已处于晚期,错过了最佳的治疗时机。因此,迫切需要一种全新的多基因集合诊断和治疗生物标记物用于改善胰腺癌患者的预后。越来越多的研究证明,线粒体在恶性肿瘤的进展中发挥重要的调控作用。其中,线粒体自噬作为一种保守的细胞过程,可以通过选择性去除功能失调的线粒体,转移制造癌症所需的
学位