基于多源异构数据的图书评论自动摘要研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:super_mouse
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图书评论作为当前图书评价的一种重要形式,反映了读者对一本书的质量的主观性见解和价值判断。挖掘图书评论,不仅有助于用户了解图书内容,辅助挑选图书,还可以作为反馈机制帮助出版社提高图书质量,优化营销策略。传统的专家评论虽具权威性,但数量少难以覆盖全部图书。互联网环境催生的在线评论数量多,但质量良莠不齐,这就对评论挖掘研究提出新要求。如何从大量评论数据中获取用户所需信息是评论挖掘的核心。将评论挖掘的结果以摘要的形式展现出来,用户只需简短阅读摘要就可以初步窥探评论的重点内容,大幅度提升用户获取或理解信息的效率。因此,如何为用户提供简洁、准确的图书评论摘要具有重要研究意义。此外,不同图书评论平台在评论偏向性方面存在较大差异,例如亚马逊等电子商务平台的图书评论包含诸如图书性价比、包装等方面的丰富信息,而豆瓣网则包含图书内容质量相关的信息。仅基于单一平台的评论,用户无法通过评论进一步全面了解图书。因此,本文利用多源数据,借助自然语言处理、自动摘要等技术对评论进行深度挖掘,从而构建图书评论摘要。在多源数据差异性分析研究中,本文以电商平台、社区阅读型平台以及专家评论平台的在线图书评论数据为实验数据,从评分、评论数、正面评论数以及负面评论数等四个方面,分析不同平台数据的差异。然后,本文以联机计算机图书馆中心(Online Computer Library Center,OCLC)提供的图书馆藏信息作为图书评价验证数据,评估基于多源数据的图书评价效果,从而为设计基于多源数据的图书评论摘要模型提供依据。理论模型构建研究中,为充分考虑不同平台数据的差异,本文提出构建评论摘要的两个基本原则,从而给出了图书评论摘要的结构化定义。在此评论摘要理论基础上,本文结合属性情感分析技术以及多文档自动摘要技术,提出一种基于多源异构数据生成图书评论摘要的方法。生成模块,本文将其分成两个阶段进行,即:图书属性摘要自动构建与图书内容摘要自动构建。在图书属性摘要自动构建研究中,我们利用属性情感分析方法细粒度挖掘图书评论数据,从属性关注度与属性满意度两个维度自动抽取图书属性信息,从而形成图书属性摘要。在图书内容摘要自动构建研究中,本研究以评论数据中的内容句进行挖掘,一方面利用多文档自动摘要技术自动抽取图书内容信息,另一方面利用规则的方法从评论内容句中抽取出核心观点句,随后整合图书内容信息以及核心观点句,从而得到图书内容摘要。最后本文整合图书基本信息、图书属性摘要以及图书内容摘要三个部分,得到基于多源数据的图书评论摘要。本文研究不但可以为图书评论摘要研究提供新的研究视角,还可以为用户选择图书提供参考。
其他文献
随着E级计算的兴起,传统基于光传输、电交换的互连网络,存在的集成度低、功耗高、可靠性差和带宽难以升等问题,已经逐渐成为下一代高性能计算机发展的瓶颈。与此同时,随着硅
粗粒度可重构处理器(Coarse-Grained Reconfigurable Architecture,CGRA)作为计算加速器的一种理想选择,具有比专用集成电路更高的灵活性,又具有比通用处理器更高的性能,常被
在当今战场上,履带车辆的战场通过性发挥着至关重要的作用,车辆通过性是军用车辆机动性的核心技术指标,它与履带式车辆的可操纵性和战场的生存能力直接相关。着眼未来我军在
磁流变阻尼器是利用磁流变液替代传统液压油作为工作介质设计而成的可实现半主动控制的智能减振装置。目前磁流变阻尼器改变输出阻尼力调节范围的方式大多通过改变磁化后的磁
为了应对汽车行业飞速发展带来的环境污染和能源危机的挑战,汽车轻量化已经成为当务之急。7000系铝合金具有较高的比强度,成为轻量化材料的理想选择。7000系铝合金在室温状态
由于在过去的六十年中氯乙酰胺类除草剂的大量使用,微生物已经进化出矿化这些化合物的途径。在氯乙酰胺类除草剂微生物代谢的上游途径中,通过N-脱烷基和酰胺水解转化为两种常
温差发电器(TEG)、碱金属热电转换器(AMTEC)和热离子热电转换器(TIC)是能直接将热能转换成电能的三种静态热电转换器,具有密封性能好、运动部件少、运行稳定等优点。三种静态热电转
铌酸钠钾(K0.5Na0.5NbO3,KNN)是一种具有丰富相结构的铁电材料,随着温度的降低,依次经历从立方相(C)到四方相(T)、从四方相到正交相(O)以及从正交相到三方相(R)的一系列结构相变。通
科学发现是科学活动中最重要的内容,是驱动科学领域发展的源动力,尤其是重大科学发现的提出,犹如一颗“种子”一样引发某一研究领域甚至整个学科的革命,这便是本文的种子辐射效应。对科学发现,尤其是重大科学发现的种子辐射效应进行探索和分析,可以揭示科学发现所引发科学生产传播活动过程及其规律,对科研创新活动、科研产出评价和科研政策制定具有重要价值。目前对科学发现种子辐射效应的研究还比较缺乏,主要集中于以定性研
电能作为一种清洁能源,在解决环境污染以及能源梯级利用等方面表现出独特优势。对于传统电采暖方式存在的高能低用的问题,相变蓄热技术很好的弥补了这一缺陷。在国家政策的有