面向问答社区的评论生成关键技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:roattrjca
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能的快速发展,自然语言处理成为最为热门的研究领域之一,而自然语言生成是其最难的任务之一。本课题研究问答社区中的用户评论自动生成任务属于自然语言生成任务,但又与传统的语言生成任务不同,如文本摘要生成、图片描述生成等生成的对象文本均是受到较多的限制,而问答社区中用户评论生成是几乎不受限的语言生成,用户评论可以存在多种表达方式、多种语言风格,甚至内容上可以与答案没有明显的相关性,在生成的过程中具有更多的困难。本文探索问答社区中的用户评论生成技术,从如下三个方面进行研究:问答社区中的用户评论行为分析、问答社区中的具体评论生成技术研究以及非具体评论自动生成技术的改进,并在典型的问答社区——知乎的数据集上进行了验证。本文的研究内容及贡献如下:第一,对问答社区中的用户评论行为进行了分析,分别分析了问答社区中的数据分布、社区中的用户参与情况、用户评论的倾向性以及用户评论的独立分析四个方面。分析结果表明用户社区中用户评论时有评论聚集现象,用户评论行为的活跃性要高于提问和回答的活跃性,用户评论行为受到答案下早期评论的影响,根据是否具有直接的评论依据得到用户评论分为具体评论和非具体评论、用户评论的内容及风格具有多样性等。第二,对问答社区中具体评论生成技术进行了探索,在提出的基于字重叠的评论点识别算法完成评论点识别任务的基础上,采用统计机器翻译方法完成具体评论自动生成任务。实验得出具有评论点的评论数据即具体评论占比为1.83%,为具体评论生成提供数据基础,通过统计机器翻译的方法将用户评论点生成为具体评论,在评价指标BLEU上测试集1和测试集2分别得到76.04和75.46的得分。第三,对问答社区中非具体评论生成采用基于神经网络的方法,首先采用基于seq2seq模型的方法分别从问题和答案两个方面生成评论,然后从模型层面引入与注意力机制拷贝机制和从数据层面融合问题和答案,来改进seq2seq模型生成评论的性能,最终在测试集1上和测试集2上分别得到Rouge得分为12.6和13.13的结果,验证了改进的方法在评论生成系统中的有效性。
其他文献
目的:探讨Sublay法无张力修补术治疗老年人腹部切口疝的临床疗效。方法:回顾性分析Sublay法治疗的24例老年腹部切口疝患者的临床资料。结果:所有患者手术均成功,Sublay法平均手
摘要:本文从足球准备阶段、足球课堂训练阶段、足球课堂结束阶段等方面,阐述了足球游戏在专科学校足球教学中的实际应用,以期为在教学之中充分发挥足球游戏的作用,促进专科学校足球教学的良好开展提供参考。  关键词:足球游戏;专科学校;足球教学;应用  随着我国各个专科学校对素质教育方面重视度的提升,其在足球教学的开展之中,教学的理念及方式方法也在进行不断的改革与创新,将足球游戏充分的融入到足球教学的整个过
论述具有零迹且主对角线上方有e个1的全体n×n对称的(0,1)-矩阵和具有d个1的全体n×n对称(0,1)-矩阵最大谱半径的界。
肛瘘术后患者伤口呈开放性且较大,炎性分泌物多,疼痛较重,伤口周围水肿明显,寻找一种可促进伤口能早期愈合,创面分泌物减少,恢复快的方法非常重要。我院在2011~2013年6月120例肛瘘术
研究了平方和立方剩余数的均值性质,并用解析方法得到了其均值的两个渐近公式.
在我国邮政行业发展电子商务是电子商务在我国发展的一个极好的切入点。本文分析了我国邮政行业的发展状况发展电子商务的优势,就电子商务在我国邮政行业的发展提出了一系列的
[目的]基于移动学习平台,创新和建设《健康评估》课程教学模式.[方法]以“学习通”为平台,建设《健康评估》医学课程,评估课程平台功能及其在教学中的应用,并对课程过程进行
在市场经济条件下,怎样的分配方式才是公平的,公平的收入分配方式应符合哪些原则,公平与平等是两个不同的概念。二者不能简单等同。这是理解“按劳分配、兼顾公平”的基础。
随着 2 1世纪的来临 ,各行各业都面临着挑战 ,只有抓住机遇 ,不断创新 ,才能适应时代的要求。本文主要论述了知识经济及其特征 ,以及在知识经济条件下急需研究和拓展的会计领
摘要:体育精神是体育价值中的核心内容。体育精神是体育的整体面貌、水平、公正、公开、特色及凝聚力、感染力和号召力的反映,是体育的理想、信念、节操及体育知识、体育道德、体育审美水平的标志,是体育的支柱和灵魂。体育精神对体育实践活动起着导向作用,并规定着体育文化模式的选择。体育精神作为一种具有能动作用的意识,是体育行为的动力源泉,是一种心理资源。  关键词:精神;体育精神;高校教育  近年来,我国经济飞