基于双向LSTM语义强化的主题建模

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:dixg03
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,双向LSTM神经网络等深度学习方法已经能有效地表达文本语义特征,为构建深层次的具有语义连贯性的主题模型提供了可能。但是,现有方法在文本的概率主题建模方面,提升的效果还比较有限。该文提出了一个基于双向LSTM语义强化的概率主题模型DGPU-LDA(double generalized polya Urn with LDA)。该模型一方面结合双向LSTM文档语义编码框架DS-Bi-LSTM(document semantic bi-directional LSTM)来实现文档宏观语义的嵌入表示,另一方面采用文档—主题和词汇—词汇双GPU(generalized polya Urn)语义强化机制以及LSTM来刻画参数推断过程中的吉布斯采样过程。在搜狗新闻数据集以及20新闻组数据集上的实验结果表明,相对于一些比较前沿的主题模型,DGPU-LDA模型在主题语义连贯性、文本分类准确率方面展现了一定的优势,同时该模型在文本语义特征表达方面的有效性也得到了证明。
其他文献
本文利用构建的食品安全披露指数和厦门大学内控课题组设计的内部控制指数(2008—2013)衡量企业食品安全披露水平和内部控制质量,研究我国上市公司内部控制质量对食品安全信
10月28日,平定县柏井镇张家岭村69岁的村民张拽生起了大早。这是和土地打了19年交道的他,早已养成的习惯。不同于以前起床就先去地里忙活,如今他每天做的第一件事是来到自家院里
报纸
弦乐二胡是中华民族乐器家族中主要的擦弦乐器之一。它适合表现悲凄、深沉的内容,也能体现气势壮观的意境。20世纪50年代,经过多元文化的撞击与融合,流派迅速发展,其中一股强
本文结合会计信息披露的目的,介绍了事件研究法中异常收益的内容,并主要利用异常收益结果对峨眉山旅游股份有限公司股价受“4.20雅安地震”的影响产生的波动情况进行分析,并
企业创新力是当今无论理论界还是实践界讨论的热点话题,许多学者提出了富有见地的观点和看法。但是企业创新力的本质是什么?尤其是企业如何客观测评自己的创新力,从那些方面
本文阐述了趣味问题的由来,审视了康德的趣味判断的先验原则,介绍了布尔迪厄的挑战:趣味区隔的历史性生成理论。指出,趣味在美学领域的含义被划分为两个层面:其一是作为鉴赏
业务系统缺乏协同、信息安全存在风险、开放平台无法融合等数据壁垒问题严重制约了"最多跑一次"的深入推进,从标准规范、部门利益、体制机制等层面深入分析了其内在生成机理,
2005年,政府就已制定了农村卫生发展规划,而乡镇卫生院的建设是重中之重。这个规划提出各级政府在4~5年之内将要投入200亿元左右,其中对乡镇卫生院的投入是140个亿左右,县医院
在网络信息化时代,语言的发展得益于网络等媒体所提供提速平台,高频率的语言模仿特性促成网络流行语的诞生。基于语言学的视角,网络语言的流传及对文化的复制传播,属于语言模
<正> 基因疗法将使医学领域发生革命,为治疗遗传性疾病带来新的希望。美国著名遗传学家胡德说:“由于出现了基因疗法,医学在未来20年所发生的变化,将比过去2000年的变化还要