面向专利的主题短语提取

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:amyfun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在中文专利主题挖掘研究中,针对基于单词的传统主题模型结果可解释性较差问题,提出一种融合词向量和Ge- neralized Pólya urn(GPU)的改进模型GW _ PhraseLDA。根据专利文本特点,使用BLSTM-CRF模型进行专利短语抽取,利用训练好的词向量生成先验知识。在Gibbs采样的迭代过程中,利用GPU策略提升语义相关短语在同一主题下的概率。在中文专利文本上的实验结果表明,所提模型能够有效提高专利主题生成质量,相比传统的主题模型更具可解释性和判别性。
其他文献
本文从5G优势着手进行分析,针对5G典型行业应用场景进行了比较详细探究,从多个方面展开5G典型行业网络需求内容的研究工作,旨在通过本文研究内容的开展,进一步为我国5G事业发展起到一定的促进作用。
第7期《人民文学》以陈忠实《李十三推磨》(短篇)为众所瞩目的焦点。余下杨少衡《前往东京的关隘》(中篇)、麦家《四面楚歌》(中篇)、及张楚《细嗓门》(中篇)诸篇,则难尽如人意,且隐约
本文首先简要剖析了基于Linux的桌面操作系统常见安全隐患,然后就基于Linux的桌面操作系统安全设计与安全加固展开全面探讨,以期能够为广大同业同仁在开展Linux的安全防护加固时有所裨益。