短文本相似度相关论文
针对短文本相似度计算中无法充分利用文本中不同部分的不同重要性且较少考虑句法信息而导致准确率较低的问题,提出一种融合注意力......
钢铁冶金工业中,运维检修工作是保障各类设备正常运行的基础,知识库是提高设备运维管理效率的有效途径。钢铁企业通过构建运维知识......
近年来,在智能教育相关政策的强力驱动下,主观题自动评分算法的研究在“人工智能+教育”的背景下具有实用价值和重要意义。算法能......
微博客作为一种新的舆论载体和传播途径,在网络舆情信息发起和传播中起着越来越重要的作用。与传统的博客、论坛和商品评论等载体......
在网络信息时代,随着通信技术的不断发展,即时通信得到了广泛应用,产生了巨大的短消息数据,短消息数据中蕴藏了大量有用信息资源,如何对......
随着互联网技术的发展,特别是移动互联网的兴起,信息爆炸进一步加剧,同时,信息传播出现了由系统化向碎片化过渡的倾向。短文本泛指......
短文本相似度研究是文本分类下的一个分支,它在智能问答、信息检索等任务中起着基础性作用,具有一定的研究价值。传统的文本相似度......
社交媒体是拥有众多用户参与的新型在线媒体,近年来以推特为代表的社交媒体网站吸引了数以亿计的用户,现实社会中所发生的重大突发......
短文本的表示方法和特征提取方法是自然语言处理基础研究的一个重要方向,具有广泛的应用价值。本文提出了BERT_BLSTM_TCNN模型,该......
传统相似度计算方法仅考虑文本结构特征或语义信息,从而导致准确率较低。结合短文本特征稀疏的特性,提出一种多重检验加权融合的短......
在基于知识的问答系统中,问句中的知识谓词信息分析结果将会对知识元组的整体匹配效果产生影响。中文短问句中的知识谓词的信息表......
伴随着移动互联的快速发展,越来越多的像微博,微信,短信等短文本信息开始充斥着人们的日常生活。在推荐,舆情等方面,短文本信息的......
大数据分析的日益发展与舆情分析任务要求的不断增长,对中文文本信息的处理提出了新的要求,尤其是短文本的出现及迅速发展,使得对......
现有近似邻居集选取方法存在分类较粗、标签缺失等问题,在移动服务方面无法取得较好的效果。为此,提出一种有效的近似邻居集选取方......
针对基于语义的短文本相似度计算方法在短文本分类中准确率较低这一问题,提出了结合词性的短文本相似度算法(GCSSA)。该方法在基于......
生物医学文献挖掘系统是从事生物医学领域研究必不可少的工具,命名实体识别是面向生物医学文献的文本挖掘技术中至关重要的一环。......
短文本是互联网中常见的内容形式,如社交媒体文本、广告关键字、观点评论、网页标题、搜索查询等。社交媒体的短文本在线聚类是指......
随着时间的推进和网络技术的发展,一方面,人们的认知行为习惯在悄然发生变化,由早期的看书、读报纸演变成现在广泛利用社会媒体进......
随着因特网和各种移动终端的发展,计算机对各种文本类信息处理的重要性日益凸显。短信、微博、电子商务的普及更使得用简短的文字......
伴随着高校招生规模的日益扩大,高校教学咨询工作面临巨大压力,学生咨询需求得不到及时满足,导致高校教学管理压力剧增,使得大部分......
为提高中文短文本相似度计算的准确率,提出一种新的基于混合策略的中文短文本相似度计算方法。首先,根据词语的语义距离,利用层次......
近年来,LDA(Latent Dirichlet Allocation)主题模型通过挖掘文本的潜在语义主题进行文本表示,为短文本的相似度计算提供了新思路。......
社交媒体平台,如微博、推特等,以其操作便利性、信息共享性、用户互动性、话题丰富性以及更新即时性等特征,吸引着大量的用户在平......