一种基于作者建模的微博检索模型

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:BIGSKYKING
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,微博的发展令人瞩目,微博检索已经成为一个重要的研究课题.而微博具有文本内容短、更新快、融合社交网络等特点,这些特点使微博的检索不同于传统的web检索.该文首先分析了传统的向量空间模型、概率模型以及基本的语言模型直接用于微博检索将面临的问题;接着在语言模型框架下提出了利用作者信息对微博内容进行扩展的思想,即利用作者信息重新估计微博的语言模型;然后针对话题模型在短文档训练中存在的问题,提出了使用作者的文档话题模型采进一步扩展微博的内容;最后在TREC公开数据集上进行了实验.实验结果表明,可以通过合理使
其他文献
针对建筑二次供水管壁生物膜对饮用水的生物安全性构成的潜在威胁,采用生物膜反应器(BAR)模拟二次供水管道,研究氯和氯胺冲击消毒过程对管壁生物膜的细菌总数、大肠杆菌和异
本讲论述了压杆稳定计算中系数的制定依据和其多条曲线的选用,扭转对失稳所起的作用,格构式压杆的计算特点和选择压杆截面实用的简化方法等项内容。其间,着重分析了残余应力
利用优质大麦芽、大米、酒花、白葡萄为主要原料,经过葡萄的酒精发酵、陈酿,再参与啤酒发酵、贮藏过程,使产品即保留了传统啤酒的风格,又具备干白葡萄酒的特征,该产品新颖、
如何科学合理的制定现代企业战略并进行战略管理,是关系到现代企业生存和发展的重大问题。着重分析了现代企业在发展中存在的问题,据此,提出了现代企业战略制定的基本原则和战略
为明确棉织物漂染废水中污染物的组分,采用m(BOD5)/m(CODCr)法测试了常用染料和助剂的可生化性.按实际漂染工艺和配方对棉织物进行前处理、染色和柔软处理,收集各阶段试验废水并进行
以苯肼盐酸盐、尿素、甲酸、乙基氯化物等为原料,采用复合催化剂,经缩合、环合、合成等步骤合成了三唑磷。收率78%。
地质档案在保管过程中,因制成材料、字迹材料、时间、保管条件、使用损耗等多种因素导致出现了不同程度的破损,笔者通过对馆藏地质资料进行保管状态调查,确定了每档档案的破
员工满意度是组织管理的一个重要指标,文章在对员工满意度的内涵及其价值绩效分析基础上,论述了员工满意的把握与调节,强调全面了解与重点把握员工的满意问题.然后提出了企业
<正>档案承载着历史,记录着历史,是人类记忆的宝物,但由于频繁的使用,造成了大量的档案破损,抢救修复破损档案已成为当前档案工作者义不容辞的责任和使命。破损档案的修复技
目的研究结肠癌所致肠梗阻采取不同手术术式治疗的临床疗效。方法将张家港市广和中西医结合医院2010年8月至2012年8月收治的52例结肠癌导致肠梗阻患者作为研究对象,探讨不同手