基于查询向量的英语话题跟踪研究

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:glosslee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过分析英语新闻报道的特点,提出了一种基于词汇区分和位置特征相结合的特征项抽取算法.词汇区分是指将单词分为首字母是大写的单词和首字母不是大写的单词,位置特征利用新闻报道的倒金字塔式的结构特点决定单词的重要性.提出了一种基于多个特征项抽取算法融合的特征项权值计算方法,该方法认为被越多的特征项抽取算法选中的特征项越重要.提出了一种基于多数投票策略的双重过滤算法,对报道和话题是否相关进行两次过滤,大大降低了系统的误报率.实验表明提出的3种算法不但取得了很好的效果,而且具有很好的可扩展性.
其他文献
智能建筑是传统建筑技术和新兴信息技术相结合的产物,智能建筑是通过配置建筑物内的各个子系统,以综合布线为基础,以计算机网络为桥梁,全面实现对建筑物内各种设备的综合管理
有限表示和树性质是研究超性质的重要工具,James利用有限树和有限表示定理给出了超自反空间的重要特征.在研究超自反空间和再赋范问题时,树性质成为行之有效的研究工具.本文引入
为探究豇豆主要根系分泌物肉桂酸对豇豆根系的毒害作用,本研究以2种抗性差异品种豇豆特早30号(TZ30)和紫秋豇6号(ZQJ6)为试验材料,在水培条件下,施用0.2 mmol·L-1肉桂酸
对于港口行业首座自动化立体仓库,秦皇岛立体仓库主要用于存储东港区大型设备备件。由于港口设备备件具有重量大、数量多、领用及时等特点,在货位分配策略中重点考虑了货物重
随着市场经济的高速发展,人才流动日趋加速.大中专学生是祖国建设的生力军,只有讲好了普通话即国语,才能更好地进行沟通、交流,才能更好地促进经济、文化的发展.所以,大中专
要全面提高学生的综合素质,培养学生的创新能力,应该着力于学生良好的非智力因素的培养,本文通过实例说明培养学生的非智力因素的方法和途径.