文档特征相关论文
热点词汇(以下简称热词)是一种普遍的网络词汇现象,反映了特定一段时间内人们普遍关注的问题,对热词进行快速识别和定向跟踪,可以快速地......
随着信息检索技术的不断发展,人们对其的要求也越来越高。通常情况下,大多数web检索系统只是根据文档与查询的匹配度返回结果文档......
由于Internet上的信息具有数量庞大、无序性强、重复性大的特点,互联网上的各种信息检索系统——搜索引擎成为帮助人们上网获取信息......
Internet的快速发展使得网络上基础教育资源数量快速增长,越来越多的人开始利用互联网进行学习,搜索引擎已成为获取教育资源的一条重......
学位
传统文档特征权重模型仅考虑关键词本身,文档内其他相关词汇并没有参与计算,信息检索时无法返回全面和准确的结果。为解决该问题提......
摘要:Word是人们工作、学习和生活中最为常用的文字处理软件,U盘作为移动存储设备为数据传输和存储带来极大的方便,但多种因素会造成U......
针对网络中所存在的大量以网页等非结构化形式存在的文本资源,提出一种改进的朴素贝叶斯分类方法.首先,通过卡方检验方法求文档特......
随着Internet上信息的日益丰富,'信息超载'成为了一个大问题,快速、准确、低成本的从信息海洋中获取需要的信息并不是容易......
文库系统对信息的传播利用有着重要的作用,但在文库系统中出现信息过载问题后,数据的利用率会大大降低.针对该问题提出了一种基于......
针对经碎纸机粉碎的文档碎片,提出拼接复原的模型并研制了相应的算法。首先研究文档碎片边界像素特征,据此提出碎片横向拼接的两种......