农业搜索个性化平台的研究与设计

被引量 : 0次 | 上传用户:duidui1314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着垂直搜索引擎的出现和发展,一定程度上克服了传统搜索引擎的弱点。然而现在的垂直搜索引擎基本上还是基于单一关键字查询的方式,无法克服关键字查询方式带来的准确率和召回率低的问题。在农业领域里,垂直搜索引擎也存在同样的问题,在国家重大科技支撑项目子课题“基于本体的农业搜索引擎”(2006BAD10A0502)的支持下,本文针对农业搜索引擎构建了用户个性化平台。首先研究了个性化平台的重要基础之一,农业信息的的地理属性的添加,这是为实现个性化平台在构建索引文档时做的基础工作。文中的设计主要对农产品市场名称进行地理定位,采用了基于地理信息库索引的市场名地理定位、基于搜索引擎搜索结果项的市场名地理定位、基于搜索引擎搜索结果数量的市场名地理定位三种方法逐步提高对市场名称的地理定位能力。然后本文研究了用户搜索个性化平台的构建方法,从服务器日志中挖掘用户兴趣信息,并基于本体对用户兴趣词汇进行语义扩展,形成用户兴趣模型,当用户检索相关信息时,应用用户兴趣模型对用户提交的关键词进行扩展,然后将扩展后的关键词提交给检索系统,按照相似度排序输出结果,这是在信息检索时所采取的步骤,从而实现个性化服务平台。本文首先介绍了关于搜索引擎和本体论方面的一些基本知识,接着分析了网络上抓取的农产品市场名称的一些特征,根据市场名称特点构建了带有别名识别的多级地理信息库,然后基于构建的地理信息库索引对市场名进行地理定位;下一步分析了在互联网上市场名称和它所在的地名一起出现在搜索结果的同一网页中的可能性关系后,研究了一种基于搜索引擎搜索结果的市场名地理定位的方法;在上述方法无法定位时,基于皮尔逊卡方来评价市场名称和地名同时出现在一个网页上的关系,从而产生了基于搜索引擎搜索结果数量的市场名地理定位的方法。然后本文研究了用户兴趣库的的构建和更新方法,首先通过用户注册信息构建初始兴趣词库,然后通过挖掘服务器日志和计算兴趣词的响应系数,来维护和更新用户兴趣库;接着研究了根据用户访问文档的具体信息计算关键词用户兴趣度的方法;进一步系统通过将用户兴趣库中的词基于本体进行语义扩展构成用户兴趣模型,并且利用模型中词汇的兴趣度来维护和更新用户兴趣模型。接着分析了利用用户兴趣模型扩展用户提交的搜索关键词的方法,利用已经建立的用户兴趣模型给使用搜索引擎的用户提供个性化服务。最后对本文进行了总结,并指出了需要进一步研究的一些问题。
其他文献
目的:观察中药熏蒸治疗跟痛症的疗效。方法:将100例跟痛症患者随机分为治疗组(50例)和对照组(50例),治疗组采用中药熏蒸治疗,对照组则给予穴位注射醋酸曲安耐德注射液2mL、盐
藏族是中国具有悠久历史和灿烂文化的民族,是中华民族大家庭中重要的一员。历史上她曾创造了古老的阿里文化,藏南的雅砻文化,藏东贡布文化和东北部康巴文化,藏北草原羌塘文化,日喀
煤化工循环水场中的需水量占据鲜水总用量的80% 左右.对工厂废水进行回收、深处理及再利用,可节约煤化工厂资金成本,有效提升经济、环境及社会效益.以超滤- 反渗透工艺为例,
基于关键词的共词分析是文献计量中常见的一种研究方法,该方法是利用论文关键词在文献数据库中成对出现的统计学特征来分析关键词之间的亲疏关系,从而揭示这些关键词所代表的
实现社会和谐,建设美好社会,始终是人类孜孜以求的社会理想,也是包括中国共产党在内的马克思主义政党不懈追求的目标。中共十六届六中全会通过的《中共中央关于构建社会主义
建立在“六书”理论基础上的传统识字教学法已经不完全适用于现代汉字教学的需要。现有的识字教学法又各有利弊,单用某一种方法,不可能完成识字教学的全部任务。试图用裘锡圭先
随着信息化脚步的加快,“信息革命”在教育领域也掀起了一股热潮,使得大学网络机校园网络中心逐渐成为整个校园教科研与资料管理的电子数据存储中心,其数据的安全性则显得尤
互联网和网络媒体的迅猛发展不但改变着人们的日常生活方式,也必然导致语言在网络这一领域中产生新的变化,网络语言应运而生。网络语言根植于传统语言,但又个性鲜明、独俱特
本文从国际工程承包业务的发展特点入手分析,对企业核心竞争力理论进行了进一步研究。在对企业核心竞争力构成要素分析的过程中,结合国际工程承包业务的行业特点对核心竞争力要
韩国是当前信息产业最发达的国家之一,尤其以手机、半导体等电子信息产品享誉全球。2006年9月,笔者随CCSA(中国通信标准化协会)代表团到韩国参会和访问,在韩期间,参加了ICB3G