【摘 要】
:
论文中给出了针对最短片断算法改进的扩展布尔检索算法,提高了Web搜索引擎的检索精度.论述了跨语言信息检索的查询翻译模块,以及如何将这个模块结合到搜索引擎中,用以实现跨
论文部分内容阅读
论文中给出了针对最短片断算法改进的扩展布尔检索算法,提高了Web搜索引擎的检索精度.论述了跨语言信息检索的查询翻译模块,以及如何将这个模块结合到搜索引擎中,用以实现跨语言信息检索系统.同时论述了半自动化信息抽取算法,其中使用了基于扩展正则表达式的信息槽抽取算法和基于网页特性的事件分割算法.这个算法被应用到网页招聘信息检索项目中,取得了不错的效果.相应的实验来说明了各个算法的优缺点.论文同时描述了利用这些算法的Web信息检索和信息抽取系统,并详细介绍了系统的体系结构和实现细节.这些系统可以被用于真实的Web环境中以提高存贮、利用信息的效率,在一定程度上解决在Internet上获取信息及利用信息的困难.
其他文献
聚变能是未来永恒的洁净能源,聚变堆系统结构复杂,聚变工程研究中方案多变、数据海量,迫切需要计算机辅助设计,而信息模型建模是其基础.包层是聚变堆的关键部件之一,主要作用
联邦数据库提供了对多种数据源进行统一访问的界面和方法,针对传统事务模型在联邦数据库的缺陷,给出了联邦数据库系统的事务模型,并使用数学的方法对其适宜性进行了评价.这个
本文主要是针对四足机器人的设计与应用进行研究,设计实现了一个专门用于四足机器人运动仿真的系统,主要包括以下几方面内容: 1、针对四足机器人的建模问题,设计了一种三维几
网络是系统工程的平台,系统工程是网络的应用对象和网络分析是系统工程的重要方法的认识,利用网络配流用户平衡与系统最优之间的关系,提出了网络规划和评价的一个宏观体系。在网
本文根据多个工程项目的实践经验,总结了顺序控制系统的设计要点和经验。并试图将软件工程中一些成功的理念应用于顺序控制系统的设计中,提出顺序控制设计的模块化思想,并对模块
语言模型是自然语言处理的基础任务,它为语音识别、词性标注、信息抽取、自动问答、文本挖掘、机器翻译等众多自然语言处理综合应用提供了至关重要的支持作用。其中,基于统计的
在信息系统的构建中,传统的C/S结构会随着系统规模的扩大和应用的复杂性增加暴露出许多弊端,如数据库服务器负载过重、系统维护成本大幅度提高等。分布式组件技术是解决上述问题
J2EE系统的Web容器、EJB容器和客户端应用程序窗口,具体负责进行用户的认证和访问授权控制工作.容器的安全性控制是基于安全角色进行的.安全角色可以认为是一组权限的集合标
该文提出一种新的信息获取方式:以某种方式制造一个通信的汇聚点,然后在该汇聚点有选择的转发、修改或者生成某一个方向的通信内容,以此来影响另一个方向的通信内容,并有选择