一个基于个有自学习机制的概念网络的搜索引擎的研究与核心算法的实现

来源 :中南工业大学 中南大学 | 被引量 : 0次 | 上传用户:haobishuiduo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该论文简要介绍了搜索引擎的发展史和目前Internet上较受欢迎的中外文搜索引擎,并且对搜索引擎所使用的基本技术及其发展趋势进行了扼要的综述.该论文还着重介绍了中文搜索引擎的发展现状,并分析中文搜索引擎与外文搜索引擎的不同之处,通讯中文搜索引擎所面临的问题.在此基础上,该论文提出了一种应用模型方法的智能搜索引擎的构建思想,自动收集网络用户的智能,从而实现基于概念的智能搜索.同时,为了能够对这种机制进行实验检验,在这种思想的基础上,该文又提出了一搜索引擎的实现模型,即一种基于具有自学习机制的概念网络的搜索引擎,对该种搜索引擎的构建思想及核心算法进行实验验证.由于中文本身在内码表示和文本表现形式与英文的区别,作为中文信息分析的前提,该论文对自动分词算法进行了较深入的研究,并实现了一种高效的分词算法(包括正向最大匹配和反向最大匹配).在此基础上,实现了中文文本特征提取算法,同时学完成了相应数据库表结构的设计.
其他文献
在问答社区中用户不仅是信息的消费者同时也是信息的创造者。海量用户在问答社区中创造了海量的数据,用户生成的内容通常会出现问题和答案之间的差距,以及一些垃圾信息的生成
随着计算机的发展,用自然语言作为人机交互语言已是必然趋势,这就对自然语言处理的深度和广度提出了越来越高的要求.这个问题在西方国家并不象在中国这样突出,因为计算机从诞
随着面向对象技术的广泛应用,面向对象软件测试技术已成为一个重要的研究方向,与传统的软件测试不同,面向对象软件测试的基本测试单元是类.相就的测试方法也可以分为两类.基
该文在讨论扩展概念格及其简化形式的基础上,重点研究它们不同的构造方法和多种维护算法.基于相对约简格可以方便有效地发现多种规则,KDD的目的是提取规则,而从事务数库中提
论文首先分析了相关背景,明确了需要完成的具体任务.接着介绍了多媒体及其通信的基本概念和电子白板的基础理论.在此基础上提出了Internet多媒体通信的数据压缩标准和舆协议,
网络管理信息系统是基于Web技术的,建立在Internet环境之上的管理信息系统.它的设计与实现是一个很复杂的系统工程,是Internet技术与管理信息系统开发方法的统一.在网络管理
该论文首先分析了开发Linux下多媒体教学系统软件的体系结构和开发方法,对利用GTK+开发Linux下图形用户界面(GUI)应用程序、Linux下的一种数据库管理系统MySQL、Linux网络编
计算机网络技术的发展,极大地推动了社会信息化进程,人们可以通过Internet很方便地进行信息交流。但是,公开便利的网络环境同时也带来网络通信安全方面的挑战。 在开放的网络
随着计算机科技的发展,嵌入式设备越来越多的被使用在生活中的各个方面。这使得基于嵌入式设备的软件开发越来越受到人们的重视。远程调试器是嵌入式软件开发中最重要的工具
H.264视频编码标准具有视频质量高和码率低等优越性能,然而这是以增加计算复杂度为代价。因此如何提高其编码速度成为提高编码效率的关键,对于满足大规模共享和高清实时传输