基于Web的实例知识条目自动构建方法

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:zkhjpaul
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的高速发展,网络信息爆炸式增长,于此相比,互联网中的知识却相当匮乏。在此背景下,基于Web2.0的各种交互式百科知识网站应运而生并发展壮大,为用户提供了大量的有价值的百科知识。当今互联网信息日新月异,高速增长的信息中又蕴含着大量的新知识,然而现有的百科知识库的构建都是基于广大用户的志愿参与来人工完成的,这种构建方式必然面临着知识条目更新不及时、不全面完整以及工作量大等问题。为了解决这些问题,本文研究开发了一套基于互联网信息的能够自动准确填充百科知识条目各方面信息的实例知识条目自动构建系统,有效弥补了现有百科知识库的不足。本文通过对知识库自动构建方法的研究,提出了一种对互联网中各个领域的信息都行之有效的实例知识条目自动构建方法,并开发实现了实例知识条目自动构建系统。整个系统包括三个主要模块,分别是异构信息采集模块、采集结果整合模块和实例知识搜索模块。本文的研究内容主要包括以下几个方面:1)异构信息的采集,利用元搜索引擎技术在互联网的海量信息中获取与词条最相关的各种异构信息,尝试改进查询扩展的方法,进一步提高了信息采集的精确性和高效性。2)采集结果的整合,尝试多种信息整合的方法,把信息采集阶段获取的信息通过网页净化、断句分词、文本去重、文本聚类、主题提取、简单排序组合等一系列处理整合成一篇介绍某个词条的知识。3)实例知识的搜索,为用户提供一个获取知识的用户接口,用户通过这个接口不但可以获取系统知识库中已经收录的实例知识,也可以在线实时生成新条目知识。通过系统服务器模型的改进,系统的负载能力和实时性得到了很大提高。本系统已成功应用在本实验中心构建的海天园百科知识库平台中。实验结果表明本文提出的实例知识条目自动构建的方法完全能够满足实例知识条目自动构建的要求,在实时性和知识精度上都达到了预期效果。
其他文献
无线传感器网络在世界各个领域都有着相当巨大的应用价值,它已经引起了世界各国在工业、农业、军事、环境、医疗等传统领域以及家用、保健、交通等许多新兴领域方面的极大应用
学位
近几十年来,数字图像,视频的处理技术一直受到广泛关注。不仅是专业的影视、动漫企业,更多的非专业用户希望对自己拍摄的媒体素材进行编辑处理工作。图像,视频的分割技术在素
随着信息技术的发展,图像处理技术已经成为科学研究的有力工具。在医学图像处理领域,应用分析处理系统对减轻医生的阅片劳动强度和提高诊断精度具有重要的意义,而图像分割是图像
随着信息时代的到来,人们对数据交互和通信的需求越来越大。大多数的数据和信息可以通过传统的路由-交换互联网有效传输,但在一些网络设备难以架设的偏远山区以及在河流湖泊
数据挖掘技术通过对数据库中的数据进行挖掘,可以得到很多重要的知识,包括分类知识、聚类模式、关联规则以及序列模式等等。其中关联规则是通过分析数据库中频繁出现的数据之
聚类和分类是数据挖掘中的基本任务。长期以来,关于聚类技术在分类中的研究主要集中在应用聚类对训练数据进行数据预处理,期望通过减少噪音数据的影响提高最终的分类精度,因此,如
在游戏项目开发中,游戏工具的开发始终占据重要的位置。软件工程技术的进步使得越来越多的工程开发理念被应用到游戏领域。无论是游戏设计理念、项目开发流程,都使得开发效率
信息技术的迅速发展使数据库面临的安全问题更加复杂和多样,数据库作为信息系统重要数据的存储和处理核心,往往成为最吸引攻击者的目标。访问控制技术是数据库安全领域的一个
学位
失衡数据集是数据挖掘领域中广泛存在数据状态,由于不同类别的数据样本数量差异悬殊而使得正常的分类算法效果不明显。在数据挖掘领域中还有一个不可避免的问题就是数据缺失,
随着嵌入式系统以及多媒体技术的高速发展,使用嵌入式技术来实现视频点播、视频会议、视频监控等功能己经成为现在的研究热点。这样的嵌入式系统一般都具有功耗低、成本低、