半结构化信息相关论文
本论文以提高半结构化信息抽取方法针对信息数量和信息类型的适应能力为目标,针对上述问题,分别对半结构化文本信息抽取和网页信息......
随着互连网的迅猛发展,越来越丰富的信息展现在人们面前,但是面对海量的互联网资源,人们感兴趣的往往只是某一领域的专门信息。如......
随着互联网的快速发展,海量的数据以网页的形式发布到互联网上。传统的网页是面向用户而设计的,人们可以通过浏览器可视化的阅读信......
随着信息时代的到来,网络上的信息资讯呈现爆发式增长。其中,微博以其交互性、实时性、原创性等特点迅速成为信息资讯传播的重要平台......
对当前XML数据存储技术研究与应用现状进行了简要介绍,重点就面向值的映像方法在XML数据存储中的应用进行了详细探讨,并给出了相应......
一、Web2.0时代的网络信息结构互联网上出现的海量信息,其结构要素有三大部分组成,即结构化信息、半结构化信息和非结构化信息。结构......
为了对WEB上不规则的动态信息按照数据库的方式集成和查询,本文采用对象交换模型(OEM)建立WEB上信息模型。为了将页面中各个部分表......
异构信息源集成技术提供统一接口,使各种基于因特网的应用能迅速、准确地提取所需信息,为用户屏蔽各种信息源的异构性.这种异构信......
随着信息技术的发展,web挖掘技术已成为数据挖掘技术的研究热点。本文针对Web挖掘中数据库环境的异构和信息半结构化等难题,提出了一......
论文对国家标准《文件管理元数据原则》中文件管理元数据的结构化信息与半结构化信息的定义、由来及其如何理解进行了探讨,并对作......
基于半结构化信息模型的知识处理的核心技术是如何有效的进行信息查询、检索、处理和转换,本文详细论述了我们在研制开发"基于半结......
XML适合于解决Web数据挖掘中数据库环境异构和信息的半结构化等难题。Web结构挖掘是整个Web信息挖掘的重要组成部分。用XML来完成W......
维基百科实体分类对自然语言处理和机器学习具有重要的作用。该文采用机器学习的方法对中文维基百科的条目进行实体分类,在利用维......
传统有监督的关系抽取方法需要大量人工标注的训练语料,而半监督方法则召回率较低,对此提出了一种基于自监督学习来抽取人物家庭关......