【摘 要】
:
随着近几年Internet的飞速发展,虽然Web已经发展成为一个巨大的分布和共享信息资源的平台,但如何从Web中快速、有效的获取信息仍然是困扰着Web用户的一个问题,在这种背景之下
论文部分内容阅读
随着近几年Internet的飞速发展,虽然Web已经发展成为一个巨大的分布和共享信息资源的平台,但如何从Web中快速、有效的获取信息仍然是困扰着Web用户的一个问题,在这种背景之下,出现了Web信息抽取技术,Web信息抽取技术是从已经存在多年的信息抽取技术中繁衍出来的,它继承和发展了信息抽取领域的一些关键技术。同时,XML技术出现之后,迅速成为互联网信息表示的事实标准,本文把传统的信息抽取技术同XML技术结合起来,在Web信息抽取过程中起到了事半功倍的作用。 本文首先对现有的信息抽取技术和XML技术加以研究,在此基础上提出了适合XML的结构又较为通用的树型结构抽取规则,它能够把Web上的数据抽取出来整合到指定模式的XML文档中去。Web信息抽取出来,用户如果不能随心所欲的加以利用,那将是毫无价值的。所以,抽取信息的数据集成也是Web信息抽取过程中不可忽略的一个子过程。那么,如何把抽取出来的数据准确的映射到目标数据库中也是本文需要研究的范畴。同时,为了方便用户对抽取出的数据进行二次利用,本文还提出基于XML的Web查询模式。总之,Web信息抽取技术结合XML的存储和访问技术,最大限度的实现了Web信息的再利用。 本文的创新所在是作者提出了一个信息抽取原型系统的设计及实现方案,该系统采用多策略的基于XML的抽取方法,来满足各个领域不同的抽取需求。在文章的最后,作者基于实例对系统的各项抽取系数进行了评价,基本达到了预期的效果。
其他文献
本文以具有一个上游制造商和一个下游零售商的供应链为研究背景,考虑了两级供应链上制造商和零售商在不确定环境下的博弈问题。在模糊环境下,把顾客的市场需求和制造商的制造成本考虑成模糊变量,建立了模糊环境下两阶段供应链博弈的期望值模型,机会约束规划模型和所对应的α乐观值,α悲观值模型,并得到了在各个模型中供应商和零售商最优定价和最优利润的解析解.在随机模糊环境下,把顾客的市场需求看作成随机模糊变量,制造商
随着经济全球化的发展,企业面临的竞争环境日趋严峻,传统的企业经营模式已经难以满足企业发展的需要。战略联盟作为一种有力的竞争武器为越来越多的企业所采用,企业与企业之间的
作者简介:卢绪首,1974年8月生,日照市规划设计研究院集团有限公司高级工程师,祖籍日照市岚山区黄墩镇寺后村人。 我又一次坐在书房里,读着书,不时抬头欣赏着春民先生“还是读书”的横匾幅,回想着先生赠书法时的谆谆话语:“……这是一位退休的一中副校长让我写的。我觉得不错,转赠给你……”人已到中年,作为一个从农村走出来的远行者,最值得坚守的是什么?我曾思考了很久。如今,欣赏这字迹厚重,意境深远的横匾幅
在逆向物流网络中,各种物流设施的选址定位是一个非常重要的问题。合理的设施选址能够节约成本,降低费用,提高回收效率和顾客满意度,甚至对于整个逆向物流系统的运作都具有重要的
在人工智能和知识工程的研究应用系统的开发中,专家系统是一个极为活跃的分支领域,其在许多领域中都有成功的应用。随着发展的深入和要求的提高,有关知识获取以及如何处理知
工作流(Workflow)技术是计算机支持的协同工作(Computer Supported Cooperative Work,CSCW)的一个分支,是一种反映业务流程的计算机模型,用于表达活动及活动之间的变化过程。
<正>根据Burkill等[1]的定义,腹膜后间隙前界为腹腔,后界为腹后壁,上界为第12肋及对应椎体,下界为骶骨表面及髂嵴所围成的区域,外侧界为腰方肌外侧缘,发生在此间隙的肿瘤为腹