基于领域知识的个性化购物比较系统的设计与实现

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:sizhezang1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务的快速发展,在线购物网站数量以及网上商品种类不断的增加,顾客要从购物网站找到自己满意的商品也变得越来越困难。为了找到最符合自己要求的商品,顾客只有花费大量的精力去访问各个购物网站,手工查找和比较各种商品,而结果往往不令人满意。 购物比较系统就是在这种应用背景下出现的,它可以帮助消费者从大量的购物网站中迅速找到真正所需的商品信息。用户只需向购物比较系统发送查询请求,系统就会从各个购物网站抽取出符合用户要求的商品信息列表。 现有的购物比较系统存在以下不足之处:(1) 手工构造封装器方法的局限性大,可扩展性差。当一个新的信息源加入或者已有的信息源结构发生变化的时候,开发人员必须重新手动构造一个新的抽取规则。(2) 基于启发式规则的封装器归纳法使用简单的启发式规则来归纳确定网页中特定信息片段的语义,自动化生成封装器。但是这种方法的启发式规则太过简单,因此一般只能抽取商品名称和价格这两种商品属性的信息。 为了解决以上问题,本文提出了一种基于领域知识的封装器归纳生成法(Domain Knowledge-based Wrapper Induction DKWI)。对于每个要抽取的信息源,DKWI方法利用已构造的领域知识库自动化生成相应的封装器,然后使用这些封装器进行信息抽取。DKWI方法不仅可以抽取商品的名称与价格信息,而且还可以抽取出与领域相关的商品的其他属性信息。例如,在图书领域,DKWI方法还可以抽取图书的名称、作者、出版社、ISBN等信息。 基于DKWI方法,设计实现了一个基于领域知识的个性化购物比较系统—eShopper系统。对于每一个购物网站,eShopper系统通过DKWI方法自动化生成能够抽取该网站商品信息的封装器。当用户需要查询感兴趣的商品的信息时,只需向eShopper系统发送一个查询请求,系统接收到该请求后,立即向各个在线购物网站发送对应的商品查询请求,然后使用对应的封装器从各个网站返回的查询结果网页中抽取商品信息,并以结构化的形式进行集成和存储。最后按照用户的需求对这些商品信息进行比较、排序,并把结果返回给用户。
其他文献
上个世纪九十年代以来,互联网技术得到了长足发展。信息的安全性问题已经变得越来越重要,国内外的研究者们已经做了不少研究工作,但数字水印仍没有在工程中得以大规模的实际应用
构件技术是支持软件复用的核心技术,如何从海量的构件库中选取出最优构件提高系统组装率,这是一个需要解决的关键问题。构件的选取一般包括两个步骤:构件的检索和构件的选择
网格是一个集成的计算与资源环境。网格的目标就是要把分布在不同地方的各种资源联合起来,形成一个虚拟的、强大的“网格计算机”。网格是下一代Internet计算模式。 本文首
机器人足球世界杯,是一个多智能体系统的典型问题,又是研究分布式人工智能的理想平台。论文以机器人足球仿真比赛作为检验平台,以多智能体系统为研究对象,选择“成功防守”作为目
基于集群的作业管理系统是一种建立在操作系统之上的中间件。它的主要用途是强化操作系统的批处理功能,它将地理上分布、异构、自治的各种工作站、PC机和专用设备通过网络构
本文主要提出一种安全域之间基于网络互连的新密钥交换协议,它是对面向网络基础设施新安全机制的扩展。该协议通过在IP层上实施嵌套安全域之间逐跳(hop-by-hop)身份验证和密钥
如何借助先进的计算机技术和科学手段,对各种防震减灾信息进行科学的组织和管理,以便迅速的采取相应的措施将突发地震灾害所带来的损失减小到最低程度是城市防震减灾工作中急
基于图像的绘制(IBR)技术是计算机图形学与计算机视觉相互交叉形成的一个研究热点。不同于传统图形学,基于图像的绘制使用一些预先采集的图像来生成不同的场景画面。随着基于
本论文首先分析了传统电信业务的不足,研究了ParlayAPI和万维网服务技术在电信业务开发中产生的影响。然后结合万维网服务组合的思想,提出了采用万维网服务的业务过程执行语言(
Web服务网络管理是一种新的网络管理方式,是网络管理发展的新阶段。它结合了Web服务的优点,可以在网络异构环境下跨越防火墙和各种平台实现组件的互操作,可以把已有的网络管理功