面向客户的电子目录本体自学习理论与方法研究

来源 :武汉理工大学 | 被引量 : 1次 | 上传用户:Test_518
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着语义网技术和电子商务应用的快速发展,用户不得不花费大量时间在各种异构的、晦涩的目录海洋中寻求所需要的信息,企业在信息交换时,也存在难以互操作和语义集成的瓶颈。建立共享概念的明确的形式化规范说明可以很好地解决这个问题。电子目录本体除了能够满足用户的查询需求,也为计算机进行信息交换、语义搜索和信息识别提供了便利。然而手工建立电子目录本体需要大量领域专家的帮助,耗时又费力,更别说难以有足够的领域专家。因此自动构建电子目录本体满足客户需求是一项重大意义的工作。本文基于以上问题和现状,借鉴现有本体自学习的研究成果,以电子目录国际分类标准、本体论和语义Web理论为基础,利用自然语言处理领域的方法和技术,对面向客户的电子目录本体建模和电子目录本体的自学习方法进行了深入研究。主要的工作包括:(1)电子目录本体元模型的构建。电子目录本体元模型为电子目录本体自学习提供了一个统一的领域框架,本文结合客户需求,对国际目录分类标准进行语义扩展,设计了具有四个层次的电子目录本体元模型,并用标准规范化的语言进行了描述。(2)基于电子目录本体元模型自动构建目录本体:●基于目录网站层次的目录本体概念获取。基于电子商务Web网站的结构地图和对Web页面块的分析,设计了基于网站分类层次的目录本体概念获取算法,并进一步利用国际目录分类标准对获取的概念进行标准化处理。●基于语义和关联规则的本体概念关系学习。提出了基于模式匹配的电子目录本体层次关系的获取方法,探讨了动词在目录本体概念非层次关系中的重要性,提出基于语义关联规则对非层次关系进行挖掘的方法。●基于模式匹配和在线统计的概念属性识别。提出利用模式匹配和Web统计分析的方法来识别电子目录本体概念属性。并特别分析了目录本体概念数据属性的属性值和属性计量单位的自学习算法。●电子目录本体概念实例提取。基于目录本体概念实例处于电子商务网站结构中的叶子节点,提出了目录实例自动提取算法。(3)电子目录本体自学习实证。介绍了以Amazon.com电子商务网站为例的电子目录本体自学习过程,并给出了构建结果。最后对自学习的电子目录本体设计了评价方法,得出本文的电子目录本体自学习方法是有效的、有价值的。
其他文献
2015年10月26日,ABB在上海庆祝电机与发电机业务在华发展20周年,并集中展示了M2BAX、NMI等多款本土研发的新型高压和低压电机,助力各行业客户节能增效,降低对环境的影响.
又到岁末,汽车行业内的各种评奖接踵而至,粗略盘算了一下,这些奖项加起来的总和没有一百,也有八十.商用车圈子也不能免俗,什么节油冠军、最美车型,这个“哥”、那个“姐”的
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
切实缩小城乡之间教育水平的差异,保证教育特别是基础教育的公平性,对于提升我国整体的教育水平、解决人民大众所关心的基本问题都有着非常重要的意义。然而,长期以来我国都
工厂电气设计中涉及到厂房照明、防雷接地系统、电力配线、变电所设计、火灾自动报警等几个方面最基本的部分,有的项目中还涉及到一些弱电方面的要求。 Plant electrical de
Perkins(珀金斯)发动机有限公司宣布委任辛恪礼( Chris Snodgrass )为环球销售及营销兼服务及售后零部件副总裁. 辛恪礼将专责拓展环球发动机销售和零部件业务及客户关系. 辛
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
卫办医政发〔2009〕124号各省、自治区、直辖市卫生厅局,新疆生产建设兵团卫生局:心脑血管疾病和内分泌代谢性疾病是严重威胁我国居民身体健康的两大疾病。我国冠心病患者中,
党的十九大,是我们党在全面建成小康社会,中国特色社会主义进入新时代的关键时期召开的极其重要的会议,习近平总书记作了《决胜全面建成小康社会,夺取新时代中国特色社会主义
期刊
在安徽长江以南,有6市16县,简称皖南。在这里不仅有大自然造就的天下无双的山水风光,而且还有大量展现中国古老文化的人文景观。许多摄影爱好者对这里的世界自然与文化遗产黄