实体解析技术研究与应用

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:goodcareer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的实体解析是指,给定一个或多个描述现实世界的引用集合,识别其中对应于现实世界中同一实体的所有引用的过程。实体解析是数据清理,数据集成,数据挖掘等技术中关键的一步,是数据质量的保障。对于实体解析相关课题的研究其实早已起步,而由于近几年网络的迅速普及和数据规模的爆炸性增长,如何在海量数据中准确获取所需的信息,如何消除相似数据的歧义,如何检测出数据中的错误信息等已成为在生活生产中亟待解决的关键问题,实体解析也因此成为近几年热门的研究课题。随着研究的深入,已经有不少的研究成果被应用于各个领域,包括保险、银行、医疗等。论文中介绍了实体解析含义,背景起源,以及算法基础。列举并解释了实体解析发展过程中的经典算法包括成对实体解析,集合实体解析,大数据的实体解析等,以及它们的特点和局限性,分享了在新的应用环境下衍生出来的针对不同需求的新的实体解析算法。由于电子商务的兴起,对网络产品的精确识别成了亟待解决的具有极高应用价值的课题。网络数据具有无标准,无结构的特性,这与传统的实体解析问题的应用背景不同,是新的挑战同时也是新的机遇,论文将对网络产品的识别进行重点研究--分析现有的几种识别算法,包括WHIRL和TMWM算法,并进行实验分析比较,同时进行改进,加入更多的识别信息,如产品的属性,然后提出了SSM算法,提高了产品识别的精度和准度,并从字符串相似度缓存,约束知识库和分块策略三个方面对SSM算法进行优化,提高了算法的运行速度。
其他文献
本文从这两大类中各选出一种有代表性的算法进行研究,这两种算法分别是粒子群优化算法和Hopfield神经网络。 粒子群优化算法已经成功用于解决连续优化问题,但是一直未能有效
科学计算可视化是实现三维地震数据三维解释的主要方法,它运用计算机图形学和图像处理技术将三维地震数据转换为图形及图像在屏幕上显示出来并进行交互式处理,主要包括面绘制
虚拟经济发展迅猛,在整个经济体中占据相当大的比例,已经成为人们日常生活中的重要组成部分,尤其是以网络游戏、app应用、云服务等为代表的虚拟交易十分火热,创造了大规模的
语音识别是机器通过识别和理解过程把人类的语音信号转变为相应的文本或命令的技术。作为人工智能领域一个重要的研究课题,它的发展将会对未来的人机交互界面带来极大的影响
随着传感器技术、计算机网络及无线通信技术的发展,无线传感器网络(Wireless Sensor Network,WSN)在相关领域得到了广泛的应用。但同时网络中感知的数据量不断增加,采集数据
三维地震数据场的可视化对石油勘探起着重要的作用,它把采集到的物理数据转换成图形、图像,并通过给体数据赋颜色和不透明度,以及改变观察角度等方式来展现三维地震数据场的
随着计算机网络技术的迅猛发展,信息安全的重要性与日俱增。数字签名能为数据传输提供身份认证、数据完整性认证和不可否认性等安全服务,因此成为近年来的研究热点。目前研究
云平台为用户提供了执行任务的计算和存储资源,供应商根据用户使用资源的情况计费以获取利润。随着大规模数据需求的迅速增长,存储资源变得越来越重要。然而,对用户和供应商
随着计算机技术的快速发展,网络应用已经在全球得以推广,人类已经进入了网络时代。网络已经成为了人们日常生活中不可缺少的一部分,并在国民经济中发挥着日益重要的作用。然而,由
目前,WebServices技术正受到产业界和学术界越来越多的关注,其应用也越来越广泛,出现了不少功能相同或相似的Web服务。为了对它们加以区分,人们通常采用服务质量(QoS)作为评价和