实体解析相关论文
随着社交网络服务平台规模的不断扩大,用户难以完整浏览并快速发现自己感兴趣的信息和服务。用户不仅期望能够快速有效获取信息,还......
异构和分布式数据被用于多方面的应用,如信息提取、数据挖掘、电子学习以及网络。而与这些应用相关的所有算法的决策准确性都直接......
随着互联网技术的发展,数据增长的速度越来越快,实体解析的重要性也变得尤为突出。实体解析是将在同一个数据源或者不同数据源中,......
实体解析是一种在结构化和非结构化数据中抽取、匹配与合并代表着同一现实世界实体的数据的处理过程。尤其在大数据时代,实体解析......
传统的实体解析是指,给定一个或多个描述现实世界的引用集合,识别其中对应于现实世界中同一实体的所有引用的过程。实体解析是数据......
传统的关键词Top-N查询技术大多基于干净数据集,难以直接用于脏数据集。脏数据集中可能存在大量包含拼写错误、空值或重复的记录,......
实体解析和查询处理是数据库和大数据领域中两个重要的研究课题。实体解析是指识别数据集中描述现实世界同一实体的多个元组,并且......
在数据库和大数据领域的研究与应用中数据质量是重要的,脏数据处理是一个挑战,实体解析(Entity Resolution,ER)是其中的关键问题之......
学位
连接查询技术往往需要很高的时间开销。随着数据量加大,连接查询会因其时间开销过大而失去实用性。现实的数据集通常是包含大量重......
实体解析用于判断两个数据记录是否描述的是同一实体对象,记录聚合则把所有属于同一实体对象的数据记录进行聚集,建立关联,方便交......
【目的】探讨实体解析理论中经典的实体解析方法及逻辑思路。【文献范围】在GoogleScholar和CNKI中分别以检索词"Entity Resolutio......
为了改善传统实体解析算法在单机环境下采用人为方式设定属性权值及阈值难以对海量数据进行快速有效处理的缺点,基于Hadoop框架使......
为了改进BP神经网络收敛速度慢、不能得到全局最优解的缺点,选择具有全局优化、支持并行且具有自适应特性的蚁群算法,优化神经网络......
本文提出了一种适用于中文文献索引数据的实体解析方法。区别于新近的属性+链接结构的聚类方法,本方依据实际问题的特点采用了先属性......
邮箱用户身份信息挖掘是数据挖掘研究的一个热点。当前相关研究大多仅从邮件头中抽取邮箱用户的别名,遗漏了邮件正文中潜藏的更能代......
实体解析是指发现并聚合描述现实世界中同一对象的记录。纯粹的机器算法虽然可以获得较高的效率,但是准确率难以保证。提出了一种机......
复杂网络为我们研究复杂性问题提供了一个新的视角和方法,激起了对于不同的实际网络特性的研究热潮。同时,信息抽取作为一门逐渐成熟......
实体解析是将在同一个数据源或者不同数据源中,指向现实世界同一实体的元组识别出来并合并的过程.如何高效而准确地将指向同一实体......
大数据环境下,海量的数据资源产生于多个数据平台,多源数据融合技术将来自多个数据源的实体信息进行整合,为数据挖掘、机器学习等......
实体解析是指匹配并合并数据中指向现实世界同一实体的数据记录,它是数据清洗数据集成中关键的一步。传统的实体解析研究工作主要......
介绍Markov逻辑网的理论模型,阐述Markov逻辑网的结构和参数学习算法及2种基本类型的推理,从命名实体识别、实体关系抽取和实体解......
实体解析是数据集成和数据清洗的重要组成部分,也是大数据分析与挖掘的必要预处理步骤.传统的批处理式实体解析的整体运行时间较长......
随着因特网的飞速发展,数据获取途径日益多样化,数据质量问题越来越被重视,数据中的歧义问题就是一个备受关注的数据质量问题,在一......
实体解析(entity resolution,ER)是数据集成和清洗系统的关键基础问题.尽管有大量实体解析方法提出,但这些方法依赖隐式或显式的假......
知识图谱是在大数据时代背景下产生的一种新型知识表示方式和数据管理模式.学习和推理是知识图谱应用研究的核心内容之一,主要任务......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
两层相关性聚类算法由于引入公共邻居,在解析的正确性及抗噪声能力方面性能较好。但该算法分两层执行,在时间效率上不具优势。为此,提......
在马尔科夫逻辑网(MLN)的实体解析算法中任意闭原子采用硬约束,导致推理及权重学习过程较难收敛到最优解,降低解析精度及执行效率。......
实体解析是数据清理、数据集成、数据挖掘等技术中关键的一步,是数据质量的保障。介绍了实体解析含义、背景起源以及算法基础。列......
大量的农业技术、供求信息、市场信息、政策法规和农业新闻等信息资源分布在互联网上农业网站中。然而由于互联网信息资源具有信息......
实体解析是指识别同一实体的不同描述形式的过程,旨在保障数据质量,是数据清理、数据集成及数据挖掘中的关键技术.随着电子商务的......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
实体解析是数据清理过程中的基本问题,随着异构数据源的大量涌现,要求能够对包含有多种属性类型的实体描述对象进行解析。针对含有......
从非结构/半结构化数据中快速准确地搜索到各种实体(例如人名、组织机构、产品和药品)及其相关信息成为很多应用的关键,包括信息检......
数据量大、数据更新速度快、数据源多样和数据存在噪声是大数据的四大特点,这为数据集成提出了新的挑战.实体解析是数据集成的一个......
自2012年5月起,随着搜索引擎公司谷歌首次提出知识图谱(Knowledge Graph),一时引起学术界与工业界广泛关注,很多研究者将知识图谱......
传统的数据挖掘技术(包括分类,聚类,关联分析等)专注分析维表的属性,却忽略了记录之间所存在的关系。另一方面,现在主要的网络分析......
复杂网络的结构非常复杂,如果仅用数据表格或文字的形式来表示网络,理解起来非常困难,导致网络所包含的信息无从体现。将复杂网络......
实体解析用于判断两个数据记录是否描述的是现实世界中的同一实体对象。它对于数据集成、数据清洗、数据去重和处理优化都十分重要......
互联网、物联网和云计算技术的不断融合,使得各行各业信息化程度越来越高,但同时也带来了数据碎片化的问题.数据碎片化的海量性、......
旨在从无监督聚类角度分析实体解析过程的机制。从特定类型、经典算法角度研究了无监督聚类的思路;从经典算法改进、演化分析角度研......