基于等价压缩快速聚类的Web表格知识抽取

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:kwannew
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web表格知识抽取是一种重要的获取高质量知识的途径,在知识图谱、网页挖掘等方面具有广泛的研究意义与应用价值。传统的Web表格知识抽取方法主要依赖于良好的表格结构和足够的先验知识,但在复杂的表格结构以及先验知识不足等情形下难以奏效。针对这类方法的问题,该文通过充分利用表格自身的结构特点,提出了一套可面向大规模数据的基于等价压缩快速聚类的Web表格知识抽取方法,以无监督的聚类方式获得相似形式结构的表格,从而推测其语义结构以抽取知识。实验结果表明,基于等价压缩的快速聚类算法在保持同水平的聚类准确率的前提下,在时
其他文献
<正>特立独行的特朗普入主白宫,其内外政策和安全战略备受瞩目。2017年12月,特朗普政府发布了国家安全战略报告,凸显了特朗普"美国优先"的政策理念,从根本上颠覆了战后几十年
事件识别是以事件为单位进行信息抽取的起点,对后续各个子任务都意义重大。针对事件识别任务,该文提出了一种融入文档信息的序列到序列方法,一方面借助神经网络减少了特征工
四十年前党的十一届三中全会一声春雷,驱散了神州大地的片片阴云,中国昂首进入了深深改变国家、党和人民命运的改革开放时代。四十年后的2018年11月14日,习近平总书记强调,庆
简述了基于GMR的三维焊缝检测传感器。为解决焊接加工自动化过程中空间焊缝的跟踪检测,将GMR焊枪悬浮高度传感器、焊缝检测传感器以及相应的微处理器有机结合并集成,用于检测跟
随着数据速率的提高,时钟抖动分析的需求也在与日俱增。本文探讨参考了时钟的作用和时钟抖动对数据抖动的影响,并讨论在E5052B信号源分析仪(SSA)上运行的AgilentE5001A精确时钟抖动分析应用软件所配备的全新测量技术。