【摘 要】
:
Web表格知识抽取是一种重要的获取高质量知识的途径,在知识图谱、网页挖掘等方面具有广泛的研究意义与应用价值。传统的Web表格知识抽取方法主要依赖于良好的表格结构和足够
【机 构】
:
中国科学院计算技术研究所智能信息处理重点实验室,中国科学院大学
【基金项目】
:
国家重点研发计划(2017YFC1700302).
论文部分内容阅读
Web表格知识抽取是一种重要的获取高质量知识的途径,在知识图谱、网页挖掘等方面具有广泛的研究意义与应用价值。传统的Web表格知识抽取方法主要依赖于良好的表格结构和足够的先验知识,但在复杂的表格结构以及先验知识不足等情形下难以奏效。针对这类方法的问题,该文通过充分利用表格自身的结构特点,提出了一套可面向大规模数据的基于等价压缩快速聚类的Web表格知识抽取方法,以无监督的聚类方式获得相似形式结构的表格,从而推测其语义结构以抽取知识。实验结果表明,基于等价压缩的快速聚类算法在保持同水平的聚类准确率的前提下,在时
其他文献
<正>特立独行的特朗普入主白宫,其内外政策和安全战略备受瞩目。2017年12月,特朗普政府发布了国家安全战略报告,凸显了特朗普"美国优先"的政策理念,从根本上颠覆了战后几十年
事件识别是以事件为单位进行信息抽取的起点,对后续各个子任务都意义重大。针对事件识别任务,该文提出了一种融入文档信息的序列到序列方法,一方面借助神经网络减少了特征工
四十年前党的十一届三中全会一声春雷,驱散了神州大地的片片阴云,中国昂首进入了深深改变国家、党和人民命运的改革开放时代。四十年后的2018年11月14日,习近平总书记强调,庆
简述了基于GMR的三维焊缝检测传感器。为解决焊接加工自动化过程中空间焊缝的跟踪检测,将GMR焊枪悬浮高度传感器、焊缝检测传感器以及相应的微处理器有机结合并集成,用于检测跟
随着数据速率的提高,时钟抖动分析的需求也在与日俱增。本文探讨参考了时钟的作用和时钟抖动对数据抖动的影响,并讨论在E5052B信号源分析仪(SSA)上运行的AgilentE5001A精确时钟抖动分析应用软件所配备的全新测量技术。