基于隐条件随机场的异构Web数据源数据抽取算法研究

来源 :科技通报 | 被引量 : 0次 | 上传用户:luzhiqing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种基于改进的隐条件随机场的异构Web数据源数据抽取算法。通过对隐条件随机场进行的改进,对隐含变量进行更为准确的计算,并且克服了该模型的性能严重依赖于初始参数选择的问题,而且进行模型训练时不需要大量的人工标注的样本数据。实验结果表明,对比已有方法,本文算法在对具有缺省属性以及多属性特征的网站进行数据抽取时,在查全率,查准率以及F1值上都获得了令人满意的性能。
其他文献
宁粳38号是宁夏农林科学院农作物研究所选育的优质、食味优良水稻品种,2006年2月通过宁夏农作物品种审定委员会审定。
农业在川东北区域经济发展中具有举足轻重的地位,加快该区域的农业产业化经营对于促进农业进步,增加农民收入,推进新农村建设,具有极其重要的意义.分析了川东北区农业产业化
腰椎穿刺术的目的是抽取脑脊液进行诊断治疗。由于患儿的年龄不同,自觉配合力差等特点,在穿刺中不断地器闹和反抗,使穿刺不能顺利进行,而采用自制带固定患儿配合腰穿,方法简单,易于
膜侧沟播栽培技术明显改善了作物生长的环境条件,适合干旱、半干旱雨养农业区气候、土壤和耕作特点。介绍了该技术的综合效益和栽培技术要点。 Film-side Sowing cultivatio
利用采自黑龙江省胞囊线虫病区的野生大豆与丰产性好、综合性状优良的栽培大豆品种(系)进行单交和三交,创新出农艺性状优异、中抗大豆胞囊线虫病的新种质。结果表明,利用野生大