基于CRF和半监督学习的中文时间信息抽取

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:yaping3211
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为提高文本中时间信息识别和抽取的效率,提出一种基于CRF(条件随机场)的方法。根据时间信息表现出的一般特点,采用机器学习的方法,通过分析文本中相关词性、短语结构和上下文信息等,提取时间信息的外部特征,采用一种自训练的半监督方法,使用CRF进行识别和抽取。实验结果表明,该方法有效提升了时间识别的性能,在显性时间、隐性时间和总体时间上分别取得了96.25%、88.65%和93.97%的F1值。
其他文献
目的探讨聚焦解决模式在提高老年人全髋关节置换术后生活质量的效果。方法将72例全髋关节置换术后老年患者分成观察组和对照组各36例,对照组采用常规护理,观察组在此基础上应
近代日本的武士道文化是对先前武士道精神的推陈出新,体现了道德、文化的共通与变异。它继承了先前武士道精神的许多优良品质与德行,同时,在历史发展的进程中,它又逐渐变更了
针对应用层DDoS(application layer DDoS,App-DDoS)攻击,提出一种基于用户忠实度的ULDM(user loyalty defense model)防御模型,其根据用户对网站的忠实程度来区分正常用户和
利用分布拟合优度检验方法,对DCT系数分布模型进行了研究。通过理论分析和实验,验证了KL散度更适合作为DCT系数分布拟合优度度量;针对单个位置和不同范围的DCT系数,系统地比
蜡酯在生物体的生命活动中起重要作用。文中综述了不同生物体中蜡酯合成途径及关键酶的特征,及蜡酯合成相关基因的异源表达和利用基因工程技术提高蜡酯异源合成产量的方法,旨
中国现代文学与马华现代文学的关系是一个很有意思的论题,从中国"五四"新文学在马来西亚的传播和接受到当下马华文学对中国现代文学(包括中国大陆文学和作为中国大陆文学支流
近年来我国国有企业改革中EVA的绩效考核是十分重要的举措,国务院国有资产监督管理委员会(国资委,下同)在2010年起对中央企业全面推行EVA业绩考核标准。本文主要分析了EVA的
中外合资企业的财务会计工作是企业内部财务及管理的重心。如何更好的建立健全中外合资企业的财务与管理体系,需要中外双方的共同努力。从我们自己的经历来看,中远集团50%股
1949-1956年间新中国的新闻事业在制度层面和运作机制上都实现了与国家机器的高度协同。新生国家政权实现了对社会直接全面的组织控制,建立起从国家领袖到普通工农群众的权力
委婉语在现代文明高度发展的过程中发挥着越来越重要的作用,特别是在西方的政界、宗教界、商界以及人们的日常生活中使用得越来越频繁。因此,商家也应在广告英语的语言特色上