中文文本中时间信息抽取及规范化方法

来源 :测绘科学技术学报 | 被引量 : 4次 | 上传用户:juwenfeng163
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间信息抽取和规范化表达在时空泛在信息处理、关联、聚合和内容服务中具有重要作用。设计并实现了一种基于规则的时间信息抽取和规范化表达的方法。首先,结合中文文本中时间信息描述的特点,定义了基本时间单元和派生时间单元,并由时间单元组合形成不同的时间表达式;然后,构建了时间词汇词典和时间表达式抽取的正则表达式模板;最后,设计了时间推理和计算的方法,实现了时间信息的规范化表达。基于中文文本语料进行了时间信息抽取测试。实验结果表明,本文方法具有较好的时间信息抽取效果。
其他文献
目前翻译界讨论较多的是译文中句式的连贯以及译文是否增加了原文所没有的歧义等问题,本文则从如何解读意义隐含这一角度,从影响语境的5个方面出发,考虑译者如何使译文读者达