【摘 要】
:
中文自动分词是中文信息检索中预处理工作的一部分,也是中文信息检索技术中的重要问题之一。针对在信息检索中完整词整体表达更有意义、更能体现用户查询目的的问题,结合完整
【机 构】
:
江西财经大学信息管理学院,江西财经大学数据与知识工程江西省高校重点实验室,南昌大学人文学院
【基金项目】
:
国家自然科学基金资助项目(60763001),江西省自然科学基金资助项目(2007GZS0082)
论文部分内容阅读
中文自动分词是中文信息检索中预处理工作的一部分,也是中文信息检索技术中的重要问题之一。针对在信息检索中完整词整体表达更有意义、更能体现用户查询目的的问题,结合完整词的成词特点,将互信息和完整词前后缀的计算,与组成完整词的可信度相关联,提出基于可信度的三种中文完整词自动识别方法,分别构成基于全信度、偏信度,以及前两者加权平均的混信度的完整词识别方法,设计及实现了基于可信度的三种完整词自动识别中文分词原型系统。最后给出了对第二届SIGHAN(2005)北京大学测试集语料的各项实验测试结果和分析,结果表明该原型
其他文献
新的蜂窝电话用锂离子电池国家标准今年7月1日起就要执行,广大企业急切想了解新国标与原有的行标有何不同?本文对此问题作了较详尽的介绍和说明,对贯彻标准具有指导意义.
结合实例讲述了利用激光进行无接触焊接已成为电子焊接领域中实用性强且效率高的重要手段.
目的初步报告晶状体超声乳化吸除术及后房型人工晶状体植入术治疗极高度近视的疗效.方法对2002年1月~2002年3月收治的极高度近视患者3例(6只眼),施行晶状体超声乳化吸除术及后
事件关系检测是一项面向事件之间逻辑关系的自然语言处理技术.事件关系识别的核心任务是以事件为基本语义单元,通过分析事件的篇章结构信息及语义特征,实现事件逻辑关系的深