中文机构名称的自动识别

来源 :大连理工大学 | 被引量 : 0次 | 上传用户：whfork

【摘要】

：

中文机构名称的自动识别对提高汉语自动分词的精确率有着重要的意义，也是自然语言理解、机器翻译、信息抽取和信息检索的基础。由于机构名称和姓名同属于专名，而且两者在组

【作者】

：

张艳丽

【机构】

：

大连理工大学

【出处】

：

大连理工大学

【发表日期】

：

2003年期

【关键词】

：

自然语言处理专名中文机构名称单词频度双词同现频度

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

中文机构名称的自动识别对提高汉语自动分词的精确率有着重要的意义，也是自然语言理解、机器翻译、信息抽取和信息检索的基础。由于机构名称和姓名同属于专名，而且两者在组成上有一定的相似性，本文首先对中文姓名和中文机构名称进行了对比研究。根据机构名称的特点，并参照中文姓名的识别系统，利用统计方法建立了机构名称特征词词典、前部词词典、单词词典、双词接续词典，综合考虑机构名称上下文以及机构名称本身的构词能力，设计并实现了以统计为主的机构名称识别系统。由于机构名称长度的不确定性以及用词用字的复杂性，导致机构名称左边界的确定是识别的难点，因而本文根据对汉语语法知识以及实际语料的分析，对机构名称前词进行了研究和分类，总结了有效的规则，以进一步提高机构名称左边界识别的正确率。通过对实际语料的测试，该模型闭式精确率和召回率分别达94.17％和91.50％，开式精确率和召回率分别达92.40％和86.48％。

其他文献

入侵检测系统的研究

该论文首先对现在的入侵技术、模型进行了系统分析研究;继而综合应用软件工程、数据融合、人工智能、知识表述与获取以及分布式系统理论和技术,从检测模型、系统原型、检测算

学位

入侵检测入侵检测系统模型检测性能分类检测算法

用UML和SystemC进行嵌入式系统的系统级设计

嵌入式系统的软硬件协同设计技术可以缩短系统的开发周期,降低开发费用,提高设计质量,使产品具有更强的市场竞争力.所以,它已经成为当前EDA领域的热点研究问题.目前,国内外许

学位

嵌入式系统软硬件协同设计系统级设计UMLSystemC

Web服务器集群研究及其二级负载平衡策略设计与实现

随着计算技术和网络技术的飞速发展，Web服务在商业领域得到日益广泛的应用，已经成为人们共享信息的重要方式。但是，通过一台高性能计算机已经很难满足日益增长的服务质量要求，提

学位

Web服务Web服务器集群负载平衡自相似性

流媒体在IPSEC和VLAN上的性能分析

该文在研究了流媒体传输对网络性能的要求的基础上,通过采用Net IQ公司的Chariot模拟了RealSystem的流媒体传输过程,着重研究了以下领域:1.流媒体在IPSEC上的传输性能分析.IP

学位

流媒体VLAN三层交换IPSEC Frees/WAN吞吐量丢包率

基于结构化数据的广告语生成模型研究

学位

PBFLow：支持预调度与分组批处理的工作流管理系统研究

为了挖掘企业的潜能、提高业务处理效率、缩短业务过程的执行周期,人们提出了很多方法.通过压缩串行活动之间的空闲时隙或者使串行的活动重叠执行来提高业务过程中活动执行的

学位

工作流工作流管理系统分组批处理预调度XML

虚拟地理环境中SARS传播行为智能模拟研究

虚拟地理环境是近几年从地理信息系统和虚拟现实发展而来的一个新兴研究领域，是一种多用户的虚拟三维环境。虚拟地理环境以用户化身为主体，为用户相互间的协作决策提供了共享空

学位

虚拟地理环境AgentSARSGISJavaVRML

基于工程试验数据仓库的数据分析支撑环境研究

由于工程试验活动的复杂多变性，对工程试验数据的管理和分析处理的有效支持一直是数据处理领域的研究热点之一。数据仓库作为一种决策支持的技术在信息领域已被广泛运用。本文

学位

数据分析支撑环境工程试验数据仓库系统描述驱动框架信息集成

基于椭圆曲线的公钥密码系统的研究与实现

通过对目前研究现状的分析表明椭圆曲线密码系统的安全性是很高的.最有效的攻击方法也必须面对指数阶的运算量,这在实际中是不奏效的.椭圆曲线密码系统已经成为众多国际标准

学位

密码学加密/解密椭圆曲线系统离散对数问题数字签名信息安全有限域

面向对象建模技术在软件开发中的应用研究

本文首先阐述了几十年来软件开发一直出现成本高、质量低、进度缓慢、不能按时交付用户等问题的主要原因：(1)难于真正理解系统需求；(2)软件开发没有遵循一个确定的、供开发人员

学位

面向对象建模统一过程UMLUnified Modeling Language

中文机构名称的自动识别

其他学术论文