面向普适计算办公环境的汉语处理技术的研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:digitalmachinec
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
普适计算的真正目的在于实现以人为本的计算,它使计算和通信能力无处不在地融合在人们生活和工作的现实环境中。其中人机交互的便利性和友好性是必需的,其对于系统的自然语言理解和处理能力有了更高的要求,使得系统能在不干扰人们注意力的同时,理解用户的需求,为用户主动地提供服务。 本文主要研究普适计算办公环境下的汉语语言处理技术,实现自然语言处理的平台,为后续的工作提供语法和语义处理接口。论文主要着眼于语法分析的研究,目的在于实现一个适用于本环境的语法分析系统。该系统分解为分词、词性标注和句法分析三个主要任务来进行,将这三个任务合并为分词和词性标注模块、句法分析模块两个模块来实现。分词和词性标注模块根据普适环境下语言的特点,采用基于词典的增字的最大词长匹配算法;句法分析模块采用改进的基于上下文的Chart算法,对传统的Chart算法添加了连看和剪枝功能,降低了冗余边的产生概率,提高了算法的分析效率和准确率。在分析了它们各自的特点和研究方法之后,分别给出了两个模块使用的算法流程、分析策略、实现过程,并给出了算法的简单分析。 最后,本文对所做的工作进行简单的总结和展望,并提出了后续语义分析的研究思路。
其他文献
数字信息存储已经成为了现代社会的基础,大容量数字存储技术的发明已经宣告了一个新时代的来临,其重要性可以与印刷技术的发明相媲美。信道编码技术是实现大容量可靠的数据存
网格技术被誉为继互联网和Web之后的第三次信息技术浪潮,网格把整个互联网整合成一台巨大的超级计算机,实现计算资源、存储资源、通信资源、软件资源、信息资源、知识资源的全
近年来,说话人识别(Speaker Recognition)领域各种特征信息提取手段层出不穷,模型识别技术日新月异,给实验和研究带来一定的挑战,目前已有的软件平台的在覆盖面和扩展性上已经不
在计算机科学领域,数据存储一直以来都是研究的重点。网络存储由于所采用的技术和协议不同,逐渐形成了不同类型的网络存储架构,其中附网存储光纤通道存储区域网是应用最为成
无线传感器网络已引起了许多国家学术界和工业界的高度重视。它被认为是对二十一世纪产生巨大影响力的技术之一,有广泛的发展前景。当前传感器网络的研究和应用都是以实现数据
近年来,在全球新科技革命浪潮的推动下,以现代信息技术的广泛深入应用为特征的远程教育随着互联网的普及和社会需求的增长迅速发展,已成为我国教育事业的重要组成部分。同时远程
在计算机动画中,人物角色的动画通过动作数据来驱动和表达的。动作数据有很多生成方式,包括关键帧动画、动作捕捉、物理模拟、动作编辑和重用等。动作重用作为一种动作生成手段
自上世纪八十年代,Marr提出视觉系统框架以来,计算机视觉得到了长足的发展,涌现出不少新的研究方向,如图像分割、运动视觉分析、三维恢复重建、物体建模与识别以及立体视觉等。本
随着信息技术的发展,作为医院数字化核心的PACS(医学影像存储与传输系统)越来越受到人们的关注。海量的医学图像数据要求PACS系统提供巨大容量的存储空间来保存;在PACS中,图像数
随着无线网络技术和音视频技术的发展,移动多媒体应用在人们的生活中扮演越来越重要的角色。为有效利用有限的带宽资源,多媒体数据在传输之前必须进行压缩,同时为保证网络多