基于网络用户信息的个性化拼音输入法研究与实现

来源 :中国科学院软件研究所 | 被引量 : 0次 | 上传用户:phlok1985
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉字输入技术是中文信息处理领域特有的一项基础性关键技术,中文输入法是中文用户使用计算机必备的应用软件。依赖于键盘的中文输入法可以分为两大类:基于汉字字形和基于拼音的输入法。据统计,拼音输入法是计算机用户最常用的汉字输入工具。   在互联网高速发展的今天,随着Web2.0以用户为中心的网络环境的流行,普通用户已经成为信息的发布者,而这对中文输入技术提出了更高的要求。因此,在这个时代背景下,如何进一步提高中文输入法的效率成为一个既有挑战性又有实际应用价值的研究课题。我们在分析了现有拼音输入法的基础上,主要在以下几个方面做了一些研究:   ●实现了一个基于统计语言模型的音字转换系统。针对音字转换系统中基于字的统计语言模型的一些问题进行了研究,提出了利用更多上下文信息来改进语言模型的方法,最后设计实验进行了验证和分析。   ●改进了基于分层隐马尔可夫模型的音字转换解码方法。对音字转换中拼音流切分作了分析,发现拼音流切分存在歧义,而且这些歧义对音字转换的准确率存在较大影响,提出了利用统计语言模型辅助拼音流切分的方法,最后设计实验进行验证。   ●对网络用户常用的应用以及用户的个性化因素(用户的聊天记录,浏览历史,搜索引擎查询历史)进行了分析与研究,实现了基于网络用户信息的个性化拼音输入法,提高输入法系统性能和用户输入体验。
其他文献
绘制技术是计算机图形学的关键领域,有真实感与非真实感两大分支。真实感绘制生成高度逼真的画面。非真实感绘制产生抽象和艺术两种效果,其中抽象化图像能够提高人们的视觉沟通
本文针对物理链路可靠性低、容错性要求高、实体异构程度高的基础设施网格化需求,在系统分析当前主流的网格体系结构的基础上,研究了移动代理(PVM)系统的特性,根据移动代理的特
企业数据仓库的建设,是以现有企业业务系统和大量业务数据的积累为基础的。然而由于各种原因,如人工操作的误输入、网络传输错误等,各个业务系统内部的数据本身存在着一些问题,如
增量启发式搜索是一种利用先前的搜索信息和启发信息提高本次搜索效率的方法,通常可用来解决动态环境下的重规划问题。在人工智能领域,一些实时系统常常需要根据外界环境的变化
无线位置感知技术研究利用无线信号确定和跟踪移动设备的位置,是普适计算中的一项重要技术。随着Wi-Fi接入点的广泛覆盖,基于Wi-Fi的室内外定位系统已经成为热门的研究领域。本
大量的硬件和软件系统广泛应用在一些重要的领域,在许多情况下错误和失效是不可接受的。需要提供方法来检验软硬件的正确性,增强我们对软硬件系统的信心。形式化验证提供了提高
星地链路加密通信是卫星通信系统安全防护的重要内容,在军事和商业中都有明确的需求,而安全技术对星地链路传输过程的影响分析则是卫星系统设计中必须考虑的问题,本文就是针对星
分布式应用的飞速发展让结点平台的可信保障成为信息安全的研究热点。传统计算机平台的信息安全技术很难满足分布式计算环境的安全需求。可信计算技术通过引入可信硬件作为“
目标识别技术在现实生活中的很多领域都有广泛的应用,但是由于遮挡,视角变换等因素的影响,目标识别技术仍面临着巨大的挑战。局部特征由于其本身同有的局部性,引起了人们的重视。
软件测试是保证软件质量的重要手段.随着软件技术的发展,软件的规模越来越大,程序的复杂度也逐渐增加.软件测试也由原来的人工操作逐渐走向自动化.自动化软件测试已经成为国内