论文部分内容阅读
汉字编码输入一直是汉字信息处理领域中参与人数最多、研究得最多、讨论得最热烈、产品竞争最激烈的领域。虽然目前的汉字编码输入法已有成千上万,然而对它的研究热潮仍然一浪高过一浪。纵观为数众多的汉字编码输入法,大多为低水平的重复设计和开发,技术上的突破很少,理论上的创新就更为罕见了,造成了巨大的人力、物力和财力的浪费。本文在全面分析汉字编码键盘输入法的历史和现状的基础上,以信息论和软件工程为指导,结合认知心理学和人体工程学原理,根据用户的实际需要,从理论和实践两方面着手来研究汉字编码输入法,建立了一个科学的汉字编码输入系统模型,阐述了汉字编码输入法的几项重要评测指标,设计和实现了一套综合性能非常优秀的汉字编码输入法——声笔系列码。本研究的结果表明:(1)汉字编码输入法的研发是一个系统工程,必须在编码层面和软件层面同时改进才能取得理想的效果。(2)“易学的不快,快的不易学”这一对缠绕人们多年的汉字输入法研究和使用中的矛盾是可以解决的。(3)汉字信源的统计特征对具体用户来说不是一成不变的,而变化的统计特征可以被利用来提高汉字输入的效率。(4)汉字输入时的人机交互应当适可而止,不能过多也不能过少。(5)汉字编码输入法可以基本上实现在通用键盘和数字键盘上的互操作。(6)大型数据库用于汉字编码输入法是可行的和有效的。(7)通过对数字键盘上字母的布局进行适当的调整,结合巧妙的编码方法,完全可以实现在数字键盘上简单、快捷地输入汉字和英文,包括各种标点符号和带调汉语拼音字母。(8)使用汉字读音特征进行编码的输入法必须解决好不认识的字的输入问题,否则该输入法就是不完备的。声笔系列码的实验结果说明:(1)声笔系列码中的声笔码、音笔码和声笔数码都符合国家规范。(2)声笔码比全拼还易学、易用,同时速度上已接近五笔字型。(3)音笔码的学习难度仅与双拼相当,易于盲打,比五笔字型容易得多,对一般的连续文本动态其平均码长却比五笔字型缩短了约10%。(4)声笔数码与T9拼音、T9 笔画的学习难度相当,人机交互比它们少得多,其动态平均码长比T9 拼音缩短了约36%,比T9 笔画缩短约12%。