论文部分内容阅读
摘 要:20世纪以来,现代汉语字母词应用研究成果不断增多。目前已有的字母词综述性文章,对其理论研究成果梳理较多,应用研究提及较少。本文综述了现代汉语字母词在语言调查、社会调查和中文信息处理三个领域的应用研究成果。
关键词:字母词 应用研究 综述
一、引言
词汇是语言系统中最活跃的要素,直接反映社会发展和语言变化。一种语言对词汇形式的自然选择也能够反映出人类实践中认识和思维倾向的发展。语言要素由音、形、义三部分组成,字母词在语音和构形上都与汉语中的其它词汇成员不同,这体现了字母词在形式上的特殊性。字母词形式简洁、醒目,随着外来新事物、新概念的引入和中国人外语整体水平的提升,字母词成为引进外来词和产生新词的一种被接受程度越来越高的词汇形式。字母词曾经在语言学界引发了很多研究课题,是一种在社会上引起热烈讨论的语言现象。
字母词理论研究已经取得了很多成果。什么是字母词,字母词属于汉语系统还是外语系统,哪些属于汉语字母词,这些问题引起了热议。随着字母词使用量增大,形式纷繁复杂,以怎样规范使用字母词的研究为标志,带动了对字母词来源、读音、分类、词典编纂、教学等多角度研究成果的出现。目前,字母词的使用状况,用“广泛使用”“全民使用”这两个词来概括已经不为过。立足当下字母词使用的现实状况,反观之前的研究论题就不够全面和与时俱进了。实际上,字母词研究迫切需要能够真实反映语言生活中字母词使用状况的报告,以助益于字母词研究、习查的工具软件及在中文信息处理领域与字母词相关的研究成果。
二、字母词研究概况
字母词形式上的特殊性,使它成为词汇研究所关注的热点问题之一,产生了一大批研究成果。单就“中国期刊全文数据库”中的论文,以“字母词(语)”为篇名关键字进行检索,得到的文章就有215篇。①字母词研究论文的时间分布见图1。
图1:中国期刊全文数据库中“字母词(语)”研究论文数量的时间分布图
从图1可看到,从1999年至2009年这十年间,是字母词研究最蓬勃的时期。世纪之交,新事物和新概念势必引起词汇系统的变化,新的专名和术语不断引进和产生,最经济、最快速的追求势必使得“字母词”这种词汇形式占据优势。字母词的大量涌现是字母词备受关注的重要原因。
研究字母词的论文研究角度多样,涉及字母词的诸多方面。字母词的研究内容分布情况见表1。
表1:中国期刊全文数据库中“字母词(语)”研究论文内容分布表
研究内容 论文篇数(篇) 占总数的百分比(%)
字母词的定义 19 8.37
字母词的读音 9 4.19
字母词产生途径和原因 10 6.51
字母词构成和特点 7 3.72
字母词语法研究 1 0.47
字母词的规范 33 16.74
字母词个案研究 15 6.98
字母词使用研究 48 23.26
字母词CIP研究 5 2.33
字母词词典编纂和书评 10 4.65
字母词对外汉语教学 3 1.40
字母词多角度研究 39 18.14
字母词研究综述 7 3.26
总 计 215 100
表1显示:第一,对字母词使用状况的研究所占比例最高,其次是对字母词的规范研究和多角度分析描写。第二,除理论研究外,字母词使用研究和字母词中文信息处理(CIP)领域研究作为字母词应用研究的代表,也取得了一定成果。
除发表的论文外,还出版了两本字母词词典,分别是刘涌泉编著的《汉语字母词词典》(2001年版和2009年版),沈梦璎主编的《实用字母词词典》(2002年版)。
字母词研究的专著目前尚属空白。不过,相关的博士论文有两篇:郑泽芝(2005)《基于动态流通语料库(DCC)的汉语字母词语识别及考察研究》和邹玉华(2006)《现代汉语字母词研究》。
字母词研究的内容涉及面广,有针对一个或几个字母词的个案研究,但多数是针对字母词整体的研究;有从一个层面或角度的深入研究,也有多角度的全面研究;有理论上的分析,也有语言使用中的调查研究和教学探讨,还有针对自然语言处理所作的专门研究。研究成果除了论文外,还有对词典编纂的指导性建议和字母词识别、标注的工具软件开发。
三、字母词与汉语词汇系统
最早对字母词下定义的是刘涌泉(1994),认为字母词是指汉语中带外文字母(主要是拉丁字母)或者完全用外文字母表达的词,前者如“B超、卡拉OK”,后者如“CD、UFO”。它是一种新形式的外来语。刘涌泉(2002)修改了定义,认为称为汉语字母词或中文字母词(Chinese lettered words)更合适,指“由拉丁字母(包括汉语拼音字母)或希腊字母构成的或由它们分别与符号、数字或汉字混合构成的词”。强调了字母词属于汉语词汇系统和字母词是中文这种非字母构词语言特有现象的性质。与他持比较一致观点的还有郭伏良(1997)、沈孟璎(2001)、周健等(2001)。
关于字母词包含的对象,各家观点不一。周玉琨(2002)认为,字母词是指含有西文字母的外来词,是从书面角度说的,与“汉字词”相对,他只承认西文字母构成的才是字母词,汉语拼音字母构成的,如“GB、HSK”不是字母词。胡明扬(2002)认为,只有像“GB、HSK”这样由汉语拼音缩略构成的词才能说是“汉语字母词/语”;像“X光、γ射线”那样包含外文字母的词可以称为“外文字母词”或“西文字母词”;像“WTO、DNA、CD”那样的外文缩略语只能说是“原装外文缩略语”。慧生(1995)和黄文贵等(2002)认为,外文字母加汉字语素构成的词语才是字母词,外文缩略语不是字母词。汉语字母词应该是已经汉化、具有汉语特征的词,它可以或已经融入汉语词汇系统中。多数学者认为外文原词不是字母词,而刘涌泉(2001)、刘建梅(2002)将部分外文原词也列入字母词范围。
对汉语字母词对象认定的代表性的观点有4种,以刘涌泉(2001)等文献认定的集合最大,其它3种观点各取其真子集。探究争论的焦点,主要集中在字母词中字母的来源,外语原词是不是字母词和是否含有汉字,即汉化才是字母词等问题上。
字母词本身是从形式角度定义的,从认知语言学角度,我们赞同邹玉华(2006)运用原型理论解释认定字母词范围差异的观点:每个人心目中,对字母词原型的认识不同,因此,在面向含有字母的词汇成分时,所调动的认知相似性和联系也不同,这就导致了大家对字母词对象认定的差异。
概率、典型性和隶属度是定性研究的重要特征。对字母词典型性的探讨,有代表性的观点的提出者是潘雪莲(2006)和邹玉华(2006)。潘雪莲根据语感将字母词分为非典型字母词和典型字母词,非典型字母词包括字母符号、拼音缩写和未经缩写的外文单词原形;典型字母词包括直接移用的外文缩写,外文字母、外文缩写和汉字的组合,利用字母自身的性质创造的词。邹玉华将原型理论引入字母词典型性界定,制定了认定字母词典型性的4个因素:形体大写、读字母名称音、与汉字组合和缩略。含有的典型性特点越多,字母词典型性越强。我们认为,邹玉华的方法具有采用一套形式化的方法来界定概念的特点。
词汇系统的变化主要表现在词形和词义的变化上。新词形的产生无外乎外来词和自造词两类,在这两类词语中,字母词都占据一定的数量。它们之间的关系可以表示为图2。
图2:字母词与汉语词汇系统的关系
字母词在汉语词汇系统中,与新词语产生和语言监测工作关系密切。在2009年9月召开的“国家语言资源监测与研究中心暨平面媒体中心成立五周年纪念学术会议”上,有声媒体语言分中心的侯敏教授介绍了语言监测的两个层面:语言形式监测和语言内容监测。字母词的监测研究正是语言形式监测的一项重要内容。
可见,字母词研究发端于理论探讨和规范制定,目前,正从理论研究走向应用研究。对字母词使用状况的语言调查、社会调查和中文信息处理领域等一系列应用领域研究成果的综述,将助益于字母词应用研究的深入和视角的扩展。
四、字母词使用状况调查研究
字母词在汉语中普遍存在,在报纸、广播、电视、网络等媒体,书面语和口语中,字母词都发挥着作用。汉语中字母词的使用可以追溯至1903年《新尔雅》中对“X光”一词的记载。但是,字母词广泛使用是在改革开放以后。《字母词使用规范方案研制报告(2006修订稿)》对《人民日报》(2002.11.16~2002.12.15)的文章(不算广告和天气预报)检索发现,字母词共出现748次,平均每天出现24.9次。《现代汉语词典》(第5版)收录“西文字母开头的词语”182个。可见,字母词已被大众、媒体和辞书接受。
字母词使用状况的语言调查研究分为共时研究和历时研究。最早的历时调查研究是皇甫素飞(2004)对《文汇报》从1938年创刊至1999年的语料中字母词的词频和种类的定量统计,结果发现,字母词绝大部分出现在改革开放以后,90年代字母词使用频次最高,增幅最大,种类最多,使用领域最广泛。共时研究成果主要有:从语体分布角度,原新梅(2005)发现,从总体上看,字母词在新闻语体、科技语体中分布较多,而在政论语体、文学语体、公文语体中数量有限,且涉及领域较窄。关润芝、杨建国(2005)对2002年《人民日报》全年语料中带标点的字母词自身特征和标点出现情况进行了分析。杨建国、郑泽芝(2005)对2002年《人民日报》全年语料中字母词和汉字词在专名中同现的情况进行了调查,并对如何规范使用字母词提出了思考。郑泽芝、张普(2005)对2002年《人民日报》全年语料进行了调查,得到ELWP(字母词语工程定义)在该语料中使用情况的分类,并对单字母ELWP、含数字ELWP的分类分析和并列结构ELWP处理等问题进行了探讨。《中国语言生活状况报告(2006)》(下编)对报纸、广播电视、网络(新闻)的字母词使用状况进行了调查,结论是:字母词已经成为汉语词汇的一部分;字母在汉语中最经常、最主要的作用就是指代、排序;典型字母词的造词方式主要是简缩;异形字母词量大,使用频率不同;同形字母词量大,有时会影响交际;字母词音、形、义之间关系复杂多样;典型字母词主要用于专业术语;字母词的书写错误现象比较严重;带字母的分词单位在不同媒体中使用频度不同。邹玉华等(2006)对字母词占据数量最多的术语字母词使用状况进行了考察,发现术语字母词的使用与文章领域相关,科技和经济领域文章使用术语字母词最多。邹玉华等(2007)通过对字母词在当代汉语中使用状况的分析发现,字母词的使用密度和文章领域相关,和报纸地域、性质无关。其中,科技领域使用密度最高,其次是教育领域、经济领域,使用密度最低的是军事领域和政法领域。郑泽芝(2009)“字母词语跟踪研究”一文采用共时调查和历时调查两种方法,对汉语字母词的使用范围、稳定性、用法等情况进行了探讨,这是目前所得到资料中,对真实文本中字母词使用概况所进行的一项较大规模的调查研究。
语言领域中字母词使用状况研究最多的是对报刊语言的研究。陈佳璇、胡范铸(2003)对2002年8月全国15种报纸使用字母词的形式、种类、分布和使用频次等情况进行了定量分析。陈佳璇、聂桂兰(2006)通过对新闻语言中字母词的易读性测量发现,文化程度高低和语境有无对字母词理解产生影响,而使用频次与理解度不构成必然联系。散见的还有对体育新闻、网络语言、广告语言中字母词使用情况的调查分析。
字母词使用状况社会调查研究中,语言态度的调查是一项重要内容。研究成果主要有:邹玉华等(2005)关于汉语中使用字母词的语言态度的调查发现,职业是影响字母词态度的重要因素,性别、年龄、文化程度与字母词的态度关系不大。曹钦明(2005)通过对字母词的流通度差异调查发现,社会人群的性别、年龄、受教育程度、职业因素对字母词使用与否的倾向性均不产生统计学上的显著影响。裴昕月(2007)通过对大学生常用字母词使用情况调查,归纳出大学生这一特定人群使用字母词的规律、特点和影响因素。字母词的知晓度是字母词社会调查的又一个重要方面,邹玉华(2006)字母词知晓度的调查报告分析了职业、性别、年龄、教育程度对字母词知晓度的影响,其中,职业是影响知晓度的主要因素,其次是教育程度,性别和年龄对字母词的知晓度不构成影响。原新梅等(2007)对留学生这个特定人群的字母词知晓度进行了调查,考察国籍、母语、年龄、性别、汉语水平、英语水平、对英语的态度、受教育程度等因素对字母词知晓度的影响。
五、字母词在中文信息处理领域的研究
字母词散布在汉语文本中,并具有一定的形式特征,研究者希望可以自动提取字母词,这是文本检索的一项内容。另外,字母词识别的正确性也关系到中文文本的自动分词和标注等,因此,字母词的识别和提取研究成为字母词在中文信息处理领域研究中涉及最多的内容。
郑泽芝等(2005a)在对字母词在大规模真实文本中的分布情况进行分析时发现,字母词所含标点,非汉字串与汉字串分合,字母词词种数辨认和等义同现问题成为字母词提取中的难点。在此分析基础上,郑泽芝等(2005b)运用字母串作为锚点,从中心向两边扩展的规则加统计的方法进行了字母词自动提取,召回率100%,准确率80%以上。郑泽芝(2007)后来改进上述思想,提出了一种字母词的自动标注算法。
关于词语流通使用度的研究,尹斌庸等(1994)和孙茂松(2000)曾经有文章探讨。郑泽芝(2009)探讨了字母词通用程度的评判方法。文章将绝对指标方法、通用度方法和散布均匀度方法进行了比较,散布均匀度方法效果较好。
六、结语
语言理论研究和应用研究在语言研究中相辅相成,相互促进。字母词研究发端于理论探讨,已有的综述性文章也对这部分研究成果梳理较多。对字母词在使用状况的调查研究和中文信息处理领域的研究探讨进行描写和综述,不仅可以弥补已有字母词综述性文章介绍理论研究成果多,应用研究成果少的缺憾,而且也将促进字母词应用的深入研究,并引发对理论研究争议的重新思考。
注 释:
①检索结果截止到2009年12月31日。
参考文献:
[1]曹钦明.字母词的社会流通度考察[J].广西社会科学,2005,(4).
[2]陈佳璇,胡范铸.我国大众传媒中字母词使用状况的调查与分析
[J].修辞学习,2003,(4).
[3]陈佳璇,聂桂兰.试论我国新闻语言中字母词的易读性测量[J].
韩山师范学院学报,2006,(1).
[4]关润芝,杨建国.字母词语块中“标点”的使用状况考察[J].语
言文字应用,2005,(1).
[5]郭熙.字母词使用规范方案研制报告(2006修订稿)[R].暨南大
学,2006.
[6]郭伏良.字母词与词典二题[J].河北大学学报(哲学社会科学版),
1997,(2).
[7]国家语言资源监测与研究中心.中国语言生活状况报告(2006)
下编[R].北京:商务印书馆,2006.
[8]胡明扬.关于外文字母词和原装外文缩略语问题[J].语言文字应
用,2002,(2).
[9]皇甫素飞.从《文汇报》看汉语字母词的历史演变[J].修辞学习,
2004,(5).
[10]黄文贵,谢英捷.汉语中外来词语的规范问题[J].江西农业大
学学报(社会科学版),2002,(3).
[11]慧生.也谈字母词[J].语文建设,1995,(7).
[12]刘建梅.现代汉字系统中外来字母规范浅议[J].语言文字应用,
2002,(1).
[13]刘涌泉.关于汉语字母词的问题[J].语言文字应用,2002,(1).
[14]刘涌泉.汉语字母词词典[Z].北京:外语教学与研究出版社,
2009.
[15]刘涌泉.汉语字母词词典[Z].上海:上海辞书出版社,2001.
[16]刘涌泉.谈谈字母词[J].语文建设,1994,(10).
[17]潘雪莲.略论字母词的定义与定位[J].科技术语研究,2006,
(2).
[18]裴昕月.大学生使用字母词情况调查[J].中国科技术语,2007,
(6).
[19]沈孟璎.浅议字母词的入典问题[J].辞书研究,2001,(1).
[20]沈孟璎.实用字母词词典[Z].上海:汉语大词典出版社,2002.
[21]孙茂松.关于词汇使用度的初步研究[J].语言文字应用,2000,
(1).
[22]薛笑丛.现代汉语中字母词研究综述[J].汉语学习,2007,(2).
[23]杨建国,郑泽芝.汉语文本中字母词语的使用与规范探讨[J].
语言文字应用,2005,(1).
[24]尹斌庸,方世增.词频统计的新概念和新方法[J].语言文字应
用,1994,(2).
[25]原新梅,梁盟.留学生字母词语的知晓度[J].语言文字应用,
2007,(1).
[26]原新梅.字母词语在不用语体中的分布[J].河南社会科学,2005,
(1)
[27]张铁文.《现汉》“西文字母开头的词语”部分的修订[J].语
言文字应用,2006,(4).
[28]郑泽芝,张普,杨建国.基于语料库的字母词语自动提取研究
[J].中文信息学报,2005b,(2).
[29]郑泽芝,张普.汉语真实文本字母词语[J].语言科学,2005d,
(6).
[30]郑泽芝.基于动态流通语料库(DCC)的汉语字母词语识别及考
察研究[D].北京语言大学博士学位论文,2005c.
[31]郑泽芝.通用字母词语提取研究[A].国家语言资源监测与研究
中心暨平面媒体分中心成立五周年纪念学术会议论文集(讨论稿)[C].2009.
[32]郑泽芝.一种字母词语自动标注算法[J].厦门大学学报,2007,
(5).
[33]郑泽芝.字母词语跟踪研究[J].语言文字应用,2009,(1).
[34]郑泽芝.字母词语自动提取的几点分析[J].语言文字应用,2005a,
(1).
[35]中国社会科学院语言研究所词典编辑室.现代汉语词典(第5
版)[Z].北京:商务印书馆,2005.
[36]周健,张述娟,刘丽宁.略论字母词语的归属与规范[J].语言
文字应用,2001,(3).
[37]周玉琨.“GB”“HSK”是字母词吗?[J].汉字文化,2002,(1).
[38]邹玉华,马广斌,刘红,韩志湘.关于汉语中使用字母词的语
言态度的调查[J].语言教学与研究,2005,(4).
[39]邹玉华,马广斌,马叔骏,刘哲,马宇菁.字母词知晓度的调
查报告[J].语言文字应用,2006,(2).
[40]邹玉华,翟国忠,董春萍.术语字母词在当代汉语中的使用状
况考察[J].科技术语研究(季刊),2006,(2).
[41]邹玉华,翟国忠,董春萍.字母词在当代汉语中使用状况的分
析[J].佛山科学技术学院学报(社会科学版),2007,(2).
[42]邹玉华.现代汉语字母词研究[D].中国传媒大学博士学位论文,
2006.
(王秋萍 北京 中国传媒大学文学院 100024)
关键词:字母词 应用研究 综述
一、引言
词汇是语言系统中最活跃的要素,直接反映社会发展和语言变化。一种语言对词汇形式的自然选择也能够反映出人类实践中认识和思维倾向的发展。语言要素由音、形、义三部分组成,字母词在语音和构形上都与汉语中的其它词汇成员不同,这体现了字母词在形式上的特殊性。字母词形式简洁、醒目,随着外来新事物、新概念的引入和中国人外语整体水平的提升,字母词成为引进外来词和产生新词的一种被接受程度越来越高的词汇形式。字母词曾经在语言学界引发了很多研究课题,是一种在社会上引起热烈讨论的语言现象。
字母词理论研究已经取得了很多成果。什么是字母词,字母词属于汉语系统还是外语系统,哪些属于汉语字母词,这些问题引起了热议。随着字母词使用量增大,形式纷繁复杂,以怎样规范使用字母词的研究为标志,带动了对字母词来源、读音、分类、词典编纂、教学等多角度研究成果的出现。目前,字母词的使用状况,用“广泛使用”“全民使用”这两个词来概括已经不为过。立足当下字母词使用的现实状况,反观之前的研究论题就不够全面和与时俱进了。实际上,字母词研究迫切需要能够真实反映语言生活中字母词使用状况的报告,以助益于字母词研究、习查的工具软件及在中文信息处理领域与字母词相关的研究成果。
二、字母词研究概况
字母词形式上的特殊性,使它成为词汇研究所关注的热点问题之一,产生了一大批研究成果。单就“中国期刊全文数据库”中的论文,以“字母词(语)”为篇名关键字进行检索,得到的文章就有215篇。①字母词研究论文的时间分布见图1。
图1:中国期刊全文数据库中“字母词(语)”研究论文数量的时间分布图
从图1可看到,从1999年至2009年这十年间,是字母词研究最蓬勃的时期。世纪之交,新事物和新概念势必引起词汇系统的变化,新的专名和术语不断引进和产生,最经济、最快速的追求势必使得“字母词”这种词汇形式占据优势。字母词的大量涌现是字母词备受关注的重要原因。
研究字母词的论文研究角度多样,涉及字母词的诸多方面。字母词的研究内容分布情况见表1。
表1:中国期刊全文数据库中“字母词(语)”研究论文内容分布表
研究内容 论文篇数(篇) 占总数的百分比(%)
字母词的定义 19 8.37
字母词的读音 9 4.19
字母词产生途径和原因 10 6.51
字母词构成和特点 7 3.72
字母词语法研究 1 0.47
字母词的规范 33 16.74
字母词个案研究 15 6.98
字母词使用研究 48 23.26
字母词CIP研究 5 2.33
字母词词典编纂和书评 10 4.65
字母词对外汉语教学 3 1.40
字母词多角度研究 39 18.14
字母词研究综述 7 3.26
总 计 215 100
表1显示:第一,对字母词使用状况的研究所占比例最高,其次是对字母词的规范研究和多角度分析描写。第二,除理论研究外,字母词使用研究和字母词中文信息处理(CIP)领域研究作为字母词应用研究的代表,也取得了一定成果。
除发表的论文外,还出版了两本字母词词典,分别是刘涌泉编著的《汉语字母词词典》(2001年版和2009年版),沈梦璎主编的《实用字母词词典》(2002年版)。
字母词研究的专著目前尚属空白。不过,相关的博士论文有两篇:郑泽芝(2005)《基于动态流通语料库(DCC)的汉语字母词语识别及考察研究》和邹玉华(2006)《现代汉语字母词研究》。
字母词研究的内容涉及面广,有针对一个或几个字母词的个案研究,但多数是针对字母词整体的研究;有从一个层面或角度的深入研究,也有多角度的全面研究;有理论上的分析,也有语言使用中的调查研究和教学探讨,还有针对自然语言处理所作的专门研究。研究成果除了论文外,还有对词典编纂的指导性建议和字母词识别、标注的工具软件开发。
三、字母词与汉语词汇系统
最早对字母词下定义的是刘涌泉(1994),认为字母词是指汉语中带外文字母(主要是拉丁字母)或者完全用外文字母表达的词,前者如“B超、卡拉OK”,后者如“CD、UFO”。它是一种新形式的外来语。刘涌泉(2002)修改了定义,认为称为汉语字母词或中文字母词(Chinese lettered words)更合适,指“由拉丁字母(包括汉语拼音字母)或希腊字母构成的或由它们分别与符号、数字或汉字混合构成的词”。强调了字母词属于汉语词汇系统和字母词是中文这种非字母构词语言特有现象的性质。与他持比较一致观点的还有郭伏良(1997)、沈孟璎(2001)、周健等(2001)。
关于字母词包含的对象,各家观点不一。周玉琨(2002)认为,字母词是指含有西文字母的外来词,是从书面角度说的,与“汉字词”相对,他只承认西文字母构成的才是字母词,汉语拼音字母构成的,如“GB、HSK”不是字母词。胡明扬(2002)认为,只有像“GB、HSK”这样由汉语拼音缩略构成的词才能说是“汉语字母词/语”;像“X光、γ射线”那样包含外文字母的词可以称为“外文字母词”或“西文字母词”;像“WTO、DNA、CD”那样的外文缩略语只能说是“原装外文缩略语”。慧生(1995)和黄文贵等(2002)认为,外文字母加汉字语素构成的词语才是字母词,外文缩略语不是字母词。汉语字母词应该是已经汉化、具有汉语特征的词,它可以或已经融入汉语词汇系统中。多数学者认为外文原词不是字母词,而刘涌泉(2001)、刘建梅(2002)将部分外文原词也列入字母词范围。
对汉语字母词对象认定的代表性的观点有4种,以刘涌泉(2001)等文献认定的集合最大,其它3种观点各取其真子集。探究争论的焦点,主要集中在字母词中字母的来源,外语原词是不是字母词和是否含有汉字,即汉化才是字母词等问题上。
字母词本身是从形式角度定义的,从认知语言学角度,我们赞同邹玉华(2006)运用原型理论解释认定字母词范围差异的观点:每个人心目中,对字母词原型的认识不同,因此,在面向含有字母的词汇成分时,所调动的认知相似性和联系也不同,这就导致了大家对字母词对象认定的差异。
概率、典型性和隶属度是定性研究的重要特征。对字母词典型性的探讨,有代表性的观点的提出者是潘雪莲(2006)和邹玉华(2006)。潘雪莲根据语感将字母词分为非典型字母词和典型字母词,非典型字母词包括字母符号、拼音缩写和未经缩写的外文单词原形;典型字母词包括直接移用的外文缩写,外文字母、外文缩写和汉字的组合,利用字母自身的性质创造的词。邹玉华将原型理论引入字母词典型性界定,制定了认定字母词典型性的4个因素:形体大写、读字母名称音、与汉字组合和缩略。含有的典型性特点越多,字母词典型性越强。我们认为,邹玉华的方法具有采用一套形式化的方法来界定概念的特点。
词汇系统的变化主要表现在词形和词义的变化上。新词形的产生无外乎外来词和自造词两类,在这两类词语中,字母词都占据一定的数量。它们之间的关系可以表示为图2。
图2:字母词与汉语词汇系统的关系
字母词在汉语词汇系统中,与新词语产生和语言监测工作关系密切。在2009年9月召开的“国家语言资源监测与研究中心暨平面媒体中心成立五周年纪念学术会议”上,有声媒体语言分中心的侯敏教授介绍了语言监测的两个层面:语言形式监测和语言内容监测。字母词的监测研究正是语言形式监测的一项重要内容。
可见,字母词研究发端于理论探讨和规范制定,目前,正从理论研究走向应用研究。对字母词使用状况的语言调查、社会调查和中文信息处理领域等一系列应用领域研究成果的综述,将助益于字母词应用研究的深入和视角的扩展。
四、字母词使用状况调查研究
字母词在汉语中普遍存在,在报纸、广播、电视、网络等媒体,书面语和口语中,字母词都发挥着作用。汉语中字母词的使用可以追溯至1903年《新尔雅》中对“X光”一词的记载。但是,字母词广泛使用是在改革开放以后。《字母词使用规范方案研制报告(2006修订稿)》对《人民日报》(2002.11.16~2002.12.15)的文章(不算广告和天气预报)检索发现,字母词共出现748次,平均每天出现24.9次。《现代汉语词典》(第5版)收录“西文字母开头的词语”182个。可见,字母词已被大众、媒体和辞书接受。
字母词使用状况的语言调查研究分为共时研究和历时研究。最早的历时调查研究是皇甫素飞(2004)对《文汇报》从1938年创刊至1999年的语料中字母词的词频和种类的定量统计,结果发现,字母词绝大部分出现在改革开放以后,90年代字母词使用频次最高,增幅最大,种类最多,使用领域最广泛。共时研究成果主要有:从语体分布角度,原新梅(2005)发现,从总体上看,字母词在新闻语体、科技语体中分布较多,而在政论语体、文学语体、公文语体中数量有限,且涉及领域较窄。关润芝、杨建国(2005)对2002年《人民日报》全年语料中带标点的字母词自身特征和标点出现情况进行了分析。杨建国、郑泽芝(2005)对2002年《人民日报》全年语料中字母词和汉字词在专名中同现的情况进行了调查,并对如何规范使用字母词提出了思考。郑泽芝、张普(2005)对2002年《人民日报》全年语料进行了调查,得到ELWP(字母词语工程定义)在该语料中使用情况的分类,并对单字母ELWP、含数字ELWP的分类分析和并列结构ELWP处理等问题进行了探讨。《中国语言生活状况报告(2006)》(下编)对报纸、广播电视、网络(新闻)的字母词使用状况进行了调查,结论是:字母词已经成为汉语词汇的一部分;字母在汉语中最经常、最主要的作用就是指代、排序;典型字母词的造词方式主要是简缩;异形字母词量大,使用频率不同;同形字母词量大,有时会影响交际;字母词音、形、义之间关系复杂多样;典型字母词主要用于专业术语;字母词的书写错误现象比较严重;带字母的分词单位在不同媒体中使用频度不同。邹玉华等(2006)对字母词占据数量最多的术语字母词使用状况进行了考察,发现术语字母词的使用与文章领域相关,科技和经济领域文章使用术语字母词最多。邹玉华等(2007)通过对字母词在当代汉语中使用状况的分析发现,字母词的使用密度和文章领域相关,和报纸地域、性质无关。其中,科技领域使用密度最高,其次是教育领域、经济领域,使用密度最低的是军事领域和政法领域。郑泽芝(2009)“字母词语跟踪研究”一文采用共时调查和历时调查两种方法,对汉语字母词的使用范围、稳定性、用法等情况进行了探讨,这是目前所得到资料中,对真实文本中字母词使用概况所进行的一项较大规模的调查研究。
语言领域中字母词使用状况研究最多的是对报刊语言的研究。陈佳璇、胡范铸(2003)对2002年8月全国15种报纸使用字母词的形式、种类、分布和使用频次等情况进行了定量分析。陈佳璇、聂桂兰(2006)通过对新闻语言中字母词的易读性测量发现,文化程度高低和语境有无对字母词理解产生影响,而使用频次与理解度不构成必然联系。散见的还有对体育新闻、网络语言、广告语言中字母词使用情况的调查分析。
字母词使用状况社会调查研究中,语言态度的调查是一项重要内容。研究成果主要有:邹玉华等(2005)关于汉语中使用字母词的语言态度的调查发现,职业是影响字母词态度的重要因素,性别、年龄、文化程度与字母词的态度关系不大。曹钦明(2005)通过对字母词的流通度差异调查发现,社会人群的性别、年龄、受教育程度、职业因素对字母词使用与否的倾向性均不产生统计学上的显著影响。裴昕月(2007)通过对大学生常用字母词使用情况调查,归纳出大学生这一特定人群使用字母词的规律、特点和影响因素。字母词的知晓度是字母词社会调查的又一个重要方面,邹玉华(2006)字母词知晓度的调查报告分析了职业、性别、年龄、教育程度对字母词知晓度的影响,其中,职业是影响知晓度的主要因素,其次是教育程度,性别和年龄对字母词的知晓度不构成影响。原新梅等(2007)对留学生这个特定人群的字母词知晓度进行了调查,考察国籍、母语、年龄、性别、汉语水平、英语水平、对英语的态度、受教育程度等因素对字母词知晓度的影响。
五、字母词在中文信息处理领域的研究
字母词散布在汉语文本中,并具有一定的形式特征,研究者希望可以自动提取字母词,这是文本检索的一项内容。另外,字母词识别的正确性也关系到中文文本的自动分词和标注等,因此,字母词的识别和提取研究成为字母词在中文信息处理领域研究中涉及最多的内容。
郑泽芝等(2005a)在对字母词在大规模真实文本中的分布情况进行分析时发现,字母词所含标点,非汉字串与汉字串分合,字母词词种数辨认和等义同现问题成为字母词提取中的难点。在此分析基础上,郑泽芝等(2005b)运用字母串作为锚点,从中心向两边扩展的规则加统计的方法进行了字母词自动提取,召回率100%,准确率80%以上。郑泽芝(2007)后来改进上述思想,提出了一种字母词的自动标注算法。
关于词语流通使用度的研究,尹斌庸等(1994)和孙茂松(2000)曾经有文章探讨。郑泽芝(2009)探讨了字母词通用程度的评判方法。文章将绝对指标方法、通用度方法和散布均匀度方法进行了比较,散布均匀度方法效果较好。
六、结语
语言理论研究和应用研究在语言研究中相辅相成,相互促进。字母词研究发端于理论探讨,已有的综述性文章也对这部分研究成果梳理较多。对字母词在使用状况的调查研究和中文信息处理领域的研究探讨进行描写和综述,不仅可以弥补已有字母词综述性文章介绍理论研究成果多,应用研究成果少的缺憾,而且也将促进字母词应用的深入研究,并引发对理论研究争议的重新思考。
注 释:
①检索结果截止到2009年12月31日。
参考文献:
[1]曹钦明.字母词的社会流通度考察[J].广西社会科学,2005,(4).
[2]陈佳璇,胡范铸.我国大众传媒中字母词使用状况的调查与分析
[J].修辞学习,2003,(4).
[3]陈佳璇,聂桂兰.试论我国新闻语言中字母词的易读性测量[J].
韩山师范学院学报,2006,(1).
[4]关润芝,杨建国.字母词语块中“标点”的使用状况考察[J].语
言文字应用,2005,(1).
[5]郭熙.字母词使用规范方案研制报告(2006修订稿)[R].暨南大
学,2006.
[6]郭伏良.字母词与词典二题[J].河北大学学报(哲学社会科学版),
1997,(2).
[7]国家语言资源监测与研究中心.中国语言生活状况报告(2006)
下编[R].北京:商务印书馆,2006.
[8]胡明扬.关于外文字母词和原装外文缩略语问题[J].语言文字应
用,2002,(2).
[9]皇甫素飞.从《文汇报》看汉语字母词的历史演变[J].修辞学习,
2004,(5).
[10]黄文贵,谢英捷.汉语中外来词语的规范问题[J].江西农业大
学学报(社会科学版),2002,(3).
[11]慧生.也谈字母词[J].语文建设,1995,(7).
[12]刘建梅.现代汉字系统中外来字母规范浅议[J].语言文字应用,
2002,(1).
[13]刘涌泉.关于汉语字母词的问题[J].语言文字应用,2002,(1).
[14]刘涌泉.汉语字母词词典[Z].北京:外语教学与研究出版社,
2009.
[15]刘涌泉.汉语字母词词典[Z].上海:上海辞书出版社,2001.
[16]刘涌泉.谈谈字母词[J].语文建设,1994,(10).
[17]潘雪莲.略论字母词的定义与定位[J].科技术语研究,2006,
(2).
[18]裴昕月.大学生使用字母词情况调查[J].中国科技术语,2007,
(6).
[19]沈孟璎.浅议字母词的入典问题[J].辞书研究,2001,(1).
[20]沈孟璎.实用字母词词典[Z].上海:汉语大词典出版社,2002.
[21]孙茂松.关于词汇使用度的初步研究[J].语言文字应用,2000,
(1).
[22]薛笑丛.现代汉语中字母词研究综述[J].汉语学习,2007,(2).
[23]杨建国,郑泽芝.汉语文本中字母词语的使用与规范探讨[J].
语言文字应用,2005,(1).
[24]尹斌庸,方世增.词频统计的新概念和新方法[J].语言文字应
用,1994,(2).
[25]原新梅,梁盟.留学生字母词语的知晓度[J].语言文字应用,
2007,(1).
[26]原新梅.字母词语在不用语体中的分布[J].河南社会科学,2005,
(1)
[27]张铁文.《现汉》“西文字母开头的词语”部分的修订[J].语
言文字应用,2006,(4).
[28]郑泽芝,张普,杨建国.基于语料库的字母词语自动提取研究
[J].中文信息学报,2005b,(2).
[29]郑泽芝,张普.汉语真实文本字母词语[J].语言科学,2005d,
(6).
[30]郑泽芝.基于动态流通语料库(DCC)的汉语字母词语识别及考
察研究[D].北京语言大学博士学位论文,2005c.
[31]郑泽芝.通用字母词语提取研究[A].国家语言资源监测与研究
中心暨平面媒体分中心成立五周年纪念学术会议论文集(讨论稿)[C].2009.
[32]郑泽芝.一种字母词语自动标注算法[J].厦门大学学报,2007,
(5).
[33]郑泽芝.字母词语跟踪研究[J].语言文字应用,2009,(1).
[34]郑泽芝.字母词语自动提取的几点分析[J].语言文字应用,2005a,
(1).
[35]中国社会科学院语言研究所词典编辑室.现代汉语词典(第5
版)[Z].北京:商务印书馆,2005.
[36]周健,张述娟,刘丽宁.略论字母词语的归属与规范[J].语言
文字应用,2001,(3).
[37]周玉琨.“GB”“HSK”是字母词吗?[J].汉字文化,2002,(1).
[38]邹玉华,马广斌,刘红,韩志湘.关于汉语中使用字母词的语
言态度的调查[J].语言教学与研究,2005,(4).
[39]邹玉华,马广斌,马叔骏,刘哲,马宇菁.字母词知晓度的调
查报告[J].语言文字应用,2006,(2).
[40]邹玉华,翟国忠,董春萍.术语字母词在当代汉语中的使用状
况考察[J].科技术语研究(季刊),2006,(2).
[41]邹玉华,翟国忠,董春萍.字母词在当代汉语中使用状况的分
析[J].佛山科学技术学院学报(社会科学版),2007,(2).
[42]邹玉华.现代汉语字母词研究[D].中国传媒大学博士学位论文,
2006.
(王秋萍 北京 中国传媒大学文学院 100024)