论文部分内容阅读
词汇的产生、消亡和词汇的意义变化是汉语史研究的基本课题。每个时代有多少词和义项,历代演变情况如何,基于语料库的统计方法可以形成重要的量化数据。目前,由于大规模精加工的历时语料库较少,汉语词汇历时发展的整体面貌还难以从数据上加以刻画。本文以词义演变为切入点,人工标校《汉语大词典》的词语义项年代信息,形成计算机数据库,使用统计方法从词汇的新增旧减和意义的变化两个角度考察词义演变的历时面貌、方式和规律。专注于以下三个方面的工作:其一,建立汉语词汇演变数据库。利用历时性权威规范语文词典《汉语大词典》建立了涵盖31万多个词语,45万多个义项的汉语词义演变时代数据库,实现了汉语词义演变可视化软件对该资源的检索和查询。我们利用网络资源补充了《汉语大词典》88万余条书证的时代信息,运用数据库技术存储了《汉语大词典》中词汇的义项、书证、使用和消亡时代等信息,使用C#语言实现了三类查询:(1)查询某词语的义项和书证信息等;(2)图形化界面呈现词语各义项的使用时代;(3)查询时代新增、消亡义项数量及面貌。其二,统计了汉语词汇演变的三个基本面貌:(1)汉语词汇在各时代使用、新增和消亡的面貌:(2)先秦词汇在后世各个时代的沿用情况:(3)当代词汇在之前各时代的使用情况。根据汉语词汇在各时代的数量概貌,我们从六个方面验证并补充了汉语史的研究成果:(1)由先秦至当代,单音节词向双音节词过渡是汉语发展的趋势;(2)先秦时代单音节词占优势是相对于后代而言的;(3)各时代汉语词汇发展面貌不同,但当某时代处于词汇剧烈新增时,一些旧的词语也会被大量淘汰;(4)先秦能沿用到当代的词汇和义项数量是极少的,但这些词的词义演变能力较强,其中先秦单音节词,更易沿用到当代;(5)四字成语在先秦时代,已经产生了一些尚未定形的算是成语的雏形,宋代和民国、当代是成语新增的时代,但后者数量更多;(6)运用语言年代学方法,拟合出词语演变的年代曲线,汉语词汇的发展同样呈现对数相关特点。其三,重新分析词义的演变模式。传统的扩大、缩小、转移理论对词义演变现象描述过于宽泛,认知的隐喻、转喻理论也不能解释全部现象。我们以20个先秦当代核心词作为研究对象,借鉴框架语义学理论和实践(FrameNet),并参考知网(HowNet)的语义体系,从代表个体心理认知模式的框架概念出发分析了不同本义类型词汇的意义变化方式。主要研究结论为:(1)一个词的本义所激活的框架限制了词义的演变,义项的变化体现为心理认知模式下关注视角的变化,具体表现为框架内框架元素凸显的变化、框架内框架元素填充物的变化和兼具这两种变化模式三类,框架限制的程度体现为新义项与词的本义所激活的基本框架间的距离;(2)动作类、属性类、实体类和数量类的义项在词性变化模式、框架义项发展模式、框架距离上都存在差异,反映了不同类型本义的词汇不同的词义演变轨迹,为预测未来词义的可能演变提供了参考。综上,本文以构建大规模汉语词汇演变电子数据库为基础,多角度统计分析了汉语词汇演变的基本面貌和总体趋势;并采用框架语义学方法,对20个核心词语的词义演变进行了细致的刻画和统计,论证了框架理论在词义演变研究中的适用性和重要性。