德语词汇长度的共时特征与历时演化

来源 :浙江大学 | 被引量 : 0次 | 上传用户:laojiawolai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语言是一个由多种单位构成的复杂系统,语音、词汇、句法等子系统各司其职。语言同时是一个动态、开放的协同系统,各种语言属性互相影响。语言本身及其属性都会受语内及语外因素影响而逐步发生演化。在语言系统中,词汇具有极其重要的作用。无论在听觉层面还是视觉层面,长度都是词汇最基础也最显著的属性之一。词汇长度不仅能在一定程度上反映语言单位的复杂性,呈现文本的整体特征,词长的变化还会引起其他语言属性发生改变,进而带来语言的整体演化。词长因其特殊性,得到了语言学、心理学、教育学、交际学、信息学等不同学科领域的关注。特别是计量语言学,将词长视为研究语言整体特性的关键切入点,相关研究层见叠出。计量语言学研究主张以大规模真实语言材料为研究对象,采用数学定量方法,以揭示人类语言的普遍特性、自适应机制、演化规律及其动因。现有词长计量研究已取得丰硕成果,但仍存在以下局限:首先,就研究工具而言,大部分研究对词汇定义的探讨有限,在选择词长测量单位时一般基于前人研究或个人经验,故存在测量方法不统一的情况,尚无研究对比不同测量方法对结果造成的影响;其次,在语料特征方面,目前考察的文本类型较为单一,以文学、书信为主,多数研究选用的语料规模较小,缺少系统的跨文体分析;再者,从研究维度上看,现有研究多从共时角度出发,且文章大多重数据而轻分析,鲜有基于统一、大量、真实语料的多维度历时考察。基于上述背景,本文聚焦17-19世纪德语词汇长度的共时跨文体特征及历时演化趋势,采用计量方法从平均词汇长度、词长分布特征、文本内部词长走势、词长与其他语言属性的关系等方面展开系统研究分析,尝试回答以下问题:1)在共时层面,不同文体的德语词汇长度具有哪些共性与差异?哪些因素造成了这些跨文体特征?2)在历时层面,1600年至1899年间,不同文体的德语词汇长度分别呈现怎样的演化趋势?其演化动因是什么?本研究语料选自德语文本历时语料库(Deutsches Textarchiv,简称DTA),涵盖四个文体类型,总词次约2000万。在开展主体实证研究之前,本文充分探讨词汇定义,据此设计实验方案,并利用DTA语料库中的“报刊”文体语料展开前测。结果表明,音节是最适合书面德语的词长测量单位。鉴于德语屈折变化丰富,词汇的形符、类符、词形、词目拥有各异的语言学意义,在具体研究时应根据研究目的选择适当的词汇形态作为测算对象。本研究在对DTA语料库“文学”“应用文”“学术”三类文体300年间的360篇语料进行跨文体、跨时段、多维度分析后,主要得出如下结论:1)在共时层面上,不同文体的词汇长度特征既有个性,又显共性。语料的差异性集中体现于整体的词长特征:无论是全文平均词长,还是各词类的平均长度,抑或多音节词的占比,同时期语料均呈现出“学术>应用文>文学”的特点。造成跨文体差异的主要原因是各文体不同的写作目的和语言使用偏好。三类文体语料的相似性主要体现在三个方面:第一,各文本的词汇长度分布特征非常相似,基于词形形符得到的分布数据可用统一数学模型(单位移超泊松分布)描述。第二,词汇长度与词汇使用频率存在相关性,“词长越短使用频率越高”的特点符合幂律函数=。上述两点均为“省力原则”在德语中的体现。第三,在一篇文本内部,词汇长度呈现出波动上升的趋势。这与写作策略及篇章信息结构相关,受到人类认知特点影响。2)从历时维度看,德语词汇长度在17-19世纪间整体呈增长趋势。具体而言,“学术”语料的词长历时增速最快,“应用文”次之,而“文学”语言的演化速率较为平缓。这主要是因为学术文本和应用文对语言表达的精准度要求更高,且为了满足新的表达需求常使用复合、派生等构词法创造新词,而这往往会令词汇长度增加。其次,不同词类的演化特征不尽相同。名词、形容词、动词的增速最快,说明上述词类具有较强的构词能力。此外,词长分布模型的参数值可以在一定程度上反映文体的历时演化特征。整体而言,语言是一个自适应动态系统,词汇长度的演化过程受到社会、文化、认知、交际等因素的共同作用。本研究首次从共时和历时两个方面系统考察了德语词汇长度的跨文体特征与演化规律,在思路方法、研究语料、研究视角等方面均有创新。在思路方法层面,本文重视“词”的概念探讨,以理论指导实践,基于先导研究结果优化主体研究设计,并找到了最适合书面德语的词长测量单位,有助于改变目前词长测量单位不统一、结果难对比的研究现状。从研究语料上看,本文突破目前时间维度、文体类型单一的局限性,在选择语料时兼顾同质性与异质性,系统考察边界条件对结果的影响。不仅验证了计量语言学的定律与假设,还佐证并拓展了文体学、历史语言学、语言类型学的相关观点。在研究视角方面,本文构建起多维的词长研究范式,以共时研究为横轴、历时研究为纵轴,结合语法、认知、社会、文化因素展开多维分析,并与现有研究充分对话,展开跨语言比较。既深化了对德语词汇文体特征及其演化规律的了解,也为人类语言共性探究提供了实证基础。
其他文献
新零售时代来临,社区零售店打通线上线下全渠道购物模式是大势所趋,同时大部分零售店企业的线下信息管理系统比较完备,收集并储存了大量交易信息。本研究便是基于实体店转型线上模式后出现的个性化推荐现实需求,利用实体零售店收集的海量信息为零售企业建立的个性化推荐模型。本文首先根据消费者购买记录以及消费信息,提取用户对商品偏好的影响特征,改进传统RFM模型。本研究充分考虑了零售数据的特点后认为用户交易数量这一
目前随着电子系统和电子设备的快速发展和广泛使用,电磁污染已经成为人们的主要关注点。受环境问题和广泛应用领域的推动,寻求高效材料来减轻电磁干扰(EMI)污染已经成为了如今
无线传感器网络是一个多学科交叉的热点研究领域,目前已广泛应用在军事、医疗、环境监测、灾难救援等领域。节点定位技术作为无线传感器网络的关键性技术一直以来广受国内外研究学者重视。本文在分析和总结无线传感网三维定位算法及其不足基础上,针对定位存在节点分布不均、边界节点难定位和定位精度低等问题,主要从智能优化算法、移动锚节点两方面对基于DV-hop的三维定位算法进行改进,并对其性能进行仿真实验验证研究。首
视频监控技术作为安防领域中重要部分,近年来其发展日益成熟,且越来越趋于智能化。智能化视频监控体现在通过人工智能技术对监控视频内容进行处理分析,实现视频中目标的自动识别和定位等,而目标检测作为智能监控视频中关键技术,已成为了研究的热点和重点。本文以校园监控视频为研究对象,采用迁移学习的方法,在卷积神经网络目标检测SSD(Single Shot Multi-Box Detector)的基础上,针对实际
目的:LncPrep+96kb是一种新发现的长链非编码RNA,有两个转录本分别为2.2kb和2.8kb,表达于卵巢颗粒细胞中,但其在卵巢的功能尚不清楚。本课题将探究lncPrep+96kb 2.2kb在小鼠卵巢颗粒细胞的作用和可能的机制。方法:通过原位杂交实验,探究lncPrep+96kb在小鼠卵巢的时空表达情况。分离培养原代颗粒细胞,转染lncPrep+96kb 2.2kb过表达质粒和敲除质粒,
石墨烯由于其特殊的能带结构,具有优异的电学与光学性能,在光电子学器件如光电开关、相位调制器、锁模激光器、滤波器等方面具有重要应用。但是由于石墨烯的单层原子特性,在可见及近红外波段具有高达97.7%的透过率,即光与石墨烯的作用相对较弱。物质的非线性光学响应与光电场的高阶项相关,因此增强石墨烯与光场的相互作用,从而增强石墨烯的非线性光学响应是非线性光学领域的重要研究课题。本论文主要研究了单层石墨烯在近
回顾中国经济改革开放以来的发展历程,可以发现,政府对经济的主导作用和对外开放是中国转型式增长模式的两个显著的特征,这两个特征构成了中国四十多年经济增长模式的核心。传统凯恩斯主义认为,政府的财政支出对经济增长的推动具有乘数效应。随着经济的高速增长,我国财政支出规模持续扩大,地方财政支出规模也逐步攀升,地方政府主要是通过调整财政支出规模和结构来实现其宏观经济目标,对外开放则提供经济快速发展与体制转换的
人-机交互(Human-Computer Interaction,HCI)是指在人和计算机之间通过“特殊对话”的方式完成信息交换的过程。随着信息技术和人工智能的迅猛发展,现阶段HCI设备也得到了全面的完善并逐渐应用于人类生活的各个领域。然而,传统的设备虽然能够根据人们的意愿完成一些基本的功能,但无法根据使用者的心理感受调整交互方式,难以真正实现“智能交互”。因此让计算机具有较强的情感识别能力对于进
毫米波大规模MIMO技术是第五代移动通信系统中的一个重要技术,通过在收发端配备大规模天线阵列来提高系统的能量效率、频谱效率和通信容量。然而,随着收发端天线数目的不断增加,通信系统也越发复杂,如何准确的估计出信道状态信息成为了毫米波大规模MIMO系统研究的热点。本文针对此问题,充分利用信号的多维特性,结合张量对大规模数据的处理能力,将大规模接收信号在接收端进行张量建模,对毫米波大规模MIMO系统信道
要素自由流动是城乡融合发展的重要环节,劳动力要素从乡村向城市汇聚,一方面缓解了我国农村“人多地少”的矛盾,使土地要素能够通过市场流转集中起来,扩大人均耕地面积,实现适度规模经营,另一方面为城市发展提供了动力,有助于通过人口城镇化的途径来提高我国城镇化水平。但现实是,农民工融入城市并不顺利,相当一部分农民工未参与土地流转,我国土地流转率仍然处于较低水平,从农民工城市融入角度探讨土地流转问题具有重要意