基于汉语儿童读物编写的汉语语料库建设

来源 :广东外语外贸大学 | 被引量 : 3次 | 上传用户:qinyue_love
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从20世纪90年代开始,人们开始逐渐意识到民族语言文化的价值,尤其是民族语料资源。在此背景下,各学术机构纷纷提出建立多种类型语料库,深入挖掘和维护民族语料的价值和使用规范。语料库是大数据时代背景下语言学研究的重要工具。对外汉语界已经建立了一些中介语语料库和HSK动态作文语料库,在对外汉语教学实践和汉语本体研究中发挥了巨大的作用。于是笔者开始思考在语料库的建设方面为汉语研究者提供更多的便利,着手建立一个汉语儿童读物的语料库。经过精心的设计和编纂,我们初步拟建立一个规模为700万字的汉语儿童读物语料库,整个开发过程包括语料库的初步设计、语料的采集、数据库编程、语料录入、后期整改等方面。语料库设计的基本出发点是:使该语料库为研究者提供的语言调查是合理而且可靠的。语料库语言学是根据从语料库中的文本统计得到相关频率信息,利用统计学原理来测量纷繁复杂的语言现象在实际语言使用中的具体情况。因为语料库的统计数据全部来自真实语言,而且基于语料库的数据可以在很大程度上避免偶然性,所得结论更具备说服力。汉语儿童读物的编写研究不仅可以深化对儿童汉语习得的认识,并且对汉语二语教学有极大的借鉴参考意义,母语习得和二语教学有着密不可分的联系,儿童读物可以真实反映出汉语习得的一些规律,这些规律既可以用来指导国内语文教学,又可以为对外汉语教学和汉语教材编写,尤其是对外汉语读物的开发提供宝贵素材。语料库作为大数据时代语言学研究的有力工具可以为这些研究提供强大的技术支撑。因此,我们设计一款针对汉语儿童读物的语料库,儿童读物主要来自国内畅销读物和翻译引进的外国优秀读物,适读年龄从1岁到12岁,其中又分为三个不同的年龄段。我们建立该语料库的目的是用来调查和分析儿童读物的语言特点和编写用字,基于自建的汉语儿童读物语料库,采集不同年龄段、不同题材的儿童读物文本,利用语料库中的分词程序进行词切分,最后完成不同年龄段、不同类型文本的字频和字段的统计,对儿童读物中汉字、词汇和句子的实际使用情况进行全面地调查了解,统计和分析儿童读物中的汉字、词语的出现频率和句子长度的使用情况进行综合分析。
其他文献
目前国内有医疗改革的呼声越来越响,其中一个观点认为医药公司竞争不足无效经营从而导致药品价格过高。文章基于DEA原理,同时在比较了国内外企业经营绩效评价研究的基础上,选择
链传动是一种重要的机械传动方式,但它受振动的影响很大.本文讨论链传动的振动的主要类型和引起振动的主要原因.
薪酬与激励机制密切相连,好的薪酬制度能激发员工的积极性。文章分析了现代企业在薪酬制度管理方面的弊端,对我国企业薪酬制度存在激励不足的问题进行探讨,最终给出了建立有
当前越南毒品问题的主要特点是毒品来源和流向多元化、国际化 ,毒品类型多样化、精制化 ,吸毒群体扩大化、年轻化。近年来越南政府采取一系列措施加大了禁毒力度 ,取得了一定
六朝教育制度是中国古代教育制度不可或缺的组成部分。基于秦汉时期制度的延续及其时代发展的社会历史背景,六朝时期形成了更为进步与完善的教育制度与机构体系,即官学为主、私学为辅,二者统一架构起封建统治取士与入仕的体制根基。在此基础上,整个官学体系提出了一系列旨在巩固统治阶层主导地位的政策内容,如设立两学、开办专学、重视考试、为皇子专任官师、完善管理机制等;而私学体制的发展则更为丰富多元,学术思想浓厚且自
宁夏引黄灌区水资源供需矛盾突出,弄清灌区水平衡关系及水力联系对于灌区水资源的合理开发利用具有重要意义。根据宁夏引黄灌区1991-2007年用水资料,应用水均衡模型,对灌区水
瑞典在20世纪和刚刚开始的21世纪取得了巨大成功,创立了举世闻名的"瑞典模式"。但不能把瑞典的成功仅仅归结为瑞典社会民主党及其所走的民主社会主义道路。瑞典作为世界现、
图书馆数字化建设是图书馆在数字信息网络时代获取发展的必由之路.在这条发展之路上有许多困难和障碍,版权问题是其中重要的一项.文章分析了图书馆数字化建设将遇到的版权问
“4.4元的话,4太多,中国人觉得难听,再降4分钱,4.36,行不行?”这几天,一段“灵魂砍价”视频在网上疯传,网友纷纷点赞。视频拍自国家医保价格谈判现场,谈判专家锱铢必较,正对
报纸
从感染HIV到体内产生HIV抗体,这一段时间称为潜伏期。那么,存在于潜伏期的艾滋病会有传染性吗?首先,艾滋病潜伏期的长短个体有差别,一般为2~6周,只有极个别的长达3~6个月。在感