论文部分内容阅读
摘要: 本文简要叙述了语料库语言学的历史,重点描述了语料库语言学与词汇研究,翻译理论研究,以及汉语研究等领域的合作及进展情况,指出语料库语言学对其他学科的发展作出了巨大贡献。展望了语料库语言学的未来发展方向和趋势,指出未来几十年语料库语言学将迎来繁荣期,语料库语言学必将为推动其他学科的发展发挥巨大作用。
关键词: 语料库语言学 过去 现在 未来
一、语料库语言学的发展史
语料库语言学研究是以大规模的机器可读语料为基础的,一般认为始于上世纪60年代。但是在机读语料库出现之前,语料库研究已广泛用于圣经和文学研究、词汇、方言研究等领域,这一时期也被称为“前电子语料库时期”。
在SEU语料库创建不久,英语语料库的编制进入了电子时代。语料库电子时代又分为第一代和第二代。
第一代电子语料库时期建立的主要语料库有布朗语料库(The Brown Corpus)、兰卡斯特-奥斯陆/卑尔根语料库(LOB Corpus)、伦敦-隆德语料库(LLC)等。LOB语料库由英国兰卡斯特大学和挪威奥斯陆大学与挪威人文科学计算中心共同合作建立。LOB语料库被认为可与布朗语料库相媲美,它收集了1961年出版的英国书面,同样有500篇文本,每篇约2000词,共计100万词次。1975年,瑞典隆德大学开始将英国SEU语料库收集的英语口语材料转化成机读的形式,并在原来语料的基础上增加了13篇文本,经过加工整理,收录100篇文本,于1980年建立起伦敦-隆德英语口语料库。
在第一代电子语料库的基础上,第二代电子语料库收录内容不再仅限于口语语料,语言信息更多,相比之下,更加完善,实用。第二代电子语料库主要有COBUILD语料库、朗文语料库、国际英语语料库等。
COBUILD计划是英国柯林斯出版社和伯明翰大学的一个合作项目,历时4年多,于1984年完成。1990年SINCLAIR宣布,COBUILD语料库经过扩展,更名为英语库。1997年,其所含的语料已超过3亿词次,并且还在不断扩大。朗文语料库网由英国的三大语料库组成,它们是朗文兰卡斯特英语语言语料库、朗文口语语料库和朗文学习者英语语料库。该语料库取材自1900年以来英国英语、美国英语和世界上其他主要的英语变体,涉及书面英语和口头英语两种形式,是一个覆盖范围很广的语料库,计划库容为5000万词次,到90年代早期,库容已达到3000万词次。国际英语语料库的最大特点是其严密的组织和语料库的国际性和代表性,统一的标准和周密的设计确保了语料库的质量,其潜在的研究与应用价值与日俱增[1]。
在我国已完成的语料库有上海交大的黄人杰、杨惠中主持完成的专门用途英语语料库、交通大学科技英语语料库,北京大学计算语言研究所开发建设的Babel汉英平行语料库,北外中国外语教育研究中心创建的北外双语对应语料库,以及由上海交通大学外国语学院翻译与词典学研究中心创建的莎士比亚戏剧英汉平行语料库等。
二、语料库与其他学科的关系
1.语料库的学科定位
什么是语料库语言学?很多学者和语言学家都各自给出过定义:
(1)K.Ailmer
关键词: 语料库语言学 过去 现在 未来
一、语料库语言学的发展史
语料库语言学研究是以大规模的机器可读语料为基础的,一般认为始于上世纪60年代。但是在机读语料库出现之前,语料库研究已广泛用于圣经和文学研究、词汇、方言研究等领域,这一时期也被称为“前电子语料库时期”。
在SEU语料库创建不久,英语语料库的编制进入了电子时代。语料库电子时代又分为第一代和第二代。
第一代电子语料库时期建立的主要语料库有布朗语料库(The Brown Corpus)、兰卡斯特-奥斯陆/卑尔根语料库(LOB Corpus)、伦敦-隆德语料库(LLC)等。LOB语料库由英国兰卡斯特大学和挪威奥斯陆大学与挪威人文科学计算中心共同合作建立。LOB语料库被认为可与布朗语料库相媲美,它收集了1961年出版的英国书面,同样有500篇文本,每篇约2000词,共计100万词次。1975年,瑞典隆德大学开始将英国SEU语料库收集的英语口语材料转化成机读的形式,并在原来语料的基础上增加了13篇文本,经过加工整理,收录100篇文本,于1980年建立起伦敦-隆德英语口语料库。
在第一代电子语料库的基础上,第二代电子语料库收录内容不再仅限于口语语料,语言信息更多,相比之下,更加完善,实用。第二代电子语料库主要有COBUILD语料库、朗文语料库、国际英语语料库等。
COBUILD计划是英国柯林斯出版社和伯明翰大学的一个合作项目,历时4年多,于1984年完成。1990年SINCLAIR宣布,COBUILD语料库经过扩展,更名为英语库。1997年,其所含的语料已超过3亿词次,并且还在不断扩大。朗文语料库网由英国的三大语料库组成,它们是朗文兰卡斯特英语语言语料库、朗文口语语料库和朗文学习者英语语料库。该语料库取材自1900年以来英国英语、美国英语和世界上其他主要的英语变体,涉及书面英语和口头英语两种形式,是一个覆盖范围很广的语料库,计划库容为5000万词次,到90年代早期,库容已达到3000万词次。国际英语语料库的最大特点是其严密的组织和语料库的国际性和代表性,统一的标准和周密的设计确保了语料库的质量,其潜在的研究与应用价值与日俱增[1]。
在我国已完成的语料库有上海交大的黄人杰、杨惠中主持完成的专门用途英语语料库、交通大学科技英语语料库,北京大学计算语言研究所开发建设的Babel汉英平行语料库,北外中国外语教育研究中心创建的北外双语对应语料库,以及由上海交通大学外国语学院翻译与词典学研究中心创建的莎士比亚戏剧英汉平行语料库等。
二、语料库与其他学科的关系
1.语料库的学科定位
什么是语料库语言学?很多学者和语言学家都各自给出过定义:
(1)K.Ailmer