论文部分内容阅读
【摘要】随着时代的发展,计算机已经成为语言研究和外语教学不可或缺的工具。本文探讨计算语言学和语料库语言学如何在语言研究和外语教学中发挥作用,以及它们在四个方面是如何影响和改变语言研究和外语教学的。
【关键词】计算语言学 语料库语言学 计算机
一、引言
1946年美国宾州大学的J.P.Ecke和J.W.Mauchly制作了世界上第一台计算机ENIAC。从那之后,人类进入了计算机时代,计算机以其运算速度快、精度高而迅速进入人们的生活和工作当中。所以早在1962年,就出现了“计算机语言学”这一学科,计算机和语言就结下了不解之缘。经过50多年的发展,计算语言学已经形成了独立的、完整的理论体系。同时应运而生的是语料库语言学,对于语料库语言学和计算语言学的归属问题,一直稍有争议。笔者认为语料库语言学隶属于计算语言学门下,目前经过几十年的发展正在成为一门独立的新兴学科。利用计算机技术进行语言研究和语言(英语)教学已成为时代发展的必然趋势。
二、计算语言学和语料库语言学对语言研究和英语教学的意义
“语料库”是为一个或多个应用目标而专门收集的、有一定结构的、有代表性的、可被计算机程序检索的、具有一定规模的语料集合。其按照一定的语言学原则,运用随机抽样的方法,收集自然出现的连续的语言运用文本或话语片段来建立。以一定大小的语言样本来代表某一研究中所确定的语言运用总体。语料库按选取的时间可以分为“历时语料库”和“共时语料库”;按加工深度可以分为“标注语料库”和“非标注语料库”;按语料库的结构可以分为“平衡语料库”和“自然随机结构语料库”;按用途可以分为“通用语料库”和“专用语料库”;按语种又可分为“单语语料库”和“多语言语料库”等(冯志伟,2008)。
语料库语言学对以往的语言学研究和语言教学方式都提出了挑战。第一、语料库语言学或计算语言学都是实证研究为主的研究方法,这区别于以往的内省法研究。语言研究和教学都不再是研究者或教师的主观臆断,更多的基于大量的实际例句。第二、语料库语言学或计算语言学对于语言研究或教学中的例句要求是“必须是语言实际使用中的真实语用”这一层面,这就避免了研究者或教师外语水平的参差不齐而导致的语言研究错误或教学错误。中国的英语老师确切的说也是“二语习得者”,根据二语习得理论,我们知道教师的“母语”是汉语,“目标语”是英语,教师只是比普通学生英语学习的更好一些,可以比学生更大程度的“接近”目标语,但教师本身也很难完全达到“本族语者”的程度;再加上日常的英语教学中教师的英语水平更是良莠不齐,因此,传统英语课堂上教师“语用”错误必然存在。但如果在英语课堂上引入本族语者语料库,这一问题可以迎刃而解。比如,BNC(British National Corpus)是1亿词次的英国英语语料库,通过这一语料库,学生可以直接接触到地道的英式英语,其收录了上个世纪80年代到1993年的多个领域的英式英语实际句用,无论对于学生还是研究者的英式英语的历时和共识变化研究都具有巨大指导意义。第三、语料库语言学融入了统计学的概念,从而也催发了“语言统计学”的发展。例如:语言学家在统计搭配强度的时候,可以利用统计学的“方差、对数”等统计手段,量化统计出搭配的强度,从而避免了不同学者的主观臆断。在英语教学中,统计学概念也应该引入,例如,词频的高低、搭配的强弱、语言样本的随机抽样等概念都应与时俱进的引入日常英语教学,从而改变几十年来一成不变的英语教学内容和模式。第四、计算机统计软件和编程语言成为划时代的研究和学习英语的手段。深爱计算语言学和语料库语言学的学者都知道,工欲善其事,必先利其器。计算机软件和计算机编程语言是本领域的利器。通过软件,我们可以快速、大量的检索语言样本,统计出高频词,计算搭配强度等。通过编程语言我们可以批量的提取、标注语言样本,从而节省大量的人力、物力,提高工作的精度和速度。语料库领域大量的经典软件,如:wordsmith,antconc等;再如:统计学软件,SPSS;编程语言有很多其中PERL是最适合进行语言提取和标注使用的。因为计算语言学和语料库语言学是交叉学科,因而对研究者和学习者都提出了更高的要求。
三、结语
综上所述,计算机在语言研究和外语学习中所起到的作用日益增大,已经成为学习和研究不可替代的工具。计算语言学和语料库语言学是交叉学科,同时精通双学科的人才更是宝贵。在英语教学中更多的引入英语本族语者语料库可以更好的矫正中国学生的中式英语,从而让学生学习更地道的英语;把语料库应用在语言研究领域,可以纠正传统研究中的一些谬误,真正发现语言使用的规律。把定性和定量研究相结合是目前和未来语言研究和学习的趋势所在。
参考文献:
[1]冯志伟.语料库语言学的进展序言[M].2009.
【关键词】计算语言学 语料库语言学 计算机
一、引言
1946年美国宾州大学的J.P.Ecke和J.W.Mauchly制作了世界上第一台计算机ENIAC。从那之后,人类进入了计算机时代,计算机以其运算速度快、精度高而迅速进入人们的生活和工作当中。所以早在1962年,就出现了“计算机语言学”这一学科,计算机和语言就结下了不解之缘。经过50多年的发展,计算语言学已经形成了独立的、完整的理论体系。同时应运而生的是语料库语言学,对于语料库语言学和计算语言学的归属问题,一直稍有争议。笔者认为语料库语言学隶属于计算语言学门下,目前经过几十年的发展正在成为一门独立的新兴学科。利用计算机技术进行语言研究和语言(英语)教学已成为时代发展的必然趋势。
二、计算语言学和语料库语言学对语言研究和英语教学的意义
“语料库”是为一个或多个应用目标而专门收集的、有一定结构的、有代表性的、可被计算机程序检索的、具有一定规模的语料集合。其按照一定的语言学原则,运用随机抽样的方法,收集自然出现的连续的语言运用文本或话语片段来建立。以一定大小的语言样本来代表某一研究中所确定的语言运用总体。语料库按选取的时间可以分为“历时语料库”和“共时语料库”;按加工深度可以分为“标注语料库”和“非标注语料库”;按语料库的结构可以分为“平衡语料库”和“自然随机结构语料库”;按用途可以分为“通用语料库”和“专用语料库”;按语种又可分为“单语语料库”和“多语言语料库”等(冯志伟,2008)。
语料库语言学对以往的语言学研究和语言教学方式都提出了挑战。第一、语料库语言学或计算语言学都是实证研究为主的研究方法,这区别于以往的内省法研究。语言研究和教学都不再是研究者或教师的主观臆断,更多的基于大量的实际例句。第二、语料库语言学或计算语言学对于语言研究或教学中的例句要求是“必须是语言实际使用中的真实语用”这一层面,这就避免了研究者或教师外语水平的参差不齐而导致的语言研究错误或教学错误。中国的英语老师确切的说也是“二语习得者”,根据二语习得理论,我们知道教师的“母语”是汉语,“目标语”是英语,教师只是比普通学生英语学习的更好一些,可以比学生更大程度的“接近”目标语,但教师本身也很难完全达到“本族语者”的程度;再加上日常的英语教学中教师的英语水平更是良莠不齐,因此,传统英语课堂上教师“语用”错误必然存在。但如果在英语课堂上引入本族语者语料库,这一问题可以迎刃而解。比如,BNC(British National Corpus)是1亿词次的英国英语语料库,通过这一语料库,学生可以直接接触到地道的英式英语,其收录了上个世纪80年代到1993年的多个领域的英式英语实际句用,无论对于学生还是研究者的英式英语的历时和共识变化研究都具有巨大指导意义。第三、语料库语言学融入了统计学的概念,从而也催发了“语言统计学”的发展。例如:语言学家在统计搭配强度的时候,可以利用统计学的“方差、对数”等统计手段,量化统计出搭配的强度,从而避免了不同学者的主观臆断。在英语教学中,统计学概念也应该引入,例如,词频的高低、搭配的强弱、语言样本的随机抽样等概念都应与时俱进的引入日常英语教学,从而改变几十年来一成不变的英语教学内容和模式。第四、计算机统计软件和编程语言成为划时代的研究和学习英语的手段。深爱计算语言学和语料库语言学的学者都知道,工欲善其事,必先利其器。计算机软件和计算机编程语言是本领域的利器。通过软件,我们可以快速、大量的检索语言样本,统计出高频词,计算搭配强度等。通过编程语言我们可以批量的提取、标注语言样本,从而节省大量的人力、物力,提高工作的精度和速度。语料库领域大量的经典软件,如:wordsmith,antconc等;再如:统计学软件,SPSS;编程语言有很多其中PERL是最适合进行语言提取和标注使用的。因为计算语言学和语料库语言学是交叉学科,因而对研究者和学习者都提出了更高的要求。
三、结语
综上所述,计算机在语言研究和外语学习中所起到的作用日益增大,已经成为学习和研究不可替代的工具。计算语言学和语料库语言学是交叉学科,同时精通双学科的人才更是宝贵。在英语教学中更多的引入英语本族语者语料库可以更好的矫正中国学生的中式英语,从而让学生学习更地道的英语;把语料库应用在语言研究领域,可以纠正传统研究中的一些谬误,真正发现语言使用的规律。把定性和定量研究相结合是目前和未来语言研究和学习的趋势所在。
参考文献:
[1]冯志伟.语料库语言学的进展序言[M].2009.