查字典论文网 >> 语料库语言学对语言学理论的贡献分析

语料库语言学对语言学理论的贡献分析

小编:

语料库语言学对语言学理论的贡献分析

摘要:语料库语言学沿袭了经验论重语言实事的传统,又提高了人的认识能力和对语言理论的证伪能力,对整个语言学体系有着重大的理论贡献。

关键词:语料库语言学 语料库 理论贡献

中图分类号:H0 文献标识码:A

语料库语言学是20世纪80年代才崭露头角的一门交叉学科。语料库通常指为语言研究收集的、用形式保存的语言材料;是由出现的书面语或口语的样本汇集而成,用来代表特定的语言或语言变体。它是一个由大量的语言实际使用的信息组成的、专供语言研究与分析和描述的语言资料库。

语料库语言学为语言研究提供了一种全新的方法和思路。它以真实的语言数据为研究对象,对大量的语言事实进行系统分析。它研究的是语言行为(language performance),其目的是凭借大规模语料库提供的客观翔实的语言证据来从事语言学研究和指导自然语言信息处理系统的开发。如:Sinclair教授领导的“柯林斯—伯明翰大学国际语料库”(Collins Birmingham University International Language Database;简称为COBUILD)利用计算机进行语料开发,COBUILD语料库至2009年8月,所含的语料库已由原来的6百万次扩展到2亿次,成为当今世界上最大的英语库之一。

本文将简要地探讨语料库语言学与西方语言哲学的历史渊源,并从语言哲学史的角度分析语料库语言学对整个语言学体系的贡献。

一 科学哲学上的经验论与唯理论

西方科学哲学的经验论认为感性经验是知识的唯一源泉,主张一切知识都通过经验而获得。唯理论则承认理性认识的可靠性,否认理性认识依赖于感性经验。

康德对人的认知能力进行了批判考察,他认为人的认知能力是有限的。正是由于人认识能力的局限性,先天地注定了理论的局限性。波普(Karl Popper)赞同康德关于理性为自然立法的思想,但又认为科学知识的增长是一个猜想与反驳的过程,即通过不断提出尝试性的猜测,并不断清除猜测中的错误的过程。在波普看来,科学的合理性,实质上就在于科学的批判和不断进步性。

二 语言学界的经验论与唯理论

语言学界的经验论体现为结构主义。该流派非常强调可以直观的感性,也就是语言材料的收集、描写和实地调查,注重语言行为的描写。

语言学界的唯理论体现为认知主义,其代表人为乔姆斯基(Noam Chomsky)。他认为结构决定功能,人的认知能力是有限的。这就暗含了语言学理论的局限性以及语言学理论被证伪的合理之处。

三 语料库语言学对整个语言学体系的意义

西方现代理论的特征是对比研究法、理论逼近法、比较研究法。从西方语言学哲学史的角度看,对比研究法和比较研究法的哲学基础是经验论,而理论逼近法的哲学基础则是康德的先验论和波普的证伪论。因此,无论从经验论的立场看,还是康德的先验论或者波普的证伪论的立场看,语料库语言学整个语言学理论体系有着深远的哲学涵义。归纳起来,其哲学影响主要体现在三方面:

1 沿袭了经验论重语言实事的传统

利用真实的语言材料研究语言一直是语言学家的传统。美国结构主义语言学派都曾以原始的方法认真积累真实语言素材,并且以这些素材为基础来发现规律和解释语言现象。提供真实语料可以说是语料库语言学的生命线。现在一些重大的语言项目几乎都是基于大规模语料库而进行的,通过大规模语料库建立统计模型也成为语言信息处理和加工的主流模式。在语料库语言学研究中,特别是口语文本一直向合语法—不合语法的两分法提出了挑战。Aarts(1991)就提供了一些很好的例子,语料库里的一些句子并不符合以直觉为基础描述的可能的情况,但这些“不合语法的”或边缘现象往往有相当高的出现频率。

语料库类型可以根据研究需要而定。建库人可以根据需要收集某一语域的口语或书面语的共时语言实例;也可以收集该语域历时的语言实例(如:赫尔辛基英文文本语料库历时部分);还可以建用于翻译或对比研究的双语或多语的平行语料库;还有像国际英语语料库(ICE)那样的某一语言的不同变体之间的语料库;还有研究一语、二语或外语学习者(口语、笔语)语料库等等。一个典型的例子是,上海交通大学的JDEST英语语料库。利用这个语料库,通过语料比较、统计、筛选等方法为中国大学英语教学提供通用词汇和技术词汇的应用信息,为确定大学英语教学大纲的词表提供了可靠的量化依据。这个语料库也在英语语言研究中发挥了作用,支持基于语料库的英语语法的频率特征、语料库驱动的词语搭配等项研究。从理论上来讲,只要我们按照严格的统计取样(辅以前期实验性取样并验证)的办法去收集,就可以获得我们所想要的具有足够代表性的语料。

语料反映了语言使用的真实状态,接近其本质特征。研究者可以借助诸如句法学、话语分析、语用学、社会学、人类学、民俗学等其他理论手段,对语言的本质和实际运作进行描写和研究。

语料库标注的好坏、类型的多寡和有无适合专项研究的处理软件很大程度上决定了语料库的有用程度。语料库标注就是把文章中的语句按一定的标准切开,并对每个词标上标记。因此,语料库标注也可以被理解为一种元语言形式。它是对原始语料进行一种初步的静态的注解。词性标注是这样,某些句法层的标注也是这样。还有一些研究者将所有语料进行主位、述位的标注,以便对其施行系统功能分析。因此,如果对口语语料再进行音段和超音段的标注,那将会给对话语的动态分析带来极大方便。

2 大大提高了人的认识能力

语言研究者既要面对康德和乔姆斯基提出的认知能力有限论,又要面对无限的语言事实,而“语言研究者的任务是要找出造成无限事实的有限成因来。西方当代理论语言学家讲得更加明确,不但要找到一种语言中无限语言事实的成因,而且要找到所有可能语言中无限语言事实的成因”。

语料库的处理工具,主要有转写工具(transcriber)、检索工具(concordancer)、对齐工具( aligner)和其它一些统计工具等等。这些计算机程序的出现使语料库语言学的定性与定量相结合的方法成为可能。借助计算机和文本分析软件强大的检索功能和文本分析能力,研究者可以对百万级的语料进行词性附码(tagging)和句法分析(parsing)等标注(annotate)操作,而这种工作量如果用过去手工方式进行,简直无法想象,而且出错率比手工方式低很多。显而易见,语料库语言学大大提高了人的有限理性,增强了人的认知能力。

一个著名的例子是,Biber(1988)和Biber(1989)描述了如何从兰开斯特-奥斯陆/卑尔根语料库(LOB)和伦敦-朗德语料库(LLC)近100万字的语料中发现了67个语言特征。这些语言特征被列出来,并计算它们在481个抽样文本中每个文本出现的次数。利用因素分析,识别出这67个语言特征共现的模式,然后建立一些文本变化的重要维度。通过这种方法,某些文本或文本群可以被视为具有共同的语言维度。因此,并不是通过模式、使用,或功能来定义文体或语域,Biber的方法是找到哪些文本具有共同的语法和词汇特点,并根据它们是否反映因素维度而建立文本类型学。

运用语料库,研究者可以进行句法、词法及自动语法分析。利用语料库进行语法分析是语料库语言学的早期目的之一。如今,人们对语料库内的语料进行更高层次的研究,对入库的语篇做进一步的处理,如进行词性附码和句法分析(句法分析是指对经过自动词性附码的语料库根据某种特定的语法描述进行语法分析),使语料的自动语法分析成为可能。从而也大大方便了词的语义及功能研究、近义词的比较研究、搭配及其结构的研究、语体的研究、英语口语音型和语调研究、英语名词短语的成语性研究和英语句法发展的研究。自动语法分析还被应用于语法检查、词义排歧、自然语言接口、对名词短语辩识的改进、机器翻译等。

此外,语料库语言学还为语义学和语用学研究、话语及会话分析、言语变体(口笔语,语言与性别,文体学及方言)、语音科学、儿童语言习得和心理语言学研究等方面提供了非常丰富的实例,充分体现了语料库语言学在语言研究方面的作用。

3 提高了对语言理论的批判能力或证伪能力

Blackburn认为:“作为与假科学相对的科学,其真谛不在于它提出了一些假设等待证据在某种高的程度上被证实,而在于它的假设能够被证据反驳。这就是说,它们真正地要面对这样的可能性:被验证,因不合经验终被否定。如此说来,科学的方法不是从积累的材料中机械地归纳出一般来,而是形成大胆假设,然后(此假设)服从严格的验证,这是一种猜想与被反驳之法。科学家提出一个有趣的猜想随后被推翻并不为错,错的是提出一个猜想而不允许被反驳或者面对反驳的证据而死守那个猜想。”

波普的证伪论对语言哲学产生了重大的影。根据波普的证伪论,理论的发展需要反例来证伪。研究者,“提出大胆的理论假设、猜想、或科学发现的假设,然后等待证伪,如不能被证实为伪,或者在证伪之前的一刻,这个假设的理论或科学发现就应该被认为是可行的或为真的。如果一个假设或猜想提出来,连有限的反例都找不到,永远等待证伪而终于未被证伪,这刚好不是证明某个猜想是一个真科学理论么?”

语言学的理论逼近法尤其需要语料来做支持。应用语料库语言学的检索功能,语言研究者可以轻松地检索某种语言现象,进而对理论假设进行验证和修改。语言学家Taylor(2002)在研究英语同义词时,就借助语料库证伪了他自己以前的理论。Dirven and Taylor(1988)的受试者认为“tall window”是很糟糕的表达。然而,这个表达却出现在小说家Iris Murdoch的一段话里(Dirven and Taylor 1988)……事实上,Dirven and Taylor(1988,p.393)错在说“human”必须被描述为“tall”而不能是“high”。兰开斯特-奥斯陆/卑尔根语料库却包含两个“high”被用于“human”的例子”。

从以上例子可以看出,借助于语料库语言学所提供的方法,语言学家一方面可以验证由内省得到的语言规则,也可以基于语料库提供的数据推演出语法、语用规则。由于不同类型的语料库和丰富的标注手段的出现,语料库语言学使研究者的视野更加开阔,证伪能力也愈加强大了。

四 结语

综上所述,语料库语言学是一门语言研究和相应的计算机技术相伴相生的产物,是语言研究中定量和定性方法相互结合的典范,为揭示语言的本质做出其应有的贡献。与语言学的其他分支相比,语料库语言学提供了一个较好的机会解决长期困扰西方科学哲学和语言哲学的难题。越来越多的从事语言学研究的人开始注意到其重要性和发展潜力。

乔姆斯基认为,真正的关于人类语言的理论要满足两个条件:“描述充分性”(descriptive adequacy)和“解释充分性”(explanatory adequacy)。而合理地运用语料库语言学进行语言研究则打开了实现这两个条件的一条新的道路。

热点推荐

上一篇:浅谈提高高职院校学生韩语会话能力的探索

下一篇:如何对幼儿进行德育教育论文 幼儿园关于德育教育之类的论文