• 休闲生活
  • 教育教学
  • 经济贸易
  • 政法军事
  • 人文社科
  • 农林牧渔
  • 信息科技
  • 建筑房产
  • 环境安全
  • 当前位置: 达达文档网 > 达达文库 > 信息科技 > 正文

    近十年国内外学习者语料库建设情况及研究述评

    时间:2021-01-14 07:56:51 来源:达达文档网 本文已影响 达达文档网手机站

    摘 要:本文通过对学习者语料库相关文献的搜索和整理,对近十年国内外学习者语料库建设情况进行了重点介绍,同时对基于学习者语料库的二语习得相关研究进行了探讨,旨在对我国学习者语料库的建设和相关研究提供借鉴。

    关键词:学习者语料库;二语习得;英语学习

    [中图分类号]H319.3

    [文献标识码]A

    [文章编号]1006-2831(2015)02-0052-6 doi:10.3969/j.issn.1006-2831.2015.01.014

    1 . 概述

    语料库语言学的研究开始于20世纪50年代,之后该领域的研究者逐渐增多,语料库的研究开始与大多数语言研究相关领域相结合,这一结合的主要贡献之一为变体研究,包括语言媒介变体研究(口语变体与笔语变体),语场变体研究(一般文体与专门化语体)以及地理地位变体研究(世界英语)。然而,对外语/二语学习者语言变体的语料库研究直到20世纪90年代初才逐渐兴起(Granger, 2003: 538)。学习者语料库主要是指经过计算机处理的外语学习者的语言产出的数据库(Leech, 1998: 3),本文将对近十年国内外学习者语料库的发展现状和基于学习者语料库的二语习得相关研究作一个评述。

    2 . 学习者语料库的建设情况

    经过三十多年的发展,学习者语料库的建设在全世界范围内掀起一股热浪。在学习者语料库研究颇有建树的研究团队代表是由比利时Louvain-La-Neuve大学的Sylviane Granger教授所创建的英语语料库语言学中心(Center for English Corpus Linguistics),简称CECL。根据CECL的不完全统计,截止到2014年11月14日,全世界学习者语料库已经达到136个,涉及的语言包括英语、汉语、捷克语、阿拉伯语、荷兰语、法语、德语、匈牙利语、朝鲜语、挪威语、西班牙语、意大利语等十几种,媒介方式由之前的以笔语为主逐渐向多媒介方式转变,包括口语(spoken)、笔语(written)、多媒体(multimedia)以及计算机中介交流(computer-mediated communication,简称CMC),收录的语料丰富多样,例如学生习作、访谈、演讲、测试等,涵盖了从语言初学者到熟练使用者不同层次的语言学习者(http:// www.uclouvain.be/en-cecl-lcworld.html)。在统计的语料库中,以英语为学习目标语言,母语为汉语的学习者语料库共有15个,5个来自中国大陆地区,6个来自香港地区,3个来自台湾地区,1个来自新加坡。

    2 . 1 国外学习者语料库的建设发展情况

    2.1.1 CECL开发的学习者语料库

    由比利时著名的英语语料库语言学中心CECL开发的学习者语料库主要有五个:ICLE、LINDSEI、LONGDALE、VESPA和FRIDA。除了FRIDA是法语学习者语料库以外,其余四个语料库都是英语学习者语料库。

    国际英语学习者语料库(The International Corpus of Learner English,简称ICLE)是由CECL在20世纪80年代末启动建设的,是世界最常用的学习者语料库之一。2009年ICLE已经升级为第二版本,其涵盖的学习者母语类型由第一版的11种语言增至16种。该语料库主要收录来自非英语国家的中高级英语成年大学生学习者所写的议论文(占85%)以及其他文体(Granger, 2003: 539),有限时作文与非限时作文之分。目前该语料库正在建设第三版本。

    英语学习者追溯型数据库(The Longitudinal Database of Learner English,简称LONGDALE)是2008年1月正式启动建设的项目,目前还在建设中。该语料库旨在搜集与英语学习者学习过程中不同阶段的语言输出,因此数据的搜集对象是在两三年的一个时间段内持续搜集的同一批英语学习者的语料,以此控制语言掌握熟练水平的发展过程,并且这些语言学习者具有不同的母语背景,一般在研究初期语言水平为中级。目前数据库建设已搜集到同一批学习者在2008、2009及2010年三个时间段所撰写的议论文,但该语料库最终目的是涵盖尽可能多的文本及口语的语言输出数据类型,包括散文,摘要,图片描述,口头访谈等等。

    专门用途英语多类型数据库(The Varieties of English for Specific Purposes Database,简称VESPA)同LONGDALE一样是2008年1月起开始的,旨在建成一个以英语为二语学习不同课程的学生的ESP文本产出语料库,课程包括语言学、法律、医学、生物等等,文本体裁包括报告、论文、硕士毕业论文等等,学生的语言水平不同,从大学一年级学生到博士生不等。

    Louvian国际英语口语数据库(The Louvain

    International Database of Spoken English Interlanguage,简称LINDSEI)是在ICLE其后1995年开发的口语语料库,其语料来自于14个背景的不同母语的中高级英语学习者的口头访谈。

    2.1.2 其他国家的新兴学习者语料库举例

    除了比利时以外,近十年来世界上其他国家的学习者语料库建设如雨后春笋般蓬勃发展,主要集中在欧洲(英国、德国、法国、西班牙、意大利、波兰、荷兰、瑞典、芬兰、挪威等国家),北美洲(美国和加拿大),亚洲(中国、日本、韩国等国家);另外巴西、以色列、南非等国家也开始投入建设学习者语料库。以下是近年来具有代表性的新兴学习者笔语语料库,目前这些语料库还在不断更新发展之中。

    相关热词搜索: 语料库 述评 学习者 近十年 国内外

    • 生活居家
    • 情感人生
    • 社会财经
    • 文化
    • 职场
    • 教育
    • 电脑上网