• 休闲生活
  • 教育教学
  • 经济贸易
  • 政法军事
  • 人文社科
  • 农林牧渔
  • 信息科技
  • 建筑房产
  • 环境安全
  • 当前位置: 达达文档网 > 达达文库 > 信息科技 > 正文

    浅谈中国少数民族濒危语言语音语料库的设计

    时间:2020-10-07 07:54:54 来源:达达文档网 本文已影响 达达文档网手机站

    【摘要】:设计构建中国少数民族濒危语言语音语料库,根本上是为了以一种系统的方式将频临消失的少数民族语言的声音永久地保存下来。这其实是一种无比珍贵的民族文化的见证,语音语料库的建立更能为相关的研究学者提供重要的参考,让他们得以以更加便捷地方式完成对相关语言资料的查询、检索与统计工作,兼具文化与研究价值。因此,本文就从对濒危语言语音语料库特点与价值的阐述出发,具体阐述了语音语料库的设计策略,希望能给相关的工作人员提供一些建议和帮助,让我国少数民族濒危的语言语音得到更好地保护与传承。

    【关键词】:中国少数民族语音;濒危语言;语言语料库;设计策略分析

    一、引言

    语音语料库与传统的纯文本语料库具有很大区别,语音语料库的表达形式有三种,它对文本、语音以及声学参数进行了融合。我们构建中国少数民族濒危语言语音语料库,不仅是为了系统而永久地保存那些濒临消失的少数民族语言的声音,也是为了给相关学者的研究提供便利。当前,构建大型语料库并基于它来开展相关研究,已然成为了国内外语言学研究工作的一个重要趋势。

    二、濒危语言语音语料库建设的实际价值分析

    计算机技术的应用使得语言学的研究机械工作量大大降低,那么相应的研究效率也就得到了很大的提升。近年来,我国在语音语料库建设工作方面取得了长足的进步,建立并完善了许多新的语音语料库。它们为语言研究及技术处理工作提供了许多重要的语料与技术参数,使得相关研究所取得的成功更加客观可靠,也更具实际应用价值。

    我们建立濒危语言语音语料库不仅仅是为了给相关研究提供便捷条件,这同时也是对人类非物质文化遗产的必要保护。随着经济的发展,全球化、城镇化等进程的不断深入,世界范围内使用非主体语言的人数锐减,逐渐地走到濒临消失的境地。近年来,无论是政府相关部门还是一些民间团体,都开始为这些语言的保护工作付诸努力。可以看到,许多的少数民族语言其实并没有具体的文字与书面语,对于这些语言的保护困难重重。在意识到语言濒危的严重性,对语言多样性保护的重要性后,我国语言学界达成了共识,必须尽快采取更加多样化、系统化的形式与手段来帮助记录、保存那些濒临消失的语言。因此,建立濒危语言语音语料库成为了一项刻不容缓的重要任务。国家也建立相应的项目,即“中国少数民族濒危语言语音语料库”,该项目就是为了对中国境内那些濒危语言,通过语言、国际音标、录像等多样化的形式进行可能是最后一次的抢救性记录工作。

    三、濒危语言语音语料库的具体设计策略

    语言语音语料库的构建工作不仅具有复杂性,还具有艰巨性,需要耗费大量的人力物力,在进行具体操作前要做好充分的准备工作,进行良好的整体规划,明确策略,规范步骤,从而有效减少返工与浪费问题的次数,提高工作效率。

    (一)确定数据库建设的目的语言与发音人

    建设语音语料库,首先要确定好目的语言。其次是要选择适宜的发音人,要求其口齿清晰、语速适中,是熟练的母语发音人,并且要能够主动配合调查工作。首要因素是对母语的掌握程度,我们必須注意到一个问题,根据语言濒危程度的不同,有些民族的年轻人的语言其实已经出现了不同程度的变化,实际上只有该民族中的那些老年人才能真正掌握完整的母语。例如仡佬语中强调鼻冠音,但五六十岁的人的鼻冠音其实就开始缺乏系统与稳定性,吟哦最终我们选择了一位年逾八十的老人作为发音人。

    (二)做好发音素材的选择与编制工作

    其次,发音素材的选择与编制工作也是数据库构建的关键环节之一。数据库是对濒危语言的记录,我们应当尽可能的以更加系统的方式将相关语言的全貌记录下来。因此,在选择与编制发言素材时应注意五个方面:首先是语音,应选择记录那些能够全面反映包括音质、超音质特点等在内的目的语语音特点的相关词语,如果存在一些具有鲜明特色的语言现象,还可以通过增加例词从而充分反映其特征。第二是词汇,四千词词表是基础,可以在此基础上进行拓展,当然对于那些无法很好译成汉语的少数民族语词也可以进行相应增减。一个词语应当重复录制三遍,采集的词语发音样本应当在一万个以上。第三是句子,提前根据语言的语法特点编制了一个总数在800左右的句子调查表,每个句子重复录制两遍,在具体录制过程中可以根据具体情况对句子的叙述方式与内容进行一定的调整。第四是自然对话,大多选择日常生活为题,以问题回答、自由谈话这两种形式为主。最后是长篇话语材料,尽可能收集多的民间故事、诗歌以及民歌等内容。

    (三)在录音过程中选取适宜的说话方式

    由于录音过程中选取的说话方式将直接影响语料库的用途,因此必须进行谨慎选择。主要有两种方式,其一是具有提示文本的朗读,发音人将汉语提示转换成母语进行朗读,其二是自然语音,由发音人不受限制地进行自我介绍,也可以阐述民族的生活状况或是讲述一些民间故事。通过将两种说话方式相结合,可以大大拓展语料库的应用领域与实际价值。

    (四)确保操作人员的工作专业性

    为了提升语料库的质量,我们必须确保操作人员具有很高的工作专业性,确保录音、记音、记音材料整理等方面的工作高效、高质量。因此,可以由相关语言的研究专家直接亲自负责记音工作,并结合事先准备、边录音边补充以及录音后核音等多道程序确保记音的准确性。在录音工作完成后,要对原始语音进行完整保存,在运用副本来完成对语音的切割整理以及核音工作。

    建立数据库系统需要储存四个方面的素材,它们分别是:发音人属性素材、发音文本素材、实际语音素材以及存储部分声学分析数据。构建的语料库应当不仅可以为从事语言研究的相关技术人员提供数据,还能为普通用户提供便捷的查询与检索通道。因此,我们要尽可能提升后台数据库管理系统与前台用户使用界面结合的有机与顺畅度。

    结语:综上所述我们可以看到,中国少数民族濒危语言语音语料库它其实是一个具有开放性的数据库,我们可以对其语料规模进行不断地扩展。此外,根据不同的研究目的,我们可以对语料信息进行相应的加层标注。但是,要想以更加高效高质量的完成濒危语言语音语料的记录与保存工作,仅仅依赖有限的工程技术人员与实验室录音资料难度极大。我们希望所有关心我国濒危语言抢救、保护以及少数民族濒危语言语音语料库建设工作的仁人志士,都能真正参与到这项工作中,通过多方努力,共同探索这一大有发展前途的研究领域,以实现更大的突破。

    参考文献:

    [1]文化的传承与少数民族濒危语言的保护研究[J]. 吴坤湖. 贵州民族研究. 2016(10)

    [2]科学理智地深入开展濒危语言保护的研究[J]. 戴庆厦. 北方民族大学学报(哲学社会科学版). 2015(03)

    [3]少数民族濒危语言的保护研究[J]. 许娥. 贵州民族研究. 2012(04)

    相关热词搜索: 语料库 濒危 浅谈 少数民族 中国

    • 生活居家
    • 情感人生
    • 社会财经
    • 文化
    • 职场
    • 教育
    • 电脑上网