旧版网站入口

站内搜索

中国少数民族语言语音声学参数统一平台建设研究中期检测报告

2016年11月29日15:26来源:全国哲学社会科学工作办公室

一、研究进展情况

① 研究计划总体执行情况及各子课题进展情况:

本项目研究计划为:通过实施和完成中国北方具有影响力或代表性语言,即蒙古语、土族语、东部裕固语、东乡语、保安语、维吾尔语、哈萨克语、鄂温克语、鄂伦春语、锡伯语等语言的语音声学参数数据库,搭建“中国少数民族语言语音声学参数统一平台”(简称“统一平台”)框架并进行调试,为进一步开展基于“统一平台”的少数民族语言语音声学描写研究和比较研究打好基础。

本课题自2014年7月以来的研究进展情况:

本项目总体上按照原计划实施。到目前为止

共完成了蒙古、维吾尔、鄂温克、达斡尔、土族等5种语言的索引库、声样库、音段标注库、声学参数标注库和声学参数库(这些声学参数库已达到熟库,并投入了使用);

完成并投入使用“声学参数自动标注/提取软件”和声学参数统一平台软件等软件工具,搭建了“中国少数民族语言语音声学参数统一平台”框架;

利用“统一平台”完成了“阿尔泰语系语言语音实验研究丛书”的蒙古、维吾尔、鄂温克等三卷;

建立了哈萨克、东部裕固等语言的索引库、声样库、音段标注库和声学参数标注库(半熟库);

正在研制东乡语、保安语和锡伯语的索引库、声样库、音段标注库和声学参数标注库。

声学参数自动标注和自动提取软件介绍:两个软件共有源代码大约1500行,自动标注实现了除冲直条外所有声学参数的自动标注,自动提取软件增加了谱重心、偏移量、韵律参数等新的参数的自动计算和提取,两款软件经过了多个用户、大量数据的运行实践和改进,证明了其稳定和高效,极大提高了参数标注和提取的工作效率。

语音声学参数统一平台管理软件介绍:该软件大约有2000行源代码,实现了一次多个音素或多个模糊音节的快速查询,并可以指定多个音节位置、多个数量和多个类型的限定条件,在结果集里增加了选定范围的功能,对所有数量型参数自动统计平均值、标准差、最大值、最小值、波动率等,极大方便了用户的参数统计工作。

②调查研究及学术交流情况(调研数据整理运用、文献资料收集整理、学术会议、学术交流、国际合作等):

调查研究:自2014年7月以来,我们课题组前后赴甘肃、青海交界的积石山保安族东乡族撒拉族自治县、甘肃省临夏回族自治州等地进行语言调查和语音信号采集工作,采集了东乡语和保安语近10个人的语料,10多小时几个G的声样。发音人均来自上述地区的熟练使用本民族语言文化传承人和民间艺人。他们的发音纯正,能够代表本民族语言的语音特征,没有嗓音方面的疾病;录音地点:在当地广播电台标准录音棚或安静的住所;仪器设备:配有索尼指向性话筒 SONY ECM 44B和Creative录音软件的IBM R系列笔记本电脑。采样率为22kHz, 16bits,单声道,S/N 不低于45dB。

自2016年7月25至26日,与内蒙古民族大学蒙古学学院联合承办了“第十二届全国语音学学术会议”。有140位专家学者参加了本次会议。从地区来讲,有15个省市和自治区,包括香港、台湾;从机构来看,中国科学院、中国社会科学院、公安部物证鉴定中心、广东省公安厅刑事技术中心;北京大学、南开大学、复旦大学,包括香港科技大学和理工大学、台湾国立联合大学等36个科研单位和大专院校。本次会议论文集共收集128篇论文。这些论文基本反映了当前我国在语音学研究领域的现状与最新进展。

正在与俄罗斯布里亚特联邦共和国国立大学合作“布里亚特语语音声学参数库”;正在与蒙古国科学院协商合作研制“蒙古语喀尔喀方言语音声学参数数据库”一事。

④研究中存在的主要问题、改进措施,研究心得、意见建议

本项目原计划实施三年,即2013.1—2015.12月。但在实施过程中发现,本项目所涉及的语言较多、实施子课题时需要在多单位之间进行多方面的调节、技术难度和工作量较大等问题。争取2016年12月结项,如果结不了,不会超过重大项目五年期限,即2017年12月。

意见和建议:为了更好地实施和完成我们团队所提出的“中国少数民族语言语音声学参数数据库”中长期目标,本项目需要滚动立项,望基金委予以考虑。

二、研究成果情况

① 代表性成果简介(基本内容、主要观点、学术价值、社会影响等)

呼和,再论蒙古语词重音问题,12千字,民族语文,2014年第4期。基本内容和主要观点:蒙古语词重音分绝对重音和相对重音。非词首音节中含有短元音的多音节词的重音为绝对重音;非词首音节中不含短元音的多音节词的重音为相对重音。蒙古语词重音是整个音节语音四要素变化的综合效应;词重音属自由重音,但不完全是自由的,其位置与长元音(或复合元音)有关;学术价值、社会影响:该项研究针对几百年以来有关蒙古语词重音方面的争论,用实证和感知实验的方法解释和解决了词重音问题。这对蒙古语、蒙古语族乃至阿尔泰语系语言的韵律基础研究和应用研究具有较高的参考价值和应用价值。

周学文,呼和,语音声学参数自动标注/提取系统简介,8千字,中文信息学报,2014年第3期,第28卷(Vol.28, No.3),p123-128,2014年5月出版。本文重点介绍了一个实用的语音声学参数自动标注/提取软件系统。使用该系统能够极大地降低语音参数标注和采集的错误率,有效提高语音声学参数库研制效率,确保实验方法和实验数据的可重复性和可验证性,从而推动语音声学参数数据库研制和语音声学实验研究工作的规范化和标准化。

呼和,蒙古语元音演变的声学语音学线索,中央民族大学学报(哲社版),2015年第4期,p142—151, 1万字。本文从声学语音学的视角探讨了蒙古语元音的演变问题。主要结论为: 圆、展唇元音的声学格局确定了它们的演变方向和方式;辅音发音方法影响元音舌位的高、低,而其发音部位影响元音舌位的前、后;后置辅音对其前置元音的影响相对大于前置辅音对其后置元音的影响;音位层面的关系是绝对的,而变体层面的关系是相对的;“阴阳对立”是蒙古语元音的一种属性,而“元音和谐律”是这种属性在具体语言中的表现形式。其中,属性层面的关系是绝对的,而规则层面的关系是相对的。导致语音演变的条件和因素错综复杂。学术价值、社会影响:本文用声学模型的理论和方法为语音演变提供新的研究思路和方法。

呼和,语言亲属关系声学语音学线索,实验语言学,第四卷第4号,2015年。本文提出用“语音声学模型相似度”实证语言之间亲属关系亲近度的思路和方法,并用蒙古、维吾尔、鄂温克、达斡尔和土族等阿尔泰语系语言的元音声学模型进行了初步验证。学术价值、社会影响:本文为语言亲属关系亲近研究提供新的理论和方法。

课题组供稿

(责编:沈王一)