旧版网站入口

站内搜索

国家社科基金重大项目

2015年工作简报

2016年06月02日14:12

(一)总体研究进展

本项目2013年1月开题至今(2015年12月)已近三年。项目按原定目标与计划推进,总体顺利。

本项目有两项目标:(1)建设一个新型的方言语篇库;(2)借助课题推动方言研究数字化。分三阶段建设:(1)前期(2013):理论研究与语料库设计;(2)中期(2014-2016):语料采集与标注;(3)后期:语料入库及语料库运行(2017)。

现汇报2014年7月至2015年12月的中期研究进展。

本期主要工作:(1)采录语料;(2)研制软件。

语料及其相应处理软件是建设语料库的基础,是本项目的两项核心任务。2014年下半年,依凭前期理论研究成果,同步启动了这两项研究。

一、 一、语料采制工作

语料采制的主体工作是采录与转写,由子课题二、三、四组担任。采用方言点责任制,即一个方言点一位责任人(当地方言学者),经费拨至方言点。语料采制分两期,第一期为2014-2016年,有14个方言点;第二期为2015-2017年,有4个方言点。各方言点2014年7月至2015年12月的工作进展见下表。

各方言语料研制进展一览表

阶段 子课题/负责人 方言点 责任人 采录 转写

第一期 二组

(北、西部方言)

莫超 兰州 莫 超 完成 完成部分

银川 张建军 完成 完成部分

平遥 史秀菊 完成 未开始

哈密 杨洪建 完成 完成部分

荣成 王淑霞 完成 开始

哈尔滨 梁晓玲 完成 开始

北京 冯青青 完成 完成部分

三组

(东部方言)

王洪钟 南京 刘俐李 完成 完成部分

温州 王洪钟 完成 开始

黟县 栗华益 完成 完成部分

常熟 顾劲松 完成 开始

长沙 李康澄 完成主体 开始

四组(南部方言)

陈晓锦 广州 陈晓锦 完成 完成主体

福州 施小梅 完成主体 未开始

第二期 四组 南昌 卢继芳 筹备中

梅县 唐志强 准备中

三组 黄冈 漆 盈 准备中

二组 成都 郭秀娟 准备中

第一期14个方言点的采录工作基本完成,已进入转写阶段。长沙完成四分之三的语料采录,剩余部分将于2016年1月的寒假完成。第二期有3个方言点正在寻找发音人,计划2016春夏季采录;另一方言责任人已有对象,待最后确认。

项目总组直接参加或指导或派员协助方言点的语料采制工作。

例如新疆哈密的语料录制。2014年8月,项目首席专家刘俐李、助手侯超实验师与新疆大学张洋教授、杨洪建副教授、研究生卜元彬组成团队共赴哈密采录。刘俐李现场总负责,哈密方言研究专家张洋同步监听发音质量,发现问题随即质疑、讨论、重录,杨洪建与卜元彬负责检查、复核、剪辑与整理音档,发现不合格的音档随即补录,侯超负责录音与录像,保证各项参数达标。5人团队白天录制,晚上总结整理,各司其职、相互配合,紧张而有序地顺利完成了语料采录,并与发音人结下深厚友谊。

再如2015年8月长沙方言语料的录制,项目组派唐志强博士协助调查与录制。2015年12月山西平遥录制语料,方言点负责人史秀菊教授多次与项目首席专家通过电话和短信讨论商量具体问题。

二、软件研制工作

有两项任务:(1)研制语料库管理软件;(2)研制语料转写软件。

语料库管理软件体现语料库的信息化构架并保障其运行,针对全体语料,只适用于本库;语料转写软件是处理入库语料的工具,针对语料个体,使语料转写软件化或半软件化,提高语料转写的效率与质量,既可用于本库也可用于其他语料,具有通用性。语料转写软件对推动方言研究数字化有重要作用。项目组以自主研究为主,引介现有软件为辅。

软件研制由子课题一承担,负责人曲维光教授。下分两组,第一组骨干成员鲍培明副教授,负责语料库管理软件及字表、词表转写软件的研制。第二组骨干成员宋益丹讲师和侯超实验师,负责声调数据处理软件的研制和借用软件的引介与培训。

2014年7月3日,项目组召开专题研讨会,邀请计算机科学、地理信息系统、实验方言学等领域的学者共同研究软件的研制。9月中旬,项目首席与软件组负责人曲维光教授讨论具体方案。11月,语料库管理软件完成构架设计。2015年5月,完成字库与词库管理软件与词表转写软件初稿。6月,项目首席专家查看软件初稿,提出修改意见。9月完成初版修改,并提交方言组使用。11月初,项目组组织软件培训,面授各方言点责任人使用,并根据使用中发现的问题或不足现场修改。11月中旬完成词表转写软件的第二版修改,同时完成句表转写软件的研制并提交使用。这是第一软件组的工作情况。

与第一组同步,项目首席组织了软件二组的声调数据处理软件的研制与借用软件的引介培训,分别由宋益丹与侯超具体负责。引介软件及自研的“同音类记”单字记音法的培训视频2015年1月完成录制并下发各方言点。声调数据

处理软件2015年7月7日初完成初稿,11月初完成二版修订并提交使用。在方言音系的记音中,声调调值最难确定,我们采用声学实验来解决,其焦点是数据处理。该软件采用比较科学的新算法,不仅使数据处理结果更为客观,而且较大幅度地提高了工作效率。

软件研制工作可总结为以下4项。

1.2.1 完成语料库管理软件的五项研究

(1)完成语料库总体设计及4个子库的数据结构和数据存放方式的设计。

(2)实现字库和词库数据从当地到服务器的上传与下载。

(3)实现字库和词库通过浏览器方式的增、删、改和查询功能。

(4)对服务器端,实现字库国际音标对词库中各字的国际音标标音功能。

(5)完成语料库管理界面的修订,于2015年11月上网供课题研究使用。

1.2.2 研制成功三项语料转写软件

(1)单字调语音实验数据处理软件

(2)词表转写软件

(3)句表转写软件

这三款软件可较大幅度提高词与句标写国际音标的效率与准确程度。

1.2.3 自创同音类记法

这是课题组集体自创的字音批量记音方法。

利用Excel的筛选、排序功能以及与音档的关联功能,将同音字文本与音档关联并集中排列,以方便批量听音审音。既降低了听音审音的强度与难度,又提高了听音审音的效率与质量。同时依据各单字的古音信息,实现批量记音,数倍提高了单字记音速度。

1.2.4 引介语篇转写软件

借用Elan ( EUDICO Linguistic Annotator)作语篇转写软件。 Elan由荷兰纽梅茵马克斯布朗克心理语言学研究所开发,是一个跨平台(可在Windows ,Macos ,Linux等主流操作系统上使用)的多媒体转写标注软件。广泛应用于口语语料库建设、话语分析、态势语研究等方面。2001年颁布,比较成熟,已有汉文版。本项目所以选择Elan是因为:第一,它可同步实现语篇的三种标注——汉字、国际音标、普通话译文;第二,可分别进行音频、视频文件的标注。这两种性能与本项目语料文件储存类型及语篇标注要求相吻合。按照项目组要求,王洪钟教授和侯超实验师研究了Elan性能和操作程序,并用已采录语料试验,确定了语篇标注工序。由侯超起草、项目首席专家审定修改,形成本项目语篇标注规范,收入《汉语方言语篇库建设手册》下篇第三部分“语料整理规范”第六款第四条“语篇标注规范”。

(二)各子课题进展

2.1 子课题一:语料库建设系列软件的研制

负责人南京师范大学计算机学院曲维光教授。任务是研究语料库管理和语料转写软件,实现语料加工的软件化或半软件化。采用两条途径实现这一目标:一是自主研制相应软件,二是借用已有软件,分别由两个小组承担。

语料库管理软件已完成五项研究,详见上1.2.1节

完成三款语料转写软件的研制,详见上1.2.2节。

完成借用软件的引介及与项目研究的对接,详见上1.2.3节。

该组成员同时进行语言处理及计算语言学的相关研究,发表论文3篇。

2.2 子课题二:西部、北部方言语料研究

负责人兰州城市学院莫超教授。该组负责北方官话二级区(不含江淮官话)及晋语的8个方言点的语料研究。

2014年8月至今,该子课题完成第一期7个方言点的语料录制,并开始语料转写。第二期的1个方言点正在准备录制。

该组成员同时进行本方言的相关研究,发表论文10篇。获市社科联科研二等奖一次。

本阶段该组成员获得两项国家社科基金课题“河州方言语言接触视阈下的河州方言形成与演变研究”(2015)和“苏北江淮官话的地理语言学研究”(2015),一项中国博士后基金课题“苏北方言语音的现状及历史演变研究”(2014)。

2.3 子课题三:中部、东部方言口语语料研究

负责人浙江师范大学王洪钟教授。该组负责吴语、徽语、湘语、江淮官话共6个方言点的语料研究。

2014年10月至今,完成一期5个方言点的语料录制,二期的1个方言点正在准备录制。

该组成员同时进行本方言的相关研究,发表论文2篇。

2015年该组成员获得一项国家社科基金课题“南部吴语发声类型多维特征参数实验研究”,2014年获得一项教育部人文社科基金课题“吴语特殊发声类型研究”。

2.4 子课题四:南部方言语料研究

负责人暨南大学陈晓锦教授,负责粤语、闽语、客家话、赣语4个方言点的语料研究。

2014年10月至今,该组完成一期两方言点主体语料的录制。二期的一个方言点正在准备录制,另一个方言点的负责人已有人选,待最后确认。

该组成员同时进行本方言的相关研究,发表论文3篇。

2014年该组成员分别获得国家社科基金重大项目与重点项目各一项:“海外华人社区汉语方言与文化研究”(重大)、“美国华人社区汉语方言与文化研究”(重点)。

2.5 子课题五:方言口语韵律研究

负责人南京师范大学顾文涛教授。本组研究任务有两项:一是建设典型方言专用韵律数据库;二是用实验方法研究各方言点韵律词(双音节)变调。

目前该组已完成的研究:

(1) 南京、徐州、苏州、常州方言句焦点重音的韵律编码方法的对比研究

(2) 基于声调格局的“边缘吴语”概念研究

(3) 仙居话内爆音的发声态研究

正在进行的研究:

(4) 江淮官话和吴语的声调研究;

(5) 江淮官话和吴语的发声态研究;

(6) 方言区的情感语音特征研究

该组成员同时还进行韵律及方言的相关研究,发表论文2篇。

(三)学术会议

一、举办全国性学术会议“2015实验方言学论坛”

2015年11月8至9日,由中国语言学会语音学分会主办、本项目组承办的 “2015实验方言学论坛”在南京召开。一批著名的方言学者与语音学者以及全国各地实验方言学者共计60余人出席论坛。课题组骨干成员出席了会议。论坛主旨是交流自2011年首届实验方言学论坛后的研究成果、推动实验方言学发展。本项目建设目标“方言研究数字化”是重要议题之一。开幕式上,项目首席专家发布了本项研究的前期成果“现代汉语方言有声语料库”(电子成果)。以下是论坛合影。

二、举办“国家社科重大项目研讨会”

2015年11月7日举办本项目组全体骨干成员专题研讨会。有三项议题,一是总结前期语料采集工作;二是培训课题组研制的三款软件(单字调数据处理软件、词表转写软件与句表转写软件)和自创的“同音类记法”,为此后的语料转写工作提供快捷工具;三是展示语料库管理界面,以征求与会成员的意见。

软件的培训采用教与学同步法,现场演示现场实习。边学边练的培训方式不仅使学者们快速掌握了软件的使用,并且软件的短板被及时发现、及时纠正,收到研制与应用的双重效果。同时,培植了方言组与软件组良好的合作情感,建立了通畅的实时沟通渠道和双方可共用的研究平台。

以下是与会成员的合影。

三、举办“全国汉语方言学会第十八届年会暨国际学术研讨会”

这是有上千会员的全国最高层次的方言学会年会,2015年8月4日至6日在兰州召开,由本项目子课题负责人兰州城市学院莫超教授主持承办。本项目组团参会,宣读论文10多篇,并有大会主题报告。

四、组织重要学术会议的专场讨论

第十一届中国语音学学术会议(PCC2014)2014年8月在新疆大学举行。中国语言学会语音学分会会长鲍怀翘研究员授意项目首席专家组织实验方言学专场。项目组以一组方言声调实验与数据处理策略的论文参会。刘俐李参会论文“方言声调大样本单体实验的启示”、侯超“基于语音实验的调系规整方法再议”、宋益丹“汉语方言调长和调型的关系研究”。

(四)学术交流

学术会议

2014年7月至2015年12月,项目组成员出席国际、国内重要学术会议48人次。主要会议有:“首届亚太语言文化生态国际会议”(2015年6月,广州),“全国汉语方言学会第十八届年会暨国际学术研讨会”(2015年8月,兰州),

“he 3rd CCF Conference on Natural Language Processing & Chinese Computing(NLPCC 2014)”(2014年12月,深圳),“动态普通话:变异与规范”首届学术研讨会(2014年11月,澳门),“第47届国际汉藏语言暨语言学会议”(2014年10月,昆明),“第十三届全国计算语言学学术会议(CCL2014)”(2014年10月,武汉),“第十一届中国语音学学术会议”(2014年8月,乌鲁木齐),“Australian International Speech Science and Technology Conference 2014”(2014年12月,新西兰Christchurch),等。

学术讲座

2015年3月,莫超教授应邀在甘肃陇南市政府做“‘氐羌来宾’:远古走来的白马藏人”。

2015年4月,刘俐李教授应邀在湖南科技大学做“汉语方言地理信息系统”讲座。

2015年7月,刘俐李教授应全国汉语方言学会邀请在“汉语方言田野调查高级研修班”(上海交通大学)做“方言研究数字化”讲座。

2014年8月,刘俐李教授应全国汉语方言学会邀请在“2014田野调查语音学研修班”(中山大学)讲授“方言音系实验”。

2014年11月,刘俐李教授应邀在澳门大学讲学:“现代语音学研究与应用”

2014年11月,刘俐李教授邀在澳门语言学会讲座:“方言音系的实验研究”

(五) 社会影响

一、两位子项目负责人获得国家社科基金重大招标项目

陈晓锦“海外华人社区汉语方言与文化研究”(14ZDB107)

顾文涛“社会情感的语音生成与认知的跨语言跨文化研究”(13&ZD189)

二、两位青年学者获得国家社科基金青年项目

冯青青“苏北江淮官话的地理语言学研究”(15CYY013)

宋益丹“南部吴语发声类型多维特征参数实验研究”(15CYY021)

三、中年学者获得国家社科基金课题

莫超“语言接触视阈下的河州方言形成与演变研究”(2015西部项目345号)

四、两位青年学者论文被方言学核心期刊《方言》采用

侯 超“北中原官话‘可’类问句的性质及归属”2015年4期

宋益丹“浙江仙居吴语浊内爆音的语音学考察” 2014年2期

五、首席专家的选题建议入选国家社科基金项目指南

“方言研究数字化基础建设研究”(2014年度国家社科基金项目语言学课题指南第12号)。

(六)阶段性成果

一、现代汉语方言有声数据库(网址:fych.njnu.edu.cn)

该电子数据库是本项目前期成果,2015年11月8日在“2015实验方言学论坛”开幕式上发布。应是我国上网的第一个汉语方言有声数据库。

该库的20个方言点分布于全国10大方言区,覆盖官话的8个二级区,以及湘、闽、吴语的部分二级区。目前发布的是方言词汇语音有声数据库。每方言点录制词汇3600~4000条,其中常用词3000-3500条,核心词300条,方言特征词100~400个。每条数据有26字段,分5类:词项,词属,词音,词义,词性。词项是纲,各方言据此选词;“词属”标明每一词条在词汇系统中的大类(基础词、核心词、特征词);“词音、词义、词性”描写词条的内部构造。词音和词义并注,声音和文本同现,集中反映方言词汇的共性和个性,可自由组合进行多种检索。

二、《论汉语方言地理信息系统》 《语文研究》 2015年4期首篇

评阅专家评语:“这是一篇讨论汉语方言学学科建设的重要论文……对汉语方言学与GIS的结合有重要的参考价值”。

主要观点:构建汉语方言GIS既可保护方言资源又能促进方言研究的数字化,而方言GIS应是综合当代地理信息科技和方言数字化研究模式的,融研究、交互与应用为一体的综合平台,应以开放、互动、数字化为构建理念。

该文阐述了本项目关于“方言研究数字化”的理念与实现途径。

三、《汉语方言语篇库建设手册》(12万字)

分语料采录大纲和工作规范两部分。

语料采录大纲分基础语料录制底本与语篇语料录制底本两部分。

基础语料含字(语音)、词(词汇)、句(语法)。语音有单字4002个,双音节韵律词546个;词汇分核心词(200)、基础词(5260,29类)、特征词(100-300);语法有100例句。

语篇语料录制底本分话本语篇、话题语篇、自话语篇三种。话本语篇有六类,分全部方言通用与各方言特用两种。话题语篇有四类,各含三至四种,提供话题及话题引导词。自话语篇两种,提供场景说明及录制要求。

“工作规范”有三项:(1)资料规范;(2)采录规范;(3)语料整理规范。包含语料库建设主要环节的基本要求与规范。

该手册有三点新意:

第一, 观念新:将方言研究的视点由静态层的字、词、句转向动态的语篇。

第二, 结构新:以语篇为中心、辅以有结构分工的基础语料来构架语料库。

第三, 方法新:以数字化手段建设语料库。

其他成果见后附“成果清单”

(七)研究中存在的主要问题

一、 经费有较大缺口

本项目批准经费60万,首次拨付54万。项目批准后虽收缩任务、减少支出(原计划80万),但主体结构已定,收缩幅度有限。经费不足的问题在开题报告及2014年的中期评估中均已提出。语料采集是本项目主体,按照已拨经费额度,每一方言点只能拨付2万,18方言点总计36万,剩余18万要支撑另两个子课题及其他基础研究,经费缺口较大。

项目启动后,每方言点2万是捉襟见肘。因工作量大与经费不足,已有几位方言点责任人请辞。现在尚未采录的方言点皆属此因。而完成语料采录的方言点均反映经费不足。

7.2 合格的愿意合作的方言发音人不容易找

近30年来,各地方言急剧萎缩,能说纯正当地方言且未受普通话浸染的人不多,其中愿意合作者有限。加之长时间录音、录像,乏味、疲劳,能坚持到底的人更少。此外,有人因各种原因的经济考虑,当酬劳不能满足时,也不参加。寻找发音人成为语料采录的第一关口。我们用不同方式解决这一问题:第一,请熟人帮忙;第二,寻求当地派出所和街道的帮助;第三,提高酬劳额度。

成果清单

序号 成果名称 作者 成果 形式 出版社

或刊物名 出版

或刊发时间 字数

(万字) 获奖

情况

1 现代汉语方言有声数据库 项目组 电子语料库 网址:fych.njnu.edu.cn 2015/11

2 汉语方言语篇库建设手册 项目组 著作(稿) 待出版 12

3 论哈萨克斯坦东干语音节的辅音化变异 刘俐李 论文 语言研究 2015年2期 0.92

4 论汉语方言地理信息系统 刘俐李

闾国年 论文 语文研究 2015年4期 1.26

5 甘肃临洮康家崖方言的几个语音特点 朱富林

莫 超 论文 方言 2014年2期 0.8

6 兴县方言同音字汇 史秀菊 论文 方言 2014年2期 1.8

7 白马语动词的人称范畴 莫 超 论文 民族语文 2014年2期 0.75

8 皖北中原官话“可”类问句的性质及归属 侯 超 论文 方言 2015年4期 1.3

9 南京方言音系百年变迁 宋益丹 论文 南京师范大学文学院学报 2015年4期 0.7

10 数字化推动特色方言口语库建设 刘俐李 论文 中国社会科学报第A08版 2014/8/11 0.3

11 “氐羌来宾”:远古走来的白马藏人 莫 超 论文 中国社会科学报,“历史学理论版” 2015/4/15 0.4

12 哈密方言“走”字句 张 洋田云华 论文 语言与翻译 2014年3期 0.6

13 从唐汪话的语法特点看其语言性质 莫 超 论文 西北师大学报 2015年2期 0.76

14 江苏邳州方言来自古庄章组的f声母 冯青青 论文 齐齐哈尔大学学报 2015/3/15 0.5

15 汉语方言地理学研究探索与分歧 冯青青 论文 常州工学院学报(社科版) 2014/8/28 0.82

16 盐城方言民俗保护与研究 冯青青 研究

报告 2015/3/31 3.3 盐城市社科联二等奖

17 近三十年湖南汉语方言比较研究述评 李康澄 论文 湖南科技大学学报 2014/7/1 1.2

18 Prosody of Mandarin affective speech by mentally retarded children 顾文涛 论文 Proceedings of WASSS 0.4

19 湖南绥宁汉语方言的接触现象 李康澄 论文 云梦学刊 2015/5/1 0.64

20 哈密方言的处所疑问代词“哪达” 张 洋

田云华 论文 新疆职业大学学报 2014年3期 0.6

说明:所收2014年上半年的个别文章此前均未统计过。

(课题组供稿) 

(责编:李叶)