旧版网站入口

站内搜索

“汉语方言自然口语变异有声数据库建设”中期检查情况

2015年07月10日16:43来源:全国哲学社会科学工作办公室

一、研究计划总体执行情况及子课题进展情况

总体执行情况。重大项目“汉语方言自然口语变异有声数据库建设”于2012年10月立项,同年11月举办开题会。侯精一、陆俭明、黄德宽、曹志耘、游汝杰、潘悟云、柳士镇、石定栩、赵世举、沈阳、王建勤、刘俐李、吴长安、王韫佳等专家参会,就课题框架设计、研究内容、研究方法、技术规范等问题进行充分讨论,会议确定了两个原则:一是数据库代表点为南京、苏州、上海三大城市;二是强调变异,充分考虑地域差异,将历史演变与自然口语共时变异相结合。设立4个子课题:总体框架设计、汉语方言自然口语分区调查、特大城市汉语方言自然口语接触与变异调查、数据库建设。

工作周期为5年,从2013年1月开始,到2017年12月结束。分为四个阶段:

第一阶段(2013.01-2013.06),完成工作规范,购置设备,搜集资料。

第二阶段(2013.07-2015.06),调查、归纳音系,完成调查任务,建库团队开始进行数据库设计和程序编写工作。

第三阶段(2015.07-2017.06),完成语料切分,数据核查,按期交给建库团队。

第四阶段(2017.07-2017.12),数据入库,建立数据库检索系统,开发数据检索界面。

目前,课题组严格按照时间表,有序推进各项工作。已召开4次小型学术研讨会,就调查规范、调查手册、任务分工等事项进行讨论。同时,就课题工作遇到的问题,不定期召开课题阶段交流会,各子课题负责人协同合作,项目进展顺利。

子课题进展情况,具体如下:

1. 总体框架设计已经完成。

2013至2014年初,召开2次小范围学术研讨会,制定本课题的总体工作方案,包括工作进度、调查手册、技术规范等,以统筹安排各项工作,使各团队、各调查点按照统一规范进行调查、采录、整理、入库工作。

技术标准:技术规范规定语音采录和语音分析采用统一技术指标,以便后期语音材料的整理入库。规定在采录过程中采用低噪仪器,语音材料用统一用斐风(FieldPhon)软件录制,采样率为44100Hz,采样精度为16bit;如对语音材料进行分析,采用Praat语音分析软件制作提取。语图用三维宽带频谱图,纵轴表频率,横轴表时长,频率取值范围为0-5000赫兹。语图的制作参数为Gaussian窗,窗长为0.005秒,时间步长为0.002秒,频率步长为20Hz。

调查手册:调查手册分单字表、词汇表、语法表三部分,根据各地方言情况略有调整。单字表收录音韵代表字2600个,以便进行历史演变分析;词汇表收录词汇2200条,按天文地理、时令节气等分为12类;收录语法代表句100句,调查、研究各地方言语法。

调查对象:选定四个年龄段,分性别进行录音。

老年男子1人(60周岁以上),采录2600音系代表字、2200词、100语法例句、独白《牛郎织女》、《狼来了》两个话题、30分钟同辈人对话(两人对话,性别不限)。

中年女子1人(41—55岁周岁),采录2600音系代表字。

青年男子1人(24—40周岁),采录2600音系代表字。

少女1人(1990年以后出生),采录2600音系代表字、2200词、100语法例句、独白《牛郎织女》、《狼来了》两个话题、30分钟同辈人对话(两人对话,性别不限)。

2.“汉语方言自然口语分区调查”和“特大城市自然口语接触与变异调查”同时进行,全面展开。

综合运用方言学、社会语言学、统计学的方法,从年龄、性别、职业、文化程度等方面,在乡村和城市进行布点密集、大规模、多样本的调查,采集自然的、实态的汉语方言自然口语语料。城市方言自然口语调查,又区分新城区和老城区,这在全国性、大规模的方言数据库建设领域尚属首创。目前,各调查团队正分赴各地进行调查。南京点录音、整理和转写作已经完成,苏州点、上海点采录工作正在进行。以上海为试点进行的“特大城市自然口语接触与变异调查”已经展开,已筛查到的语音变异项近40个,极具研究价值。

3. 数据库建设工作进展顺利。

“数据库建设”子课题在语音资料整理、转写、切分基础上,对调查资料进行整理入库、加工开发,建立“汉语方言自然口语数据库”,开发和使用专门的分析软件和规范化工具,对调查资料进行分析、校对、规范化处理,以保证资料的数字化质量,并构建相应的检索系统,实现资料的存储、关联、访问和检索。

现已完成南京点语音资料的整理、转写工作,其他点的录音、整理、转写正在进行,为后期数据库入库准备了大量语音图文资料。

二、调查研究及学术交流情况

1. 田野调查工作

为采录方言自然口语,项目组历时一年半,在南京和苏州地区展开大规模的田野调查,采录了大量语音样本,按照数据库建设的技术参数录制了高质量的音频资料。在上海市,为调查语言变异项,前期已经展开录音工作,采集语音样本,甄选具有代表性的变异项。

2.学术交流活动

2013年至2014年6月,本项目组召开了4次小型学术研讨会,多次阶段性汇报会、交流会。与会专家来自北京大学、南京大学、复旦大学、北京语言大学、陕西师范大学、暨南大学、南京师范大学、苏州大学、南通大学等高校,制定调查文本,如调查字表、词表、语法例句、话题等规定内容;确定数据库建设的各项技术标准,如录音软件、采样率、语图制作规范、数据入库技术等;就本课题的相关前沿问题充分探讨,互相交流。

三、研究中遇到的主要问题及解决办法

1.自然口语调查手册的制定

迄今为止,我国尚无一份专门用于调查方言自然口语的调查表,国外亦无可供借鉴的资料。我们按照本课题的目标、范围、方法等制定调查表的总体框架、分类系统以及具体条目,召开2次研讨会,反复论证,最后确定音韵代表字2600个,词汇十二类2200条,语法例句100句,从字、词、句三个方面调查方言自然口语。

2.数据库的建设

方言自然口语的数据库建设属前沿课题,要求研究者掌握方言学、计算机科学、民俗学、人类学的相关知识。我们依托南京大学相关院系资源,通过院系交流、学术研讨,对本课题组成员进行了专门培训。此外,方言自然口语有声数据库对口语语料的自然性和音像质量要求很高,录音工作难度较大。为保证语音数据质量,我们严格按照统一的采录规范,采用低噪设备,确保音像质量;在各调查团队安排以当地方言为母语的调查人,或在调查点长期工作的人,保证数据的真实性、自然性和准确性。

二、研究成果情况

1. 顾黔《南京方言知庄章三组历时演变与年龄差异研究》(《语言暨语言学》Language and Linguistics, Monograph Series53,2014,台湾中研院语言所)

南京方言知、庄、章三组存在[ts、tsh、s]与[t?、t?h、?]的对立,这在江苏境内的江淮方言是一重要特征。凡北京话读[ts、tsh、s]者南京话亦读[ts、tsh、s];然而北京话读[t?、t?h、?]者南京话存在明显的年龄差异,这是历史上知、庄、章三组的对立,尤其是庄组与知章组的对立在南京方言的遗存和反映。该文以少、青、中、老四个年龄段为调查对象,在中古知、庄、章三组选择南京人常用口语词(字)119个,逐一调查、统计、分析其在四个年龄层的音读分布情况,探讨差异产生的原因及历时演变的轨迹和方向。

调查发现,操南京方言的老年人,中古知、庄、章三组字[ts]、[ t?]两类是共存、叠置的,只是与北京话相比[ts]类稍多于[t?]类。到了中年阶段,大量[t?]组字归入[ts]组(不包括韵母是舌尖后[?]的字),使得中年组[ts]占了主导地位。青少年由于受普通话的影响,并未沿袭中年人在发音上的转变,而是又将许多字归入[t?]组,因此[ts]、[t?]两组的比率又恢复了基本平衡。少儿组[ts]类出现的几率最小。

文章指出,目前,南京话知庄章三组既有古音的遗存,又由于语言接触受汉民族共同语普通话的影响,不少语音特征发生了变化。认为南京话知、庄、章三组的读音从老年到中年的转变是南京方言自身发展的结果;而中年到青少年的变化是近几十年来普通话正音教育的结果。

该文于2013年6月,在美国新泽西大学举办的“Various Aspects of Chinese Studies in the Global Age(全球化视野下的中国研究)”国际学术研讨会上,由顾 黔教授作主题演讲。与会专家十分关注南京方言的变异情况,对该文给予高度评价。

2. 顾黔《南京方言宕江两摄入声韵的共时变异及历时演变研究》(《澳门理工学报》,2013年第4期)

南京是中国四大古都之一,其方言古为吴语,由于历史上多次北人南下,充实江淮间,现已演变为江淮官话。文章运用历史层次分析法,考察南京方言宕江两摄入声韵在老、中、青、少四个年龄段的共时变异,分析宕江两摄入声韵的语音层次,探讨普通话渗透、嵌入南京方言的方式和步骤,讨论南京方言入声韵的演变轨迹和发展趋势。

文章探讨南京方言宕江两摄入声韵纷繁复杂的音读形式,与外地方言(特别是普通话)的接触影响引起的竞争、叠置、借入的具体情况,指出其演变过程,分为四个步骤:

第一步 声母白读+韵母白读+声调白读 削sio?5

第二步 声母文读+韵母白读+声调白读 削?yo?5、确t?hyo?5⑥

第三步 声母文读+韵母文读+声调白读 削?ye?5、确t?hye?5

第四步 a.声母文读+韵母文读+声调文读(对应的南京话调值)削?ye31、确t?hye44

b.声母文读+韵母文读+声调文读(对应的普通话调值)削?ye55、确t?hye51

文章从方言接触、历史层次、异源叠置等角度,探讨南京方言的共时变异和历史演变,具有重要的学术价值。

3.陈忠敏《历史比较法与汉语方言语音比较》(《语言研究》,2013年第5期)

文章根据历史比较法的原理,讨论高本汉方言语音比较法、罗杰瑞闽语语音比较法的得失,认为“方言的语音比较其实就是建立方言间语音层次的对应,只有是对应的层次才是对等的语音形式”,“在语言接触频繁的方言里,语音层次分析是语音比较的前提”,提出“方言语音层次比较法”这一概念。文章考察闽语鱼韵读音,说明语音层次比较法的具体步骤:

一、必须先在单个方言点梳理出所研究项目的语音层次

二、研究异读

三、确定语音层次的音韵特点和语音层次的时间先后

四、根据单个方言点层次的音韵特点和时间先后,由近及远寻找方言间的对等层次(对等语音形式)。

文章指出,语音层次分析不是为了给《切韵》的音类拟音,它不仅关注方言的原始成分,也分析各时期由于语言接触引起的层次现象,也即可以对方言的整个语音发展的历史作出分析和解释。

4. 陈忠敏《上海方言的形成及其特点》(《澳门理工学报》,2013年第4期)

上海市中心方言是由原松江地区的方言发展出来的。由于170年来独特的政治、经济、文化、移民等因素,造成了市中心方言跟周围松江方言区方言的发展不平衡,是一个非常典型的方言地层学现象,具有极高的研究价值。

文章从语言接触的角度和方言形成的历时人文背景,根据实地调查,指出上海地区的方言可根据声调的调类分合及调值特点分为5个区。在此基础上,描写市中心方言区语音的主要特征,分析市中心方言的历时演变,探讨上海市中心方言的变异现象及其原因。

文章通过梳理、分析历史文献,归纳出170年来上海话声母、韵母、声调等重要演变规律,在上海传统方言衰亡前尽可能全面、真实地记录方言面貌,为中华文化和人类文明留下一份珍贵的遗产。

5. 陈立中《甘肃合水太白方言自然口语语料类编》(南京大学出版社,2014)

《甘肃合水太白方言自然口语语料类编》,辑录甘肃省合水县太白方言的自然口语语料。作者在实地录得约200小时的语音材料,用国际音标记录录音材料,用汉字转写每句方言话语。

语料按内容分类排列,涉及天文、地理、时间、传统节日、农业、植物、动物、民居、日常生活用品、人品、亲属、身体、医疗、服饰、饮食、红白大事、宗教迷信、行政、日常生活、交际、为人处事、工商业、教育、文体娱乐、动作行为、位置、代词、形容词、副词、介词、量词、数词、声音等34类。

全书180万字,内容丰富,语料翔实,堪称一部地方方言和文化的百科全书。

6. 顾黔“南京方言自然口语变异有声数据库”(2013年)

按照统一规范,从2013年5月至2014年5月,课题组采用科学方法和现代化技术手段,实地采录自然的、实态的汉语方言口语语料,标记、转写、整理,完成了南京方言自然口语变异数据库建设。

课题组选择四个年龄段,分性别进行录音。老年男子(60周岁以上)和少年女子(1990年以后出生)各一人,采录2600音系代表字、2200词、100语法例句、独白《牛郎织女》、《狼来了》两个话题、30分钟同辈人对话(两人对话,性别不限)。中年女子(41—55岁周岁)和青年男子(24—40周岁)各一人,采录2600音系代表字。

在采录过程中,采用低噪仪器,统一用斐风(FieldPhon)软件录制,采样率为44100Hz,采样精度为16bit;采用Praat语音分析软件对语言材料进行分析,制作提取语图。语图用三维宽带频谱图,纵轴表频率,横轴表时长,频率取值范围为0-5000赫兹。语图的制作参数为Gaussian窗,窗长为0.005秒,时间步长为0.002秒,频率步长为20Hz。

在保存和呈现环节,广泛使用最新的多媒体、现代化技术手段,包括录音、录像、照相、音像加工技术等,利用数据库和网络技术展示方言自然口语的实际面貌,真正做到方言自然口语的多媒体化和“实态”化。

注:2010年立项的重大项目主要填写2012年6月以来的研究成果情况。

序号

成果名称

作者

成果形式

刊物名或出版社、刊发或出版时间

字数

转载、引用、获奖等情况

1

南京方言自然口语变异有声数据库

顾  黔

数据库

2013年

18GB

2

《南京方言宕江两摄入声韵的共时变异及历时演变研究》

顾  黔

论文

《澳门理工学报》

2013年第4期

6700字

3

《南京方言知庄章三组历时演变与年龄差异研究》

顾  黔

论文

Language and Linguistics, 2014

(《语言暨语言学》)

5400字

4

Nanjing Dialect and Folk Culture: Everyday Utensils

顾  黔

论文

Various Aspects of Chinese Studies, 2014

9000字

5

《历史比较法与汉语方言语音比较》

陈忠敏

论文

《语言科学》

2013年第5期

2.1万字

6

《也谈历史比较法与历史层次分析法》

陈忠敏

论文

《语言学论丛》

第47辑2013年

商务印书馆

1.2万字

7

《上海方言的形成及其特点》

陈忠敏

论文

《澳门理工学报》

2013年第4期

9000字

8

On the relationship between tones and initials of the dialects in the Shanghai area

陈忠敏

论文

Language and Linguistics, 2014

(《语言暨语言学》)

1.6万字

9

《江浙沪交界处方言送气分调及相关问题》

陈忠敏

论文

《承泽堂方言论丛》

语文出版社

2014年

6400字

10

Feature combination via importance-inhibition analysis

陈家骏等

论文

Journal of Southeast University (英文版)

2013年第1期

5000字

11

《关中东府方言古知庄章组合口字与精组字合流的内外因素》

邢向东

论文

《语言研究》

2014年第1期

6000字

12

《近八十年来关中方言端精见组齐齿呼字的分混类型及其分布的演变》

邢向东

论文

《陕西师范大学学报》2013年第5期

7700字

13

《甘肃合水太白方言自然口语语料类编》

陈立中

著作

南京大学出版社

2014年

180万字

14

《现代湘语和吴语浊音声母发音特征的比较》

钟江华

陈立中

论文

《湖北民族学院学报》

2012年第4期

5000字

15

《江苏海安方言的“子”尾词》

汪如东

论文

《方言》

2012年第4期

6000字

16

《上海话“辣海”的语源及虚化特征的比较研究》

汪如东

论文

《东南大学学报》

2012年第4期

1.2万字

17

《适应原理下句法系统的自繁殖》

马清华

论文

《语言研究》

2014年第1期

8000字

18

《拟声词在语言发生学上的意义》

马清华

论文

《外国语》

2013年第1期

7200字

19

《江苏丹阳方言的语气词》

徐娟娟

论文

《方言》

2013年第4期

1.1万字

20

《语音层次与边界方言属性——以丹阳方言为例》

徐娟娟

论文

《语言科学》

2012年第5期

7000字

21

《丹阳方言文白异读与语音演变》

徐娟娟

论文

《暨南学报》

2012年第3期

1.2万字

被引用1次

22

《明清木鱼书中的粤方言》

邓小琴

论文

《暨南学报》

2014年第4期

7200字

23

《粤方言否定副词“咪”之溯源及其语义虚化》

邓小琴

论文

《前沿》

2013年第20期

5000字

24

《身份认同与儿化使用——以北京儿化为例》

王  玲

论文

《暨南学报》

2014年第3期

7200字

25

《城市化进程中本地居民和外来移民的语言适应行为研究》

 

王  玲

论文

《语言文字应用》

2012年第2期

1.2万字

被引用5次

26

《语言生活中的弱势群体——概念、界定和原因分析》

王  玲

论文

《外语研究》

2013年第1期

8400字

27

《现代汉语评论话语使用状况研究》

 

王  玲

郭  晶

论文

《扬州大学学报》

2013年第6期

7200字

28

《城市语言环境变化与城市语言冲突事件》

王  玲

刘艳秋

论文

《安徽师范大学学报》

2013年05期

9600字

29

《城市化中语言适应行为与语音变异关系研究》

王  玲

论文

《陕西师范大学学报》

2014年第2期

8400字

30

《南京方言中的“有点儿”和“一点儿”》

张  薇

论文

《语文学刊》

2013年第12期

3000字

31

《丹阳方言语音层次与历史演变》

徐娟娟

南京大学

博士论文

2012年

20万字

32

《常熟方言音韵演变研究》

莫娲

南京大学

博士论文

2013年

15万字

33

《江阴方言历时演变及共时年龄变异研究》

张志凌

南京大学

博士论文

2013年

15万字

34

《高淳方言语音研究》

张薇

南京大学

博士论文

2014年

22万字

35

《连云港方言地理语言学研究——一语音为例》

王萍

南京大学

博士论文

2014年

15万字

 

课题组供稿

(责编:实习生、张文卓(实习生))