旧版网站入口

站内搜索

元明清民国时期官话语音语料库平台建设与研究中期检查报告

2019年12月16日10:14来源:全国哲学社会科学工作办公室

一、研究进展情况

主要内容:

一、研究计划总体执行情况及各子课题进展情况

(1)项目总体设计:建设元明清以来官话方言语音语料库,我们项目将从韵书韵图资料30-50种(原计划80-100种,采纳开题专家建议后修改),传教士西文汉语字典与教科书10-15种(原计划23-36种),日本近世唐音、片假名标音的教科书、琉球官话和对音10-20种资料(原计划20种),朝鲜谚文注音近5-8种资料(原计划10种),俗文学的押韵资料、地方戏曲戏剧资料,历代方志中的官话方音资料估计100多种(原计划400多种,剔除无关语音和非官话),建成了一个库容达到200-400万字熟语料库的、元明清以来官话方言语音语料库。项目目前执行情况总体良好,已经完成总体语料的30%左右,完成了数据库平台的建设。

(2)子课题材料计划与执行情况

2.1 数据库平台建设

○1利用已有的数据根据类别建立五个数据库

○2网站

A.网站初步效果

目前着力解决搜索问题,网站配色装饰方面暂时没有调整。

左侧分栏可以选择不同的功能块。介绍可以添加些介绍性文字,有利于使用者了解该网站功能和用法。下面几项可选择搜索的数据库,综合搜索目标实现五个数据库的综合搜索。其中各数据库内的搜索已经实现,跨五个数据库的综合搜索正在完善。

B.搜索功能和搜索结果的呈现方式

可以在搜索框中输入任意字段,网站将返回匹配该字段的所有行,以表格形式呈现。其中,中近古音韵数据库中是广韵、中原音韵,其中未收字用中州音韵补,标记Z。搜索单字时带不带z或Z都可以搜到

除了中近古音韵地位以外均为精确搜索,即所搜索内容需完全匹配数据库中内容才返回该行

2.2 传教士文献材料

材料完成传教士字典与教科书、日本韩国汉语注音类材料10种,依据《汉语方言调查字表》3800字转写罗马字为Excel数据库,总40000多字。

2.2.1《华英文义津逮》《语言自迩集》《寻津录》标音数据库

2.2.2 高本汉记南京音、《南京官话》《南京字汇》标音数据库

2.2.3 明清时期日文汉字音片假名转写数据库

2.2.4 《汉清文鉴》韩文转写数据库

2.3 讲唱文学押韵材料

俗文学押韵材料,完成河西宝卷、贤孝唱词、秦腔韵谱780000字,正进行校对,加入Excel数据库。

2.3.1 韵谱文本

2.4 官话方志语音材料

官话方志方音资料Excel数据库总计4100多条,70000多字;文本及其校勘全部完成,总字数2638900,正与出版社商定出版事宜。

2.4.1环北京地区方志数据库

2.4.2 山东地区方志数据库

2.4.3 历代方志文献集成

2.5 韵书韵图材料

韵书韵图部分,完成了《广韵》《中原音韵》《蒙古字韵》(3800字标注地位,《中原音韵》未收的,用《洪武正韵》《中州音韵》等补入)《正音新纂》全部的3800音节表转写。

2.5.1《正音新纂》入声韵母表

《正音新纂》

日[??] 以[i?] 无[u?] 遇[y?]

啊[a?] 娃[ua?] 雅[ia?]

我[o?] 约[io?]

额[??]

危[ui?]

野[i??]/[e?]

越[ye?]

2.5.2 中原音韵、蒙古字韵对应音节表

2.6 其他比较数据库

完成了官话93个点(依据陈章太等《普通话基础方言基本词汇集》)3800字标音Excel数据库建库工作,总字数353000;完成现代汉语方言40个代表点( 据《现代汉语方言音库》,有北京 、哈尔滨、天津、 济南 、青岛 、郑州、 西安 、西宁 、银川、 兰州、 乌鲁木齐、 武汉 、成都 、贵阳 、昆明 、南京、 合肥 、太原、 平遥 、呼和浩特、 上海 、苏州、 杭州、 温州 、歙县 、屯溪、 长沙 、湘潭 、南昌、 梅县、 桃园、 广州 、南宁 、香港 、厦门、 福州 、建瓯、汕头、 海口 、台北 )1800字标音Excel数据库建库工作,总字数72000。总库建成后将剔除与官话93点重复部分。

2.6.1 官话93点3800字语音数据库

2.6.2 现代汉语方言40点1037字数据库

其他专题数据库:如果摄历时音读数据库、元明清宕江摄入声历时音读数据库、现代汉语止摄遇摄读音数据库等,总数20000音节。

二、调查研究及学术交流情况

2.1 参加学术交流

(1) 2017年9月16日至17日,徐朝东教授参加复旦大学中文系“汉语史研究国际研讨会”,发表论文《唐五代以来支微入鱼现象之讨论》,并作方言、音韵方面大会总结。

(2) 2017年11月18至19日,徐朝东教授参加百色学院主办“语言研究新视野高端论坛”,发表论文《宋元以来宕江摄入声韵的演变研究》。

(3) 2018年5月1日2-13日,徐朝东教授参加台湾辅仁大学、台湾“第十六届国际暨第三十六届全国声韵学学术研讨会”,发表论文《唐五代时期、支微入鱼、现象之调查》,并担任大会专题评价。

(4) 2018年6月29日-7月1日,徐朝东教授参加安徽大学“第十一届中古汉语国际学术研讨会”,发表论文《敦煌世俗文书中所见语音现象之研究》。

(5) 2018年7月2日4日,徐朝东教授参加北京语言大学“第四届文献语言学国际论坛”,发表论文《宋元以来宕江摄入声韵演变之研究》。

(6) 2018年12月1日,徐朝东教授参加清华大学中文系“明清汉语官话与方言工作坊”,发表论文《宋元以来宕江摄入声韵读音演变研究》。

(7) 2018年11月14-16日,徐朝东教授参加杭州佛学院“第十六届吴越佛教学术研讨会”,发表论文《元代僧人沙啰巴陀罗尼对音之研究》。

(8) 2018年11月9-11日,徐朝东教授参加华中科技大学“第二届华中大语言论坛”,发表论文《宋以来果摄韵母读音及其在现代汉语官话中的分布研究》。

(9) 2018年9月15-17日,徐朝东教授参加河南信阳师院与社科院语言所“汉语研究新视角高端论坛”,发表论文《语言接触引起的唐代标准变化》。

(10) 张续龙博士《清与民国山东方志所录方言资料的方音研究》,广州大学语言学青年论坛,2018年11月。

(11) 2019年6月27-30日,徐朝东、陈琦付芳、李彬彬、王芳、王露参加内蒙古师大与北京语言大学合办的“第五届文献语言学国际学术论坛暨第二届文献语言学青年学术论坛”,徐朝东与陈琦合作发表《百年来南京话入声演变研究》,付芳发表了《明清以来疑母字演变研究》论文。

2.2研究资料调研与文献资料收集整理

(1) 2018年5月徐朝东赴台湾中研院图书馆、书店收集资料。

(2) 2018年7月、12月 徐朝东先后赴南京、苏州、上海等地收集资料。

(3) 2018年12月张续龙、李彬彬赴福建等地调研方言材料。

(4) 2019年4月陈琦赴南京调研方言材料。

(5) 2019年6-7月张续龙赴天津收集、调研材料。

三、成果宣传推介情况

3.1 项目支持的音韵学主题沙龙

2018年10月20日,项目主持人徐朝东教授主持并邀请马重奇教授、蒋冀骋教授、黄笑山教授、孙建元教授、杨军教授、储泰松教授、华学诚教授、魏德胜教授、郑林啸副教授、赵彤副教授,梁慧婧博士,就、音韵学研究的新视野、进行了一次专题沙龙。也讨论了本项目中一些技术问题。

马重奇教授讲的是传教士音韵文献方面的前沿成果《近代西文闽方言文献音系研究方法论》。马重奇教授介绍了西方传教士编写的记录闽方言的文献大致情况。并指出,西文闽语文献是由英语、荷兰语、西班牙语、日语、拉丁语等不同语种写成的,其中多以罗马字标示闽南、闽东、闽北、潮汕诸方言的字或词。这些文献有别于中文闽语文献。西文闽语文献大致可以分为两类:一是根据某种闽语韵书的声韵调系统编撰的西文闽语字典辞书,二是传教士没有可参考的某种闽语韵书而亲自进行田野调查后编撰的字典辞书。

马重奇教授总结了四种研究方法。一是、中西文闽语文献对读法、。该方法就是把两种音系相同或相近的闽语文献放在一起、彼此对勘,互相参证、,以形成对事实的科学认识。对西文闽语文献的对读研究分为两个方面:一种是西文闽语文献与同期同音系中文闽语文献对读研究;第二种是西文闽语文献与不同期同音系中文闽语文献对读研究。第二种研究方法是音系归纳法。马老师细致地讲解了归纳《夏英大辞典》音系的方法。先把辞典中所有的1127个音节列成表,并根据书中各个方言点不同的符合归纳整理出各自的声韵调系统。第三种研究方法是共时和历时比较法。马重奇教授以《厦英大词典》和《中西字典》为例来说明共时比较法。通过对比可知,《厦英大词典》、泉州音系、有19个元音韵母,《中西字典》有16个个元音韵母。前者比后者多了3个韵母,即ō[?(?)]、ū[?]、ōe[?(?)e],此乃最能反映泉州音韵特征的韵母之一。第四种研究方法是内部拟测法。

黄笑山教授就本土传世文献的价值,提出应该重新审视,比如重纽问题。《切韵》中某些字通过反切系联法是无法展现一些有明显对立的小韵的。有的人认为是方言的问题,这当是错误的观点。通过改变方法,会发现这些重纽对立,不仅出现在《切韵》之中,也出现在其他音韵著作中,如《经典释文》《一切经音义》。这种现象绝不是巧合能够解释的。传统的反切系联法无法解释重纽A、B两组的对立,但后来人们注意到它们是不一样的,在语音上是有区别的,而反切结构分析法则能够分辨出反切上字、反切下字是如何区分的。

黄笑山教授提出,运用反切结构分析法来重新对《切韵》或《切韵》前后不同时期的注音材料的反切进行研究,发现这些对立小韵不仅存在某种相似性,而且这种语音现象还按一定的语音规律在变化发展中。因此,黄笑山教授提出,如今一般都认为反切的改良是在近代时期,其实在中古时期,反切就已经在变化了。这种新视角、新方法不仅可以用来审视已经研究过的材料,还可以运用到出土文献中去。这就给音韵研究带来了无限的空间。

杨军教授交流的前沿成果是《从慧琳的反切论传世数据的语音价值》。首先,杨军教授根据史实证明署名玄宗的《韵英》是唐代官定的标准韵书,是替代、未能厘革、的陆法言《切韵》的。景审说过慧琳的反切是从张戬《考声切韵》、元庭坚《韵英》来的,因此就可以知道慧琳音系跟《切韵》音系不同,且差别巨大。这一点从声母、韵母、声调、声韵配合关系和等的结构五方面均可以证明。其次,杨军教授指出,慧琳的反切上字与被切字声母与介音相同,有的反切上字甚至是、准直音、,即除了声调不同,被切字与反切上字的读音是一致的。如鞋,吁歌切。鞋、吁皆是三等字,而反切下字歌反而是一等字。因此,三等韵在《韵镜》型韵图上的位置需要作变更。

杨军教授总结了慧琳反切的整体特点:上字管声母与介音,下字管韵核与声调;亦即无论上字是类一致还是准直音,介音由上字管。因此就可以作如下解释:1.下字介音不同类不影响拼读,因为区别介音的功能已经转移到了反切上字。2.重纽两类只是介音不同,韵核相同,否则反切下字不能用不同类的下字作切的。3.既然重纽两类只是介音不同,那么重纽韵没有散。4.慧琳的重纽韵内容增加了,纯四等并入了原来的A类和C1;同摄的普通三等韵并入了B类和C2。5.慧琳的系统里完全没有了纯四等韵,原先属纯四等的韵都有了一个跟三等重纽A类的一样的前腭介音。

赵彤老师则根据出土文献材料介绍了一种全新的方法:系联比较法,即根据谐声关系将声类相同或相近的字系联起来。比如在楚简中箸字,常用作书,两者皆从者声,这样就将端母的、者、字与书母的、书、联系起来,从而将这一类的字系联起来。还列举了楚简中,常用作侮、诲、谋,这些字同样运用系联比较法可以联系起来。

蒋冀骋教授则强调了三点:一是《说文解字》中的字形有一部分是汉代演变以后的字形,如果进行谐声归纳,需要参考甲骨文、金文等,互相参证。二是在使用对音材料时,需要特别注意其语音系统,尤其是汉语没有的语音现象。三是研究音韵学,必须懂得一定的方言学知识。比如一等字、登、,拟音为?,与、一等洪大、相矛盾,这种构拟值得怀疑,需要从方言中寻求正确的构拟,因为有的方言中、登、字韵读为a。

广西师范大学孙建元教授讲述了自己做对音研究时会遇到的困难和一些经验。一,刚刚蒋老师所说的对音要考虑对音符号产生的语言的语音与我们的目标语言的语音的差别,这是非常对的。从另一方面,刚刚马老师说的一点我也很赞同。闽方言传教士对音,很多域外的学者记录汉语时比我们方言调查的学者要细致得多。如曾梗摄的字,我们现在一般拟音都是一个单元音,但在谚解注音是带韵尾的,-i韵尾。这样就好解释曾梗摄的字在北京方言中进入韵ei类的读音。所以我们在考虑对音时既要考虑语音的差异,同时也要有胆量来利用它做精细的语音描写。二,明清对音和明清韵书的研究大面上的语音语料好写,难点在于那些疑难问题,疑难的语言现象单独从明清断代文献材料里面是不好解释的。汉语语音史的研究要重视、音变节律,节律、是语音生成的结构问题,不同的反切结构可能源自不同的音变曲线、不同的音变形式和规律。孙老师认为音韵学不是没有事情做,而是有很多事情可以做。

储泰松教授则就梵汉对音的角度,从三个方面提出了自己音韵研究的新视野。一是拓展材料,比如地理文献《括地志》《元和郡县图志》《水经注》《太平寰宇记》等也含有许多音韵材料,尤其延边地区地名的历时演变是可以映像语音演变的。这些文献中有一些我们不太关注的能揭示语音信息的材料,如一些地名在不同朝代有不同的叫法。延边地区的地名的变化我们能从音韵学角度进行解读,但为什么会有这样的变化,储老师认为不能排除一个话题,就是受到了少数民族语言的影响。二是音韵学研究需要吸收相关学科的研究成果,比如民族学、历史学、考古学等。一些历史学家的小学功底很好,他们的研究对我们研究音韵学是有启发的。三是在使用对音材料时,须注意层次的问题,即文献的层次和语音的层次。四,充分认识到我们现在利用的对音材料的复杂性。

这次专题讨论内容十分丰富,与会学者收获颇丰。

3.2元明清民国时期官话语音语料库平台建设与研究、开题专家咨询会召开

2018年10月21日上午,2017年度国家社科基金重大招标项目——“元明清民国时期官话语音语料库平台建设与研究”开题专家咨询会在北京语言大学综合楼909会议室召开。南京大学鲁国尧教授、清华大学黄德宽教授、福建师范大学马重奇教授、湖南师范大学蒋冀骋教授、南京师范大学董志翘教授、北京语言大学校长刘利教授、安徽师范大学储泰松教授、北京语言大学华学诚教授作为项目开题论证专家出席了会议,北京语言大学副校长张旺喜教授、北京语言大学科研处处长张健教授、北京语言大学程娟教授出席了会议。大会由程娟教授担任主持人,黄德宽教授担任咨询会专家组组长。

北京语言大学副校长张旺喜教授代表学校分管领导发表了讲话。张旺喜教授代表学校支持该项目的进行。

项目咨询部分由黄德宽教授主持。首先项目负责人徐朝东教授,子项目负责人黄笑山教授、孙建元教授、曹小云教授、刘祥柏教授、皇甫伟教授,分别从研究背景、研究目标、研究材料、研究思路等方面,汇报了项目总体设计要求与目标各个子项目的内容和规划。

与会专家就项目操作与执行方面提出具体建议。刘利校长首先表达了对与会专家的欢迎,以及对徐朝东教授所带领的项目组的支持。刘利校长肯定了项目立意宏大,提议做一些语音资料的汇编,把整理的成果成系统、多角度地呈现出来。

马重奇教授认为本项目材料多,工作量大。需要在不同性质的研究材料方面作出一定的取舍。鲁国尧教授认为这个项目选题非常好,能够对官话的定性产生影响,解决积疑。项目可以加强相关民国语音材料的研究。蒋冀骋教授提议适当减少缩减研究的语料范围,把重点放在研究上。董志翘教授认为项目里涉及到大量的语料,要进行校勘,工作量非常大。华学诚教授指出方志里面涉及的方言资料承袭性很强,需要在材料定性、定时方面注意,项目组还需要在如何使用方志资料的理论上有所突破。储泰松教授建议,加强子项目材料之间的协调与相关技术处理,提升研究的理论工作。

咨询会专家组组长黄德宽教授做专家意见总结讲话。他提出,一是抓住重点,理清目标,明确任务清单。首席专家要把各个子项目统筹好,把平台建设作为主要任务。在材料呈现上,既要有阶段性的文本呈现,也有数据库呈现,且要把数据库做成综合的开放的。研究成果围绕数据库建设,提炼重要的理论问题进行建设。二是希望项目组在数据分析挖掘这方面能够提出创造一些高水平的成果。三是要促成资源共享,增强已有项目之间的联系,提高工作效率。

四、研究中存在的主要问题、改进措施,研究心得、意见建议

主要是人工投入太大,所需劳务费开支太大,建议提高劳务费占比。

二、研究成果情况

主要内容:

一、代表性成果简介

(1)完成国家社科一般项目《明清以来河西方音研究》,完成人:徐朝东、唐浩、王芳。结项等级:合格。本成果为本课题子课题“讲唱文学的押韵资料”一部分。

基本内容:我们对115种河西宝卷整理本、39种贤孝唱词印刷本、170种陕甘秦腔传统剧目印刷本中的韵文押韵内容,以及河西宝卷写本中异文别字等材料中涉及语音内容进行了系统的研究。通过对河西宝卷、贤孝唱词与陕甘秦腔传统剧目中韵文的韵段,以及对河西宝卷中存在的异文别字现象分析研究,我们发现这些材料中存在语音现象:

《中原音韵》的阳声韵还存在[-m] [-n][-?]三分,明清西北方音中只有3部,前高元音后的阳声韵尾不分,后低元音[a]仅区别[-n][-?]。西北方音中阳声韵主要元音鼻音化,鼻音韵尾[-m]已经消失,并入了[-n]尾,且[-n]尾与[-?]已经相混(或消失)。明清西北方音中支思与齐微韵合并。

宝卷所代表的河西走廊一带方音中麻韵三等字与歌戈韵读音相同,麻韵三等字(如爷、爹、夜、些、野、斜、射、舍等)已经完全演变为[e]、[ie];麻韵二等则独立为家麻,现代兰银官话方音读作[o],属于兰银官话的特征。秦腔和贤孝中的麻韵二三等读音无区别不相同。

明清西北方音中存在“鱼入支微”的现象,鱼模与止摄开合口字都有混押的例子,表明鱼模韵部分字读为[i][ui]。

明清西北方音中[-p]、[-t]、[-k]三个塞音韵尾完全失落,入声韵消失,都按照其主元音押入了相对应的阴声韵。铎职(部分字)觉药陌德麦昔(部分字)曷(部分字)没(部分字)栉薛末屑月(部分字)叶盍(部分字)合(部分字)等韵韵字押入歌戈韵。曷(部分字)辖月(部分字)黠合(部分字)盍(部分字)狎乏等韵韵字押入家麻韵。屋(部分字)烛沃物术没(部分字)缉等韵韵字押入鱼模韵。职(部分字)锡昔(部分字)德(“得”字白读)迄质缉等韵韵字押入支微韵。屋(部分三等字)押入尤侯韵。这与《中原音韵》迥异,特别是宕江摄入声字,基本归入歌戈韵,极少数字有宵豪韵的异读,这属于后来北京官话影响所致。德陌药韵的大部分是押韵歌戈部的。

明清西北方音平声已经分为阴阳,全浊上声变为去声,并且平声与去声的音值相近,入声派入了四声。“平声似去”,这是《中原音韵》以来西北方音声调的一个区别特征。河西宝卷中有11个入声与阴声形成的异文别字,基本与今兰银官话相同,全浊入读阳平,全清入声读上声等。

河西宝卷中异文别字所代表的明清西北方音声母方面现象有:(1)全浊声母已经清化,全浊塞音、塞擦音、擦音声母都清化为相同发音部位的清音,并且呈现出“平送仄不送”的规律。(2)非敷奉三母已经合并,知照系合口字读作唇齿音,表现为“书”“夫”同音;微母与日母合口字读作[-v],表现为“无”“如”同音。这是一种西北方音中独特的音变现象。(3)还有精组和见组不分,细音腭化现象明显。喻母三、四等不分,影、疑、喻三母不分,泥母和来母不分,知组与照组不分等现象。

明清西北方音与《中原音韵》声母的演变规律有着很高的一致性,只有泥母和来母不分、精组和见组细音独立、知照系合口字读作唇齿音等是西北方言性的体现。明清西北方音韵部方面,与《中原音韵》近、与《洪武正韵》完全不同。这说明了明清西北方音与《中原音韵》音系所代表的14世纪的官话说话音有关系密切,而与《洪武正韵》音系所代表的14世纪的官话读书音有很大差异。河西宝卷等所反映的明清西北方音一方面继承了唐五代、宋代西北方音的一些特点,如全浊声母已经清化,轻、重唇音分化,中古精见合流(细音腭化),知照合流,喻三、四等不分,影疑喻三母不分,“浊上变去”“平声似去”等等;又产生了一些区别于前代的新特点,如中古泥母和来母混同,麻韵三等字的演变,阳声韵主要元音的鼻音化,鼻音韵尾[-m]消失,[-n]尾与[-?]已经相混(或消失),入声的消失等等。

主要观点:

通过与现代西北地区的兰银官话与中原官话代表点方言比较,宝卷等中9种个语音现象,全部匹配的是兰银官话银吴片的银川方言,其他如兰州、张掖、凉州等兰银官话都有6-7项可以匹配,中原官话基本只有5项相合。浊音清化、[-n][-m][-?]消失、入声消失、宕江摄部分入声字有歌戈、宵豪异读现象等4种,属于中原与兰银官话所共有的语音特征;麻三归歌、德陌药觉韵等入声字在兰银官话中主要读入歌戈韵(中原官话大多读作支微韵),知系擦音合口[f]、日母合口读[v] 都是兰银官话的区别特征,个别中原官话中也能发现或多或少的语音现象,应该是受到兰银官话接触影响而致。河西宝卷等讲唱文学中有大量口语化强的韵文和别字等音韵材料,真实地反映了明清时期西北地区语语音的概貌。

我们将明清河西方音9种区别性语音现象,与宋元以来西北地区存在过的西夏语、女真、契丹、蒙古语等与汉语的对音资料进行全面比较,这些语音现象在民族语言与汉语对音中或多或少有些体现,但是鲜有一种民族语对音与汉语本体的语音现象基本对应。只有东干族语言,多与宝卷等语音能够对应。东干族是指清乾隆年间迁徙至新疆陕甘的回民与陕甘回民起义军等,进入俄国等中亚地区形成的一个群体,他们使用的是陕甘地区汉语方言。宝卷等确实能够反映明清时期河西方音。

项目还专题讨论了汉语方言中存在的“支微入鱼”与宕江摄入声韵异读现象产生等问题。通过系统地调查与研究唐五代、宋元明清至于现代的方言资料,我们认为“支微入鱼”是汉语两种不同的演变方向,一种是汉末以来、现在存留在南方方言中比较多见的止摄合口字读为遇摄;另外一种是从唐五代以来汉藏语共同发生的部分遇摄读同止摄。现代汉语不少方言中保存着两种音变的叠置现象。宝卷等中支微与鱼模混押现象属于“鱼入支微”,即部分遇摄字读为主元音[i]。

宕江摄入声韵由于入声尾消失,其元音也高化,宋元以来在汉语官话中开始读入歌戈韵;宕江摄入声韵读为宵豪是雍正以后由满人带入汉语北京话,后来成为标准音读音。通过对宋元以来韵书韵图中阴阳入相配情况考察,入声配阴声并非就是实际语音,有些是对阳入配的一种革新,其实质并无区别;有些阴入配确实实际音变的反映,要细致考察辨析。《蒙古字韵》中入声还是独立的,宕江摄乃至整个入声韵是阴入配,其主要依据是主要元音相同,并不是入声塞尾的脱落或者元音化。而《中原音韵》中入声韵入宕江摄入声就有大量的宵豪与歌戈韵的异读,其重要的一个读音来源就是仿照《蒙古字韵》,即采用了宕江摄入声配宵豪韵,一个读音来源是实际语音的记录,即宕江摄入声韵读为歌戈韵。

通过我们调查河西宝卷与贤孝唱词、陕甘秦腔传统剧目中韵文,发现这三种讲唱文学形式的押韵在一定程度上能够反映明清以来西北地区汉语方言的实际语音,而写本的河西宝卷更加真实地再现了河西走廊地区的方音原貌。从这三种讲唱文学韵文押韵如麻三韵归属等不同之处,中原官话与兰银官话的区别至少可以上推到明清。通过与唐五代西北方音、宋金元词韵、《中原音韵》等历时语音的比较,与西安等中原官话以及与兰州等兰银官话的共时比较,河西宝卷代表的方音现象就是兰银官话的源头。

学术价值:

本项目的创新之处在于,尝试利用河西宝卷等讲唱文学资料的音韵资料,建构了明清时期的河西与西北方音概貌;梳理了西北方音从唐五代经宋明清至今的发展脉络。

(2)完成专题论文及其相关内容与价值

2.1 敦煌世俗文书中所见语音现象之研究,《语言研究》2019年第1期(CSSCI)。完成人

主要内容:我们通过对敦煌文书中的韵文、非佛经音义等语音材料的研究,发现全浊声母普遍清化、非敷奉不分、泥娘母不分、知照组合流、精见组声母有腭化现象、零声母已经产生、鱼韵读入支微韵、鼻韵尾已显出了消失的迹象、入声尾开始弱化,与阴声韵相混,平声与去声调相近等九种在唐五代西北地区出现新的语音现象。

2.2 宋元以来汉语与民族语对音所见几种语音现象,《古汉语研究》2018年第4期(CSSCI)。

主要内容:明清时期在西北地区流行的河西宝卷中存在11种典型性的语音现象,与宋元以来汉语与西夏语、女真、契丹、蒙古语等对音资料有一些对应关系,这些语音资料揭示了宋元以来汉语官话的发展一些规律,一种类似全浊声母清化、阳声尾-m并入-n、入声塞尾丢失等,是汉语官话的普遍规律;一种如麻歌读音相近,鱼入支微,宕江、曾(一等)、梗(二等)摄入声读入歌戈韵,是宋元以来中原地区通语的普遍特征;一种是知照组与日微等合口字读为唇擦音[f][v],这是明清以来西北方音区别特征。

2.3 竺法护译经中“晋言”所见梵汉译音及其音韵现象,《励耘语言学刊》2018年第2期(CSSCI)。

主要内容:竺法护一生翻译的大小乘经典共有154部309卷。其译经中屡用“晋言”,是3-4世纪实际语言的运用。本文对法护译经“晋言”15条专名的梵语形式进行考察,讨论了两晋之际汉语出现的如阴声韵无塞音尾、幽部是一个单元音、声母清浊分划、影母为零声母、没有娘母等语音现象。

2.4 《南京官话》音系初探,《合肥师范学院学报》,2018 年第第5期。徐朝东、陈琦。

主要内容:本文对1907年出版的德国人何美龄《南京官话》进行系统研究,归纳出《南京官话》所反映的语音系统,着重分析《南京官话》泥来母不分、知庄章二分、尖团区分、入声韵的归并等十一个个语音特点,初步窥见晚清南京官话的面貌:

1.《南京官话》的知庄章三组声母是二分型。知二梗摄入声、庄组部分韵读[ts]组声母,知组(除知二梗摄入声)、庄组部分韵、章组读[t?]组声母, [t?]组:罩长抽知组扎壮炒豺庄组蔗敞成船涮章组。其中庄组声母演变比较特殊。《南京官话》所收的庄组字:庄母和遇止流深曾梗六摄韵母相拼时为ts[ts],和假蟹效咸山宕江七摄韵母相拼时为ch[t?]。一个例外,臻韵的“臻”字读[t?],不读ts[ts]。初母和遇止深臻曾梗六摄韵母相拼时为ts?[ts?],和假蟹效咸山宕江七摄韵母相拼时为ch?[t??]。崇母仄声变为不送气音,和遇流两摄韵母相拼时为ts[ts],和假咸山宕四摄韵母相拼时为ch[t?];崇母平声变为送气音,和遇流通三摄韵母相拼时为ts?[ts?],和假蟹效咸宕五摄声母相拼时为ch?[t??];崇母的止摄开口字读s[s],如“事士仕”。生母和遇止流深臻曾梗七摄声母相拼时读s[s],和 假蟹效咸山宕江相拼时读sh[?],部分止摄字也读sh[?],如“驶史使”。

2.个别书母字在《南京官话》中读塞擦音ch?[t??],如“鼠[t??u] 翅[t???]”。

3.严格区分尖团。见晓组开口二三四等字已经腭化,读[?][??] [?],也有一些未腭化,如“港[ka?]、给[ki]”;精组在细音前仍读[ts] [ts?] [s] 。

在细音见组字已经腭化,与精组字尚未腭化有别:[见晓组]鸡[?i]欺[??i]希[?i]≠[精组]跻[tsi]妻[ts?i]西[si]。

4.泥母字和来母字相混。何美玲在“语音概述”以及音值描写部分都明确说明南京官话中的n和l在听感上不易分辨,在所有的韵母前都相混,发音时舌尖触碰上齿龈,实际上是带上鼻化色彩的l。

5.日母字大都读j[?],如“然如茸”;个别日母字读l [l],如“攘懦”,还有变为零声母的,如“冗yung[io?]”。个别疑母、云母和以母入声字,归入日母,也读j[?],如“狱郁育”。

6. 《南京官话》中没有舌根音声母ng[?]声母,只有零声母,如ngan、ngên、ngou现在南京话读成an[a?]、ên[??]、ou[ou]。

7.果摄一等字无论开口还是合口都读开口呼韵母[o],如“河[xo]哥[ko]坐[tso]”,也有一些例外“他[t?a]敷[fu]”。《南京官话》果摄开合口并未分化,在今天南京方言中仍是开口呼[o]。果摄见晓组和精组的合口三等字读撮口呼韵母[üeh],如“瘸[??ye]靴[?ye]诠[tsye]”。《南京官话》读ê[?]韵的字都来自于章组车遮韵,如“蛇舍者”。它们不和歌戈韵相混,歌戈韵的字都读o[o]。

8.蟹摄开口一、二等韵读ai[ai],如“哀ai[ai]改kai[kai]”。见系蟹摄二等韵读iai[iai],如“鞋[?iai]皆[?iai]”。蟹摄二等喉牙音字在《中原音韵》中属于皆来韵,没有和车遮韵字相混,如:皆来韵的“鞋捱街 iai[iai]”和车遮韵的“邪野姐ieh[e]”不同音。蟹摄合口的泥来母字依旧读合口韵ui[ui],如“雷lui[lui]”。

9.咸山摄一二等阳声韵归入宕摄一等和江摄二等阳声韵,都读ang[a?]或uang[ua?]。深臻摄开口阳声韵归入曾梗摄开口阳声韵,读êng[??]或ing[i?]。臻摄合口阳声韵和通摄阳声韵分立,不相混,如“春魂un [un]、充弘ung[u?]”。何美玲提到:“齿部(前)和喉部(后)鼻音在元音a、ê、i后易相混,而与此相矛盾且又无法解释的是它们在元音u后面又严格区分。因此大量以ang、 êng、ing为韵母的音节与以an、ên、in为韵母的音节两两相对应着合并了。事实上,这些韵母的韵尾发成齿部鼻音似乎比喉部鼻音更常见,似乎语音和谐是唯一控制它们发生此种变化的准则,方言区内的发音人自己无法意识到也察觉不出它们的区别。有时同一个字单独发音时,就会发成齿部鼻音;当它和其他字组合时,就发成喉部鼻音。”

10.假摄开口三等、咸山摄开口三四等的i介音在帮组、端组、精组字后消失,读[e][e?][en]。如“别[pe?]跌[te?]姐[tse]前[tsen]”。

11.入声韵的归并及其与阴声韵匹配情况比较特殊。曾摄一等(德韵)、梗摄二等(麦韵、陌韵)、曾摄三等(职韵)庄组、咸山摄三等(薛韵、葉韵)知系入声字合流,读[ai?]。山摄三等(薛韵)知系字、宕摄一等(铎韵)、曾摄一等(德韵)字合流,读[uai?]。臻摄三等(质韵)、深曾梗摄三等(缉韵、职韵、昔韵)知系入声字合流,读[??],其主要元音是舌尖后高元音[?],这在其他官话中不见,而现代南京话仍保留。江摄二等(觉韵)、山摄一等(曷韵)见系、山摄一等(末韵)、宕摄三等(药韵)合流,读[o]。宕江摄(药韵、觉韵)见系读[io]。药觉末韵、盍韵见系字主要元音都与果摄[o]同。

2.5 敦煌世俗文书中唇音问题之考察,《阅江学刊》,2018年第2期。

主要内容:通过系统调查唐五代敦煌世俗文书中音切与异文别字材料发现,轻重唇音在隋唐五代的音义材料中,分成两种不同的情况:一种是《切韵》系列韵书中,轻重唇声母切上字仍有相混;另一种实际口语汇总无论北方方言还是南方方言的语音材料中,轻唇音和重唇音分化已经基本完成了,明微分化的速度稍慢。轻重唇分化后,全浊奉母开始清化,非敷衍奉合流成为河西方音重要的语音特征。

2.6 山东胶东方言词语考释数则——订正与补充《寿光》《牟平》等方言志,《东亚文献研究》(韩国)第20卷,2017年,张续龙、徐朝东。

主要内容: 我们以《寿光方言志》和《牟平方言志》为主,辅之以其它县市的方言志,通过对照,找出其未使用本字标注的词汇,再结合古典文献和工具书,确认胶东方言词语的本字。同时,民国时期出版的部分山东地方志,也记录了当时胶东方言的语音和词汇情况,不仅可以证明我们考释的本字,还能补充方言志中并未录用、现在正使用的方言词语。

我们分饮食、动作与言谈、才能与品性和日常生活四类共十二个有山东方言特色的词语,分别对其作语音或语义上的考释,从而订正和说明部分山东方言志的用字错误,如动作、言谈:攎 [lu55] 双手搂抱:树那么粗,我们五个人~不过来。

另外,山东方言志词汇一章中,有的词语义项安排欠妥,如楔子或楔入曰楔,无击打义(《寿光方言志》p146);打、敲击之义应该是揳;有的有音无字,如上文中的“趖”。这就要求我们在编纂方言志时,使用方言本字,避免误用借音字;词义不可强加合并,扩大字词的词义范围。

胶东方言口语中的一些常用的词,由于不常见于普通话或现代书面语中,所以通常认为是有音无字的词,但是通过考求本字,可以发现,这些词古已有之,在方言中保存下来。

作为语言地方变体的方言,是认识当地文化的一把锁钥;方言词语更是直接折射出当地文化的特色,反映出当地的社会风俗。因此考察方言本字,我们首先在语音上确保声、韵、调的一致性,即使发生讹变,也要符合变化规律;语义上,能够通过古典文献得到证明的方言词语必须符合当地的文化内涵,同时考虑到语言的发展性,即方言词语是古语词还是新词。比较《牟平》、《寿光》等部分胶东方言志的词语用字,我们发现很多皆是使用借音字或白读同音字来表示的,这虽然准确地记录了方言语音,但割裂了字形与意义之间的关系。本文通过参考各经典文献和工具书,找出胶东方言口语常用词的本字,订正并补充了部分已出版方言志使用的词语,以期对后续的方言志编纂有所帮助。

2.7 山东方志所录方言资料的再认识,《东亚文献研究》第22卷(韩国),2018年,张续龙。

主要内容:日本波多野太郎编《中国方志所录方言汇编》(以下简称《汇编》)仅收录山东方志14种,所收山东方志并不完整。我们搜集的山东方志主要来源于台湾成文出版社的《中国方志丛书·山东省》(共222册,106种)和凤凰出版社的《中国地方志集成·山东府县志辑》(共95册,181种),同时辅以中国国家数字图书馆和南京图书馆所藏方志丛书。

我们搜集到含有方言资料的山东方志共有26种,除《齐乘》外,其中,《东明县新志》《昌乐县续志》《夏津县志续编》《续修广饶县志》《四续掖县志》《齐东县志》《青城县志》《东平县志》《沾化县志》《续修临邑县志》《清平县志》和《潍县志稿》,共12种,日本波多野太郎的《汇编》皆漏收。

山东方志所录方言资料的体例问题。方言材料在山东方志中的地位并不是整齐划一的,有的独立成卷,如《昌乐县续志》《临朐续志》;大多数则在《民社志》《礼俗志》《风俗志》《故实略》等之下自成一小节;少数将其与“歌谣”“谣谚”混同。从解释体例来看。山东方志所录方言数据的解释方法有“直述式”的,有“注释式”的,这些解释方法仍属于传统方言学范畴。就解释的内容来看,主要是解释某字词在山东方言的意义,揭示其在何种古代文献资料,并且考释了部分方言本字,同时,县志编纂者也注意到了山东方音的独特性,故在解释词语的过程中标明了字词的方音,值得一提的是,《牟平县志》和《潍县志稿》中,不仅使用传统的注音方法,还采用了民国时期的注音字母给字词标注方音。在山东方言史语音材料非常稀少的情况下,方志中有关山东方音的记录就显得尤为珍贵。

综观山东方志所录方言数据,其语言学价值当有三点。一是提供山东各地方言的一些词汇材料,并且集录了不少古代方言的数据,可以作为研究方言词汇的参考,也可以作为研究汉语词汇发展史的参考。二是反映了方音特点,可以作为研究山东方音史的参考。三是考释山东方言“本字”或“语源”,订正有关山东方言著作中的讹误。

山东方志所录方言材料浩繁复杂,语料零散,难于整理,鲜有对其进行全面研究的。今人大多是就经济、政治、地理、移民等方面的问题进行描述,而忽略了方志中含有的方言语音和词汇数据。文章对山东26种方志方言材料的体例、地域和历史分布以及语言学价值作了全面的概述。当然,这只是抛砖引玉,山东方志所录方言材料的语言学价值还需撰文再研究,也期许今人加强对方志所录方言数据价值的再认识。

2.8 “子”尾亲属称谓词综合研究——以清代及民国时期环北京地区方志方言为中心,《励耘语言学刊》2018年第2期(CSSCI),仝正涛。

主要内容:大型方志丛书《中国地方志集成》收入187种环北京地区方志。其中,方言类目下录有“子称词”的方志有31种,其编修时间集中于清末及民国时期。方志方言文献录有“子称词”的相应地域涵盖今北京官话、冀鲁官话、晋语等多种官话方言。官话方言是汉民族共同语的基础方言。方志方言文献所录“子称词”的研究,有助于从语言学视角深化对官话方言及民族共同语中这种称谓现象的认识和理解。

通过考察方志方言文献,梳理出了清代及民国时期环北京地区“子称词”的系统,我们发现:“子称词”萌芽于唐五代时期,元代以后才发展起来的特殊称谓现象,成为亲属称谓词的重要组成部分;“子称词”采用附加式构词,类推造词法是其主要造词方式,有“X+子”和“大/小X+子”两种模式,多用于指称平辈姻亲亲属;从“子称词”内部关系看,“大/小X子”脱胎于“大/小X”,前者是后者附加“子”尾演变而来的,前者分担了后者的部分语义,是专门作从儿称谓的形式;“子称词”中的“子”尾属于表达性词缀,是表示非正式化功能的词语标记,部分词中还具有成词、变义、衍音等功能。交际是语言的首要功能,催生语言的变化发展。“子称词”(尤其是“大/小X子”型)弥补了从儿称谓现象引起的词语空缺,给语言交际活动带来了诸多便利。

2.9 其他会议论文,学术刊物待刊

2.9.1河西宝卷所见明清西北地区几个方音现象,《语言学论丛》(CSSCI)即出

主要内容:河西宝卷是一种明清时期流行于甘肃河西一带的讲唱文学形式。通过对宝卷中韵文韵脚字的系联和异文别字的考察,发现其所代表的明清西北方音特点有:阴阳声韵数量大大减少,阳声韵韵尾合并或主元音的鼻音化,入声韵已消失,部分麻三字与歌戈读音相同;全浊声母清化,知系擦音合口字读[fu]或[phu],微影疑喻与日母合口字读为[v]。宝卷中大部分的中古德陌韵押入歌戈韵,与兰银官话同、与中原官话主要读支微韵不同。宝卷中的语音属于兰银官话。

2.10 专著《王仁昫〈刊谬补缺切韵〉三种点校整理本》,徐朝东,中华书局,2020年出版。

2.11 专著《历代方志文献集成》,曹小云,与出版社商定出版事宜。

2.12 专著《明清以来西北方音演变研究》,徐朝东、唐浩、王芳,商务印书馆选题评审。

2.13 专著《敦煌世俗文书语音综合研究》,徐朝东、仝正涛、唐浩,与出版社商定出版事宜。

三、下一步研究计划

这个项目是一个工作量大、材料复杂,数据库建设后对于汉语近代语音史的建构以及现代汉语官话方音的研究无疑将提供更大的便利,我们全体参与者全力以赴在规定时间内完成这个重大的任务。

5个子项目从目前工作的完成量看,

数据库平台建设基本完成,负责人皇甫伟教授以及团队正在与其他团队磨合数据接口,规范数据标注工作。

方志方面资料收集、文本录入都已经完成,北京地区、山东地区方志语音数据库及其研究部分已经完成,正在进行的是南京等地区方志,这些资料有限,估计2020年6月将完成。

域外译音资料包快传教士的双语字词典、教科书,日语片假名对音资料,朝鲜汉字音资料等工作进展超出预期,估计2020年12月全部完成数据库。

讲唱文学押韵数据库方面,已经完成了西北地区河西宝卷、贤孝唱词、秦腔等民间文学资料,现在正在剔除一些攙入的现代写本资料;正在进行的元明清戏曲戏剧用韵资料整理,估计2021年6月全部完成数据库。

韵书韵图资料数据库建设,相对比较滞后。我们将加大人力投入,协调资料的规范与统一模板,估计2022年6月全部完成数据库。

1.韵书韵图数据库(音节表),计划47种,完成了5种。

根据开题专家的建议,将原计划80左右韵书韵图资料缩减至40-50本韵书韵图资料,重点选择北京地区与南京地区的资料。从目前整理的情况看,韵书韵图资料选本已经完成,基本47种资料收集已经完成,酌情以后增补。

本课题选择的主要韵书韵图资料有:元代的《蒙古字韵》《中原音韵》,其他分区域统计:燕京、东北地区方言韵书10种:徐孝、张元善《合并字学集韵便览》(1602),乔中和《元韵谱》(1611),王荔《正音捃言》(1573-1620),樊腾凤《五方元音》(1661-1670),赵绍箕《拙庵韵悟》(1674),释阿摩利谛《三教经书文字根本》、《谐声韵学》(1699-1704),李光地、王兰生《音韵阐微》(1726),存之堂《圆音正考》(1743),都四德《黄钟通韵》(乾隆晚年),刘世英《元音改正》(1779),李汝珍《李氏音鉴》(1805),徐鉴《音泭》(1817),华长忠《韵籁》(1805-1858),张恩成《等韵简成》(1837),裕恩《音韵逢源》(1840),夏鸾翔《南北方音》中的北音(1863),王璞《京音字汇》(1912)《国音京音对照表》(1921),《国音常用字汇》(1932)。中原、西北地区方言韵书6种,如桑绍良《青郊杂著》《文韵考衷六声会编》(1581)、贾存仁《等韵精要》(1776)等。山东地区方言韵书6种,如毕拱辰《韵略汇通》(1642)等。南方(江淮)官话韵书13种:李登(南京)《书文音义便考私编》(1587),李世泽(南京)《韵法横图》与《韵法直图》(1573),萧云从(芜湖)《韵通》(成书于天启、崇祯年间),方以智(桐城)《切韵声原》(1666),吴烺(全椒)《五声反切正韵》(1763),李书云《音韵须知》(康雍间),许桂林(连云港人)《说音》(1807),许惠(桐城人)《等韵学》(1878),汪鎏《空谷传声》(1882),胡垣(南京)《古今中外音韵通例》(1888),马鸣鹤《正音新纂》(1902)徐宗斌(盐城)《徐氏类音字汇》(1900)等。西南地区方言韵书6种,如兰茂《韵略易通》(1442)等。

已经初步完成了《蒙古字韵》《中原音韵》《古今中外音韵通例》《正音新纂》4-5种资料音节表的制作工作。但是类资料太复杂,没有相应的模式,进展缓慢。经由与负责人黄笑山教授商量,决定使用《广韵》音节表的结构,分合关系讨论则根据各种资料性质的实际来决断。由张续龙、孙珊、周芷羽博士加入本子项目,配合负责人黄笑山教授将设计通用的一个模板。

2.域外对音资料数据库,计划20-30种,目前完成14种西文、3种片假名、1种谚文总共15种资料。

本课题原计划选择23种罗马字母、14种片假名、7种谚文注音的双语词典或教科书,先逐一将注音部分转写成现代罗马字音(非国际音标)。接受开题专家建议,将重点内容缩减至20种左右。

目前材料收集全部完成。

转写已经完成:罗明坚和利玛窦《葡汉辞典》(1583-1588),利玛窦《明末罗马字注音文章》(1606),马礼逊(Robert Morrison)《英华词典》(1815),麦都思《华英字典》(1842-1843),卫三畏(S.Wells Williams)的《英华韵府历阶》《英华分韵撮要》(1856),威妥玛《语言自迩集》(1857-1903);《寻津录》(1859),罗存德《英华字典》(1866-69)。屈耐特(Kühnert)《南京字汇》(1898),鲍康宁(F.W.Baller)《汉英分解字典》(1900),狄考文《官话课本》(1906),何美龄(K.Hemeling)《南京官话》(1902)。高本汉《中国音韵学研究》(1915-1928)各地方音字表。

日文片假名资料:《唐话纂要》(1718),岛津重豪《南山考讲记》(1768),伊泽修二《日清字音鉴》(1895)。朝鲜编写的北京话教材:《汉清文鉴》。

正在进行的金尼阁《西儒耳目资》(1626),崔世珍《翻译老乞大》《翻译朴通事》(1507-1517);小仓锦太、金泽保胤编《中国南部会话》(又名《南京官话》,1768-1813)。

由付芳负责西文材料,丁鼎、王露负责片假名材料,李彬彬负责谚文资料,这些数据统一转写为拉丁字母,不标音值。2019年12月底完成,将由皇甫伟教授验收。

3. 讲唱文学的押韵资料数据库。已经完成西北地区的讲唱文学资料韵谱,正在进行全元与全明戏曲韵谱制作。

本课题主要以讲唱文学为主,元明的官话讲唱文学资料;已经完成写本讲唱文学资料押韵韵谱建设,正在曲谱的建设工作。

本项目由刘祥柏教授指导,具体有唐浩副教授、王芳博士带领相关研究生正在进行韵谱转为数据库工作,曲谱将于今年年底开始,预计2020年6月底完成。

4. 历代方志中的语音材料,文本校勘已经完成,北京、山东地区方志方音数据库已经完成,进行江淮、西北及中原地区方音数据库建设,所有将于2020年元月完成。

曹小云教授已经完成所有文本工作,仝正涛、张续龙博士分别完成北京与山东地区的方志方音数据库,下一步由仝正涛博士负责其他地区的方志方音数据库建设。

课题组供稿 

(责编:孙爽、艾雯)