旧版网站入口

站内搜索

基于大型词汇语音数据库的汉藏历史比较语言学研究中期检测报告

2016年11月30日16:53来源:全国哲学社会科学工作办公室

一、研究进展情况

本课题2015年7月提交了中期检查课题,主要内容是提出课题延期至2018年12月。延期原因是课题执行遇到难以逾越的技术困难,使得顺利进行的课题不得不改变技术路线。我们感谢基金委理解我们提出的延期理由,并批准本课题的延期申请。

本课题目前依据新的方案执行,新方案要点是:机器自动比较,人工核查。理论基础是:数据相似关系计算。我们将采用改良的Levanstein距离对两两语言之间的相似性距离计算,这种计算数学上理解为亲缘关系,类似语言的谱系关系。同时,我们要根据语言情况对Levanstein公式进行修订,目前已决定采用插值方式分析语音结构,再利用语音音素之间的关系确定权重开展这项研究。在上一次中期会议上,课题设计人已向各个子课题组负责人汇报了用20种语言计算东亚语言亲缘(相似)关系的实验,实验结果令人满意,实验结果跟传统结论十分接近,意味着可以应用于已有语言关系结论的验证和谱系未确定语言的分类。

经过一年的努力,我们已经在新的方案之下初步完成或接近完成了以下工作内容:(1)数据收集,(2)数据前期处理,(3)语音参数转换,(4)程序开发和程序调试。与以上准备工作同时开展的是课题组的理论建设,按照本次中期检查要求,仅填写2014年至今已发表论文20余篇。我们已经填写阶段性成果清单。

子课题调整方面,分工和人员仍然按照2015年中期报告执行。增加两位博士后和两位博士生参与课题。

虽然课题方案发生较大变化,但是课题组怀着极大的热情和信心完成研究工作,我们的研究是有希望的,真正具有创新性的。我们相信,课题的完成将对东亚和中国语言谱系关系提出有分量的成果。

二、研究成果情况

2015年中期报告我们介绍了孙宏开教授的“汉藏语系语言的共同创新”(民族语文,2014第2期),人大报刊全文刊载。江荻等“词形结构进化与世界语言的多样性”(科学通报,中、英文版,2014年 59(21),人大报刊全文刊载)。这次介绍三篇:江荻,张辉“汉语词头残迹印证早期汉语是多音节型语言”,载《古汉语语法研究新论》,西南师范大学出版社,2015年10月。施向东“关于“汉藏音轨”问题的再思考之一对俞敏先生上古音体系几个问题的讨论”,载《南开语言学刊》2015年第1期。江荻,尹巧云“中国不同族群对核心词认知的实验”,载《语言文字应用》2016年第1期,人大报刊全文刊载。

1.“汉语词头残迹印证早期汉语是多音节型语言”。文章用《诗经》和其他先秦材料的词头词论证早期汉语是多音节词语言。通过对比亲属语言迭音词和一个半音节词的演化现象,以及观察词头词与重言词共存的等价功能和数量关系,提出早期汉语跟其他东亚和东南亚语言一样是轻重格词模式语言。又依据Hayes的抑扬格-扬抑格定律,发现词头词的单音节化痕迹。并由此证明,“有”字头等词头词不是词缀、不是衬音词、也不是实词,而是多音节词的(弱)首音节,确定了词头词的性质以及作为早期语言多音节性重要遗存的证物。这项研究厘清了汉语史一个难点,也为早期汉语词汇史研究提供了新知。这篇文章既阐述了一直争议未决的词头词性质,又论证了汉语源自多音节词语言,这项基础原创可以说颠覆了数千年来认为汉语是孤立语和单音节词语言的观点。

2.“关于‘汉藏音轨’问题的再思考之一:对俞敏先生上古音体系几个问题的讨论”。这篇文章根据俞敏先生在《汉语的“其”跟藏语的gji》《汉藏同源字谱稿》及其他文章中的观点,整理出了俞敏先生的汉语上古音体系,并在它跟藏文所反映的古藏语进行比较的基础上提出若干修正的意见:1.对上古音宵部、药部、蒸部进行了构拟;2.对之部进行了重新构拟;3.对音节起首和韵尾的复辅音系统进行了讨论。文章指出,俞敏先生主张周代汉语已有平上去入四声,而且汉语的声调跟音节韵尾的某些音质音位是密切相关的,这是俞敏先生在汉语声调来源和演变问题上的重要发现。

3.“中国不同族群对核心词认知的实验”。心理语言学认为人类心理词库的组织结构可能不是层级的。本项实验通过不同语言族群和不同词汇集,考察被试在不同条件下的图片命名反应时间,证明心理词库在语义、概念本体性质上不太可能是层级结构,认为任何具体词集(包括Swadesh词表)都是根据某种应用目的从心理词库整体词汇中抽取出来的,必然映射人类认知世界的文化、语用等层次性特征。本文结论对理解心理词库以及对Swadesh词表的深化应用和对核心词的构建研究带来新的思路。由于采用Swadesh历史演化词表,也就不可避免地涉及人类认知世界的文化、语用等层次性特征和其他特征。这样的词集性质有可能给历史比较研究带来机遇和挑战。

(责编:沈王一)