旧版网站入口

站内搜索

“基于大型词汇语音数据库的汉藏历史比较语言学研究”中期检查情况

2015年07月21日16:16来源:全国哲学社会科学工作办公室

一、研究进展情况

本项目2012年获得批准以来,于2013年3月20日在中国社会科学院民族学与人类学研究所举办开题论证会,听取专家意见。此后进行了具体部署和工作,目前进展顺利。

1. 2013年6月委托中科院软件研究所开发网络工作平台,2013年2月完成工作平台设置。具体内容包括:设置研究人员注册,语言比较界面,语言数据分析和查询界面等。

2. 成立8个子课题组并签订子课题责任人协议书,包括“汉藏语历史比较计算机辅助平台”、“汉藏语语言词汇数据采集”、“侗台语比较”、“南亚语比较”、“苗瑶语比较”、“藏缅语-藏羌比较”、“藏缅语-景颇彝缅比较”、“藏-汉同源词谱历史比较”。

3. “汉藏语历史比较计算机辅助平台”子课题举办3次小型研讨会,部分在京课题组成员主要就比较内容、比较方法进行技术讨论。

4. “汉藏语语言词汇数据采集”调研和收集130种语言数据的录入和校对,并已上载数据比较平台,平台调试工作近期已经完成。

5. 课题组近期正在研究词汇语音相似性比较方法,主要利用计算机建模方式开展语言资源数据的相似性计算和相似关系树形分析。

6. 课题组发表了多篇相关性论文,参见研究成果。

7. 课题组报送了一次“工作简报”。

课题进展中存在的问题:

1. 藏缅语言数据过分庞大,现已分成藏羌和景颇彝缅两组,但比较起来仍然不便操作,可能考虑将彝语支再次划分出来。南岛语言目前尚未设立子课题组,已经跟陕西师大博士后崔金明约谈,可做进一步安排。

2. 虽然本课题采集的语言数据不少,并还在增长,但实际上数据仍然存在两个重要缺陷,一是数据准确度需要认真核查,二是仍然存在数据稀疏问题。第一个的解决办法是全面核准,第二个问题目前准备局部采用田野补充调查方法进行复核。

二、研究成果情况

代表性成果1:

Evolution of Word-Syllable Structures and the Diversity of World Languages, 发表于Chinese Science Bulletin(中国科学通报). 2014,Vol.59:21. 作者: JIANG Di, KANG Caijun, YAN Haixiong.

代表性成果2:

王念孙的联绵词‘天籁’说证 语言科学 2013年12卷第5期.作者: 江荻

成果1提出一项原创性的观点,认为: 世界语言的基本差异源于词形结构(WSS), 而不是区别性的音素. 语言的多样性似乎来自词形结构的演化结果, 取决于音节构造形态类型和词的音节长度. 本文采集世界179种语言的Swadesh词表来分析词形结构多样性指数的地理分布, 并尝试发现它们在演化过程中的进化位置和深度. 通过建立理想的词形结构偏移量模型, 计算每种语言的偏移距离和偏移方向, 根据分析结果把语言划分成三组, 每一组代表一种演化类型. 得出词形结构的多样性和偏移量模型代表了人类语言演化的多样性方向和演化过程, 当今每种语言都在一定程度上保留了词形结构最基本的特征, 因此, 词形结构可以视为人类语言“基因”.

当前,学界对东亚和中国人群起源存在较大争议,部分遗传人类学者(人类基因和分子人类学)认为东亚人群来自非洲,这个观点跟国际主流观点一致;部分古人类学者(主要是古人类考古)认为东亚人群是本地独立发展或跟非洲迁移来的现代人混合而形成的。那么,语言学可否做出自己的判断。本文把汉语为代表的东亚语言放在世界范围观察,提出人类语言的核心要素,即词形和词形结构,采用数学建模方法论证了词形结构发展模式和规律,划分了世界语言词形结构类型,从词形结构的多样性和语言地理分布的多样性发现东亚人类语言的“基因”。

成果2将成果1的结论应用于先秦以前的汉语文献,结合当代民族语言(达让语)进一步论证单音节汉语也是从多音节语言发展而来。这个结论破除了西方把汉语称为落后的孤立语的观点,为汉语史研究和现代汉语研究带来新的探索领域和研究方向。

注:2010年立项的重大项目主要填写2012年6月以来的研究成果情况。 

序号

成果名称

作者

成果形式

刊物名或出版社、刊发或出版时间

字数

转载、引用、获奖等情况

1

Evolution of Word-Syllable Structures and the Diversity of World Languages

JiangDo,  Kang Caijun, YAN Haixiong

论文

Chinese Science Bulletin. 2014,Vol.59-21

1.2

 

2

达让语研究

江荻 李大勤 孙宏开

专著

民族出版社,2013.10

29万

 

3

万水千山走遍 中国民族语言语法研究暨庆祝孙宏开先生80寿诞论文集

江荻 黄行 李大勤(主编)

论文集

民族出版社 2013.11.

43万

 

4

中国语言地图集第2版:少数民族语言卷:C-25藏语--西藏自治区 四川省 青海省 甘肃省 云南省: 182-188页. C2-3甘肃省 青海省少数民族语言(合作)211-215页.C2-11西藏自治区东南部少数民族语言: 25-256页.

江荻(参编)

地图集

商务印书馆 2012年

4.5万

 

5

格林伯格的语言发生学与世界语言分类--语言发生学 理论与方法文集概述

江荻

论文

汉藏语学报2012年(第6期)Pp37-53 商务印书馆

1.8

 

6

彝语派生名词构词法研究

马辉 江荻

论文

民族语文2012年第3期31-38页

1.0

 

7

有关计算机数据处理的记音规范建议

潘悟云 江荻 麦耘

论文

民族语文2012年第5期3-7页

1.0

 

8

国际音标表的本地化修订建议与说明

江荻

论文

民族语文2012年第5期28-32页

1.0

 

9

常用记音和国际音标的中文名称

董颖红

论文

民族语文2012年第5期70-73页

0.8

 

10

论声调的起源和声调的发生机制

江荻

论文

藏语文工作(汉文版)2012年第2期

1.5

 

11

国际音标扩展表的分类 命名与功能

吕佳 江荻

论文

听力学及言语疾病杂志 2013.10(21卷第6期:665-668页)

1.2

 

12

音节型语言演化的语音后果

江荻

论文

大江东去—王士元教授80岁贺寿文集 香港 香港城市大学出版社 2013.8 Pp371-388

1.8

 

13

桑耶寺钟和昌珠寺钟的语法标注和释读

江荻

论文

江荻等主编万水千山走遍 中国民族语言语法研究暨庆祝孙宏开先生80寿诞论文集 民族出版社 2013.11(Pp388-397)

0.6

 

14

当代中国语言学界的大学者 孙宏开研究员

江荻

论文

江荻等主编万水千山走遍 中国民族语言语法研究暨庆祝孙宏开先生80寿诞论文集 民族出版社 2013.11(Pp431-458)

1.8

 

15

藏语句法功能组块的边界识别

李琳 龙从军 江荻

论文

中文信息学报 2013年27卷第6期 Pp165-168.

0.9

 

16

基于词位的藏文黏写形式的切分

康才畯 龙从军 江荻

论文

计算机工程与应用2014年第11期

0.8

 

17

王念孙的联绵词‘天籁’说证

江荻

论文

语言科学 2013年12卷第5期 460-467

1.5

 

18

基于条件随机场的藏文人名识别研究

康才畯 龙从军 江荻

论文

计算机工程与应用,2014年3月14日优先出版

0.8

 

19

藏语判断句、存在句识别策略

李琳,龙从军

论文

中文信息学报2013.8

0.7万

 

20

藏语甘孜话的人称代词

燕海雄

论文

江荻等主编万水千山走遍 中国民族语言语法研究暨庆祝孙宏开先生80寿诞论文集 民族出版社 2013.11

0.6万

 

21

藏语的句法成分的标记系统

龙从军

论文

江荻等主编万水千山走遍 中国民族语言语法研究暨庆祝孙宏开先生80寿诞论文集 民族出版社 2013.11

0.8万

 

22

论软腭塞音在藏语方言中的变化

燕海雄

论文

《中国社会科学院民族学与人类学研究所青年学术论坛(2011)》,社会科学文献出版社2013年1月

0.6万

 

23

The Competence Between Evolution and anti-Evolution of the Word Lengths in Old Chinese

Yinghong Dong, Di Jiang

论文

Proceedings of the 25th North American Conference on Chinese Linguistics. NACCL-25 (21-23 June 2013): University of Michigan. -- forthcoming

1.0

 

24

The Types of Tibeto-Burman Consonant Clusters and Their Influence on Language Classification

Di Jiang

论文

Proceedings of the 25th North American Conference on Chinese Linguistics. NACCL-25 (21-23 June 2013): University of Michigan. -- forthcoming

1.0

 

25

The Comparative Research on the Segmentation Strategies of Tibetan bounded-variant forms

Congjun Long Caijun Kang Di Jiang

国际会议论文

2013 International Conference on Asian Language Processing,2013.8, (Urumqi, China, Aug 17-19, 2013)IEEE

0.8

 

26

Tibetan word segmentation based on word-position tagging

Caijun Kang Congjun Long Di Jiang

国际会议论文

2013 International Conference on Asian Language Processing,2013.8, (Urumqi, China, Aug 17-19, 2013)IEEE

0.9

 

27

Applied Lexicon Hierarchies for Ethnic Groups Released by Psychological Experiments

Qiaoyun Yin,  Di Jiang

国际会议论文

The 5th International Conference in Evolutionary Linguistics (CIEL-5, Aug.17-19,2013), The Chinese University of Hong Kong.

1.0

 

28

古藏语非音节性名词词缀消亡的原因

江荻

国际会议论文

The 5th International Conference in Evolutionary Linguistics (CIEL-5, Aug.17-19,2013), The Chinese University of Hong Kong.

1.2

 

 

课题组供稿

(责编:实习生、张文卓(实习生))