舊版網站入口

站內搜索

“基於大型詞匯語音數據庫的漢藏歷史比較語言學研究”中期檢查情況

2015年07月21日16:16來源:全國哲學社會科學工作辦公室

一、研究進展情況

本項目2012年獲得批准以來,於2013年3月20日在中國社會科學院民族學與人類學研究所舉辦開題論証會,聽取專家意見。此后進行了具體部署和工作,目前進展順利。

1. 2013年6月委托中科院軟件研究所開發網絡工作平台,2013年2月完成工作平台設置。具體內容包括:設置研究人員注冊,語言比較界面,語言數據分析和查詢界面等。

2. 成立8個子課題組並簽訂子課題責任人協議書,包括“漢藏語歷史比較計算機輔助平台”、“漢藏語語言詞匯數據採集”、“侗台語比較”、“南亞語比較”、“苗瑤語比較”、“藏緬語-藏羌比較”、“藏緬語-景頗彝緬比較”、“藏-漢同源詞譜歷史比較”。

3. “漢藏語歷史比較計算機輔助平台”子課題舉辦3次小型研討會,部分在京課題組成員主要就比較內容、比較方法進行技術討論。

4. “漢藏語語言詞匯數據採集”調研和收集130種語言數據的錄入和校對,並已上載數據比較平台,平台調試工作近期已經完成。

5. 課題組近期正在研究詞匯語音相似性比較方法,主要利用計算機建模方式開展語言資源數據的相似性計算和相似關系樹形分析。

6. 課題組發表了多篇相關性論文,參見研究成果。

7. 課題組報送了一次“工作簡報”。

課題進展中存在的問題:

1. 藏緬語言數據過分龐大,現已分成藏羌和景頗彝緬兩組,但比較起來仍然不便操作,可能考慮將彝語支再次劃分出來。南島語言目前尚未設立子課題組,已經跟陝西師大博士后崔金明約談,可做進一步安排。

2. 雖然本課題採集的語言數據不少,並還在增長,但實際上數據仍然存在兩個重要缺陷,一是數據准確度需要認真核查,二是仍然存在數據稀疏問題。第一個的解決辦法是全面核准,第二個問題目前准備局部採用田野補充調查方法進行復核。

二、研究成果情況

代表性成果1:

Evolution of Word-Syllable Structures and the Diversity of World Languages, 發表於Chinese Science Bulletin(中國科學通報). 2014,Vol.59:21. 作者: JIANG Di, KANG Caijun, YAN Haixiong.

代表性成果2:

王念孫的聯綿詞‘天籟’說証 語言科學 2013年12卷第5期.作者: 江荻

成果1提出一項原創性的觀點,認為: 世界語言的基本差異源於詞形結構(WSS), 而不是區別性的音素. 語言的多樣性似乎來自詞形結構的演化結果, 取決於音節構造形態類型和詞的音節長度. 本文採集世界179種語言的Swadesh詞表來分析詞形結構多樣性指數的地理分布, 並嘗試發現它們在演化過程中的進化位置和深度. 通過建立理想的詞形結構偏移量模型, 計算每種語言的偏移距離和偏移方向, 根據分析結果把語言劃分成三組, 每一組代表一種演化類型. 得出詞形結構的多樣性和偏移量模型代表了人類語言演化的多樣性方向和演化過程, 當今每種語言都在一定程度上保留了詞形結構最基本的特征, 因此, 詞形結構可以視為人類語言“基因”.

當前,學界對東亞和中國人群起源存在較大爭議,部分遺傳人類學者(人類基因和分子人類學)認為東亞人群來自非洲,這個觀點跟國際主流觀點一致﹔部分古人類學者(主要是古人類考古)認為東亞人群是本地獨立發展或跟非洲遷移來的現代人混合而形成的。那麼,語言學可否做出自己的判斷。本文把漢語為代表的東亞語言放在世界范圍觀察,提出人類語言的核心要素,即詞形和詞形結構,採用數學建模方法論証了詞形結構發展模式和規律,劃分了世界語言詞形結構類型,從詞形結構的多樣性和語言地理分布的多樣性發現東亞人類語言的“基因”。

成果2將成果1的結論應用於先秦以前的漢語文獻,結合當代民族語言(達讓語)進一步論証單音節漢語也是從多音節語言發展而來。這個結論破除了西方把漢語稱為落后的孤立語的觀點,為漢語史研究和現代漢語研究帶來新的探索領域和研究方向。

注:2010年立項的重大項目主要填寫2012年6月以來的研究成果情況。 

序號

成果名稱

作者

成果形式

刊物名或出版社、刊發或出版時間

字數

轉載、引用、獲獎等情況

1

Evolution of Word-Syllable Structures and the Diversity of World Languages

JiangDo,  Kang Caijun, YAN Haixiong

論文

Chinese Science Bulletin. 2014,Vol.59-21

1.2

 

2

達讓語研究

江荻 李大勤 孫宏開

專著

民族出版社,2013.10

29萬

 

3

萬水千山走遍 中國民族語言語法研究暨慶祝孫宏開先生80壽誕論文集

江荻 黃行 李大勤(主編)

論文集

民族出版社 2013.11.

43萬

 

4

中國語言地圖集第2版:少數民族語言卷:C-25藏語--西藏自治區 四川省 青海省 甘肅省 雲南省: 182-188頁. C2-3甘肅省 青海省少數民族語言(合作)211-215頁.C2-11西藏自治區東南部少數民族語言: 25-256頁.

江荻(參編)

地圖集

商務印書館 2012年

4.5萬

 

5

格林伯格的語言發生學與世界語言分類--語言發生學 理論與方法文集概述

江荻

論文

漢藏語學報2012年(第6期)Pp37-53 商務印書館

1.8

 

6

彝語派生名詞構詞法研究

馬輝 江荻

論文

民族語文2012年第3期31-38頁

1.0

 

7

有關計算機數據處理的記音規范建議

潘悟雲 江荻 麥耘

論文

民族語文2012年第5期3-7頁

1.0

 

8

國際音標表的本地化修訂建議與說明

江荻

論文

民族語文2012年第5期28-32頁

1.0

 

9

常用記音和國際音標的中文名稱

董穎紅

論文

民族語文2012年第5期70-73頁

0.8

 

10

論聲調的起源和聲調的發生機制

江荻

論文

藏語文工作(漢文版)2012年第2期

1.5

 

11

國際音標擴展表的分類 命名與功能

呂佳 江荻

論文

聽力學及言語疾病雜志 2013.10(21卷第6期:665-668頁)

1.2

 

12

音節型語言演化的語音后果

江荻

論文

大江東去—王士元教授80歲賀壽文集 香港 香港城市大學出版社 2013.8 Pp371-388

1.8

 

13

桑耶寺鐘和昌珠寺鐘的語法標注和釋讀

江荻

論文

江荻等主編萬水千山走遍 中國民族語言語法研究暨慶祝孫宏開先生80壽誕論文集 民族出版社 2013.11(Pp388-397)

0.6

 

14

當代中國語言學界的大學者 孫宏開研究員

江荻

論文

江荻等主編萬水千山走遍 中國民族語言語法研究暨慶祝孫宏開先生80壽誕論文集 民族出版社 2013.11(Pp431-458)

1.8

 

15

藏語句法功能組塊的邊界識別

李琳 龍從軍 江荻

論文

中文信息學報 2013年27卷第6期 Pp165-168.

0.9

 

16

基於詞位的藏文黏寫形式的切分

康才畯 龍從軍 江荻

論文

計算機工程與應用2014年第11期

0.8

 

17

王念孫的聯綿詞‘天籟’說証

江荻

論文

語言科學 2013年12卷第5期 460-467

1.5

 

18

基於條件隨機場的藏文人名識別研究

康才畯 龍從軍 江荻

論文

計算機工程與應用,2014年3月14日優先出版

0.8

 

19

藏語判斷句、存在句識別策略

李琳,龍從軍

論文

中文信息學報2013.8

0.7萬

 

20

藏語甘孜話的人稱代詞

燕海雄

論文

江荻等主編萬水千山走遍 中國民族語言語法研究暨慶祝孫宏開先生80壽誕論文集 民族出版社 2013.11

0.6萬

 

21

藏語的句法成分的標記系統

龍從軍

論文

江荻等主編萬水千山走遍 中國民族語言語法研究暨慶祝孫宏開先生80壽誕論文集 民族出版社 2013.11

0.8萬

 

22

論軟腭塞音在藏語方言中的變化

燕海雄

論文

《中國社會科學院民族學與人類學研究所青年學術論壇(2011)》,社會科學文獻出版社2013年1月

0.6萬

 

23

The Competence Between Evolution and anti-Evolution of the Word Lengths in Old Chinese

Yinghong Dong, Di Jiang

論文

Proceedings of the 25th North American Conference on Chinese Linguistics. NACCL-25 (21-23 June 2013): University of Michigan. -- forthcoming

1.0

 

24

The Types of Tibeto-Burman Consonant Clusters and Their Influence on Language Classification

Di Jiang

論文

Proceedings of the 25th North American Conference on Chinese Linguistics. NACCL-25 (21-23 June 2013): University of Michigan. -- forthcoming

1.0

 

25

The Comparative Research on the Segmentation Strategies of Tibetan bounded-variant forms

Congjun Long Caijun Kang Di Jiang

國際會議論文

2013 International Conference on Asian Language Processing,2013.8, (Urumqi, China, Aug 17-19, 2013)IEEE

0.8

 

26

Tibetan word segmentation based on word-position tagging

Caijun Kang Congjun Long Di Jiang

國際會議論文

2013 International Conference on Asian Language Processing,2013.8, (Urumqi, China, Aug 17-19, 2013)IEEE

0.9

 

27

Applied Lexicon Hierarchies for Ethnic Groups Released by Psychological Experiments

Qiaoyun Yin,  Di Jiang

國際會議論文

The 5th International Conference in Evolutionary Linguistics (CIEL-5, Aug.17-19,2013), The Chinese University of Hong Kong.

1.0

 

28

古藏語非音節性名詞詞綴消亡的原因

江荻

國際會議論文

The 5th International Conference in Evolutionary Linguistics (CIEL-5, Aug.17-19,2013), The Chinese University of Hong Kong.

1.2

 

 

課題組供稿

(責編:實習生、張文卓(實習生))