舊版網站入口

站內搜索

“漢語方言自然口語變異有聲數據庫建設”中期檢查情況

2015年07月10日16:43來源:全國哲學社會科學工作辦公室

一、研究計劃總體執行情況及子課題進展情況

總體執行情況。重大項目“漢語方言自然口語變異有聲數據庫建設”於2012年10月立項,同年11月舉辦開題會。侯精一、陸儉明、黃德寬、曹志耘、游汝杰、潘悟雲、柳士鎮、石定栩、趙世舉、沈陽、王建勤、劉俐李、吳長安、王韞佳等專家參會,就課題框架設計、研究內容、研究方法、技術規范等問題進行充分討論,會議確定了兩個原則:一是數據庫代表點為南京、蘇州、上海三大城市﹔二是強調變異,充分考慮地域差異,將歷史演變與自然口語共時變異相結合。設立4個子課題:總體框架設計、漢語方言自然口語分區調查、特大城市漢語方言自然口語接觸與變異調查、數據庫建設。

工作周期為5年,從2013年1月開始,到2017年12月結束。分為四個階段:

第一階段(2013.01-2013.06),完成工作規范,購置設備,搜集資料。

第二階段(2013.07-2015.06),調查、歸納音系,完成調查任務,建庫團隊開始進行數據庫設計和程序編寫工作。

第三階段(2015.07-2017.06),完成語料切分,數據核查,按期交給建庫團隊。

第四階段(2017.07-2017.12),數據入庫,建立數據庫檢索系統,開發數據檢索界面。

目前,課題組嚴格按照時間表,有序推進各項工作。已召開4次小型學術研討會,就調查規范、調查手冊、任務分工等事項進行討論。同時,就課題工作遇到的問題,不定期召開課題階段交流會,各子課題負責人協同合作,項目進展順利。

子課題進展情況,具體如下:

1. 總體框架設計已經完成。

2013至2014年初,召開2次小范圍學術研討會,制定本課題的總體工作方案,包括工作進度、調查手冊、技術規范等,以統籌安排各項工作,使各團隊、各調查點按照統一規范進行調查、採錄、整理、入庫工作。

技術標准:技術規范規定語音採錄和語音分析採用統一技術指標,以便后期語音材料的整理入庫。規定在採錄過程中採用低噪儀器,語音材料用統一用斐風(FieldPhon)軟件錄制,採樣率為44100Hz,採樣精度為16bit﹔如對語音材料進行分析,採用Praat語音分析軟件制作提取。語圖用三維寬帶頻譜圖,縱軸表頻率,橫軸表時長,頻率取值范圍為0-5000赫茲。語圖的制作參數為Gaussian窗,窗長為0.005秒,時間步長為0.002秒,頻率步長為20Hz。

調查手冊:調查手冊分單字表、詞匯表、語法表三部分,根據各地方言情況略有調整。單字表收錄音韻代表字2600個,以便進行歷史演變分析﹔詞匯表收錄詞匯2200條,按天文地理、時令節氣等分為12類﹔收錄語法代表句100句,調查、研究各地方言語法。

調查對象:選定四個年齡段,分性別進行錄音。

老年男子1人(60周歲以上),採錄2600音系代表字、2200詞、100語法例句、獨白《牛郎織女》、《狼來了》兩個話題、30分鐘同輩人對話(兩人對話,性別不限)。

中年女子1人(41—55歲周歲),採錄2600音系代表字。

青年男子1人(24—40周歲),採錄2600音系代表字。

少女1人(1990年以后出生),採錄2600音系代表字、2200詞、100語法例句、獨白《牛郎織女》、《狼來了》兩個話題、30分鐘同輩人對話(兩人對話,性別不限)。

2.“漢語方言自然口語分區調查”和“特大城市自然口語接觸與變異調查”同時進行,全面展開。

綜合運用方言學、社會語言學、統計學的方法,從年齡、性別、職業、文化程度等方面,在鄉村和城市進行布點密集、大規模、多樣本的調查,採集自然的、實態的漢語方言自然口語語料。城市方言自然口語調查,又區分新城區和老城區,這在全國性、大規模的方言數據庫建設領域尚屬首創。目前,各調查團隊正分赴各地進行調查。南京點錄音、整理和轉寫作已經完成,蘇州點、上海點採錄工作正在進行。以上海為試點進行的“特大城市自然口語接觸與變異調查”已經展開,已篩查到的語音變異項近40個,極具研究價值。

3. 數據庫建設工作進展順利。

“數據庫建設”子課題在語音資料整理、轉寫、切分基礎上,對調查資料進行整理入庫、加工開發,建立“漢語方言自然口語數據庫”,開發和使用專門的分析軟件和規范化工具,對調查資料進行分析、校對、規范化處理,以保証資料的數字化質量,並構建相應的檢索系統,實現資料的存儲、關聯、訪問和檢索。

現已完成南京點語音資料的整理、轉寫工作,其他點的錄音、整理、轉寫正在進行,為后期數據庫入庫准備了大量語音圖文資料。

二、調查研究及學術交流情況

1. 田野調查工作

為採錄方言自然口語,項目組歷時一年半,在南京和蘇州地區展開大規模的田野調查,採錄了大量語音樣本,按照數據庫建設的技術參數錄制了高質量的音頻資料。在上海市,為調查語言變異項,前期已經展開錄音工作,採集語音樣本,甄選具有代表性的變異項。

2.學術交流活動

2013年至2014年6月,本項目組召開了4次小型學術研討會,多次階段性匯報會、交流會。與會專家來自北京大學、南京大學、復旦大學、北京語言大學、陝西師范大學、暨南大學、南京師范大學、蘇州大學、南通大學等高校,制定調查文本,如調查字表、詞表、語法例句、話題等規定內容﹔確定數據庫建設的各項技術標准,如錄音軟件、採樣率、語圖制作規范、數據入庫技術等﹔就本課題的相關前沿問題充分探討,互相交流。

三、研究中遇到的主要問題及解決辦法

1.自然口語調查手冊的制定

迄今為止,我國尚無一份專門用於調查方言自然口語的調查表,國外亦無可供借鑒的資料。我們按照本課題的目標、范圍、方法等制定調查表的總體框架、分類系統以及具體條目,召開2次研討會,反復論証,最后確定音韻代表字2600個,詞匯十二類2200條,語法例句100句,從字、詞、句三個方面調查方言自然口語。

2.數據庫的建設

方言自然口語的數據庫建設屬前沿課題,要求研究者掌握方言學、計算機科學、民俗學、人類學的相關知識。我們依托南京大學相關院系資源,通過院系交流、學術研討,對本課題組成員進行了專門培訓。此外,方言自然口語有聲數據庫對口語語料的自然性和音像質量要求很高,錄音工作難度較大。為保証語音數據質量,我們嚴格按照統一的採錄規范,採用低噪設備,確保音像質量﹔在各調查團隊安排以當地方言為母語的調查人,或在調查點長期工作的人,保証數據的真實性、自然性和准確性。

二、研究成果情況

1. 顧黔《南京方言知庄章三組歷時演變與年齡差異研究》(《語言暨語言學》Language and Linguistics, Monograph Series53,2014,台灣中研院語言所)

南京方言知、庄、章三組存在[ts、tsh、s]與[tʂ、tʂh、ʂ]的對立,這在江蘇境內的江淮方言是一重要特征。凡北京話讀﹝ts、tsh、s﹞者南京話亦讀﹝ts、tsh、s﹞﹔然而北京話讀﹝tʂ、tʂh、ʂ﹞者南京話存在明顯的年齡差異,這是歷史上知、庄、章三組的對立,尤其是庄組與知章組的對立在南京方言的遺存和反映。該文以少、青、中、老四個年齡段為調查對象,在中古知、庄、章三組選擇南京人常用口語詞(字)119個,逐一調查、統計、分析其在四個年齡層的音讀分布情況,探討差異產生的原因及歷時演變的軌跡和方向。

調查發現,操南京方言的老年人,中古知、庄、章三組字[ts]、[ tʂ]兩類是共存、疊置的,只是與北京話相比[ts]類稍多於[tʂ]類。到了中年階段,大量[tʂ]組字歸入[ts]組(不包括韻母是舌尖后[ʅ]的字),使得中年組[ts]佔了主導地位。青少年由於受普通話的影響,並未沿襲中年人在發音上的轉變,而是又將許多字歸入[tʂ]組,因此[ts]、[tʂ]兩組的比率又恢復了基本平衡。少兒組[ts]類出現的幾率最小。

文章指出,目前,南京話知庄章三組既有古音的遺存,又由於語言接觸受漢民族共同語普通話的影響,不少語音特征發生了變化。認為南京話知、庄、章三組的讀音從老年到中年的轉變是南京方言自身發展的結果﹔而中年到青少年的變化是近幾十年來普通話正音教育的結果。

該文於2013年6月,在美國新澤西大學舉辦的“Various Aspects of Chinese Studies in the Global Age(全球化視野下的中國研究)”國際學術研討會上,由顧 黔教授作主題演講。與會專家十分關注南京方言的變異情況,對該文給予高度評價。

2. 顧黔《南京方言宕江兩攝入聲韻的共時變異及歷時演變研究》(《澳門理工學報》,2013年第4期)

南京是中國四大古都之一,其方言古為吳語,由於歷史上多次北人南下,充實江淮間,現已演變為江淮官話。文章運用歷史層次分析法,考察南京方言宕江兩攝入聲韻在老、中、青、少四個年齡段的共時變異,分析宕江兩攝入聲韻的語音層次,探討普通話滲透、嵌入南京方言的方式和步驟,討論南京方言入聲韻的演變軌跡和發展趨勢。

文章探討南京方言宕江兩攝入聲韻紛繁復雜的音讀形式,與外地方言(特別是普通話)的接觸影響引起的競爭、疊置、借入的具體情況,指出其演變過程,分為四個步驟:

第一步 聲母白讀+韻母白讀+聲調白讀 削sioʔ5

第二步 聲母文讀+韻母白讀+聲調白讀 削ɕyoʔ5、確tɕhyoʔ5⑥

第三步 聲母文讀+韻母文讀+聲調白讀 削ɕyeʔ5、確tɕhyeʔ5

第四步 a.聲母文讀+韻母文讀+聲調文讀(對應的南京話調值)削ɕye31、確tɕhye44

b.聲母文讀+韻母文讀+聲調文讀(對應的普通話調值)削ɕye55、確tɕhye51

文章從方言接觸、歷史層次、異源疊置等角度,探討南京方言的共時變異和歷史演變,具有重要的學術價值。

3.陳忠敏《歷史比較法與漢語方言語音比較》(《語言研究》,2013年第5期)

文章根據歷史比較法的原理,討論高本漢方言語音比較法、羅杰瑞閩語語音比較法的得失,認為“方言的語音比較其實就是建立方言間語音層次的對應,隻有是對應的層次才是對等的語音形式”,“在語言接觸頻繁的方言裡,語音層次分析是語音比較的前提”,提出“方言語音層次比較法”這一概念。文章考察閩語魚韻讀音,說明語音層次比較法的具體步驟:

一、必須先在單個方言點梳理出所研究項目的語音層次

二、研究異讀

三、確定語音層次的音韻特點和語音層次的時間先后

四、根據單個方言點層次的音韻特點和時間先后,由近及遠尋找方言間的對等層次(對等語音形式)。

文章指出,語音層次分析不是為了給《切韻》的音類擬音,它不僅關注方言的原始成分,也分析各時期由於語言接觸引起的層次現象,也即可以對方言的整個語音發展的歷史作出分析和解釋。

4. 陳忠敏《上海方言的形成及其特點》(《澳門理工學報》,2013年第4期)

上海市中心方言是由原鬆江地區的方言發展出來的。由於170年來獨特的政治、經濟、文化、移民等因素,造成了市中心方言跟周圍鬆江方言區方言的發展不平衡,是一個非常典型的方言地層學現象,具有極高的研究價值。

文章從語言接觸的角度和方言形成的歷時人文背景,根據實地調查,指出上海地區的方言可根據聲調的調類分合及調值特點分為5個區。在此基礎上,描寫市中心方言區語音的主要特征,分析市中心方言的歷時演變,探討上海市中心方言的變異現象及其原因。

文章通過梳理、分析歷史文獻,歸納出170年來上海話聲母、韻母、聲調等重要演變規律,在上海傳統方言衰亡前盡可能全面、真實地記錄方言面貌,為中華文化和人類文明留下一份珍貴的遺產。

5. 陳立中《甘肅合水太白方言自然口語語料類編》(南京大學出版社,2014)

《甘肅合水太白方言自然口語語料類編》,輯錄甘肅省合水縣太白方言的自然口語語料。作者在實地錄得約200小時的語音材料,用國際音標記錄錄音材料,用漢字轉寫每句方言話語。

語料按內容分類排列,涉及天文、地理、時間、傳統節日、農業、植物、動物、民居、日常生活用品、人品、親屬、身體、醫療、服飾、飲食、紅白大事、宗教迷信、行政、日常生活、交際、為人處事、工商業、教育、文體娛樂、動作行為、位置、代詞、形容詞、副詞、介詞、量詞、數詞、聲音等34類。

全書180萬字,內容豐富,語料翔實,堪稱一部地方方言和文化的百科全書。

6. 顧黔“南京方言自然口語變異有聲數據庫”(2013年)

按照統一規范,從2013年5月至2014年5月,課題組採用科學方法和現代化技術手段,實地採錄自然的、實態的漢語方言口語語料,標記、轉寫、整理,完成了南京方言自然口語變異數據庫建設。

課題組選擇四個年齡段,分性別進行錄音。老年男子(60周歲以上)和少年女子(1990年以后出生)各一人,採錄2600音系代表字、2200詞、100語法例句、獨白《牛郎織女》、《狼來了》兩個話題、30分鐘同輩人對話(兩人對話,性別不限)。中年女子(41—55歲周歲)和青年男子(24—40周歲)各一人,採錄2600音系代表字。

在採錄過程中,採用低噪儀器,統一用斐風(FieldPhon)軟件錄制,採樣率為44100Hz,採樣精度為16bit﹔採用Praat語音分析軟件對語言材料進行分析,制作提取語圖。語圖用三維寬帶頻譜圖,縱軸表頻率,橫軸表時長,頻率取值范圍為0-5000赫茲。語圖的制作參數為Gaussian窗,窗長為0.005秒,時間步長為0.002秒,頻率步長為20Hz。

在保存和呈現環節,廣泛使用最新的多媒體、現代化技術手段,包括錄音、錄像、照相、音像加工技術等,利用數據庫和網絡技術展示方言自然口語的實際面貌,真正做到方言自然口語的多媒體化和“實態”化。

注:2010年立項的重大項目主要填寫2012年6月以來的研究成果情況。

序號

成果名稱

作者

成果形式

刊物名或出版社、刊發或出版時間

字數

轉載、引用、獲獎等情況

1

南京方言自然口語變異有聲數據庫

顧  黔

數據庫

2013年

18GB

2

《南京方言宕江兩攝入聲韻的共時變異及歷時演變研究》

顧  黔

論文

《澳門理工學報》

2013年第4期

6700字

3

《南京方言知庄章三組歷時演變與年齡差異研究》

顧  黔

論文

Language and Linguistics, 2014

(《語言暨語言學》)

5400字

4

Nanjing Dialect and Folk Culture: Everyday Utensils

顧  黔

論文

Various Aspects of Chinese Studies, 2014

9000字

5

《歷史比較法與漢語方言語音比較》

陳忠敏

論文

《語言科學》

2013年第5期

2.1萬字

6

《也談歷史比較法與歷史層次分析法》

陳忠敏

論文

《語言學論叢》

第47輯2013年

商務印書館

1.2萬字

7

《上海方言的形成及其特點》

陳忠敏

論文

《澳門理工學報》

2013年第4期

9000字

8

On the relationship between tones and initials of the dialects in the Shanghai area

陳忠敏

論文

Language and Linguistics, 2014

(《語言暨語言學》)

1.6萬字

9

《江浙滬交界處方言送氣分調及相關問題》

陳忠敏

論文

《承澤堂方言論叢》

語文出版社

2014年

6400字

10

Feature combination via importance-inhibition analysis

陳家駿等

論文

Journal of Southeast University (英文版)

2013年第1期

5000字

11

《關中東府方言古知庄章組合口字與精組字合流的內外因素》

邢向東

論文

《語言研究》

2014年第1期

6000字

12

《近八十年來關中方言端精見組齊齒呼字的分混類型及其分布的演變》

邢向東

論文

《陝西師范大學學報》2013年第5期

7700字

13

《甘肅合水太白方言自然口語語料類編》

陳立中

著作

南京大學出版社

2014年

180萬字

14

《現代湘語和吳語濁音聲母發音特征的比較》

鐘江華

陳立中

論文

《湖北民族學院學報》

2012年第4期

5000字

15

《江蘇海安方言的“子”尾詞》

汪如東

論文

《方言》

2012年第4期

6000字

16

《上海話“辣海”的語源及虛化特征的比較研究》

汪如東

論文

《東南大學學報》

2012年第4期

1.2萬字

17

《適應原理下句法系統的自繁殖》

馬清華

論文

《語言研究》

2014年第1期

8000字

18

《擬聲詞在語言發生學上的意義》

馬清華

論文

《外國語》

2013年第1期

7200字

19

《江蘇丹陽方言的語氣詞》

徐娟娟

論文

《方言》

2013年第4期

1.1萬字

20

《語音層次與邊界方言屬性——以丹陽方言為例》

徐娟娟

論文

《語言科學》

2012年第5期

7000字

21

《丹陽方言文白異讀與語音演變》

徐娟娟

論文

《暨南學報》

2012年第3期

1.2萬字

被引用1次

22

《明清木魚書中的粵方言》

鄧小琴

論文

《暨南學報》

2014年第4期

7200字

23

《粵方言否定副詞“咪”之溯源及其語義虛化》

鄧小琴

論文

《前沿》

2013年第20期

5000字

24

《身份認同與兒化使用——以北京兒化為例》

王  玲

論文

《暨南學報》

2014年第3期

7200字

25

《城市化進程中本地居民和外來移民的語言適應行為研究》

 

王  玲

論文

《語言文字應用》

2012年第2期

1.2萬字

被引用5次

26

《語言生活中的弱勢群體——概念、界定和原因分析》

王  玲

論文

《外語研究》

2013年第1期

8400字

27

《現代漢語評論話語使用狀況研究》

 

王  玲

郭  晶

論文

《揚州大學學報》

2013年第6期

7200字

28

《城市語言環境變化與城市語言沖突事件》

王  玲

劉艷秋

論文

《安徽師范大學學報》

2013年05期

9600字

29

《城市化中語言適應行為與語音變異關系研究》

王  玲

論文

《陝西師范大學學報》

2014年第2期

8400字

30

《南京方言中的“有點兒”和“一點兒”》

張  薇

論文

《語文學刊》

2013年第12期

3000字

31

《丹陽方言語音層次與歷史演變》

徐娟娟

南京大學

博士論文

2012年

20萬字

32

《常熟方言音韻演變研究》

莫媧

南京大學

博士論文

2013年

15萬字

33

《江陰方言歷時演變及共時年齡變異研究》

張志凌

南京大學

博士論文

2013年

15萬字

34

《高淳方言語音研究》

張薇

南京大學

博士論文

2014年

22萬字

35

《連雲港方言地理語言學研究——一語音為例》

王萍

南京大學

博士論文

2014年

15萬字

 

課題組供稿

(責編:實習生、張文卓(實習生))