舊版網站入口

站內搜索

錫伯語(滿語)基礎語料庫建設與研究中期檢查報告

2017年12月11日10:07來源:全國哲學社會科學工作辦公室

一、 研究進展情況

1、研究計劃總體執行情況及各子課題進展情況

2016年5月,課題論証開題會議后,根據特邀語料庫研究專家及滿學研究專家意見,針對今日各類語料庫建設標准不一,技術規范差次不齊的現狀,決定本課題語料庫建設參照國家語言保護工程規范開展,將原定生活交際用語語料庫、教育新聞用語語料庫、宗教民俗用語語料庫、文化藝術用語語料庫、民間文本與口述史語料庫五個部分合為一錄制,調整原語言學、歷史學、民族學三學科交叉性質的語言資料庫方案,避免“廣而泛,無特色,不規范”誤區,集中力量以語言學規范,建設基礎語料庫。課題突出“方言特色,地域特點,技術特色”,即突出錫伯語、滿語方言對比,填補前人研究空白﹔課題調研地域廣泛,涵蓋諸多前人未涉及地點﹔課題以國家權威語料庫建設標准,定位課題研究工作,建立概況、音系、詞匯、語法、話語、口頭文化、口述史等採集規范,使課題以國家最新最高標准推進,確保課題成果經得起檢驗。課題組編輯各點錄制手冊,從五方面子課題涉及詞匯中選定典型詞匯3500詞,語法句150句,及代表人物的話語、口述專題,選定察布查爾錫伯自治縣八個牛錄、伊寧、鞏留、塔城、烏魯木齊、伊車噶善、北京、黑河、三家子十六個方言語料採集點,按照國家語言保護標准對採集音視頻信息,對書面語進行拉丁轉寫注音,對口語進行國際音標注音,對話語開展語法分析。課題計劃調整后,前期採集工作精煉而縮減,但后期編輯工作量大為增加。

至今,課題十六個調研點中完成六個﹔每個調研點錄制口語代表人物一人,錄制口述文化代表人物十二人,共錄制詞匯21000個,語法900句,話語、口述文化等110小時﹔收集各類文本、圖書623冊﹔對以採錄的音視頻詞匯、語句按照國家語保標准進行數據整理﹔拉丁轉寫、音標注音、語法分析等工作完成過半。同時,根據調研中發現的新方言詞匯及語言現象,課題組進一步增加錫伯語(滿語)詞匯、語法收錄容量。

2、調查研究及學術交流情況

2015年12月10日-30日,課題組成員赴新疆維吾爾自治區伊犁哈薩克自治州察布查爾錫伯自治縣開展預調查,訪談錫伯族老人西林、塔沁台、扎文才、關文明,於縣文廣局召開小型調研會議,了解語言狀況,選定察布查爾縣代表人物。

2016年4月17日-25日,課題組成員赴北京開展調研,訪談春英、佟鬆柏、肖昌、孔繁英等錫伯族老人,了解錫伯族口語變遷情況﹔訪談第一歷史檔案館吳元豐、關精明、郭美蘭,訪談北京社會科學院趙志強,了解錫伯語文技術標准﹔到中國科學院了解專業語料庫建設情況。

2016年5月7、8日,課題組成員參加中國語言資源保護工程培訓,學習國家語保工程技術與規范,了解各地語料庫建設相關動態及經驗。

2016年5月27日,課題組於吉林師范大學歷史文化學院召開開題論証大會,遼寧省檔案館原館長佟永功研究員、遼寧省民族研究所原所長關嘉祿研究員、內蒙古大學蒙古學中心主任齊木德道爾吉教授、中國第一歷史檔案滿文部主任吳元豐研究員、北京社會科學院滿學研究所趙志強研究員、中央民族大學歷史文化學院趙令志教授、吉林師范大學校長楊景海教授出席開題會。各位專家在充分肯定課題論証的前提下,提出了寶貴意見。課題組根據論証會專家的意見,就課題框架及規范標准進行了調整。

2016年6月18日-7月14日,課題組成員赴新疆伊犁州察布查爾錫伯自治縣開展語料庫錄制,完成顧永勝、顧宋兒二人口語採錄,及格吐肯一人的訪談。

2016年8月6-7日,課題組成員赴伊寧市參加伊犁州文物局舉辦的“惠遠古城歷史文化研討會”,就清代新疆滿、漢文奏折相關問題進行學術交流。

2016年8月24日-9月8日,課題組成員赴新疆伊犁州霍城縣伊車嘎善鄉開展語料庫錄制,完成吳光明一人口語採錄,訪談孔玉崇、顧錫慶、張國慶、趙曉萌等八人,並於察布查爾縣教育局、語委會開展調研,了解雙語教育狀況,及《察布查爾錫伯自治縣錫伯語言文字保護條例》執行情況。

2016年9月10日,於伊寧市參加伊犁師范學院舉辦的“首屆錫伯族語言與文化學術研討會”,了解錫伯語研究最新動態,與伊犁師范錫伯語言文化研究中心交流座談,了解該中心錫伯語文信息化問題。

2016年11月15日-29日,課題組成員赴烏魯木齊、伊犁調研,補錄吳光明口語,訪談蘇德山,調研錫伯營滿文檔冊事宜。

2017年1月10日-3月25日,課題組成員於北京進行第一批錄制音視頻資料整理工作,召開小型會議,就第一階段語料庫錄制問題進行總結。

2017年2月27日,課題組成員於中國人民大學參加趙志強老師教育部重大項目“《滿文原檔》翻譯與研究”開題會。

2017年6月27-7月3日,課題組成員組織召開吉林師范大學“國際滿學學術研討會”及研習營,就滿文清史焦點問題進行交流研討。

2017年7月12日-8月20日,課題組成員赴新疆伊犁州察布查爾錫伯自治縣進行語料庫錄制,完成關新福、曾斌、郭金英三人口語錄制。

課題組成員自察布查爾錫伯自治縣、霍城縣、塔城、烏魯木齊等地收集錫伯文圖書623冊,滿文圖書1020冊,並完成數字化整理。錄制音視頻資料110小時,復制各類錫伯語音視頻資料300余小時。收集錫伯族相關資料及研究相關成果,並建立錫伯研究資料庫,包括論文庫(1311篇)、人物庫(770人)、圖片庫(15467張)、音樂庫(220首)、文學庫(323篇)等,為進一步深化課題課題研究創造條件。

3、成果宣傳推介情況

課題前期調研、錄制、編輯處理工作龐雜,諸多工作均在探索中逐步推進,各項技術標准不斷規范,各類制度規范不斷完善,課題研究成果不斷成熟,課題組成員已有多篇研究成果刊載,《基於音素法的錫伯文字母劃分與拼寫的研究》、《錫伯語研究綜述》、《錫伯族語言群體認同的變化機制研究》等論文,從不同角度對錫伯語研究形成創新﹔《清文助語虛字注述》、及《錫伯語會話讀本》兩部著書已送審中國社會科學出版社,將於年底出版﹔有關錫伯族方言、語法專題成果尚在修改完善中,擬於近期定稿后投遞相關專題刊物﹔課題標志性成果有待十六個調研點錄制結束,錫伯語(滿語)語料整理完成后形成。課題組撰寫《工作簡報》三篇,近期研究動態及成果擬於完成暑期調研后報送國家社科基金專刊。

4、研究中存在的主要問題、改進措施,研究心得、意見建議﹔

課題開題期間,課題組對於語料庫建設規范進一步明確,語料庫建設系經科學取樣和加工的大規模電子文本庫,使用中真實出現的語言材料,以電子計算機為載體承載語言資源,並經語言學分析和處理,即真實語言、數字化、語言學處理三點要求,明確語料庫建設三個階段,即音視頻的錄制、編輯、分析處理。目前,就課題進展而言,音視頻錄制階段經預調查、詞庫、句庫建設,並參照國家語言保護工程規范,主要問題已解決。現階段錄制問題主要集中在場地環境上,租用錄音棚或布設達到錄制要求的場地,並檢查採錄者准備情況,熟悉錄制信息,開展預錄制演練,盡可能減少錄制過程中的干擾因素,是錄制階段的主要問題。音視頻編輯階段,前期軟件等問題已解決。現按照語言保護工程標准及最新軟件,對每一音視頻文件進行降噪、控時、編號、音視頻對比等編輯處理,進展順利。對音視頻用語言學的規范進行分析處理,是現階段課題研究耗時最多、難度最大的部分,主要表現在幾個方面:1.國際音標注音處理,主要集中於對各採集點3500個詞匯、150個語法句的國際音標注音,其音標注音以國家語言保護工程為准,注音詳細,難度較大,課題組成員需要強化練習才能熟練掌握﹔2. 國家語保標准的語法分析處理,以語言學要求對錄制的語法句及話語進行語法語素分析,解析各句語法結構及語法現象﹔3.話語的直譯、意譯處理,准確把握話語語意,按照語言學翻譯要求,准確進行詞、句的直譯、意譯翻譯,並對方言差異進行必要說明。話語分析處理例句如下:

話語處理例句

錫 伯 文:ᡜᠬᢞᠧ ᠿᢑᡇᡢ ᠡᡨᠵᡢ ᡒᠫᢓᠫᢞᢃᠵᡚᠨ᠀ ᡜᠬᢞᠧ ᠯᡨᠱ ᡊᠵᢞᠤᠱ ᡡᠵᡑᡲᠢ ᡦᠤᡌᡚᡃ ᡊᠤᡚᠨ᠀ ᠦᡑᡂ ᢏᠤᠶᡬᠤᡢ

ᡊᠤᢠᠤᡢ ᡯᠤᢘᠤᡢ ᡊᠲ᠀ ᡜᠬᢞᠧ ᠺᢕᠱ ᡏᠵᡤᠱ ᡱᠤᠶᢞᠤᢕᡇᡬᠢ ᡊᠽᠻ ᡯᠤᢘᠤᡢ᠀ ᡱᠤᠶᢞᠤᢕᡇᡬᠢ ᡊᠽᠻ ᡯᠤᢘᠤᡢ᠁ ᡦᠢ ᡦᠢ ᡦᠢ …… ᡜᠬᢞᠧ ᠺᢕᠱ ᡏᠵᡤᠱ ᡱᠤᠶᢞᠤᢕᡇᡬᠢ ᡊᠽᠻ ᡯᠤᢘᠤᡢ᠀ ᡱᠤᠶᢞᠤᢕᡇᡬᠢ ᡊᠽᠻ ᡯᠤᢘᠤᡢ᠁

音 標:thərə usun alin fətʂərkitə,thərə ili pirai nimχa laptu patə,əmu saiqhan pajan qaʂan pi,thərə otɕhi mini χairatʂhuqha poo qaʂan,χairatʂhuqha poo qaʂan。la la la ……thərə otɕhi mini χairatʂhuqha poo qaʂan,χairatʂhuqha poo qaʂan。

語素分析:thərə usun alin fətʂərki-tə thərə ili pira-i nimχa laptu pa-tə əmu saiqhan pajan qaʂan pi thərə otɕhi mi-ni χairatʂhuqha poo qaʂan χairatʂhuqha poo qaʂan la la la …… thərə otɕhi mi-ni χairatʂhuqha poo qaʂan χairatʂhuqha poo qaʂan

直 譯:那個 烏孫 山 下面-后置 那個 伊犁 河-領屬 魚 多 地方-后置 一 美麗 富饒 鄉村 有 那個 是 我-領屬 可愛的 家 鄉村 可愛的 家 鄉村 啦 啦 啦…… 那個 是 我-領屬 可愛的 家 鄉村 可愛的 家 鄉村

意 譯:在那烏孫山下,在那伊犁河魚多的地方,有一個美麗富饒的鄉村,那就是我可愛的家鄉,可愛的家鄉。啦!啦!啦……那就是我可愛的家鄉,可愛的家鄉。

語法處理例句

語意:阿山說他明天不來。

國際音標注音:aʂan kisɤrɤmaŋ thɤr tʂaqh tɕhimar tɕiqh sɤr.

語素分析:aʂan kisɤrɤ-maŋ thɤr tʂaqh tɕhimar tɕi-qh sɤ-r

語法分析:阿山-主格 說-第一人稱正在進行時 那 家伙 明天 來-否定 說-未完成體

方言差異說明:伊車噶善方言特點……,語氣……,用詞……﹔察布查爾縣方言特點……,語氣……,用詞……。

根據現階段工作強度及難度,及課題組部分成員語言學專業知識相對薄弱,前一階段工作中出現一定問題的狀況,課題組擬組織開展專題培訓工作,圍繞國際音標注音、語法分析、語素分析等薄弱環節,緊密圍繞課題前期問題,強化語言學訓練,提高注音准確度,提高語法分析能力,進而保証課題質量。此外,派課題組成員參與國家語言保護工程相關學習與培訓,及時了解國家語言保護工程的最新技術標准及規范,對課題技術處理進行調整,保証課題技術規范的前沿性。

5、其他需要說明的問題。

黑龍江黑河、三家子是滿族滿語的語料採集點,但在預調查過程中,聽取80年代末滿語代表人物調研錄音,並對比今日該地區幾位滿語傳承人口語,發現近三十年來,黑河、三家子滿語變異情況嚴重,語言變化較大,諸多音位、語位、音素變異較大,原有口語詞匯被書面語詞匯代替,語法結構也多被漢語語法代替,表現出用滿文書面語詞匯套用漢語語法進行表達的現象。新疆錫伯族調研中,各調研點情況不一,塔城錫伯族口語因長期受哈薩克語影響,其詞匯、發音等呈現哈薩克語特點﹔伊寧市錫伯族口語中受維吾爾、俄羅斯語影響較多,維語、俄語借詞數量大,音位相對察布查爾縣有所特點﹔察布查爾縣各鄉鎮亦各有特點,除傳統方言詞匯、借詞使用差異外,部分村落受外省移民影響,錫伯語發音亦有一定變化。

針對上述問題,課題嚴格按照國家語言保護工程的要求,包括人員年齡、職業、生活區域等要素選定口語代表人物,保証口語採集對象為該區域公認口語代表人﹔其次,對於該區域已無口語代表人物者,或口語嚴重變異,失去方言特征者,進行詳細甄別,則或放棄採錄,或局部採錄,避免將非代表性、非傳統性口語錄入語料庫。

二、研究成果情況

1、著書《清文助語虛字注述》

該書對清代滿文虛字進行注述,清朝三百年期間,用滿文書寫形成了數量浩繁的滿文文獻,全面記錄了滿族及清朝的社會歷史、語言文學、風俗習慣、宗教信仰和民族關系等各方面內容。有關清文虛字的著書屈指可數,採用傳統方法講述滿語虛詞,雖對后世影響較大,但諸多內容難以理解。本書在解讀《重刻清文虛字指南編》基礎上,從文獻學與語言學角度,對滿文虛字逐一解讀,深化對滿文虛字的理解,強化助語虛字的實際運用,系統論証滿文虛字在滿文文獻研究與滿語語法研究中的作用。

2、著書《錫伯語會話讀本》

本書從錫伯語教學實際出發,針對口語與書面語的特點,選取典型場景,編輯585個例句,涵蓋錫伯族多數語法現象,揭示傳據等重要語法內容。書中編有多篇經典短文,從文學、歷史等方面介紹滿文、錫伯文二者關系,並解釋口語與書面語的異同,為錫伯語讀本中的創新之作。

3、論文《基於音素法的錫伯文字母劃分與拼寫的研究》

分析了錫伯文語言文字發展歷史和現狀,按照現代語音學規律,以錫伯文發音音素為基礎,同時充分考慮計算機信息處理的原理和特性,研究並劃分出錫伯文字母以及對應於字母的錫伯文字母書寫形式,在此基礎上研究錫伯文字母的拼寫規則,論述摒棄以音節為基礎的傳統識讀學習模式,建立以音素為基礎的新型模式,音素教學法為今日錫伯語、滿語教學的一大創新。該成果為“索貝特”錫伯文(滿文)錄入法的重要設計理念,也是最新版錫伯文小學教材的創新點,今年最新版以音素教學法為核心的錫伯文小學教材已由新疆教育出版社出版發行。

4、論文《錫伯語研究綜述》

全文綜述錫伯語研究脈絡沿革,總結國內外錫伯語文研究,主要圍繞錫伯語、錫伯文、錫伯語口語與書面語、錫伯語與滿語、錫伯語中的借詞、錫伯語文使用情況調查等問題進行,各領域代表作,及成果創新點,解析日后錫伯族語言文字研究的重心和難點,為進一步拓展錫伯語文研究提供了思路。

5、論文《錫伯族語言群體認同的變化機制研究》

運用民族學、美學和社會語言學的理論視角進行分析,對錫伯族的語言群體認同變化軌跡進行梳理,並對237名察布查爾縣錫伯族青少年展開問卷調查。論文表明民族認同、審美意識和社交網絡是維持語言群體認同的重要力量。指出提高錫伯族的語言群體認同,需要促進青少年的情感向行為轉化,充分利用資源提升語言認知能力和審美意識,並通過家庭傳承深化民族語言自覺。

課題組供稿 

(責編:王瑤)