旧版网站入口

站内搜索

锡伯语(满语)基础语料库建设与研究中期检查报告

2017年12月11日10:07来源:全国哲学社会科学工作办公室

一、 研究进展情况

1、研究计划总体执行情况及各子课题进展情况

2016年5月,课题论证开题会议后,根据特邀语料库研究专家及满学研究专家意见,针对今日各类语料库建设标准不一,技术规范差次不齐的现状,决定本课题语料库建设参照国家语言保护工程规范开展,将原定生活交际用语语料库、教育新闻用语语料库、宗教民俗用语语料库、文化艺术用语语料库、民间文本与口述史语料库五个部分合为一录制,调整原语言学、历史学、民族学三学科交叉性质的语言资料库方案,避免“广而泛,无特色,不规范”误区,集中力量以语言学规范,建设基础语料库。课题突出“方言特色,地域特点,技术特色”,即突出锡伯语、满语方言对比,填补前人研究空白;课题调研地域广泛,涵盖诸多前人未涉及地点;课题以国家权威语料库建设标准,定位课题研究工作,建立概况、音系、词汇、语法、话语、口头文化、口述史等采集规范,使课题以国家最新最高标准推进,确保课题成果经得起检验。课题组编辑各点录制手册,从五方面子课题涉及词汇中选定典型词汇3500词,语法句150句,及代表人物的话语、口述专题,选定察布查尔锡伯自治县八个牛录、伊宁、巩留、塔城、乌鲁木齐、伊车噶善、北京、黑河、三家子十六个方言语料采集点,按照国家语言保护标准对采集音视频信息,对书面语进行拉丁转写注音,对口语进行国际音标注音,对话语开展语法分析。课题计划调整后,前期采集工作精炼而缩减,但后期编辑工作量大为增加。

至今,课题十六个调研点中完成六个;每个调研点录制口语代表人物一人,录制口述文化代表人物十二人,共录制词汇21000个,语法900句,话语、口述文化等110小时;收集各类文本、图书623册;对以采录的音视频词汇、语句按照国家语保标准进行数据整理;拉丁转写、音标注音、语法分析等工作完成过半。同时,根据调研中发现的新方言词汇及语言现象,课题组进一步增加锡伯语(满语)词汇、语法收录容量。

2、调查研究及学术交流情况

2015年12月10日-30日,课题组成员赴新疆维吾尔自治区伊犁哈萨克自治州察布查尔锡伯自治县开展预调查,访谈锡伯族老人西林、塔沁台、扎文才、关文明,于县文广局召开小型调研会议,了解语言状况,选定察布查尔县代表人物。

2016年4月17日-25日,课题组成员赴北京开展调研,访谈春英、佟松柏、肖昌、孔繁英等锡伯族老人,了解锡伯族口语变迁情况;访谈第一历史档案馆吴元丰、关精明、郭美兰,访谈北京社会科学院赵志强,了解锡伯语文技术标准;到中国科学院了解专业语料库建设情况。

2016年5月7、8日,课题组成员参加中国语言资源保护工程培训,学习国家语保工程技术与规范,了解各地语料库建设相关动态及经验。

2016年5月27日,课题组于吉林师范大学历史文化学院召开开题论证大会,辽宁省档案馆原馆长佟永功研究员、辽宁省民族研究所原所长关嘉禄研究员、内蒙古大学蒙古学中心主任齐木德道尔吉教授、中国第一历史档案满文部主任吴元丰研究员、北京社会科学院满学研究所赵志强研究员、中央民族大学历史文化学院赵令志教授、吉林师范大学校长杨景海教授出席开题会。各位专家在充分肯定课题论证的前提下,提出了宝贵意见。课题组根据论证会专家的意见,就课题框架及规范标准进行了调整。

2016年6月18日-7月14日,课题组成员赴新疆伊犁州察布查尔锡伯自治县开展语料库录制,完成顾永胜、顾宋儿二人口语采录,及格吐肯一人的访谈。

2016年8月6-7日,课题组成员赴伊宁市参加伊犁州文物局举办的“惠远古城历史文化研讨会”,就清代新疆满、汉文奏折相关问题进行学术交流。

2016年8月24日-9月8日,课题组成员赴新疆伊犁州霍城县伊车嘎善乡开展语料库录制,完成吴光明一人口语采录,访谈孔玉崇、顾锡庆、张国庆、赵晓萌等八人,并于察布查尔县教育局、语委会开展调研,了解双语教育状况,及《察布查尔锡伯自治县锡伯语言文字保护条例》执行情况。

2016年9月10日,于伊宁市参加伊犁师范学院举办的“首届锡伯族语言与文化学术研讨会”,了解锡伯语研究最新动态,与伊犁师范锡伯语言文化研究中心交流座谈,了解该中心锡伯语文信息化问题。

2016年11月15日-29日,课题组成员赴乌鲁木齐、伊犁调研,补录吴光明口语,访谈苏德山,调研锡伯营满文档册事宜。

2017年1月10日-3月25日,课题组成员于北京进行第一批录制音视频资料整理工作,召开小型会议,就第一阶段语料库录制问题进行总结。

2017年2月27日,课题组成员于中国人民大学参加赵志强老师教育部重大项目“《满文原档》翻译与研究”开题会。

2017年6月27-7月3日,课题组成员组织召开吉林师范大学“国际满学学术研讨会”及研习营,就满文清史焦点问题进行交流研讨。

2017年7月12日-8月20日,课题组成员赴新疆伊犁州察布查尔锡伯自治县进行语料库录制,完成关新福、曾斌、郭金英三人口语录制。

课题组成员自察布查尔锡伯自治县、霍城县、塔城、乌鲁木齐等地收集锡伯文图书623册,满文图书1020册,并完成数字化整理。录制音视频资料110小时,复制各类锡伯语音视频资料300余小时。收集锡伯族相关资料及研究相关成果,并建立锡伯研究资料库,包括论文库(1311篇)、人物库(770人)、图片库(15467张)、音乐库(220首)、文学库(323篇)等,为进一步深化课题课题研究创造条件。

3、成果宣传推介情况

课题前期调研、录制、编辑处理工作庞杂,诸多工作均在探索中逐步推进,各项技术标准不断规范,各类制度规范不断完善,课题研究成果不断成熟,课题组成员已有多篇研究成果刊载,《基于音素法的锡伯文字母划分与拼写的研究》、《锡伯语研究综述》、《锡伯族语言群体认同的变化机制研究》等论文,从不同角度对锡伯语研究形成创新;《清文助语虚字注述》、及《锡伯语会话读本》两部著书已送审中国社会科学出版社,将于年底出版;有关锡伯族方言、语法专题成果尚在修改完善中,拟于近期定稿后投递相关专题刊物;课题标志性成果有待十六个调研点录制结束,锡伯语(满语)语料整理完成后形成。课题组撰写《工作简报》三篇,近期研究动态及成果拟于完成暑期调研后报送国家社科基金专刊。

4、研究中存在的主要问题、改进措施,研究心得、意见建议;

课题开题期间,课题组对于语料库建设规范进一步明确,语料库建设系经科学取样和加工的大规模电子文本库,使用中真实出现的语言材料,以电子计算机为载体承载语言资源,并经语言学分析和处理,即真实语言、数字化、语言学处理三点要求,明确语料库建设三个阶段,即音视频的录制、编辑、分析处理。目前,就课题进展而言,音视频录制阶段经预调查、词库、句库建设,并参照国家语言保护工程规范,主要问题已解决。现阶段录制问题主要集中在场地环境上,租用录音棚或布设达到录制要求的场地,并检查采录者准备情况,熟悉录制信息,开展预录制演练,尽可能减少录制过程中的干扰因素,是录制阶段的主要问题。音视频编辑阶段,前期软件等问题已解决。现按照语言保护工程标准及最新软件,对每一音视频文件进行降噪、控时、编号、音视频对比等编辑处理,进展顺利。对音视频用语言学的规范进行分析处理,是现阶段课题研究耗时最多、难度最大的部分,主要表现在几个方面:1.国际音标注音处理,主要集中于对各采集点3500个词汇、150个语法句的国际音标注音,其音标注音以国家语言保护工程为准,注音详细,难度较大,课题组成员需要强化练习才能熟练掌握;2. 国家语保标准的语法分析处理,以语言学要求对录制的语法句及话语进行语法语素分析,解析各句语法结构及语法现象;3.话语的直译、意译处理,准确把握话语语意,按照语言学翻译要求,准确进行词、句的直译、意译翻译,并对方言差异进行必要说明。话语分析处理例句如下:

话语处理例句

锡 伯 文:???? ???? ???? ?????????? ???? ??? ????? ????? ????? ????? ??? ??????

????? ????? ??? ???? ??? ???? ????????? ??? ?????? ????????? ??? ?????? ?? ?? ?? …… ???? ??? ???? ????????? ??? ?????? ????????? ??? ??????

音 标:th?r? usun alin f?t??rkit?,th?r? ili pirai nimχa laptu pat?,?mu saiqhan pajan qa?an pi,th?r? ot?hi mini χairat?huqha poo qa?an,χairat?huqha poo qa?an。la la la ……th?r? ot?hi mini χairat?huqha poo qa?an,χairat?huqha poo qa?an。

语素分析:th?r? usun alin f?t??rki-t? th?r? ili pira-i nimχa laptu pa-t? ?mu saiqhan pajan qa?an pi th?r? ot?hi mi-ni χairat?huqha poo qa?an χairat?huqha poo qa?an la la la …… th?r? ot?hi mi-ni χairat?huqha poo qa?an χairat?huqha poo qa?an

直 译:那个 乌孙 山 下面-后置 那个 伊犁 河-领属 鱼 多 地方-后置 一 美丽 富饶 乡村 有 那个 是 我-领属 可爱的 家 乡村 可爱的 家 乡村 啦 啦 啦…… 那个 是 我-领属 可爱的 家 乡村 可爱的 家 乡村

意 译:在那乌孙山下,在那伊犁河鱼多的地方,有一个美丽富饶的乡村,那就是我可爱的家乡,可爱的家乡。啦!啦!啦……那就是我可爱的家乡,可爱的家乡。

语法处理例句

语意:阿山说他明天不来。

国际音标注音:a?an kis?r?ma? th?r t?aqh t?himar t?iqh s?r.

语素分析:a?an kis?r?-ma? th?r t?aqh t?himar t?i-qh s?-r

语法分析:阿山-主格 说-第一人称正在进行时 那 家伙 明天 来-否定 说-未完成体

方言差异说明:伊车噶善方言特点……,语气……,用词……;察布查尔县方言特点……,语气……,用词……。

根据现阶段工作强度及难度,及课题组部分成员语言学专业知识相对薄弱,前一阶段工作中出现一定问题的状况,课题组拟组织开展专题培训工作,围绕国际音标注音、语法分析、语素分析等薄弱环节,紧密围绕课题前期问题,强化语言学训练,提高注音准确度,提高语法分析能力,进而保证课题质量。此外,派课题组成员参与国家语言保护工程相关学习与培训,及时了解国家语言保护工程的最新技术标准及规范,对课题技术处理进行调整,保证课题技术规范的前沿性。

5、其他需要说明的问题。

黑龙江黑河、三家子是满族满语的语料采集点,但在预调查过程中,听取80年代末满语代表人物调研录音,并对比今日该地区几位满语传承人口语,发现近三十年来,黑河、三家子满语变异情况严重,语言变化较大,诸多音位、语位、音素变异较大,原有口语词汇被书面语词汇代替,语法结构也多被汉语语法代替,表现出用满文书面语词汇套用汉语语法进行表达的现象。新疆锡伯族调研中,各调研点情况不一,塔城锡伯族口语因长期受哈萨克语影响,其词汇、发音等呈现哈萨克语特点;伊宁市锡伯族口语中受维吾尔、俄罗斯语影响较多,维语、俄语借词数量大,音位相对察布查尔县有所特点;察布查尔县各乡镇亦各有特点,除传统方言词汇、借词使用差异外,部分村落受外省移民影响,锡伯语发音亦有一定变化。

针对上述问题,课题严格按照国家语言保护工程的要求,包括人员年龄、职业、生活区域等要素选定口语代表人物,保证口语采集对象为该区域公认口语代表人;其次,对于该区域已无口语代表人物者,或口语严重变异,失去方言特征者,进行详细甄别,则或放弃采录,或局部采录,避免将非代表性、非传统性口语录入语料库。

二、研究成果情况

1、著书《清文助语虚字注述》

该书对清代满文虚字进行注述,清朝三百年期间,用满文书写形成了数量浩繁的满文文献,全面记录了满族及清朝的社会历史、语言文学、风俗习惯、宗教信仰和民族关系等各方面内容。有关清文虚字的著书屈指可数,采用传统方法讲述满语虚词,虽对后世影响较大,但诸多内容难以理解。本书在解读《重刻清文虚字指南编》基础上,从文献学与语言学角度,对满文虚字逐一解读,深化对满文虚字的理解,强化助语虚字的实际运用,系统论证满文虚字在满文文献研究与满语语法研究中的作用。

2、著书《锡伯语会话读本》

本书从锡伯语教学实际出发,针对口语与书面语的特点,选取典型场景,编辑585个例句,涵盖锡伯族多数语法现象,揭示传据等重要语法内容。书中编有多篇经典短文,从文学、历史等方面介绍满文、锡伯文二者关系,并解释口语与书面语的异同,为锡伯语读本中的创新之作。

3、论文《基于音素法的锡伯文字母划分与拼写的研究》

分析了锡伯文语言文字发展历史和现状,按照现代语音学规律,以锡伯文发音音素为基础,同时充分考虑计算机信息处理的原理和特性,研究并划分出锡伯文字母以及对应于字母的锡伯文字母书写形式,在此基础上研究锡伯文字母的拼写规则,论述摒弃以音节为基础的传统识读学习模式,建立以音素为基础的新型模式,音素教学法为今日锡伯语、满语教学的一大创新。该成果为“索贝特”锡伯文(满文)录入法的重要设计理念,也是最新版锡伯文小学教材的创新点,今年最新版以音素教学法为核心的锡伯文小学教材已由新疆教育出版社出版发行。

4、论文《锡伯语研究综述》

全文综述锡伯语研究脉络沿革,总结国内外锡伯语文研究,主要围绕锡伯语、锡伯文、锡伯语口语与书面语、锡伯语与满语、锡伯语中的借词、锡伯语文使用情况调查等问题进行,各领域代表作,及成果创新点,解析日后锡伯族语言文字研究的重心和难点,为进一步拓展锡伯语文研究提供了思路。

5、论文《锡伯族语言群体认同的变化机制研究》

运用民族学、美学和社会语言学的理论视角进行分析,对锡伯族的语言群体认同变化轨迹进行梳理,并对237名察布查尔县锡伯族青少年展开问卷调查。论文表明民族认同、审美意识和社交网络是维持语言群体认同的重要力量。指出提高锡伯族的语言群体认同,需要促进青少年的情感向行为转化,充分利用资源提升语言认知能力和审美意识,并通过家庭传承深化民族语言自觉。

课题组供稿 

(责编:王瑶)