旧版网站入口

站内搜索

基于大型可比语料库的中国学者(科学家)学术英语现状研究

2022年04月24日08:52

北京航空航天大学卫乃兴主持完成的国家社会科学基金项目《基于大型可比语料库的中国学者(科学家)学术英语现状研究》(项目批准号为:13BYY074),最终成果为同名专著。课题组成员有:高霞、何宇茵、张毓、杨越森、王冰昕、张磊、高歌、杨晨姣。

一 研究的目的和意义

(一)研究目的

(1)通过大型中西学者学术英语可比语料库的建设和探索,从多视角定量、定性描述、探讨中国学者学术英语的词汇—语法特征、话语策略、话语行为与意义方式,凸显其不同于西方学者文本的显著性差异特征。(2)探索可比语料库建设的技术方案优化与改进;尝试开发新的短语单位自动认定技术和学术文本“局部语法”、“语义序列”研究分析技术,为研究意义单位提供坚实的技术与数据支撑。

(二)研究意义

该成果基于数据开展中国学者学术英语现状研究,发现了不同于以往研究结论的重要内容及底层制约机制,丰富或重构ESP及相关领域的某些描述体系,完善有关理论表述。项目所开展的系列研究为重新审视和探讨话语策略和话语行为提供了新的观察视角和方法路径。这对学术英语能力的多层面评估与衡量,对我国的英语教育、ESP教育决策可提供有价值的反馈和参照。

二 成果的主要内容和重要观点或对策建议

(一)主要内容

1.建设了一个截至目前国内最大容量的中外学术英语可比语料库Bei-jingCARE(Beijing Collection of Academic Research Essays)

该库由“中国学者论文库”和“西方学者论文库”两大子库组成,涵盖自然科学、工程学科、生命与医学、人文与社会科学四大领域内共23个学科的学术论文。于2015年初步建成,并逐年持续更新至今。Beijing CARE语料库所含文本均为2000~2017年各学科影响因子较高的国际学术期刊所发表的西方国家学者和中国学者的论文,所选期刊总计150种。全库共计收录6155篇论文,总库容为33415707形符、276129类符。其中,西方学者子库包含3918个文本,总形符22671866词次、类符171656词,标准类符/形符比率为35.51%;各学科子库库容在975649形符到998532形符之间。中国学者论文库共收录2237个文本,包含10743841形符、104473类符,标准类符/形符比率为33.29%;各学科子库库容在459334形符到488420形符之间。中国学者论文的第一作者均来自中国大陆,西方学者论文库第一作者来自英语内圈国家,包括英国、美国、加拿大、澳大利亚和新西兰。

2.语料加工

对语料进行了适用于不同目的的多种加工与标注。对全部文本进行了元信息标注和词类信息赋码,获得了POS(part of speech)tagged语料库。并对部分语料进行句法分析和语篇特征标注。

3.短语序列计算工具开发与数据库建设

开发了新一代的短语序列计算工具(New MI等),用于学术英语短语的自动识别、提取。我们综合多种计算技术,包括频数、内部联结力(in-ternal association)、边界熵(boundary entropy)等,突破了传统互联网信息只能计算二元序列的限制,实现了基于多种统计手段的短语序列提取方法,并研制开发了相应的系统。实验结果表明,该系统能够在普通计算机上支持千万词级规模的大型语料库运算,并能显著提高短语序列的提取质量。在此基础上,我们提取了大量的n元序、短语单位、常用型式,形成了丰富的学术英语数据资源。对学术英语研究、学术话语分析的方法论建设做了有益的建设性工作。

4.尝试开发了适用于学术英语研究的“局部语法”(local grammar)、语义序列(semantic sequence)等分析技术

形成了分析学术文本意义方式、话语策略、态度意义的新的分析框架和视角。对开辟新的研究方向具有一定的引领作用。

(二)重要观点

基于Beijing CARE语料库,我们对中西学者论文的高频短语序列、共选形式、局部功能和局部语法特征进行了系统的跨文化群体、跨学科对比分析,主要发现包括以下三个方面。

1.局部功能

不同于传统研究所述语言系统层级上的抽象/泛化功能,局部功能是有限类别文本或局部语境下的具体话语行为。局部功能不直接相关于语言系统,而与局部文本环境下的语言共选形式紧密相连。局部功能探索是将功能研究引向深入,增强了描述详尽性和解释详尽性。我们通过缜密检查高频词语共选形式,发现了中国学者论文的一系列局部功能,如概指名词(general nouns)形式的局部功能有“呈现当前研究”、“报道结果/发现”、“提出方法”、“评价方法”、“表述效应”、“时间/条件定位”等;动词模糊语序列的局部功能有“解释数据”、“表述声言”、“验证模型/理论”、“推理”、“转述”等。

2.局部语法

不同于传统语言学描述的通用语法,局部语法是关于有限类别文本或受限意义下语言使用规律描写的一条新路径;局部语法不直接相关于语言系统,而是对具体语境下意义/功能实现方式的结构化。我们建构了适用于学术话语研究的局部语法分析框架。如“评价局部语法”的构架包括:(1)评价形式(evaluative pattern);(2)功能范畴(functional category);(3)语义参量(semantic parameter);(4)局部语法形式(local grammar pattern);(5)特征性局部语法形式(characteristic local grammar pattern)。以此对比分析了中西法律学者的评价局部语法异同,发现中国学者的局部语法形式频数显著低于西方学者,且多联结于最高频的n v-link ADJ to-inf.形式,揭示其评价意义表达方式十分局限。两组学者局部语法形式中的语义参量有着明显差异:西方学者趋于评价与外部物质世界相关的命题与对象;中国学者更关注与自身经验密切相关的事物以及语内对象(discourse-internal object);等等。母语文化的认识论、传统修辞习惯影响、有限的二语英语水平制约是位于深层的制约因素。

3.话语策略

话语策略是成熟社团成员在论文中使用的有效构建知识、传播信息的方法和手段。我们基于动词模糊语序列的研究发现,中国学者常用四种学术话语策略:准确表述策略(accurate presentation strategy)、共识策略(consensus-seeking strategy)、声言责任策略(claim commitment strategy)和介入策略(engagement strategy)。准确表述策略与论文的客观性知识紧密联系,用于方法描述、数据呈述、结果报道;声言责任策略紧密联系于数据解释和观点表述;共识策略和介入策略面向读者和话语社团,旨在与同行沟通,引导读者解读数据。四种策略交替使用、相辅相成,旨在构建合格专业知识、明确个人贡献且降低责任风险,以及赢得社团成员认可。

4.意义方式

对中西学者学术论文中高频it评价形式的对比研究表明,两组学者共享4个特征性it形式。但是,除it v-link ADJ fornto形式外,中国学者的其他形式频数均显著低于西方学者,表明他们表达主观态度意义的能力较弱。两个群体所用it形式的语义分布差异显著。中国学者尤其不善于评价事件或命题的重要性和似然性。中国学者趋于使用形式表达命题或事件的难易度和确定性意义,而西方学者趋于表达重要性和似然性意义。对N that-cl形式的对比研究表明,西方学者重视研究过程,包括观点分析及逻辑推理,而中国学者更重视研究结果。这些区别反映了两组学者“经常述说之事”不同、站位与价值观不同,亦即意义方式不同。

5.认识论与文化制约

认识论、母语文化、学科文化是学术语言使用的重要制约因素。中国学者的独特用法形式可追溯至母语文化认识论、传统修辞习惯、二语英语水平制约。跨学科对比分析则表明,学科认识论与学科文化是学术话语特征的底层制约。纯理型硬学科、应用型硬学科、纯理型软学科及应用型软学科论文中的分布数据和意义表达折射出各自典型的知识结构、知识发展与构建方式、研究客体的不同特征,等等。具体而言,软硬学科的对比:知识的结构特征(原子型vs整体型)、知识发展方式(累积型vs迭代型)、知识构建方式(实验vs论述)、研究客体(自然物体/规律vs社会现象/概念)等制约了作者的形式选择。如硬学科通过科学观察与实验构建知识,因而趋于使用it v-link ADJ to,以对特定的研究活动或方法做出评判;软学科主要依靠阐释与论述构建知识,故更倾向于使用it v-link ADJ that,从而易于评价命题信息。纯理学科侧重逻辑论证与理论分析,同样频繁使用it v-link ADJ that;应用学科强调对接现实需求,则更趋于使用itv-linkADJfornto。由此,认识论与学科文化制约着话语行为和意义方式,具有相同或相似认识论的学科往往具有相似的形式使用趋势。

三 成果的价值

该项目的研究成果具有较高的学术价值与应用价值。其学术和应用价值在于:(1)尝试性使用了“局部功能”和“局部语法”的概念和分析框架,从新的视角和层面探讨学术论文的意义方式、话语策略、话语行为及结构特征,发现了大量新的语言事实和语言形式。对以往的普通语法研究和一般功能研究形成互补。这应当是国内学界首个系统探索局部功能和局部语法的实证研究,有望引领、发展新的研究方向。(2)关于学术论文意义方式、话语策略、知识构建方式的探索都是本领域比较新颖的探索话题和分析角度,对(学术)话语分析下一步的发展走向具有启示和建设性作用。(3)该成果开发的学术英语短语序列计算与自动提取工具(New MI等)极大地提高了数据提取的准确率和召回率,对短语计算具有实用价值。(4)所进行的学术论文跨文化群体、跨学科对比研究及其数据发现对外语教学,尤其是学术英语写作教学提供有益反馈和参照,具有现实的指导意义。

(责编:王小林、黄瑾)