舊版網站入口

站內搜索

基於大型可比語料庫的中國學者(科學家)學術英語現狀研究

2022年04月24日08:52

北京航空航天大學衛乃興主持完成的國家社會科學基金項目《基於大型可比語料庫的中國學者(科學家)學術英語現狀研究》(項目批准號為:13BYY074),最終成果為同名專著。課題組成員有:高霞、何宇茵、張毓、楊越森、王冰昕、張磊、高歌、楊晨姣。

一 研究的目的和意義

(一)研究目的

(1)通過大型中西學者學術英語可比語料庫的建設和探索,從多視角定量、定性描述、探討中國學者學術英語的詞匯—語法特征、話語策略、話語行為與意義方式,凸顯其不同於西方學者文本的顯著性差異特征。(2)探索可比語料庫建設的技術方案優化與改進﹔嘗試開發新的短語單位自動認定技術和學術文本“局部語法”、“語義序列”研究分析技術,為研究意義單位提供堅實的技術與數據支撐。

(二)研究意義

該成果基於數據開展中國學者學術英語現狀研究,發現了不同於以往研究結論的重要內容及底層制約機制,豐富或重構ESP及相關領域的某些描述體系,完善有關理論表述。項目所開展的系列研究為重新審視和探討話語策略和話語行為提供了新的觀察視角和方法路徑。這對學術英語能力的多層面評估與衡量,對我國的英語教育、ESP教育決策可提供有價值的反饋和參照。

二 成果的主要內容和重要觀點或對策建議

(一)主要內容

1.建設了一個截至目前國內最大容量的中外學術英語可比語料庫Bei-jingCARE(Beijing Collection of Academic Research Essays)

該庫由“中國學者論文庫”和“西方學者論文庫”兩大子庫組成,涵蓋自然科學、工程學科、生命與醫學、人文與社會科學四大領域內共23個學科的學術論文。於2015年初步建成,並逐年持續更新至今。Beijing CARE語料庫所含文本均為2000∼2017年各學科影響因子較高的國際學術期刊所發表的西方國家學者和中國學者的論文,所選期刊總計150種。全庫共計收錄6155篇論文,總庫容為33415707形符、276129類符。其中,西方學者子庫包含3918個文本,總形符22671866詞次、類符171656詞,標准類符/形符比率為35.51%﹔各學科子庫庫容在975649形符到998532形符之間。中國學者論文庫共收錄2237個文本,包含10743841形符、104473類符,標准類符/形符比率為33.29%﹔各學科子庫庫容在459334形符到488420形符之間。中國學者論文的第一作者均來自中國大陸,西方學者論文庫第一作者來自英語內圈國家,包括英國、美國、加拿大、澳大利亞和新西蘭。

2.語料加工

對語料進行了適用於不同目的的多種加工與標注。對全部文本進行了元信息標注和詞類信息賦碼,獲得了POS(part of speech)tagged語料庫。並對部分語料進行句法分析和語篇特征標注。

3.短語序列計算工具開發與數據庫建設

開發了新一代的短語序列計算工具(New MI等),用於學術英語短語的自動識別、提取。我們綜合多種計算技術,包括頻數、內部聯結力(in-ternal association)、邊界熵(boundary entropy)等,突破了傳統互聯網信息隻能計算二元序列的限制,實現了基於多種統計手段的短語序列提取方法,並研制開發了相應的系統。實驗結果表明,該系統能夠在普通計算機上支持千萬詞級規模的大型語料庫運算,並能顯著提高短語序列的提取質量。在此基礎上,我們提取了大量的n元序、短語單位、常用型式,形成了豐富的學術英語數據資源。對學術英語研究、學術話語分析的方法論建設做了有益的建設性工作。

4.嘗試開發了適用於學術英語研究的“局部語法”(local grammar)、語義序列(semantic sequence)等分析技術

形成了分析學術文本意義方式、話語策略、態度意義的新的分析框架和視角。對開辟新的研究方向具有一定的引領作用。

(二)重要觀點

基於Beijing CARE語料庫,我們對中西學者論文的高頻短語序列、共選形式、局部功能和局部語法特征進行了系統的跨文化群體、跨學科對比分析,主要發現包括以下三個方面。

1.局部功能

不同於傳統研究所述語言系統層級上的抽象/泛化功能,局部功能是有限類別文本或局部語境下的具體話語行為。局部功能不直接相關於語言系統,而與局部文本環境下的語言共選形式緊密相連。局部功能探索是將功能研究引向深入,增強了描述詳盡性和解釋詳盡性。我們通過縝密檢查高頻詞語共選形式,發現了中國學者論文的一系列局部功能,如概指名詞(general nouns)形式的局部功能有“呈現當前研究”、“報道結果/發現”、“提出方法”、“評價方法”、“表述效應”、“時間/條件定位”等﹔動詞模糊語序列的局部功能有“解釋數據”、“表述聲言”、“驗証模型/理論”、“推理”、“轉述”等。

2.局部語法

不同於傳統語言學描述的通用語法,局部語法是關於有限類別文本或受限意義下語言使用規律描寫的一條新路徑﹔局部語法不直接相關於語言系統,而是對具體語境下意義/功能實現方式的結構化。我們建構了適用於學術話語研究的局部語法分析框架。如“評價局部語法”的構架包括:(1)評價形式(evaluative pattern)﹔(2)功能范疇(functional category)﹔(3)語義參量(semantic parameter)﹔(4)局部語法形式(local grammar pattern)﹔(5)特征性局部語法形式(characteristic local grammar pattern)。以此對比分析了中西法律學者的評價局部語法異同,發現中國學者的局部語法形式頻數顯著低於西方學者,且多聯結於最高頻的n v-link ADJ to-inf.形式,揭示其評價意義表達方式十分局限。兩組學者局部語法形式中的語義參量有著明顯差異:西方學者趨於評價與外部物質世界相關的命題與對象﹔中國學者更關注與自身經驗密切相關的事物以及語內對象(discourse-internal object)﹔等等。母語文化的認識論、傳統修辭習慣影響、有限的二語英語水平制約是位於深層的制約因素。

3.話語策略

話語策略是成熟社團成員在論文中使用的有效構建知識、傳播信息的方法和手段。我們基於動詞模糊語序列的研究發現,中國學者常用四種學術話語策略:准確表述策略(accurate presentation strategy)、共識策略(consensus-seeking strategy)、聲言責任策略(claim commitment strategy)和介入策略(engagement strategy)。准確表述策略與論文的客觀性知識緊密聯系,用於方法描述、數據呈述、結果報道﹔聲言責任策略緊密聯系於數據解釋和觀點表述﹔共識策略和介入策略面向讀者和話語社團,旨在與同行溝通,引導讀者解讀數據。四種策略交替使用、相輔相成,旨在構建合格專業知識、明確個人貢獻且降低責任風險,以及贏得社團成員認可。

4.意義方式

對中西學者學術論文中高頻it評價形式的對比研究表明,兩組學者共享4個特征性it形式。但是,除it v-link ADJ fornto形式外,中國學者的其他形式頻數均顯著低於西方學者,表明他們表達主觀態度意義的能力較弱。兩個群體所用it形式的語義分布差異顯著。中國學者尤其不善於評價事件或命題的重要性和似然性。中國學者趨於使用形式表達命題或事件的難易度和確定性意義,而西方學者趨於表達重要性和似然性意義。對N that-cl形式的對比研究表明,西方學者重視研究過程,包括觀點分析及邏輯推理,而中國學者更重視研究結果。這些區別反映了兩組學者“經常述說之事”不同、站位與價值觀不同,亦即意義方式不同。

5.認識論與文化制約

認識論、母語文化、學科文化是學術語言使用的重要制約因素。中國學者的獨特用法形式可追溯至母語文化認識論、傳統修辭習慣、二語英語水平制約。跨學科對比分析則表明,學科認識論與學科文化是學術話語特征的底層制約。純理型硬學科、應用型硬學科、純理型軟學科及應用型軟學科論文中的分布數據和意義表達折射出各自典型的知識結構、知識發展與構建方式、研究客體的不同特征,等等。具體而言,軟硬學科的對比:知識的結構特征(原子型vs整體型)、知識發展方式(累積型vs迭代型)、知識構建方式(實驗vs論述)、研究客體(自然物體/規律vs社會現象/概念)等制約了作者的形式選擇。如硬學科通過科學觀察與實驗構建知識,因而趨於使用it v-link ADJ to,以對特定的研究活動或方法做出評判﹔軟學科主要依靠闡釋與論述構建知識,故更傾向於使用it v-link ADJ that,從而易於評價命題信息。純理學科側重邏輯論証與理論分析,同樣頻繁使用it v-link ADJ that﹔應用學科強調對接現實需求,則更趨於使用itv-linkADJfornto。由此,認識論與學科文化制約著話語行為和意義方式,具有相同或相似認識論的學科往往具有相似的形式使用趨勢。

三 成果的價值

該項目的研究成果具有較高的學術價值與應用價值。其學術和應用價值在於:(1)嘗試性使用了“局部功能”和“局部語法”的概念和分析框架,從新的視角和層面探討學術論文的意義方式、話語策略、話語行為及結構特征,發現了大量新的語言事實和語言形式。對以往的普通語法研究和一般功能研究形成互補。這應當是國內學界首個系統探索局部功能和局部語法的實証研究,有望引領、發展新的研究方向。(2)關於學術論文意義方式、話語策略、知識構建方式的探索都是本領域比較新穎的探索話題和分析角度,對(學術)話語分析下一步的發展走向具有啟示和建設性作用。(3)該成果開發的學術英語短語序列計算與自動提取工具(New MI等)極大地提高了數據提取的准確率和召回率,對短語計算具有實用價值。(4)所進行的學術論文跨文化群體、跨學科對比研究及其數據發現對外語教學,尤其是學術英語寫作教學提供有益反饋和參照,具有現實的指導意義。

(責編:王小林、黃瑾)