近十年來口譯語料庫研究現狀及發展趨勢

張威2013年04月23日08:37

（北京語言大學外國語學院，北京 100083）

[摘要] 口譯語料庫建設與研究迄今僅有十余年歷史。目前，已建與在建的口譯語料庫尚不到10個，最大的也不過100萬字，而且種類單一（會議口譯）、標注簡單。相應的研究數量較少，集中在口譯文本語言特征與口譯操作過程兩方面。因此，未來口譯語料庫建設應注重以下問題：多類型、不同性質語料庫的建設與完善、語料庫規模的擴大、停頓、填充語、省略等副語言信息的精確標注與轉寫、口譯語料庫的“信息對應”、適合口譯語料的檢索工具的研發。同時，基於口譯語料庫的研究應該考慮多種研究方法綜合利用，集中討論口譯文本的語篇特征、口譯實踐策略、口譯相關理論與概念的驗証與發展等關鍵問題，促進口譯研究與教學的協調發展。

[關鍵詞] 口譯語料庫﹔類型﹔規模﹔標注﹔“信息對應”﹔口譯語料庫研究

Interpreting Corpus and Corpus-based Interpreting Studies: Reviews and Prospects

Zhang Wei

(School of Foreign Languages, Beijing Language and Culture University, Beijing 100083, China)

Abstract: It’s merely a decade since interpreting corpus and relevant researches made their debut. At present, the number of interpreting corpus (both finished and unfinished) is less than 10, the largest being no more than 1 million words, and characterized by one single category (conference interpreting) and simple tagging. The corpus-based interpreting studies, consequently, focus on either the linguistic features of interpreting texts or interpreting processing. The future of interpreting corpus, therefore, should highlight the following issues: the more diverse corpus of different nature, the larger size in corpus, the more exact tagging and transcription of paralinguistic expressions (pause, fillers, ellipsis, etc.), the “information equivalence” in interpreting corpus, and R & D of searching tools for interpering corpus. Meanwhile, the corpus-based interpreting studies should adopt multiple approaches to explore textualities of interpreting texts, interpreting strategies, and relevant interpreting theories and terms (their confirmation and development) so as to promote the coordinated development of interpreting studies and teaching.

Key words: interpreting corpus; category; size; tagging; “information equivalence”; corpus-based interpreting studies

一、引言

談到現代科學技術對翻譯教學與研究的影響，王克非曾指出，“我們的口筆譯教學或培訓，將不可避免地要使用新的工具和技術，誰先邁出一步，誰就佔據前沿，誰就能夠獲得創新的資源。”[1]209因此，開發建設並積極應用以教學實踐及研究為目標的語料庫，已經成為翻譯教學與研究領域一個核心議題，相關研究成果日益豐富，對翻譯教學與實踐的積極作用也得到廣泛認可[2-3]。

相應地，作為一種特殊形式的翻譯，口譯也正在成為語料庫建設與研究關注的對象。當然，相比筆譯語料庫，口譯語料庫的建設與相關研究剛剛起步，表現出的缺陷更加突出[4-7]。因此，我們更需要就此做出全面而客觀的總結與梳理，既要歸納口譯語料庫建設與研究所取得的成果，也要明確存在的不足，更要通過分析其中的原因，對口譯語料庫研究的發展方向、研究重點、實施戰略等內容進行詳細論証，這樣才能進一步強化口譯語料庫對口譯研究的意義，明確口譯語料庫研究的方向與重點，提升研究質量，同時引發對口譯語料庫研究更多的關注，最終有利於提高口譯研究在翻譯研究中的地位與影響。

二、語料庫口譯研究綜述

從Shlesinger於1998首次提出開展基於語料庫的口譯研究[4]，到日本、意大利等國研究人員率先於2003-2005年期間先后建立了數個不同類型的口譯語料庫，再到基於語料庫的口譯研究陸續展開，迄今為時不過十余年。口譯語料庫的建設與相關研究一方面取得了階段性的研究成果，顯示了依托大型語料庫拓展口譯研究視野、深化口譯研究層次的效果，另一方面也凸顯出在語料收集、整理加工、研究范圍與質量等方面存在的缺憾。現分述如下。

2．1口譯語料庫的開發與建設

整體來看，國外關於口譯語料庫的討論與建設起步於20世紀末[4]，目前已有幾個較為成熟的語料庫[8]。首先，日本名古屋大學設計開發了涉及英日兩語的同傳語料庫（Simultaneous Interpretation Database of Nagoya University）。該語料庫採編口譯錄音材料總共182小時，轉寫材料共計約100萬字，是目前世界上規模最大的同聲傳譯語料庫。其次，意大利博洛尼亞大學研究人員開發了“歐洲議會口譯語料庫”（the European Parliament Interpreting Corpus，簡稱EPIC）[9]，是對歐洲議會同聲傳譯的材料匯集與轉寫，是一個包含英語、意大利語、西班牙語的多語平行語料庫（multilingual parallel corpus），目前庫容量約為18萬字。最后，國外其他在建的口譯語料庫還包括：DIRSI（“同聲傳譯方向性語料庫”），語料場景為國際健康會議，採編錄音約20小時，容量約為13萬字﹔“K2口譯語料庫”，涉及醫院情景下的口譯活動，容量為16萬字﹔“K6口譯語料庫”，涉及環境保護議題，容量為3萬5千字﹔FOOTIE（“2008歐洲足球冠軍杯新聞發布會口譯語料庫”），主要收集新聞發布會上的同傳語料。

國內而言，關於口譯語料庫建設與研究的相關文獻2007年以后才逐步出現[5-7，10-11]。目前已進入研究與應用階段的口譯語料庫是由上海交通大學研制開發的“漢英會議口譯語料庫”（CECIC），以國內外新聞發布會口譯活動為對象，設計為平行語料庫，包括漢英口譯語料庫、英語原語語料庫、漢語原語語料庫三個子庫，目前容量約為54萬字[5]。

值得注意是是，國內部分研究冠以“口譯語料庫”的名稱，但實際並未嚴格依照語料庫語言學通行的TEI或SGML模式[5，12-13]，對口譯中的原語與譯語文本進行轉寫、詞性附碼、標注等加工處理，而主要是對口譯練習材料（音頻或紙介）的收集與分類整理（部分也做了篇頭標注，如作者、標題、日期、材料來源、性質等），主要目的是為口譯教學與培訓提供多樣化的語言素材，同時完善口譯教學手段，改善口譯教學效果[14-16]。因此，這些口譯語料庫無法嚴格依據語料庫語言學的統計程序與方法，對口譯文本特征進行量化描述與分析，難以支撐嚴格意義上的語料庫研究與探索。此外，一些口譯語料庫雖然依據語料庫語言學標准對口譯語料進行了標注，但其口譯語料來源於學生英語專業八級口語測試，而非真實口譯情景或實際口譯學習環境[10]，數據性質以及基於該數據的研究結論是否能夠客觀反映口譯學習與實踐情景，尚待實証研究加以分析。

2．2基於語料庫的口譯研究成果分析

伴隨著口譯語料庫的討論與建設，相關研究也相繼展開，積累了部分實証數據，對口譯文本特征、口譯操作程序、口譯策略特征與效果等問題進行了初步量化描述與分析。現從研究主題、研究人員、研究策略、研究重點等方面歸納如下。

2．2．1研究主題

2．2．1．1口譯文本的語言特征

對翻譯文本語言特征的量化描述與分析，一直是語料庫翻譯研究最成熟的研究領域之一。相應地，目前對口譯文本語言特點的分析最為集中，許多工具和程序都從筆譯語料庫研究中直接借鑒而來[17-18]。

首先是通過對口譯轉寫文本的統計分析，對口譯的詞匯特征的進行了歸納與總結，主要包括：利用類符/形符比（type-token ratio）分析口譯文本的詞匯密度與變異（lexcial density and variety）、口譯高頻詞匯、詞語索引（concordances）、詞語搭配、詞匯相似性與陌生性（lexical similarity and dissimiliarity）（考察交傳情景下，原文本與口譯文本在詞匯相似性方面的差異）、前綴與后綴的應用、詞語同現（co-occurrences）[4，7，19-20]。

其次是基於上述口譯詞匯特征的描述，對口譯文本的語法結構以及口譯文本的普遍性進行了探索，主要包括：口譯文本中語態類型的應用、口譯文本的語篇模式、口譯文本表現出的“簡化性”普遍特征等[4，7，21-22] 。

2．2．1．2口譯操作過程的觀察與分析

通過對口譯文本的量化分析，口譯操作方式與處理策略成為研究關注的焦點，主要包括：

1）同傳的“間斷性”（disfluency），也就是同傳中的停頓。主要考察停頓的長度、停頓前后的語言特征、停頓對聽眾反應的影響等[22-24]。研究發現，就即席材料而言，同傳停頓越少，聽眾認為信息接受效果越好。就准備好的發言稿而言，停頓長度與聽眾評價沒有明確關系。此外，目標語的韻律與口譯員停頓的規律性對聽眾的影響比較明顯。

2）同傳中對原文隱喻的處理[25]。應用EPIC語料庫，考察比喻性表達在口譯中的處理方式與效果。結果發現，如果原文有大量比喻性表達，則口譯文本出現許多猶豫、錯誤開始或摸棱兩可的說法，說明比喻表達難以有效轉換。

3）口譯語速分析[26]。應用日本名古屋大學同傳語料庫，重點考察同傳譯員的語速問題。結果發現，口譯員語速與發言人語速並無顯著相關性。原語發言結尾時，語速較快，而在原語停頓期間，口譯員語速則較快。

4）口譯操作中自我修正（self correction）的機制與表現[27]。研究發現，在同傳中，語言方向、目標語類型以及語境因素對同傳自我修正有明顯影響。如，大多數自我修正（75%）發生在外語-母語同傳中，比母語-外語同傳的自我修正多三倍﹔引起自我修正的語言現象主要包括：反義詞、數字、專有名詞、地理和國家名稱、單復數轉換、隱喻表達等。

5）同傳中的延遲現象[28]。利用日本名古屋大學口譯語料庫，考察日語與英語同傳中的延遲現象（Ear Voice Span，EVS）。結果發現，日英同傳中的延遲要長於英日同傳。此外，日英同傳中，名詞翻譯的延遲要長於動詞翻譯的延遲，在英日同同傳中則正好相反。

2．2．2研究人員

目前，進行口譯語料庫建設與相關研究的人員均是一線口譯員，教學與研究經驗也比較豐富，是比較理想的“從業研究人員”（practisearcher）[29]，能夠一定程度上提高口譯研究的“生態合理性”（ecological validity）（即研究材料、研究場景、參與人員等因素與真實口譯實踐的特點基本一致）[30]71，較好地保証研究結論的代表性。這是不同與以往口譯研究的一個顯著特點。以往口譯研究人員多為教育或研究結構的教師或專業研究人員，雖然他們有較深厚的學科理論修養和系統的研究方法意識，其中也不乏口譯實踐與教學經驗豐富的人員，但整體上缺乏與職業口譯員的聯系與交流，也很少邀請職業譯員參與研究項目，因此他們的研究程序與結論（尤其是非真實口譯情景下的實驗性研究）往往受到職業譯員的質疑[29]。

2．2．3研究策略

就研究策略而言，目前基於語料庫的口譯研究主要表現出以下兩個特點：一是，絕大多數研究遵循“建設語料庫、研究語料庫”的原則，依托現有的口譯語料庫（如EPIC），充分利用大規模數據統計與分析，對具體問題進行量化描述。同時，部分研究開始嘗試建設小規模的口譯語料庫，並借此對研究主題進行描述與分析[22，27]。這些研究一方面具備個案研究精細分析的特點，另一方面也借鑒了語料規模化分析的優勢，研究程序嚴謹，研究結論有一定代表性﹔二是，能夠熟練地掌握語料庫語言學的分析原則與方法，量化統計與分析的程序與標准日趨成熟，對提高研究結論的代表性有明顯的促進作用。

2．2．4研究重點

一方面，根據語料庫語言學大規模量化描述與分析的特點與優勢，當前基於語料庫的口譯研究集中關注口譯文本的語言特征以及口譯操作特點，兼有“產品導向”（product-oriented）與“過程導向”（process-oriented）的特點[31]，既討論諸如口譯詞匯特點、口譯加工策略等微觀現象，也關注如口譯文本普遍特性等宏觀特征，對口譯文本及口譯加工過程進行了較為全面的探索與分析[32]。

另一方面，除個別研究嘗試分析交替傳譯的文本特征及翻譯策略外[19]，目前基於語料庫的口譯研究仍然以同聲傳譯為考察對象。此外，相關研究以會議口譯為主，很少關注“社區口譯”（community interpreting）等其他類型的口譯活動。

2．3當前口譯語料庫建設與研究的缺陷

2．3．1語料庫設計與建設的局限性

2．3．1．1語料庫規模

語料庫語言學的基本應用原則是，利用大規模的語料收集與分析，提高對語言認識的准確性與代表性[13]。因此，語料庫的規模就成為制約語料代表的一個關鍵因素，也是影響基於語料庫的相關研究科學性的一個重要條件。相對於當前筆譯語料庫上千萬詞規模的發展趨勢，現有口譯語料庫的規模顯然太小，相關統計數字的客觀性與普遍性難以充分保証，也難以有效支撐對口譯文本特征及口譯操作特點的研究結論。

2．3．1．2語料加工方法與層次

當前的口譯語料庫主要對語料進行詞性、句法等傳統意義的賦碼處理，沒有對口譯活動中停頓、支吾語、省略等“副語言”現象進行標注，這是當前口譯語料庫建設中的一個重大缺陷[4]。因為口譯操作中的韻律特征（prosodic features）是區分口譯與其他口語活動的關鍵標志[4，33]。此外，這些豐富的“副語言”形式往往蘊涵著豐富的含義，它們不僅僅是口頭語言表達的自然反映，也常常是具體口譯策略應用的直接表現。通過對這些“副語言”的深入考察與分析，非常有利於判定具體口譯策略的影響因素，以及這些策略的應用效果，對口譯教學與實踐有積極的借鑒意義。

2．3．1．3口譯語料庫檢索工具的開發

當前，各國口譯語料庫尚未開發針對口譯操作特征的語料檢索工具，只是簡單地借用筆譯語料庫現有的檢索工具（如WordSmith、TACT、ACAMRIT、VocabProfile、LEXA、MicroConcord、WORDCRUNCH、WINMAX等）[34]，隻能對口譯語料進行基本的關鍵詞、高頻詞、詞匯密度等項檢驗，依此而得出的關於口譯文本特征的描述與推論，其客觀性與代表性尚待充分驗証。

2．3．2研究規模較小，產生的數據基數非常有限，難以支撐相關結論的代表性。同時，針對同一口譯主題的研究數量更為有限，難以驗証研究程序的科學性以及研究結論的普遍性。

2．3．3研究范圍比較狹窄，過於關注口譯文本特征的分析，對口譯策略在口譯實踐中的應用情況及效果，沒有進行系統而客觀的描述。同時，也沒有充分考察口譯語料庫在口譯教學與培訓中的作用，研究的實際應用價值受到一定影響。

2．3．4研究手段單一，過於依賴甚至“迷信”語料庫的描述方法與統計程序，沒有嘗試結合訪談、調查、觀察、實驗等其他定量與定性研究手段，對具體研究結論進行“多維”驗証[6]。

2．3．5語料來源較為單一，多為會議口譯，或針對個別職業口譯員的個人表現，尚未建立較大規模的口譯學習者語料庫，難以客觀反映口譯學習過程的特征與變化情況，不利於口譯語料庫與口譯教學與培訓的結合。

2．3．6資源沒有充分共享。除EPIC等少數語料庫外，其他口譯語料庫僅為部分研究機構及研究人員所用，沒有對所有研究人員或其他公眾開放，也沒有形成商業化經營。不僅語料庫的影響力受到限制，其他人員也不能針對具體問題進行重復性研究或証實，不利於核實具體研究結論的普遍性與代表性。

三、語料庫口譯研究的發展趨勢

基於上述對口譯語料庫研究的總結，特別是考慮到目前存在的不足，我們認為，應該在語料庫建設、研究設計、研究領域等三個方面重點探索，以期獲得突破性進展，以完善口譯語料庫的建設，提高相關研究的質量。

3．1口譯語料庫的建設與完善

3．1．1多類型口譯語料庫的建設與完善

首先，應該實現口譯語料庫結構模式的多樣化，可以包括口譯平行語料庫（parallel interpreting corpus）、口譯比較語料庫（comparative interpreting corpus）、多模式翻譯語料庫（intermodal translation corpus）等[35]。

其次，可根據不同標准，分別建立不同性質的口譯語料庫，如：不同口譯方式的口譯語料庫（同傳語料庫、交傳語料庫）、不同口譯主題的口譯語料庫（政論、科技、經濟、教育等）﹔不同口譯場景的口譯語料庫（會議口譯語料庫、社區口譯語料庫）﹔不同口譯環境的口譯語料庫（模擬環境口譯語料庫、現場口譯語料庫）﹔不同口譯人員的口譯語料庫（口譯學習者語料庫、職業口譯員語料庫）等。

3．1．2加工層次與賦碼標准

首先，對副語言信息的賦碼應該是口譯語料庫建設與研究下一階段重點解決的問題。令人振奮的是，原語口語中副語言信息以及音段、超音段的研究與標注已經引起相關研究人員的重視，可以嘗試將其中的方法與工具用以分析口譯文本的副語言信息[7，36]，再根據口譯操作的特點，爭取開發出適於口譯特點的副語言標注工具與程序，從而深化並豐富口譯語料的加工層次與類型。

其次，整體上講，口譯語料庫更多地應該具有平行語料庫的特點，其重點考察對象之一是原語與譯語的語言組織特點及其相互關系，這也是分析口譯轉換策略及口譯深層認知機制的基礎（詳見3．3）。因此，口譯語料庫可參考如ENPC（The English-Norwegian Parallel Corpus，英語/挪威語平行語料庫）等較成熟的平行語料庫的標記方法與原則（包括對語言形式及語義內容的標記），以確保后期基於語料庫的研究的順利實施與研究質量。

最后，對齊層次與標准

口譯實踐的特點（特別是同傳）要求口譯員在短時間內完成原語核心信息的有效傳遞，促成交際雙方的交流與溝通。因此，“字字對譯”或“逐句對應”並非口譯實踐的常態，“信息對等”、“功能等效”才是評價口譯質量的首選因素[37]。因此，口譯語料庫不應進行“字對應”，要實現筆譯語料庫中的“句對應”也有相當難度[2，38] 。因此，可考慮借鑒語言學關於信息單位的界定與分析的相關結論，解決口譯信息單位的劃定標准、量化指標等關鍵問題，以實現口譯語料庫的“信息對應”。

具體來說，功能語言學認為，在具體語言交際場景下，交際活動產生的語言信息可以切分為有明顯語言標記的信息單位，即由舊信息和新信息組成[39]。舊信息指已知或可以預期的信息，而新信息指新出現的或無法預期的信息，而且一般情況下，舊信息在前，新信息在后，兩者相互銜接，彼此作用，產生了語言學意義上的信息[40]。同時，信息單位又區別於說明語法結構的小句系統（即主位系統）：信息單位可以與小句系統的語言結構一致，即可以小句為基礎分析話語的信息內容，但信息單位也可以突破句子范疇，以自然語調為劃分依據[41]。

因此，要實現口譯語料庫的“信息對應”，可以考慮以下幾個步驟：

1，對原語與譯語語料進行嚴格文字轉寫，作為后期信息對應的基礎﹔

2，在對原語與譯語語料進行基本語言標注（如詞質）的基礎上，根據信息的性質對新舊信息進行標注﹔

3，確定原語信息主題內容及分布狀況，確定若干明顯的意義段落，以備后期判斷譯語信息傳達的完整性﹔

4，根據原語信息單位的構成及信息內容，確定譯語中相應信息的保持情況。注意：這裡，在相應的時間范圍內（特別是同傳的即時性特點，要求譯語與原語基本保持時間上的同步），原語某一個信息單位及其內容可能在譯語中有缺失，但這並不意味著原語信息的損失，要在較大意義段落中，甚至在整個語篇中，去判斷所失信息的重要性，這樣才有可能對口譯質量有更客觀的分析與評價。

3．1．3檢索工具的研發

現有口譯語料庫的檢索工具主要還是應用其他語料庫的一般檢索工具，隻能進行KWIC索引、詞頻、搭配、類聯接等常規統計任務，還未能對“副語言”、時間分割等口譯活動特有信息進行有效處理。因此，考慮到口譯活動的特殊性，口譯語料庫檢索工具的研發應該是未來口譯語料庫建設中一項非常關鍵而艱巨的任務，其成功與否直接關系到口譯語料庫的實際效果以及相關研究的質量[7]。

3．2基於語料庫的口譯研究的思路與方法

3．2．1驗証性與探索性相結合的實施思路。

就其屬性與方法特征而言，語料庫語言學屬於描述語言學的范疇，而語言研究（包括語料庫語言學）的終極目標是為了解釋語言的生成過程與實際應用[42]。因此，以大規模實際口譯操作語料為基礎，口譯語料庫研究一方面應該對既有理論、概念、術語、實踐規范（口譯策略），包括口譯教學策略與方法，進行實証性分析，考察相關理論和概念在口譯實踐中的具體表現，檢驗其合理性以及在具體語言環境中的適用程度（詳見3．3．3）﹔另一方面，應該合理利用語料統計與概率分析，對口譯文本的特征、口譯操作機制、口譯轉換策略等問題，進行歸納與總結，探索相應的規律與特點（詳見3．3．1、3．3．2）。

3．2．2研究與教學相互促進的價值取向。

當前，語料庫語言學的一個重點發展方向是如何將大規模鮮活語言材料的細致分析應用到語言教學過程中，最終提高語言學習與應用的效果。因此，基於口譯語料庫的相關研究應該注重研究主題在口譯教學或口譯實踐中的應用價值，特別要強調對口譯學習者的參考意義，既要明確高質量口譯操作的基本要求與特征，也要分析口譯失誤的表現與原因，以期最終提高口譯實踐效果（詳見3．3．2）。

3．2．3多種研究方法綜合利用的設計方案。

鑒於口譯實踐操作的復雜性與多變性，語料庫的研究方法應該與訪談、調查、觀察、實驗等其他定量與定性研究工具有效結合，獲取多種類型的數據基礎，共同對口譯現象進行系統而全面的描述與分析[6]。

3．3基於口譯語料庫的研究應該重點突破的幾個領域

整體而言，語料庫語言學的研究目的與應用領域應該包括：對語言實際應用的細致而系統的描述與分析，特別是對語言基本特征（如文體特征、語篇組織特點等）的歸納與探索，對語言交際策略及其應用效果的全面總結與客觀解釋，對語言學理論（包括語言生成、語言應用以及語言教學）的驗証與反思等[43-46]。因此，基於口譯語料庫的口譯研究未來應該著重解決以下幾方面的議題。

3．3．1口譯文本的語篇特征分析

對文本的語言特征進行細致而系統的統計與分析，是語料庫技術設計與應用的長項，口譯語料庫研究無疑應該充分利用這一優勢，對口譯文本的語言特征進行更為細致的描述與系統分析，從而為客觀認識口譯活動的語言特質，特別是為准確判斷口譯實踐效果，最終為提高口譯教學與實踐質量，提供系統而全面的數據支持。為此，口譯文本的語篇特征分析可以主要包括如下內容：口譯文本的銜接形式與特點[4]、口譯文本的語義關鍵詞分析（參照原文關鍵詞做對比分析，對口譯質量評估有一定輔助意義）、口譯文本“普遍性”的重復驗証（如口譯文本的明晰化、簡潔化、規范化等特征）、口譯的文本類型特征與互文性特點[47-49]。

3．3．2口譯實踐策略分析

首先，利用口譯語料庫的文本對比分析方法，可以對諸如重組、預測、省略、增補、解釋、“填充”（fillers）等口譯策略在口譯實踐中的頻率、分布狀況，進行客觀描述，明確其具體使用效果，不僅對口譯教學與實踐有重要應用價值，也可用於分析口譯認知機制，如通過考察口譯省略現象分析認知記憶因素在口譯操作中的性質與作用[50-52]。

其次，翻譯單位一直是翻譯實踐教學與翻譯理論思考的一個焦點議題，目前依然沒有形成一致的意見[53-54]。鑒於口譯實踐在時間性、信息性等方面的特殊性質與要求，口譯轉換的單位必然不同於筆譯操作[55]。因此，借助於口譯學習及口譯實戰的真實語料，通過對比分析原文與譯文在信息與意義方面的對等層次與實際效果，將有利於分析並解釋口譯實踐操作中各種翻譯單位（如詞（組）、句子、語篇等）應用情況及具體效果，促進口譯教學的改革與口譯實踐水平的提高。

最后，口譯實踐與研究証實[4，56-57]，口譯學員的口譯學習過程與專業口譯員的口譯表現具有同樣的研究價值。而且，口譯學員人數較多，相對容易進行集中（或長期）觀察與分析，研究數據與結論能夠較為客觀地反映口譯學員群體的普遍特征。因此，建立口譯學習者語料庫（或包括職業口譯員在內的綜合語料庫），對比考察口譯學員與職業口譯員在口譯策略、口譯質量等方面的差異，能夠全面顯示口譯學習與實踐對口譯技能發展的影響，對口譯教學與培訓有明顯而實際的啟示意義和應用價值。

3．3．3口譯相關理論與術語的驗証與發展

許多學者認為[4，29，58]，應該充分利用實驗、觀察、語料庫等多種手段，獲取客觀實証數據，驗証既有口譯理論或術語，深化對口譯操作本質特征的認識。

因此，針對巴黎釋意派提出的“脫離原語語言外殼”（déverbalisation）的觀念，一方面，可以通過口譯語料庫中原文本與口譯文本的對比分析，包括省略、替代等各項策略的應用情況[59]，另一方面可考慮通過對口譯文本中核心短語的提取與統計分析，判斷口譯文本對原文本的偏離程度，以考察“脫離原語語言外殼”在口譯學習與實踐中的實際狀況。

此外，通過對原文本與口譯文本的差異性的大規模對比分析，特別是口譯信息錯譯、漏譯等現象，一方面可以判斷口譯策略應用及口譯質量，另一方面也可據此驗証Gile提出的口譯認知資源配置理論（Efforts Model）等[60] 。

四、結語

將語料庫語言學的理念與方法引入翻譯教學與研究領域，是翻譯學科發展的一個戰略方向與重點[2]。同樣，口譯語料庫的建設與相關研究，也必將是口譯教學與研究未來發展的一個核心。目前來看，口譯語料庫建設與相關研究的重點主要體現為：一方面，擴大語料庫規模、豐富語料類型、深化語料加工層次、提高語料加工精確度，從而完善口譯語料庫的建設，提高語料庫的代表性﹔另一方面，應該拓展研究視野、豐富研究主題，同時應用多種研究方法進行綜合考察與分析，加強跨學科合作與交流，從而提高基於語料庫的口譯研究的質量。這樣，作為口譯教學與研究的一個重要途徑與手段，口譯語料庫的建設才能更趨成熟，基於口譯語料庫的教學與研究質量才能不斷提高，口譯教學與研究的整體影響力才會進一步擴大。

參考文獻

[1] 王克非等：《雙語對應語料庫：研制與應用》，北京：外語教學與研究出版社，2004年。[Wang Kefei et al, Parallel Corpora: Design and Application, Beijing: Foreign Language Teaching and Research Press, 2004. ]

[2] 王克非：《雙語平行語料庫在翻譯教學上的用途》，《外語電化教學》2004年第6期，第27-32頁。[Wang Kefei, “The Use of Parallel Corpora in Translator Training,” Computer Assisted Foreign Language Education, No. 6(2004), pp.27-32.]

[3] 秦洪武、王克非：《對應語料庫在翻譯教學中的應用：理論依據和實施原則》，《中國翻譯》2007年第5期，第49-52頁。[Qin Hongwu & Wang Kefei, “Parallel Corpus in Translation Teaching: Theory and Application,” Chinese Translators Journal, No. 4(2006), pp.20-26.]

[4] M. Shlesinger, “Corpus-Based Interpreting Studies as an Offshoot of Corpus-Based Translation Studies,” Meta, Vol.4(1998), pp. 486-493.

[5] 胡開寶、吳勇、陶慶：《語料庫與譯學研究：趨勢與問題》，《外國語》2007年第5期，第64-69頁。[Hu Kaibao, Wu Yong, Tao Qing, “Trends and Problems in Corpus-based Translation Studies: A Review of 2007 International Conference and Workshop on Corpora and Translation Studies,” Journal of Foreign Languages, No. 5(2007), pp.64-69. ]

[6] 張威：《口譯語料庫的開發與建設：理論與實踐的若干問題》，《中國翻譯》2009年第3期，第54-59頁。[Zhang Wei, “Interpreting Corpus: Some Theoretical and Practical Issues,” Chinese Translators Journal, No. 3(2009), pp.54-59.]

[7] 胡開寶、陶慶：《漢英會議口譯語料庫的創建與應用研究》，《中國翻譯》2010年第5期，第49-56頁。[Hu Kaibao & Tao Qing, “The Compilation and Application of Chinese-English Conference Interpreting Corpus,” Chinese Translators Journal, No. 5(2010), pp.49-56. ]

[8] 李婧、李德超：《基於語料庫的口譯研究：回顧與展望》，《中國外語》2010年第5期，第100-105頁。[Li Jing & Li Dechao, “Corpus-based Interpreting Studies: The Start of the Art,” Foreign Languages in China, No. 5(2010), pp.100-105.]

[9] C. Monti, C. Bendazzoli, A. Sandrelli and M. Russo, “Studying Directionality in Simultaneous Interpreting through an Electronic Corpus: EPIC (European Parliament Interpreting Corpus),” Meta, Vol. 4(2005), pp. 114-129.

[10] 文秋芳、王金銓：《中國大學生英漢漢英口筆譯語料庫》，北京：外語教學與研究出版社，2008年。[Wen Qiufang & Wang Jinquan, Parallel Corpus of Chinese EFL learners, Beijing: Foreign Language Teaching and Research Press, 2008.]

[11] 胡開寶、陶慶：《漢英會議口譯中語篇意義顯化及其動因研究——一項基於平行語料庫的研究》，《解放軍外國語學院學報》2009年第4期，第67-73頁。[Hu Kaibao & Tao Qing, “Explicitation in the Chinese-English Conference Interpreting and Its Motivation- A Study based on Parallel Corpus,” Journal of PLA University of Foreign Languages, No. 4(2009), pp.67-73. ]

[12] T. McEnery & A. Wilson, Corpus Linguistics, Edinburgh University Press, 1996.

[13] E. Tognini Bonelli, Corpus Linguistics at Work, Amsterdam & Philadelphia: John Benjamins, 2001.

[14] 王斌華、葉亮：《面向教學的口譯語料庫建設：理論與實踐》，《外語界》2009年第2期，第23-32頁。[Wang Binhua & Ye Liang, “Constructing a corpus for interpreting teaching:Theory and Practice,” Foreign Language World, No. 2(2009), pp.23-32.]

[15] 陳振東、李瀾：《基於網絡和語料庫的口譯教學策略探索》，《外語電化教學》2009年第1期，第9-13頁。[Chen Zhendong & Li Lan, “On the Network and corpora-based Interpretation Teaching Strategy,” Computer Assisted Foreign Language Education, No. 1(2009), pp.9-13. ]

[16] 陶友蘭：《基於語料庫的翻譯專業口譯教材建設》，《外語界》2010年第4期，第2-8頁。[Tao Youlan, “On the making of corpus-based interpretation textbooks for translation majors,” Foreign Language World, No. 4(2010), pp.2-8.]

[17] L. Bowker, Computer-Aided Translation Technology: a Practical Introduction, Ottawa: University of Ottawa Press, 2002.

[18] S. Laviosa, Corpus-based Translation Studies: Theory, Findings, Applications, Amsterdam & New York: Rodopi, 2002.

[19] H.V. Dam, “Lexcial similiarity vs lexcial dissimiliarity in consecutive interpreting: A product-oriented study of form-based vs meaning-based interpreting,” in F. Pochhacker & M. Shlesinger (eds.), The Interptering Studies Reader, London and New York: Routledge, 2002, pp. 266-277.

[20] M. Russo, C. Bendazzoli and A. Sandrelli, “Looking for lexical patterns in a trilingual corpus of source and interpreted speeches: extended analysis of EPIC (European Parliament Interpreting Corpus),” FORUM, Vol.1(2006), pp. 221-254.

[21] C. Bendazzoli & A. Sandrelli, Annalisa, “An Approach to Corpus-Based Interpreting Studies: Developing EPIC (European Parliament Interpreting Corpus) 2005,” 2008-09-24, http://www.euroconferences.info, 2010-10-13.

[22] C. Bendazzoli & A. Sandrelli, “Corpus-based Interpreting Studies: Early Work and Future Prospect,” 2008-11-08, http://webs2002.uab.es/tradumatica/revista/num7/articles/08/08.pdf, 2010-10-08.

[23] Hitomi Toyama & Shigeki Matsubara, “The relationship between listener impressions and the length of pauses in simultaneous interpreting: an analysis of experimental data using the CIAIR simultaneous interpreting database,” Interpretation Studies, Vol.5(2005), pp. 137-155.

[24] 戴朝暉：《中國大學生漢英口譯非流利現象研究》，《上海翻譯》2011年第1期，第38-43頁。 [Dai Zhaohui, “A Study on Disfluency in Chinese to English Interpretations of Chinese EFL Learners,” Shanghai Journal of Translators, No. 1(2011): 38-43.]

[25] N. Spinollo & J.G. Christopher, “To Kill or Not to Kill: Metaphors in Simultaneous Interpreting,” FORUM, Vol.1(2010), pp. 181-211.

[26] Ryu Koichiro, Haibei Yu & Shigeri Matsubar, “Corpus-based Analyses of Simultaneous Interpreters’ Speech Rates,”. Interpreting and Translation Studies, Vol.9(2009), pp. 21-32.

[27] O. Fellus, Self-Corrections in Simultaneous Interpretation in the Language Pair Hebrew and English. MA thesis, Bar Ilan University, 2005. (see Bulletin N.38 June 2009)

[28] Takahiro Ono, Hitomi Tohyama and Shigeki Matsubara, “Construction and Analysis of word-level Time-aligned Simultaneous Interpretation Corpus,” 2008-11-12, http://www.lrec-conf.org/proceedings/lrec2008/, 2010-09-18.

[29] D. Gile, “Issues in interdisciplinary research into conference interpreting,”.in F. Dimitrova and S. Hylyenstam (eds.), Language Processing and Simultaneous Interpreting: Interdisciplinary Perspectives, Amsterdam and Philadelphia: John Benjamins Publishing Company, 2000, pp. 89-106.

[30] F. Pöchhacker, Introducing Interpreting Studies, London and New York: Routledge, 2004.

[31] J. Holmes, “The Name of Nature of Translation Studies,” in L. Venuti (ed.), The Translation Studies Reader, London and New York: Routledge, 2000, pp. 172-185.

[32] C. Bendazzoli, Corporae interpretazione simultanea, Bologna: Asterisco, 2010. (see Bulletin N.41 June 2010)

[33] S. Williams, “Observations on Anomalous Stress Interpreting,” The Translator, Vol.1(1995), pp. 47-64.

[34] 何安平：《語料庫語言學與英語教學》，北京：外語教學與研究出版社，2004年。 [He Anping, Corpus Linguistics and English Teaching, Beijing: Foreign Language Teaching and Research Press, 2004. ]

[35] M. Shlesinger, “Towards a Definition of Interpretese. An intermodal, corpus-based study,” in G. Hansen, A. Chesterman and H. Gerzymisch-Arbogast (eds.), Efforts and Models in Interpreting and Translation Research, Amsterdam and Philadelphia: John Benjamins, 2008, pp. 65-89.

[36] 許家金：《語料庫語言學的理論解析》，《外語教學》2003年第6期，第6-9頁。[Xu Jiajin, “Theoretical Considerations in Corpus Linguistics,” Foreign Language Education, No. 6(2003), pp.6-9.]

[37] 劉和平：《談口譯研究與專業口譯培訓》，《中國翻譯》2007年第1期，第54-56頁。[Liu Heping, “Interpreting Studies and Professional Interpreting Training,” Chinese Translators Journal, No. 1(2007), pp.54-56.]

[38] 蔡小紅：《論口譯質量評估的信息單位》，《外國語》2003年第5期，第75-80頁。[Cai Xiaohong, “On the Information Units of Interpretation Quality Evaluation,” Journal of Foreign Languages, No. 5(2003), pp.75-80. ]

[39] M.A.K. Halliday & C. Matthissen, An Introduction to Functional Grammar (3rd edition). London: Edward Arnold, 2004.

[40] 任紹曾：《信息單位與信息狀態—試析語言信息的二分說與三分說》，《外語教學與研究》2010年第3期，第190-197頁。[Ren Shaozeng, “Information unit and information state: A tentative inquiry into the binary division and three way breakdown of information,” Foreign Language Teaching and Research, No. 3(2010), pp.190-197.]

[41] M.A.K. Halliday & C. Matthissen, An Introduction to Functional Grammar (2nd edition), London: Edward Arnold, 1994.

[42] 衛乃興：《語料庫語言學的方法論及相關理念》，《外語研究》2009年第5期，第36-41頁。[Wei Naixing, “The Methodology and Related Notions of Corpus Linguistics,” Foreign Languages Research, No. 5(2007), pp.36-41.]

[43] D. Kenny, “Corpora in Translation Studies,” in M. Baker (ed.), Routledge Encyclopedia of Translation Studies, London and New York: Routledge, 1998, pp. 50-53.

[44] D. Biber, S. Conrad, and R. Reppen, Corpus Linguistics, Beijing: Foreign Language Teaching and Research Press, 2000.

[45] 廖七一：《語料庫與翻譯研究》，《外語教學與研究》2000年第5期，第380-384頁。[Liao Qiyi, “Corpus and Translation Studies,” Foreign Language Teaching and Research, No. 5(2000), pp.380-384.]

[46] 楊惠中：《語料庫語言學導論》，上海：上海外語教育出版社，2002年。[Yang Huizhong, An Introduction to Corpus Linguistics, Shanghai: Shanghai Foreign Language Education Publishing House, 2002.]

[47] B. Alexieva, “Types of texts and intertextuality in simultaneous interpreting,” in Snell-Hornby et al (eds.), Translation Studies: An Interdiscipline, Amsterdam and Philadelphia: John Benjamins, 1991, pp. 179-187.

[48] B. Hatim & I. Mason, “Interpreting: A text linguistic approach,” in F. Pöchhacker and M. Shlesinger (eds.), The Interpreting Studies Reader, London and New York: Routledge, 2002, pp. 254-265.

[49] A. Pym, Exploring Translation Theories, London and New York: Routledge, 2010.

[50] K. Kohn & S. Kalina, “The Strateic Dimension of Interpreting,” Meta, Vol.1(1996), pp. 118-138.

[51] S. Kalina, “Quality Assurance for Interpreting Processes,” Meta, Vol. 2(2005), pp. 768-784.

[52] A. Riccardi, “On the Evolution of Interpreting Strategies in Simultaneous Interpreting,” Meta, Vol.2(2005), pp. 753-767.

[53] 司顯柱：《對近二十年中國譯學界對翻譯單位命題研究的評述》，《外語學刊》2001年第1期，第96-101頁。[Si Xianzhu, “Review on Studies of UT in China over the Past Decades,” Foreign Language Research, No. 1(2001), pp. 96-101.]

[54] 曾利沙：《論“翻譯單位”研究的動態觀》，《外語教學》2003年第1期，第47-51頁。[Zeng Lisha, “On Dynamic Studies of Translation/Translating Units---Thoughts on Inheritance and Development of Theories of Translatology,” Foreign Language Education, No. 1(2003), pp.47-51.]

[55] 趙軍峰：《論口譯的翻譯單位》，《中國科技翻譯》2005年第2期，第25-27頁。[Zhao Junfeng, “Translation Units in Interpreting,” Chinese Science & Technology Translators Journal, No. 2(2005), pp.25-27.]

[56] B. Moser-Mercer, S. Lambert, V. Darò and S. Williams, “Skill components in simultaneous interpreting,” in S. Gambier et al. (eds.), Conference Interpreting: Current Trends in Research, Amsterdam and Philadelphia: John Benjamins Publishing Company, 1997, pp. 133-148.

[57] Liu Minhua, S. Diane, and J.C. Patrick, “Working memory and expertise in simultaneous interpreting,”. Interpreting, Vol.1(2004), pp. 19-42.

[58] 劉和平：《法國釋意理論：質疑與探討》，《中國翻譯》2006年第4期，第20-26頁。[Liu Heping, “The Interpretive Theory of Translation: Questions and Analyses,” Chinese Translators Journal, No. 4(2006), pp.20-26.]

[59] 張威：《認知記憶在同聲傳譯實踐中的作用》，《北京第二外國語學院學報》2009年第2期，第53-60頁。[Zhang Wei, “Cognitive Memory s role in Simultaneous Interpreting Practice: A Survey on Omissions in Interpreting,” Journal of Beijing International Studies University, No. 3(2009), pp.54-59.]

[60] D. Gile, Daniel, Basic Concepts and Models for Interpreter and Translator Training, Amserdam and Philadelphia: John Benjamins Publishing Company, 1995.

(責編：秦華)

近十年來口譯語料庫研究現狀及發展趨勢

主管主辦：全國哲學社會科學工作辦公室承辦：人民網

©1999-2019 全國哲學社會科學工作辦公室版權所有京ICP備12051030號

近十年來口譯語料庫研究現狀及發展趨勢

主管主辦：全國哲學社會科學工作辦公室 承辦：人民網

©1999-2019 全國哲學社會科學工作辦公室 版權所有 京ICP備12051030號

主管主辦：全國哲學社會科學工作辦公室承辦：人民網

©1999-2019 全國哲學社會科學工作辦公室版權所有京ICP備12051030號