站內搜索        項目查詢   專家查詢   網站地圖   重大項目要覽   管理規章   
加入收藏 加入收藏     設為首頁 設為首頁   

光明日報國家社科基金專刊>>重點文章推薦

跨學科研究

計量語言學:語言研究的科學化途徑

劉海濤  2012年02月15日08:37  來源:光明日報

計量語言學:語言研究的科學化途徑


  漢語句法關系網絡圖。通過研究此種網絡的結構,不僅可以發現語言網絡與其他網絡的共性,也可加深對人類語言結構及其復雜性的了解。
  編者按
  為貫徹落實中央有關精神,適應當代學術發展潮流,去年以來,國家社科基金設立一批重大招標項目,對跨學科研究進行專項資助。為進一步推介學界跨學科研究成果,本專刊自即日起開辟“跨學科研究”專欄,以饗讀者。
  長久以來,語言研究的科學化一直是現代語言學家的一個主要努力方向與重要目標。
  現代自然科學成功的原因主要是:可驗証的結論、精准的預測能力以及豐富的實際應用。而這一切都需要通過各種實驗方法與恰當的模型來獲得。因此,測量方法與實驗手段的改進是自然科學理論發展的基本保証,其中計量與測量又是其基本操作。然而,在人文社科領域,除心理學、經濟學、社會學等學科外,計量手段卻用得很少。如果計量手段是一門學科科學化的有效方法,那麼,在語言學中引入計量方法可能是語言學科學化的必要途徑。
  1935年,美國語言學家齊普夫有關語言統計的著作出版。這標志著一個新的語言學分支學科和一種新的語言研究方法的誕生。齊普夫認為利用統計方法可以定量研究語言中的各種現象,這樣語言學便可成為一門精確的科學。齊普夫這本書的標題“語言的心理生物學”表達了結合人類的經驗與功能來研究語言的願望,書的副標題“動態語文學”則強調了這種方法與其他方法的主要區別在於研究採用的是真實的語言樣本。齊普夫所倡導的這種用精確的方法來研究語言結構與發展規律的學科,今天稱之為“計量語言學”。大量真實的語言行為數據可以反映語言結構及其相互關系遵循著某些普遍的規律,這些規律正如那些眾所周知的自然科學規律一樣,可以用嚴格的數學形式來表達。計量語言學的目的就是揭示這些語言現象之間的關系,系統地描述並用公式化的定律來解釋這些現象。
  20世紀70年代之后,有不少語言學家開始使用數學方法來進行語言規律的探索,計量語言學在德國和東歐得到了快速的發展。目前這一領域的主要代表人物大多來自德國、奧地利及東歐國家,其中最著名的是德國波鴻大學的阿爾特曼教授。他在計量語言學的諸多領域均有重要貢獻,是齊普夫之后最重要的計量語言學家,被譽為現代計量語言學的奠基人之一。另外一位重量級人物是特裡爾大學的科勒教授,現任國際計量語言學學會會長與會刊《計量語言學學刊》主編。
  然而,計量語言學研究不只是以上國家和地區的一個局部現象,其研究方法正被許多國家的學者用來精確地探求人類語言的普遍規律。國外語言學家已對多種語言進行了多層次、全方位的計量研究,發現了許多語言系統的結構與演化規律。這些研究不僅有助於人類對語言系統的精確認識,加深了對人的認知機理的理解,也極大地提升了語言學研究的科學價值。
  從學科的特點和地位來看,計量語言學不同於一般的採用代數、集合、邏輯等方法對語言的結構特征進行(靜態)定性描述的形式語言學,也不同於通過語料庫來研究語言結構與使用的語料庫語言學。計量語言學關注的是語言的定量特征以及這些特征之間的協同關系。因此,計量語言學與其他語言學分支的差別主要是方法上的差別。採用從真實文本中抽象出的數量關系,描述與理解語言系統及其組成成分的發展與運作規律是計量語言學的根本任務。“精確、真實、動態”是計量語言學研究的三大特點。計量語言學認為,語言是一種生物—認知現象,也是一種心理—社會現象。語言系統是一個自組織、自適應的動態系統,是一個復雜系統。計量語言學研究涉及語言學、數學、統計學、社會學、心理學、物理學、系統科學和計算機科學等多個學科領域,是一個典型的文理交叉學科,具有鮮明的跨學科研究特質。這些特點使計量語言學成為語言學諸多分支中最具現代科學特點的一個研究領域,而它所發現的語言規律也有助於更精確地描寫與解釋相應的語言現象。
  經過幾十年的努力,各國計量語言學學者已經發現了不少具有普適性的計量語言學定律。這些定律可以分為三類:分布定律、函數定律、演化定律。齊普夫定律、門策拉—阿爾特曼定律、皮奧特洛夫斯基—阿爾特曼定律分別是這三類定律的代表。
  (1)齊普夫定律:20世紀20年代,哈佛大學的語言學家齊普夫在研究人類語言的真實文本時,發現詞出現的頻數與其頻數序之間存在反比例關系,這一關系后來被稱為齊普夫定律。齊普夫定律是計量語言學最早提出的統計規律之一,也是一個在計量語言學中具有核心地位、與諸多語言性質和語言過程密切相關的語言規律。
  (2)門策拉—阿爾特曼定律:1928年,德國心理學家、語音學家門策拉在研究詞和音節的長度關系時發現,隨著一個詞所含音節數的增加,這些音節的平均長度會減小。他把此種現象概括為“整體越大,其組成部分就越小”。為了用數學公式建立語言學單位間的這種部分與整體的關系,阿爾特曼於1980年對其進行了數學描述,將其精確為“一種語言結構越長,則構成它的成分越短”,即:部件長度是結構長度的函數。
  (3)皮奧特洛夫斯基—阿爾特曼定律:如何用數學手段來描述語言中的變化是計量語言學家所關心的問題之一。1974年,蘇聯語言學家皮奧特洛夫斯基等人提出用反正切函數來描述語言的演化規律。1983年,阿爾特曼等人在皮奧特洛夫斯基發現的基礎上,結合拉波夫等人的研究成果,提出了語言演化規律的三種變體。這一定律認為“所有語言變化都是新老形式交互作用的結果”。
  觀察現有計量語言學研究成果,不難發現,目前計量語言學研究採用的語料大多來自歐洲語言。這種過於注重歐洲語言的現狀,對計量語言學的進一步發展是不利的。我們需要用更多類型的語言來驗証語言定律的普適性,否則很難把某個定律視為人類語言的普遍規律。擴大計量語言學所研究語種的數量與類型不僅有益於發現普適性的定律,也有助於發現每種語言的特殊性。在中國開展計量語言學研究,不但可以更精確地了解漢語的結構特征,而且也可以通過與其他語言的比較,更深入地理解漢語所具有的特殊性與普遍性。更為重要的是,此類研究是真正從系統科學的角度來全面理解漢語系統的基礎,對於建立科學哲學基礎之上的漢語語言學理論具有極大的意義。
  總的說來,開展多層次的漢語計量語言學研究不僅是對國際計量語言學的補充與發展,也有助於提高中國語言學的國際化與語言學的科學化,是一個值得更多語言學家參與的領域。
  (作者為國家社科基金重大項目“現代漢語計量語言學研究”首席專家、浙江大學教授)

(責編:秦華、高巍)


點擊返回首頁

點擊返回頂部