舊版網站入口

站內搜索

《社會博弈的邏輯與計算模擬研究》中期檢查報告

2016年03月10日13:44

一、 研究進展情況

①研究計劃總體執行情況及各子課題進展情況

本項目自開題以來,課題組在社會博弈的理論基礎、數理模型、計算復雜性和計算機模擬四個子課題上開展分工協作,研究工作按計劃有序進行。在國際權威期刊和國際會議發表論文9篇,主編論文集1部(world scientific出版),完成書稿1部。舉辦課題組成員集中討論1次。參加國際學術會議和國際合作15人次。

一、社會博弈的理論基礎方向:課題組研究人員開展了扎實的調研和研究工作,為整個項目后續的數理模型與計算機模擬研究提供了經驗數據基礎和實証研究。目前已經取得了很好的研究成果。

1. 首先,在經驗研究上,我們開展了以西藏藏族地區為中心的人類學調研。基於扎實的田野考察和全面的數據分析整理,我們對藏族群體(宗教)交流互動的語言模式、語用規則和基本模型進行了恰當的分析與提煉。

2. 在理論研究上,我們進一步提出和發展了著重社會文化因素分析的廣義論証理論。基於已有的人類學、社會學實証結果,我們拓展了當代論証研究的社會文化維度,並分析了不同文化中的說理活動是否在論証類型或模式上的存在差別,並特別探討了中西文化群體論証性交際的社會文化差異。

3. 在應用研究上,我們著重發展了一種社會選擇理論和判斷聚合理論。通過對個人意見匯聚機制的理論研究,我們探討了文化群體的社會理性和集體可接受性問題,提出了一種關於社會理性新的觀點,並証明了這種觀點可以解決經典的集體選擇困境。以之為基礎,我們解決了一些與利益最大化、一致性和公平正義問題相關的理論問題。

二、社會博弈的數理模型方向:子課題成員在博弈論和智能體信念模型方面取得了以下的進展:

1.在博弈論方面,我們初步建立了幾個在不完全信息下的博弈模型。主要分為兩個方面。一個是不完全信息下博弈者對其他博弈者類型缺乏認識的問題﹔另一個是不完全信息下博弈者對博弈策略本身缺乏完全認識的問題。在這兩個方面,我們都建立了相應的博弈模型,並進一步討論了這些博弈模型的各種重要性質。已有相關論文發表於國際權威雜志上。基於上述模型,我們還討論了其決策方法問題。我們使用了公理化方法探討了Yager決策理論中,在不確定條件下的決策模型。相關論文也已發表於國際權威雜志。

2.在智能體理論方面,我們主要討論了智能體的信念模型和信念修正問題。基於標准的信念修正理論,即AGM理論,我們給出了一種新的,具有一般性的信念修正函數。這種信念函數適用於智能體信念系統中有一部分核心信念的情況。在這種情況下,智能體的信念根據核心信念可按其可接受程度分級。信念修正的過程依賴於這種分級系統。我們已有相關論文發表於國際權威雜志。

3.提出了含混偏好下的博弈模型,考察社會個體在含混厭惡和極小化極大反悔條件下的博弈過程﹔為了推廣經典期望效用理論,文獻提出了很多不確定性條件下的決策模型,基於聚類算子的決策模型為其中的一種重要模型。然而,這個理論缺乏公理化的基礎。對於一個形式的理論來說,公理化辯護是必要的,因為這樣的辯護不但可以揭示理論的預設,也可以為其基本概念提供語義解釋。 課題組為基於聚類算子的決策模型建立了公理化基礎。在這一研究中,我們確定了基於聚類算子決策模型的公理,証明了該理論的表征定理和相關的性質,並為該理論的基本概念做出了合理的解釋。

三、博弈模型的計算復雜性方向:劉虎教授研究一種無界合作博弈(GUCG博弈),這種博弈中,每個玩家賦予一個經典命題公式作為目標。劉虎研究了各種均衡的計算復雜性。由於命題邏輯在博弈論中的作用,趙希順、沈榆平研究了作為經典計算模型的命題邏輯與非單調邏輯程序之間的簡潔性問題,並証明了它們之間的不可比較性。這個結果意味著如果我們用命題邏輯去刻畫一些博弈問題,在某些實例下它與邏輯程序刻畫相比將節省指數多的公式﹔反之,使用邏輯程序去刻畫一些博弈問題,在某些實例下將比命題邏輯節省指數多的公式。課題組成員還研究了博弈論中常涉及到的組合原理的証明強度及組合命題強度的新定義,並得到一系列反直觀的結果,如多數組合原理本質上是相當弱的。

四、社會博弈的計算機模擬方向:課題組採用基於agent的計算建模方法,構造人工社會模型對主要的社會博弈問題進行了研究。我們針對網絡結構的社會博弈,對平等規范的涌現以及公平合作行為的涌現進行了分析。規范的涌現與演化是社會現象的重要特點。從復雜性和計算建模的角度對其進行研究已經成為社會科學的重要研究方向。我們重點考慮社會博弈行為者的特點,尤其是agent社會性行為特征。在社會博弈中,agent之間的博弈涉及到大量個體之間的互動,這個互動博弈的個體之間往往具有比較復雜的網絡結構,而這種互動結構對社會博弈有重要的影響。我們通過計算模擬,分析了社會博弈中agent互動網絡結構和平等規范涌現的關系,並考慮了在社會博弈中,平等規范如何能夠從社會網絡中agent的分布式互動中產生出來,以及不同的社會網絡結構對平等規范的涌現具有何種不同的影響等問題。我們的貢獻是對不同網絡結構如規則網格、小世界網絡以及BA無標度等幾種重要的網絡結構類型對平等規范產生的影響進行了深入的分析。結果表明平等的規范確實可以從大量agent的互動中涌現出來,但是不同的社會結構有不同的影響,更趨於平等網絡節點度數分布的網絡結構如WS小世界網絡更加有利於平等規范的涌現。此外,我們還分析了網絡結構中的其他因素如鄰域的大小,agent社會學習對結果的影響。我們的另外一個貢獻是修改了agent初始策略分布。在現有的研究中,agent策略的初始分布式離散的,取有限的幾種離散值進行討價還價策略,我們在研究中將agent策略擴展為分布在[0,1]區間的連續值。顯然這種設置更加符合現實的情況,而且在這種情況下,我們通過計算模擬還是可以發現平等規范從agent的博弈中產生。這方面研究對於深入理解社會博弈的特點,社會規范的產生與演化是很有意義的工作。

②調查研究及學術交流情況

為開展社會博弈的理論基礎研究,課題組員在西藏藏族地區開展了為期近半年的人類學實証研究,收集了大量的經驗數據,並完成了相關的數據整理和分析工作。在基於扎實的田野考察和全面的數據分析整理,我們對藏族群體(宗教)交流互動的語言模式、語用規則和基本模型進行了恰當的分析與提煉,進一步提出和發展了著重社會文化因素分析的廣義論証理論。立項以來課題組先后10余人次參加國際學術會議。鞠實兒、謝耘還先后赴埃及、葡萄牙進行學術交流活動,發表了相關的研究成果,並拓展了與國外學者和機構的合作研究。其中,在葡萄牙舉辦的“首屆歐洲論証研究國際學術會議”(2015年6月9日-12日),鞠實兒教授和謝耘副教授的報告引起了眾多國際學者的關注。 在社會博弈的計算復雜性和數理基礎方向,課題組成員積極進行學術交流及舉辦有重要影響的國際學術會議。劉虎應邀在第13屆亞洲邏輯會議上作特邀報告。在2014年7月,趙希順、沈榆平等赴奧地利維也納參加維也納邏輯之夏系列學術會議,特別地,在知識表示與推理國際會議上報告了課題組的研究成果﹔2014年5月,課題組成員在希臘召開的SETN人工智能會議上報告了信息不完全條件下進行規劃的邏輯系統研究成果。此外,課題組王瑋副教授、尹一木副教授分別赴新加坡、法國等地學術機構進行學術訪問與交流。鮮於波參加國際會議 International Conference on Management Science and Industrial Engineering(ICMSIE2014) 和International Conference on Economics and Management Engineering (ICEME 2014)。2014年7月趙希順應邀訪問德國帕德博恩大學計算機系交流研究成果。在2014、2015年上半年,德國Paderborn大學Hans Klein Buening教授和英國Swansea大學Oliver Kullmann博士來訪中山大學,就基於命題邏輯的計算模型相關復雜性問題進行了深入的合作。

二、 研究成果情況

①代表性成果簡介

1. 社會選擇的可接受性問題研究

本研究內容主要圍繞兩個核心論點展開,一是社會理性與集體可接受性是等價的,社會理性的目的是實現集體可接受﹔二是對集體選擇結果可接受的理性要求下,能夠得到合理的判斷聚合規則,即克服判斷聚合的不可能性定理。我們首先對社會理性展開分析,指出如果將社會理性看做一種方法,它是一個具有個體主體性、目的性,以及強調個體的審思和人際間比較的方法。在可接受性方面,我們系統的研究了可接受性理論發展的歷史和現狀,在對概然主義和似真主義兩大實現可接受性的主要路徑批判的基礎上,我們在“可行能力”理論基礎上,提出了一種“可行的可接受性”實現方法。在此基礎上對社會理性和集體可接受性進行了深入的分析,並建立了兩者之間的關系,發現揭開最大化、一致性和公平正義等社會理性可能目的的面紗,社會理性的目的隻有實現集體的可接受,換句話說,當我們討論社會選擇是否理性的時候,實質上只是在說能否達成社會共識,也即實現了社會的可接受。通過這一部分的研究,我們成功的將對社會理性的討論轉化為對集體可接受性的討論。

在前面分析的基礎上,我們提出了集體判斷的理性即為集體可接受性。為此,進一步構建了基於“可行的可接受性”理論的兩階段方法,用以刻畫集體可接受性,並建立了形式化的模型,証明了該方法能夠克服判斷聚合困境,能夠在社會選擇中找到理性的判斷聚合規則。更進一步的,我們還証明了這種兩階段的集體可接受性刻畫模式是不能分離的,如果只是對結論的可接受性進行判定,有可能為一些看似不民主的聚合規則作出辯護,比如少數決定制。

總體上看,本研究提出了一種關於社會理性新的觀點,即可行的集體可接受性可以充分表達社會理性,並証明了這種觀點可以解決經典的集體選擇邏輯困境。本書對於加深人們對於社會理性的認識,對於推動社會選擇理論和判斷聚合理論的發展,對於在當前這樣一個多元的社會,建立更為恰當的個人意見匯聚機制具有積極的理論意義和現實價值。

2. 博弈決策模型及信念修正

探討了在現實中,由於信息不完全造成的博弈者對博弈信息掌握的不確定性。在這種情況下,博弈者對同一個策略集可能有不同的最優態度。熊衛教授使用Hurwicz標准和Dempster-Shafer理論提出了一種決策規則,基於這種決策規則,給出了新的博弈模型,並討論了該博弈模型的各種性質。進而討論博弈者對缺乏關於其它博弈者類型的信息問題,給出了該情況下的貝葉斯博弈模型,並討論了該模型的一系列重要性質。袁永峰、文學峰還研究了博弈者的信念系統及其信念修正問題。給出了一種新的信念修正算子,用以處理在存在核心信息的情況下,如何根據新信念修正原有信念系統的問題。通過大量的文獻對比,說明給出的信念修正函數具有廣泛性和一般性。文章均發表在國際權威雜志International Journal of Intelligent Systems 和 Journal of Logic and Computation。

3.基於邏輯的計算模型能力研究

經典的命題邏輯被作為一個通用的形式系統,在自動推理、知識表示、博弈問題的刻畫等領域得到廣泛地應用,它也是第一個被証明是NP完全問題,因此對其計算能力的研究是非常重要的。特別的,非單調的邏輯程序也是一個NP完全推理難度的系統,近年來廣泛用於知識表示、自動談判等領域。從計算模型角度研究二者的區別,吸引了許多學者開展工作。在2006年,美國學者Vladimir Lifschitz教授及哥德爾獎得主、A. Razborov教授証明了存在一些用邏輯程序可以簡潔刻畫的問題,在命題邏輯下無法簡潔刻畫。也就是說,使用邏輯程序在刻畫某些問題時有較強的簡潔表示能力。但是,是否邏輯程序在所有問題的刻畫,都有較強的簡潔表示能力呢? 課題組成員最近証明存在一些問題,使用命題邏輯可以進行簡潔的刻畫,而邏輯程序無法簡潔刻畫。結果表明,這兩個計算模型在計算能力或簡潔性上,是不可比較的。該結果發表在人工智能領域內知名的-知識表示與推理國際會議,得到許多國際同行的積極評價。如一名國際同行審稿人稱此成果為“...nice work that closes a gap by proving a rather interesting and at first glance may be somewhat unintuitive result. I find these questions fascinating and worth of study.”

4. 社會博弈Nash討價還價模型的模擬研究

課題組在改進的Nash討價還價模型上,研究agent的偏好能否通過分布式博弈趨向於平等的規范。研究了不同網絡結構如規則網格、小世界網絡以及BA無標度等幾種重要的網絡結構類型對平等規范產生的影響。研究的結果表明平等的規范確實可以從大量agent的互動中涌現出來,但是不同的社會結構有不同的影響,更趨於平等網絡節點度數分布的網絡結構如WS小世界網絡更加有利於平等規范的涌現。此外,網絡結構中的其他因素如鄰域的大小,agent社會學習對結果的影響也得到了計算模型的研究。這對於研究社會系統中規范包括平等規范的涌現具有較好的理論價值,加深對社會科學動態演化過程的理解。在修改后的Nash討價還價網絡模型中,研究平等規范的涌現。論文的一個貢獻是修改了agent初始策略分布。在現有的研究中,agent策略的初始分布式離散的,取有限的幾種值和討價還價策略,我們在研究中將agent策略擴展為分布在[0,1]區間的連續值,並在此及情況下,研究了平等規范的涌現以及網絡結構等因素對該規范產生的影響。該研究對於進一步理解社會規范涌現的條件與可能性提供了理論上更加一般化的解釋。

本模型編寫的計算模型程序提供了一個計算實驗的平台,據此我們可以對影響價格的相關因素選取不同的值進行多次重復的計算模擬實驗,得到相關因素對價格的影響。因此通過這樣的一個計算和評估的平台,我們可以檢測各種模型參數調整對價格的影響,因此能夠通過計算實驗各種因素對市場價格和演化的影響,從而對干預策略的制定具有一定的參考價值。這方面的工作涉及到計算機制設計的研究,是將來的一個研究方向。 

課題組供稿

(責編:李葉)