舊版網站入口

站內搜索

輔助信息在抽樣調查中的應用模型與方法

——《輔助信息在抽樣調查中的應用模型與方法研究》成果簡介

2011年05月15日16:32

  暨南大學劉建平教授主持完成的國家社會科學基金項目《輔助信息在抽樣調查中的應用模型與方法研究》(批准號為04BTJ013),最終成果為專著《輔助信息在抽樣調查中的應用模型與方法》。課題組成員有:陳光慧。

  當今社會已經步入信息時代,人們每天都面對著海量的數據和信息。無論是國家對經濟社會的宏觀管理,還是處於社會再生產各個環節的投資者、生產者和消費者以及各種中介機構的微觀管理﹔無論是有效地生產,還是高質量地生活,抑或科學地研究,都需要獲取和利用大量、及時和有效的信息。社會對信息的依賴和需求日益增大,人們對有效獲取信息的手段和方法愈來愈重視。面對海量的信息,如何有效地獲取和利用信息是統計工作的一項基本任務。作為統計調查主體方法的抽樣調查,由於在獲取信息中所具有的獨特優勢而得到越來越廣泛的重視和應用。一項大中型抽樣調查能否獲得成功,很大程度上依賴於抽樣調查中對輔助信息利用得好壞。

  一、該成果的主要內容和重要觀點

  1.研究思路與方法路徑。該成果的研究思路與方法可歸納為兩條路徑。路徑一:兩個階段→一個目標→兩個標准。兩個階段是指輔助信息在抽樣調查中的應用主要體現在抽樣設計和抽樣估計兩個階段﹔一個目標是指如何充分利用現實中各種類型的輔助信息進行抽樣設計和估計量設計,構造出一個精度更高的估計量﹔兩個標准指的是評價抽樣設計和估計量優劣的兩個依據:一個是構造的估計量要滿足無偏性、有效性、一致性和充分性等統計性質的要求,另一個是要能給出估計量的方差及其估計量的計算公式。這是該項成果的整體研究思路。路徑二:超總體回歸模型→有限總體回歸模型→樣本回歸模型。傳統的抽樣調查將總體看成是固定的,隨機性僅表現在樣本的抽取,估計推斷以抽樣設計為基礎。該成果把有限總體看成是超總體的一個隨機實現,把超總體回歸模型作為研究的工具,是一種基於模型的模型輔助估計方法。它首先研究如何充分利用現有的各類輔助信息設計超總體回歸模型,其次研究如何估計超總體回歸模型的參數。如果掌握有限總體的數據,就依據有限總體的數據估計出超總體回歸模型參數的估計值  ,進而給出估計量的方差﹔實際調查中,一般並不掌握有限總體的數據,這時就運用概率樣本數據進行估計,估計出超總體回歸模型參數的樣本估計值,進而得到方差的估計量。這是該成果在估計量設計階段利用輔助信息的主要方法路徑。

  2.提出在普查基礎上科學編制抽樣框是在我國統計調查方法體系中真正確立普查基礎地位和抽樣調查主體地位的關鍵,給出了編制基礎抽樣框和操作抽樣框以及對名錄庫進行更新維護的思路和方法。

  3.建立了抽樣調查的基礎概念體系。它是構建輔助信息在抽樣調查中應用模型和方法體系的基礎。這些基礎概念包括抽樣設計、樣本示性變量、包含概率、量、量的方差及其估計量。這些概念相互之間邏輯關系緊密,對於抽樣從設計到估計的全過程起著基礎的和基本的作用。抽樣設計是研究包含概率、量及其相關統計性質的基礎。在有限總體中,抽樣設計確定了,包含概率和量也就隨之確定了。不同的抽樣設計,給出不同的包含概率,最終也使量具有不同的形式。量是在抽樣設計下得到的一般性估計量,量具有的統計性質能很容易推廣到具體抽樣設計下的不同情形。樣本示性變量的定義和優良特性使包含概率、量及其統計性質的推導簡潔方便。該成果的研究內容是以包含概率和量為基礎的。

  4.建立了輔助信息在抽樣設計中應用的模型與方法體系。該成果分別對等概率抽樣設計中的伯努力抽樣、簡單隨機抽樣、系統抽樣和不等概率抽樣設計中的泊鬆抽樣、樣和樣如何利用輔助信息提高抽樣效率進行了系統深入的研究,比較了各種方法對輔助信息的利用程度及其效率。特別是給出了樣本量大於2時樣設計下方差估計的一種簡便算法,使樣的應用不再局限於樣本量小於等於2的情形,給出了在MPPS抽樣下利用輔助信息對Hansen-Hurwitz估計量進行擴展的方法,解決了多目標抽樣下估計量整體估計精度不高的問題。比較好地解決了如何在分層抽樣設計中利用輔助信息分配樣本、選擇分層標志、確定分層界限和層數的問題,探討了利用輔助信息尋求多目標分層抽樣的最優設計方法。系統研究了在整群抽樣設計和二階抽樣設計中應用不同類型輔助信息的基本條件和方法,對兩種方法的抽樣設計效應以及影響效應大小的因素進行了深入的分析研究。

  5.建立了輔助信息在抽樣估計中應用的模型與方法體系。該成果所用的抽樣推斷方法是模型輔助估計。這種方法只是把超總體回歸模型作為一種輔助工具,而不是依賴超總體模型進行估計,不管模型是否會出現設定誤差,都不會直接影響到回歸估計量基本統計性質的成立。在抽樣估計階段,要利用已知的輔助變量提高抽樣估計的精度,關鍵在於建立反映輔助變量與研究變量之間關系的回歸模型。所以,該研究成果專門研究了如何根據獲得的輔助信息的不同類型,建立恰當地反映輔助變量與研究變量之間關系的超總體回歸模型,從而最大限度地提高各種回歸估計量的精度。首先研究了如何由一般的超總體回歸模型推導出GREG估計量,對GREG估計量的統計性質進行了嚴格的推導証明。其次,根據輔助變量與研究變量之間具體的回歸關系,對一般的超總體回歸模型所得出的結論加以推廣,建立比率模型、線性回歸模型、事后分層回歸模型和非參數回歸模型,分別推導出比率估計量、線性回歸估計量、事后分層回歸估計量和非參數回歸估計量,並研究相應的估計量性質。從而建立起一個較為完整的抽樣估計方法體系。

  6.建立了輔助信息在抽樣設計與估計量設計中同時應用的模型與方法體系。為了更加充分地利用已有的輔助信息,盡可能地提高抽樣估計的精度,該成果將抽樣設計與估計方法作為一個整體,研究了利用一種或多種輔助信息同時改進抽樣設計和估計量設計的模型和方法。把抽樣設計階段的分層抽樣和抽樣估計階段的比率估計、回歸估計結合起來進行研究,使輔助信息在分層抽樣設計和比率估計與回歸估計中同時得到應用﹔研究了如何利用不同種類的輔助信息在整群抽樣設計和二階抽樣設計下進行回歸估計,對整群抽樣設計效應進行了更深入的討論,對分層整群抽樣回歸模型與事后分層整群抽樣回歸模型進行了系統的研究﹔研究了如何利用輔助變量進行二重分層抽樣、二重回歸估計以及二重分層回歸估計,即在二重抽樣下同時考慮分層抽樣設計和使用回歸估計方法,實現從抽樣設計和估計方法兩個層面同時提高二重抽樣的估計精度。

  7.輔助信息在抽樣調查其他環節中應用的模型與方法。該研究成果圍繞抽樣設計和估計量設計這兩個關鍵,對輔助信息在相關課題中的應用模型和方法也進行了研究,具體包括輔助信息在域估計、樣本輪換和無回答中的應用。從滿足多層次推斷和多級管理的需要出發,分別研究了輔助信息在域估計中的直接估計和間接估計的應用模型和方法。研究了在樣本輪換中分別以前期樣本資料為輔助信息的量,同時以前期樣本資料及全面資料為輔助信息的回歸估計量,同時以前期樣本資料和全面資料為輔助信息的校准估計量。研究了處理無回答的加權調整法和插補法,提出了校准加權調整法,這種方法綜合了加權調整法和插補法兩者的優點,更充分地利用了已有的輔助信息,從而更多地減少了由於無回答的存在給估計帶來的精度損失。

  二、研究成果的學術和社會價值

  1.建立了輔助信息在抽樣調查中應用的模型和方法體系。該成果在系統總結前人研究成果的基礎上,對輔助信息在抽樣調查中各個環節的應用模型與方法進行系統研究,建立了輔助信息在抽樣調查中的應用模型和方法體系。這也有利於從事抽樣調查實踐的人員運用該研究成果對抽樣實踐進行指導,從而提高我國抽樣調查的方法技術水平,提高抽樣調查的效率和效益。

  2.在若干方面取得突破性進展,解決了抽樣方法中存在的一些難題。給出樣本量大於2時樣下方差估計的一種簡便算法,解決了二階包含概率不易計算的難題,拓展了樣的應用范圍﹔給出了MPPS抽樣下,利用輔助信息對Hansen-Hurwitz估計量進行擴展的方法,解決了多目標抽樣下估計量整體精度不高的難題。通過輔助變量的最小值和最大值進行線性轉化改進比率估計量,給出在不同條件下選用有效估計量的標准﹔在比率模型和線性回歸模型中考慮異方差問題,針對不同的方差結構,給出相應的估計方法﹔將事后分層作為估計方法研究,根據定性和定量的輔助信息分別建立事后分層回歸模型﹔根據輔助變量與研究變量之間的非參數回歸關系建立非參數回歸模型等等,開辟了抽樣估計方法研究的新領域。
(責編:陳葉軍)