黑龍江大學馬海群主持完成的國家社會科學基金項目“開放數據與數據安全的政策協同研究”(項目批准號為:15ATQ008),最終成果為同名專著。課題組成員有:周麗霞、趙建平、賀延輝、牛曉宏、張靜萍、孫瑞英、洪偉達、唐守利、楊志和、蒲攀、石岱。
一 研究的目的和意義
隨著大數據、人工智能概念的興起,世界各國對數據掌控尤為重視,數據不但在質和量上增長迅速,而且在人類生活和社會創新發展中更是佔據著重要地位。誰掌握了數據和數據分析方法,誰就將會在大數據領域領先,無論是國家文明還是商業組織,隻要充分發揮大數據技術的價值,迎接大數據時代面臨的挑戰,如數據安全和隱私問題,並及時進行應對,就會處於大數據時代的不敗之地。大數據環境下,隨著數字經濟的興起和數據產業的發展,數據范式正在形成,數據治理成為重要的政府治理和社會治理手段﹔數據治理的兩個核心主題即為開放數據與數據安全,數據治理的重要工具是政策手段,數據治理最佳效能狀態的一種體現方式則是對開放數據與數據安全的政策協同的研究。信息與數據的開放與保護、共享與安全,是透明化現代社會健康發展與前進的兩股交織互動的重要力量,是信息資源建設需要面臨的重要課題,要加強中文網絡信息資源建設,特別是數據和知識挖掘,需要技術支持和政策扶持。那麼在技術方面,數據庫技術及網絡技術已相對成熟,那就需要從政策視角出發,激勵數據建設和服務。數據安全政策與開放數據政策的相互作用與協調發展,則是國家對信息資源宏觀規劃與配置的核心手段。
二 成果的主要內容
該成果分別從政策擴散、語料庫、知識圖譜的角度出發,對開放數據和數據安全政策及數據政策中開放數據和數據安全主題進行協同性研究。
(1)政策擴散角度:在研究內容上,選取“開放數據”和“數據安全”這兩類看似呈現出對立性的政策,根據發布機構層級不同,在自建語料庫中按照中央層級和地方層級分別選擇符合要求的政策文本作為研究樣本,共計得到中央層級發布的101條政策文本,地方層級發布的230條政策文本,總計331條政策文本,覆蓋范圍上較為全面﹔在研究方法的設計上,本研究擬從政策擴散的角度出發,同時結合研究內容的特點,定義相關指標,考量不同政策之間文本主題詞的擴散程度,利用“桑基圖”的特點,嘗試將定量分析與結果可視化結合起來,對兩類政策之間的協同情況進行直觀的展示。該成果的突出特色在於將“政策擴散”的思想應用到兩類政策的協同探究上,改變了以往的“政策擴散”思想主要應用在“同類政策”研究上的局面。通過定量研究的手段,直觀鮮明地體現出了兩類政策之間的協同程度,並由此體現出了兩者之間不協同性主要表現的方面﹔主要建樹表現在對協同理論和政策擴散理論的內涵進行了分析的同時,並未單純從理論層面上進行解讀,反而借鑒熱力學第二定律的有關理念形象,直觀地對二者之間的邏輯關系進行了闡述,同時根據設計的方法和提出的指標結合具體實例進行了相關的實証分析,証明了所提出的方法的可行性。
(2)語料庫角度:利用語料庫研究方法結合內容分析法和聚類分析法,通過自建語料庫採集並篩選數據類政策文本446條,其中包括根政策19條,干政策41條,枝政策386條。為提升政策分析的精准度,選用主題關系協同度和復合系統協同度兩個視角對現有數據類政策中開放數據和數據安全兩類主題進行協同關系分析,最終通過計算結果算出政策協同關系的取值范圍,結合數據給出數據類政策對策及建議並列出現存政策中協同關系較好的政策文件。基於實証表明,我國正處於不斷完善相關數據政策體系階段,開放數據和數據安全政策多數相對獨立,並沒有形成體系融入現有的數據類政策中來,要促進開放數據與數據安全子系統間協同,須建立開放數據及數據安全協同創新機制。開放數據及數據安全子系統和子子系統的平衡發展有助於復合系統協同能力發展。復合系統協同強調子系統間相互作用,加強子系統之間良好協作的意義大於單個子系統有序度的提升。政府應促進開放數據和數據安全體系的緊密結合,從實際政策數據分析來看,單獨提升某一個子系統的關注度,很難提升二者之間的協同效應。如某大數據政策中開放數據子系統的有序度持續上升,但該政策中並未提及安全相關事宜,因此數據安全子系統有序度並未持續上升,而是呈現平穩或波動狀態。在數據開放政策制定的同時,還要確保開放的數據安全穩定,要更加注重開放及安全子系統各子子系統之間的協同。
(3)知識圖譜角度:“基於知識圖譜的開放數據與數據安全政策協同研究”應用知識圖譜針對政策中兩類不同主題——開放數與數據安全的協同情況做出探索性研究,並選擇政策國務院關於印發促進大數據發展行動綱要的通知的國發〔2015〕50號《促進大數據發展行動綱要》完成實踐應用,該研究基於人工智能下的知識圖譜技術為核心,運用全文本數據作為研究分析對象,選擇數據挖掘中關聯規則構建推理模型,探索性地完成關於研究主題——開放數據與數據安全協同情況的推理分析:首先,完成政策全文數據的文本核心意圖、政策熱點等統計與分析,並以此為基礎選擇政策文本中的“任務”這部分內容完成該政策中兩類不同主題協同情況的分析。研究結果表明,通過基於知識圖譜技術的政策協同情況探索研究,該方法可以推廣應用於多篇政策文本中不同主題協同情況分析。該研究方法創新性在於探索完成政策分析領域知識圖譜的應用可行性,研究突出特色在於將自然科學中強人工智能技術——認知智能與政策文本潛在知識的挖掘難題相結合的研究。研究思路中體現自然科學發展最新技術方法與社會科學有機融合:一是研究設計按照標准化軟件工程規范可行性分析、需求分析、概要設計、詳細設計與代碼實現、結果可視化展示、研究結果與研究問題有機結合的應用分析﹔二是研究核心問題按照知識圖譜生命周期中知識提取、知識表示、知識存儲、知識融合、知識推理與知識應用完成政策中以文本形式闡述的不同主題的協同程度情況研究﹔該研究中突出貢獻在於提出——將“關聯規則”數據挖掘算法作為知識圖譜技術核心部分知識推理機的動力,構建政策協同情況的推理模型,針對目前無法客觀性、權威性界定政策協同度參考值的前提下研究政策的協同問題這一難題提供了一種科學的、可行的、可移植應用的解決方法。本研究探索了自然科學領域中的技術前沿方法與社會科學界研究熱點與難點解決的無縫對接:針對政府政策協同問題輔助決策研究,其學術與應用價值一方面拓展性地實現了領域知識圖譜應用的寬度,另一方面延展性地實現了政策文本研究問題的深度,該研究在政策文本深層次語義層挖掘具備開創性的應用價值。
三 對策建議
基於以上不同角度對開放數據和數據安全協同度的分析,該成果提出如下政策對策建議。
(1)建設統一政府數據開放共享平台
平台用於匯聚、存儲、共享、開放政府數據,要明確數據開放領域及數據標准格式,社會公眾和市場主體關注度、需求度高的政府數據,應當優先向社會開放。如信用、交通、醫療、衛生、就業、社保、地理、文化、教育、科技、資源、農業、環境、安監、金融、質量、統計、氣象等民生保障服務相關領域的政府數據應當優先向社會開放。共享數據分為無條件共享和有條件共享兩部分,其中無條件共享的政府數據,應當提供給所有政府機關共享使用﹔有條件共享的政府數據,僅提供給相關政府機關或者部分政府機關共享使用。技術層面:政府提供通用的符合技術標准的訪問接口與共享平台和開放平台對接﹔數據管理層面:政府數據實行分級、分類目錄管理,所開放共享的數據能夠使大數據為各行業活動提供強有力的支撐﹔業務水平提升層面:數據行政主管部門應定期組織行政機關工作人員開展政府數據共享開放培訓和交流,提升共享開放業務能力和服務水平﹔考核標准層面:各級各類政府機構要制定考核辦法,將政府數據共享開放﹔監管評估層面:需要有第三方對政府數據進行監管與評估。
(2)構建政府數據安全保障體系
政府要從制度建設、安全應急演練、安全監管、人才培養、知識產權等方面盡快構建完善數據安全保障體系,給各行業的商業活動提供安全保障環境。在政府構建數據共享開放平台的前提下,應當依法維護國家安全和社會公共安全,保守國家秘密、商業秘密,保護個人隱私,任何組織和個人不得利用共享、開放政府數據進行違法活動。制度建設層面:政府應當依法建立健全政府數據安全管理制度和共享開放保密審查機制,行政機關和共享開放平台運行、維護單位應當落實安全保護技術措施,全力保障數據安全。安全監管層面:相關部門要開展大數據安全的等級保護、日常巡查、執法檢查、信息通報、應急處置等監督管理工作。人才培養層面:要創新人才培養模式,建立健全多層次、多類型的數據安全人才培養體系,重點培養具有統計分析、計算機技術、經濟管理、數據安全等多學科知識的跨界復合型人才。知識產權保護層面:要加強新領域創新成果的知識產權數據保護,加強互聯網、電子商務、大數據等領域的知識產權保護規則研究,推動完善知識產權數據保護體系。
(3)保障開放數據和數據安全政策協同且穩定運行
開放數據與數據安全主題在明確職責、數據立法、知識產權、監督預警等方面都存在不同程序的關聯關系。明確職責:政府應明確所要開放數據的採集匯聚、目錄編制、數據提供、更新維護和安全管理等工作職責,政府部門應當按照技術規范,在職責范圍內採集政府數據,進行處理后實時向共享平台匯聚,採集政府數據涉及多部門,要按照規定的職責協同採集匯聚。數據立法:由於政府數據共享開放與信息安全之間的法律界限不明,在開放數據過程中時常與數據安全問題產生沖突,因此應加快推進大數據相關立法工作進程。知識產權:要加強對開放數據知識產權的保護來有效確保數據安全穩定。通過發掘新知識和創造新價值及大數據領域的智力成果,採取合理的規則保護其知識產權。不但要通過開放數據防止數據資源壟斷,保護基於大數據的創新動力,實現基礎數據資源共享,不斷完善數據資源建設體系,發揮其最大效能﹔還要通過知識產權保護數據獲取、挖掘和開發主體的利益,實現具有商業價值的大數據的有償轉讓和交易,提升數據資源集聚和管理水平。監督預警:要建立開放數據和數據安全的監督和預警體系,應由專業數據行政主管部門負責政府數據共享開放的監督管理和指導工作。政府應著手從以上方面來保証數據開放平台及數據安全保障體系的協同、穩定運行。
四 成果的主要價值
該成果以政策擴散、知識圖譜、內容分析、協同學理論為依據,從政策協同視角探討開放數據及數據安全政策以及數據政策中開放數據與數據安全主題間的相互支撐、協同發展,學術價值在於可以延伸信息政策體系在大數據背景下的內涵拓展,在現有語料庫中提取數據類政策文本446條(其中包括根政策19條,干政策41條,枝政策386條),從理論和實証層面上構建協同框架模型並通過計算結果算出政策協同關系的取值范圍。貴州省是我國大數據政策貫徹落實較好的地區之一,該成果以貴州省為例利用所建立框架模型及取值范圍,對貴州省的大數據政策進行了實証分析。最終給出開放數據與數據安全政策協同的對策及建議。