舊版網站入口

站內搜索

大數據時代知識融合的體系架構、實現模式及實証研究中期檢查報告

2017年12月11日13:44來源:全國哲學社會科學工作辦公室

一、 研究進展情況

1、課題開題與子課題進展情況

課題“大數據時代知識融合的體系架構、實現模式及實証研究”自立項以來,認真組織、積極探討,按照項目預定計劃及國家社會科學基金各項規定執行。項目整體進展順利,召開課題啟動會1次,邀請校內外專家進行指導把關﹔課題組及各子課題之間定期召開討論會,討論項目進展及下一步研究計劃。其中課題核心成員約10人堅持每周開組會。

截至2017年7月底,共發表學術論文4篇,其中英文論文1篇(SCI收錄),中文論文3篇。項目首席專家或子課題負責人學術報告14人次,其中在全國性全學術會議上學術報告7次,專題報告2次,博士生在海外報告2次,國內報告3次。子課題負責人劉曉娟老師與化柏林老師在本課題研究的基礎上,進一步拓展研究,並分別以“社交媒體視域下科研評價的理論與方法研究”與“基於多源數據融合的情報用戶需求探測研究”為題申報國家社會科學基金面上項目,並於今年獲批。具體情況如下:

(1)已發表論文

[1] Hui Xie, Guangjian Li, Yongjie Yan, and Sihui Shu, “Evolution of Bounded Confidence Opinion in Social Networks,” Discrete Dynamics in Nature and Society, vol. 2017, Article ID 3173016, 5 pages, 2017. doi:10.1155/2017/3173016. ISSN: 1026-0226.(SCI檢索)

[2] 祝振媛,李廣建.“數據-信息-知識”整體視角下的知識融合初探. 情報理論與實踐, 2017(2)

[3] 劉曉娟,李廣建,化柏林.知識融合:概念辨析與界說[J].圖書情報工作,2016,60(13)

[4] 李廣建,劉曉娟,王昊賢.知識融合研究進展. 載《信息資源管理研究進展》,武漢大學出版社,2017年

(2)拓展項目

2017年國家社會科學基金面上項目

[1] 社交媒體視域下科研評價的理論與方法研究.劉曉娟.北京師范大學

[2] 基於多源數據融合的情報用戶需求探測研究.化柏林.北京大學

2、調查研究及學術交流情況

(1)調研數據整理

知識融合項目組自立項以來已准備各項支撐數據與實驗數據,目前已通過各種渠道與方式獲取LIS領域在WoS上文獻題錄數據近30萬條,通過arvix獲取開放全文數據1123000篇,約1個TB,下載專利數據近1百萬條等,另外還有主題詞表、情感詞表、領域本體等支撐數據,收集並整理了一些微博等社會媒體數據。

(2)文獻資料收集整理

項目組廣泛搜集各類文獻資料,截至2017年7月底共收集與項目相關的學術期刊論文200余篇,講稿PPT30余份,學術著作20余部。

(3)學術交流

[1] 李廣建. 數據挖掘、知識融合與知識服務,2015全國知識組織與知識鏈接學術交流會,2016 年 9 月19-21 日,武漢

[2] 李廣建. 數據挖掘、知識融合與知識服務, 2016年京津冀信息資源管理高峰論壇 2016年11月17-18日,保定

[3] 李廣建. 大數據時代的知識融合 2016全國知識組織與知識鏈接學術交流會,2016年12月10-12日,北京

[4]張智雄. 基於對象計算的知識揭示和組織——四類不同知識的揭示和組織應用方法. 2016全國知識服務與情報工程學術交流會,2016年12月8-9日,北京

[5] 化柏林. 面向智能情報的知識抽取. 2016 全國知識服務與情報工程學術交流會,2016年12月8-9日,北京

[6] 李廣建. 基於大數據技術的可配置計算型情報分析系統設計與實現,首屆數據分析與知識發現學術會議,2017年6月8-9日,北京

[7] 李廣建. 基於機器學習的情報分析比較方法研究與實現,數據驅動知識發現:情報學與數據科學的交互與融匯國際研討會,2016年6月19-22日,北京

[8]王曉笛《A Study on LDA Topic Modeling Topic Word Interpretation Aided by Automatic Methods》.亞太信息學院論壇(the Asia-Pacific Forum of Information Schools,APIS2016)和第18屆亞太數字圖書館國際會議(18th International Conference on Asia-Pacific Digital Libraries,ICADL2016),2016年12月5-9日,日本筑波(注:該論文獲博士生論壇的最佳論文獎)

[9] 徐敏. Research on frontier topic detection based on probability outbreak and correlation analysis. APIS2016 & 18th International Conference on Asia-Pacific Digital Libraries,ICADL2016),2016年12月5-9日,日本筑波

3、學術會議與學術交流活動

(1)學術會議

項目開題論証會

2016年3月8日,北京大學信息管理系李廣建教授主持的國家社會科學基金重大項目“大數據時代知識融合的體系架構、實現模式及實証研究”開題論証會在信息管理系507會議室召開。出席論証會的專家有:中國社會科學院學部委員、國家社科規劃辦圖書館?情報與文獻學學科規劃評審組組長黃長著研究員,中國科學技術信息研究所黨委書記趙志耘研究員,中國國防科技信息中心主任劉林山研究員,南開大學信息資源管理系柯平教授,中國人民大學信息資源管理學院副院長盧小賓教授。北京大學校長助理、社會科學部部長王博教授出席了此次會議。開題論証會由黃長著研究員主持。

王博教授首先代表學校對出席論証會的各位專家表示熱烈歡迎和感謝,並對李廣建教授獲批國家社科基金重大項目表示祝賀。他充分肯定了課題組在項目申請中取得的成績,並指出,能取得國家社科基金重大項目是一件好事,但是將項目做好才是最終目的,今天各位專家為項目把脈論証,課題組要認真領會並充分吸收專家的建議,為高水平地完成項目任務奠定基礎。王博教授還表示,學校社會科學部會大力支持課題組的研究工作,並預祝項目順利完成。

項目首席專家李廣建教授從課題研究內容的設計、研究的改進和實施方案等三個方面進行了匯報,論述了四個子課題的內容構成和相互關系,並提出了本課題研究可能的四個創新點以及目標成果。他針對課題申報過程中的評審意見,從知識融合的概念辨析、新文獻的計量分析與跟蹤、實驗數據的准備與計劃三個方面介紹了項目的改進情況。四位子課題負責人北京大學信息管理系申靜教授、化柏林助理教授,中國科學院文獻情報中心張智雄研究員,北京師范大學政府管理學院劉曉娟副教授分別就大數據時代知識融合的理論研究、知識融合體系架構研究、知識融合技術方法與實現模式研究、知識融合系統原型與實証研究進行了匯報。

本次論証會中,專家對課題研究中的重點、難點、關鍵問題,以及可能產生的重要突破點等都提出了一系列具有重要價值的具體建議,使得課題組成員進一步拓寬了研究思路,明確了研究任務。課題組成員圍繞具體研究問題與專家們進行了深入交流,李廣建教授代表課題組感謝專家們的寶貴建議,並表態說,課題組成員將會通力合作,按時保質完成課題工作,力爭產出高質量高水准的科研成果。

(2)專題報告

[1] 2017年5月31日下午,子課題負責人張智雄研究員受邀到中科院蘭州文獻情報中心作題為《豐富語義組織揭示的研究與實踐》的學術報告,蘭州文獻情報中心相關業務部門人員及研究生60余人參加了報告會。

[2] 2017年4月28日上午,子課題負責人化柏林研究員受邀到中國人民大學信息資源管理學院作題為《針對學術文獻的句子級知識抽取》的學術報告,並與該學院的師生進行了交流。

(3)國際合作

2016年7月5-8日,課題組成員化柏林赴德國參加第19屆信息融合國際會議,在會議期間聆聽了國際同行的報告,並與一些人員作了交流。回國后與課題組成員進行了分享。

4、成果推介與宣傳

2016年03月16日中國社會科學網報道了“李廣建教授主持2015年度重大項目開題論証會召開”,http://www.cssn.cn/skjj/skjj_jjgg/201603/t20160316_2925137.shtml

由於本項目基礎工作量較大,目前尚未形成重大研究成果。課題組將悉心組織,全力攻克關鍵技術問題,在一到兩年內多報送成果。

二、 研究成果情況

代表性成果簡介:

[1] 論文《知識融合:概念辨析與界說》(圖書情報工作,2016) 的基本內容、主要觀點與學術價值:

通過充分調研和分析,在理論和實踐層面汲取以往研究中的觀點和成果,一方面選取不同時期和不同領域的知識融合概念的典型表述,並分別提取“處理對象”“融合過程”以及“融合結果”3 個關鍵要素; 另一方面通過知識融合系統體系架構的剖析來進一步明確知識融合的研究范疇與邊界。綜合概括得到一個相對完整的知識融合概念定義,並從流程角度對知識融合概念進行分解。

文章認為,知識融合是面向知識服務和決策問題,以多源異構數據為基礎,在本體庫和規則庫的支持下,通過知識抽取和轉換獲得隱藏在數據資源中的知識因子及其關聯關系,進而在語義層次上組合、推理、創造出新知識的過程,並且這個過程需要根據數據源的變化和用戶反饋進行實時動態調整

知識融合是一個隨技術環境和社會環境不斷發展變化的概念,並可應用於多個學科領域,然而目前學術領域對知識融合的概念界定還缺少一致的理解,對其進行辨析有利於推動后續研究。

文章結合當前的理論和實踐研究,選取來自不同年代、不同學科領域的典型概念表述和系統體系架構,從中提取共同特征,把握知識融合的核心要素; 同時也對其中存在的差異進行了探究,以便判別知識融合的邊界與范疇,進而綜合概括得到一個相對全面的知識融合概念的定義,以期明確知識融合概念的內涵與外延,為下一步的理論研究和系統開發奠定基礎。

[2] 論文《“數據-信息-知識”整體視角下的知識融合初探》.(情報理論與實踐, 2017)的主要內容與觀點:

文章在調研融合研究文獻的基礎上,利用內容分析法梳理知識融合概念產生的背景與演進情況,並從“數據—信息—知識”整體視角,揭示數據融合、信息融合以及知識融合相關研究的發展淵源、研究演進與應用趨勢等方面情況。

本文選取“數據—信息—知識”三者融合的整體視角梳理融合研究的不同側重點,得到以下結論: ①傳統的數據融合相關研究的關注點集中在網絡異構數據的集成、多傳感器圖像與影像的融合等方面,對數據的集成是主要側重點。傳統的信息融合相關研究的關注點集中在多傳感器的信息融合的技術與方法方面上,研究更傾向於對傳感器收集的信息的處理與整合。②大數據背景環境下,數據融合與信息融合研究的內容日益趨同,研究邊界並不十分清晰,均側重於多傳感器信息與數據的融合以及異構數據的集成。③知識融合關注點集中在數字資源的整合、網絡文獻的集成、異構數字化資源整合、企業知識庫組織、本體的構建等方面,對文獻與知識的融合是研究的主要側重點。知識融合的研究明顯不同於數據融合與知識融合,主要側重在知識庫的建設、知識地圖的構建、本體的構建等方面,這些方面更強調語義和資源之間關系的組織與表達。

課題組供稿 

(責編:王瑤)