舊版網站入口

站內搜索

“基於語義的館藏資源深度聚合與可視化展示研究”中期檢查報告

2014年01月27日14:46來源:全國哲學社會科學工作辦公室

①研究計劃總體執行情況及各子課題進展情況:項目開題至今,項目總體執行按原計劃進行,已基本完成項目總體的基礎研究,已有17篇核心及以上期刊論文、10篇學位論文的研究成果。主要對涉及整個課題的基本理論問題和關鍵技術展開研究,為后面的子課題研究打下必要的理論、方法和技術基礎。這個部分的研究內容主要包括:①當代館藏資源的類型、狀態和特征分析﹔②本課題研究的國內外調查和比較分析﹔③館藏資源語義化、深度聚合與可視化的基本理論問題研究﹔④館藏資源語義化、深度聚合與可視化的關鍵技術研究﹔⑤館藏資源語義化、深度聚合與可視化的關系研究。由於子課題分配依據項目計劃由前至后分配,子課題1、2、4、5涉及到基礎研究的內容,因此四個子課題負責人和參與人員按照計劃進行了研究,並發表成果。

②調研及學術交流情況:針對高校圖書館的館藏資源,博士學位論文“領域本體構建方法及實証研究──以測繪學領域為例”收集了武漢大學圖書館中測繪學領域的詞表和期刊論文。其他文獻資料和整理工作均已在發表和錄用的成果中體現。目前進行的學術交流和國際合作活動包括2012年6月29日邀請美國Drexel University的胡小華教授作了“基於社會標簽的網絡知識挖掘與搜索研究”的報告﹔資助博士研究生王菲菲參加美國馬裡蘭召開的ASIS&T 75th Annual Meeting﹔資助博士研究生瞿輝等人參加2012年全國情報學博士生論壇﹔資助博士研究生樓雯參加2012年全國知識組織與知識鏈接學術交流會﹔資助博士研究生李小濤等人參加標准編寫培訓班﹔資助博士研究生董克、碩士研究生余厚強參加2012年循証科技政策研究研討班。

③代表性成果簡介:代表性成果博士學位論文“基於計量分析的數字文獻資源語義化研究”面向國家創新體系建設和知識經濟發展的要求,從數字圖書館知識組織的基本原理出發,綜合運用體與語義、計量學網絡科等領域方法工具創新性地提出基於計量分析的數字文獻資源語義化理論與應用模型,並嘗試構建創新性地提出基於計量分析的數字文獻資源語義化理論與應用模型,並嘗試構建面向數字文獻資源知識組織與檢索應用的計量本體,繼而實証分析面向數字文獻資源知識組織與檢索應用的計量本體,繼而實証分析驗証了該語義化本體模型的可操作性和實用,充分現了基於計量關系館藏數字文獻資義化本體模型的可操作性和實用,充分體現了基於計量關系館藏數字文獻資源的語義化關聯揭示和知識重組與聚合﹔力圖利用計量思路源的語義化關聯揭示和知識重組與聚合﹔力圖利用計量思路改善館藏數字資源在知識組織與共享等方面的效率水平,提高圖書館服務能力和字資源在知識組織與共享等方面的效率水平,提高圖書館服務能力和利用率,為未來數字圖書利用率,為未來數字圖書館發展和交叉學科方法論體系建設提供有益的引導幫助。

代表性成果博士學位論文“領域本體構建方法及實証研究—以測繪學領域為例”以本體構建抽象方法為指導,把本體構建工作劃分成概念獲取、關系獲取和形式化三個部分,在對敘詞表和文本兩種不同數據源進行綜合運用的基礎上,對文本中的信息進行了基於組詞規則和N-gram算法的概念提取、基於擴展互信息和上下文信息的概念過濾、基於加權算法和信息熵的核心領域詞匯的篩選、基於空間向量相似度的等級關系提取、基於語法規則和擴展關聯規則的非等級關系提取和基於Jena的形式化處理,最后以測繪學敘詞表和文獻為例,基於以上方法構建了測繪學領域本體,對方法的可用性進行了實証研究。通過對基於語言學和統計學的概念提取方法以及基於字和詞的相似度方法的對比,對互信息和關聯規則方法的擴展,以及對加權算法和信息熵的綜合,本文提供了一套構建本體的方法,並對現有的方法進行了改進,不僅豐富了本體構建的方法,而且為形成本體構建的一般方法提供參考。

代表性成果中國圖書館學報發文“基於計量分析的館藏資源語義化理論研究”在揭示目前館藏資源語義化方法存在問題的基礎上,引入信息計量學的分析方法,結合語義網的相關理論和方法,構建了基於計量分析的館藏資源語義化理論模型。通過對信息計量學和語義網進行理論和可視化應用的類比研究,發現信息計量學從定義、主要規律、館藏資源元數據的關系研究到元數據的可視化展示都與語義網的理論、應用非常類似。基於計量分析的館藏資源語義化方法在語義關系深度、計算機自動處理程度、可重復性和實用性方面比基於元數據和領域本體的館藏資源語義化方法更好。把計量分析方法應用到館藏資源語義化中,不僅可以提高館藏資源的應用效率,解決基於元數據和領域本體的語義化的不足,還能夠促進交叉研究和學科發展。

代表性成果中國圖書館學報發文“基於共現與耦合的館藏文獻資源深度聚合研究探析”從共現與耦合的理論原理出發,著眼於計量學中共現與耦合方法在館藏資源聚合中的應用,從文獻特征關聯、利用過程關聯、知識關聯、用戶需求關聯四維角度探討了典型的八種館藏文獻資源聚合模式,分別是基於機構、學者、主題、知識、文獻、期刊、用戶需求的關聯聚合以及研究主體-研究客體-研究載體交叉關聯聚合,並構建了基於共現與耦合的館藏數字文獻資源聚合四層模型。該模型涵蓋從館藏數字文獻資源的初始數據准備到共現路徑與計量方法的設計,再到不同資源聚合模式和聚合深度與層次的引入,直至針對用戶需求的聚合結果獲取,串聯了資源與用戶之間的整個路徑。

代表性成果中國圖書館學報發文“基於共現分析的語義信息檢索研究”利用文獻調研、共現分析和構建本體等方法,設計了基於共現分析的語義信息檢索和流程,並利用武漢大學圖書館的書目檢索系統中“世界考古”類目的數據進行了實驗分析。經過文獻調研可以總結出目前語義信息檢索主要集中在基於本體的查詢技術、語義標注問題和語義關系檢索等方面的研究,發現語義信息檢索目前隻能做到表層相關的檢索﹔構建的基於共現分析的語義信息檢索模型包括規范器、分析器和本體構建器三個部分,其中分析器是本模型的核心﹔經過實驗分析發現共現分析可以應用於語義信息檢索,並比較得出基於共現分析的語義檢索比傳統檢索更人性化、具引導性。

代表性成果中國圖書館學報發文“引文網絡中文獻深度聚合方法與實証研究——以WOS數據庫中XML研究論文為例”以WOS數據庫中XML研究論文所構成的引文網絡為例,利用引文關系權重與文獻節點權重確定核心文獻,並在此基礎上從閾值和權值"高地"兩個角度對核心文獻進行聚合。研究發現:文獻核心程度的確定過程充分考慮了不同引用實質上的重要程度區別,據此計算得到的引文和文獻節點權重能夠准確反映文獻的質量;閾值聚合能夠迅速發現整個學科發展過程中最核心的文獻和引文;權值"高地"聚合分析結果更為多樣,並能彌補閾值聚合在揭示次重要子結構方面的不足,發現整個知識體系發展過程中豐富的研究維度。

代表性成果情報資料工作發文“基於CSSCI的情報學資源本體構建研究”首次提出了資源本體的定義和概念,文章探索一種新的構建本體的方法,並為本體自動構建技術提供參考。數據來源為CSSCI中2001年到2010年情報學的8290篇文獻,利用統計分析、共現分析和語義相似度計算等方法,依照本體構建原則與常用的本體構建步驟,構建情報學資源本體。其類目及等級體系依CSSCI標引字段建立,最終包括七個類目的78291個實例、182109對語義關系對。構建過程與成果表明:自動構建技術尚須完善﹔資源本體是本體研究中新的突破點﹔語義相似度與共現分析的結合定量化描述概念間關系。

代表性成果現代圖書情報技術發文“RDB2RDF標准及應用研究”在對RDB2RDF映射語言的功能需求和Direct Mapping、R2RML這兩種映射語言進行文獻調研和試驗研究的基礎上,分析RDB2RDF的功能需求,研究Direct Mapping和R2RML的邏輯框架、語法規則、使用方法和實施方案,得出這兩種映射語言互為補充、將提高數據轉換的質量和促進關聯數據應用的結論。

代表性圖書與情報發文“基於戰略坐標圖的我國館藏資源研究主題分析”以中國學術期刊全文數據庫、網絡出版總庫以及中國博碩士學位論文全文數據庫為信息源,以"館藏資源"為主題檢索了與之相關的學位論文。對高頻關鍵詞進行聚類,並進行了關鍵詞類團粘合度、向心度以及密度的計算,從而我國館藏資源的主流研究主題,通過繪制戰略坐標圖考察了我國館藏資源研究各個主題的發展現狀及研究地位,給出了加強我國館藏資源研究的建議。

④成果宣傳推介情況:項目開題論証會於2011年12月25日在武漢大學信息管理學院召開。各子課題負責人於2012年底向首席專家報送子課題一年來的工作簡報。由於子課題2負責人身體有恙,本課題於2013年4月向社科規劃辦提出變更子課題負責人的申請並得到批准。

階段性成果

序號

成果名稱

作者

成果形式

刊物名或出版社、刊發或出版時間

字數

轉載、引用、獲獎等情況

1

基於計量分析的館藏資源語義化理論研究

邱均平、余凡

期刊文章

中國圖書館學報,2012(4)

9000

人大復印報刊資料轉載

2

基於共現分析的語義信息檢索研究

邱均平、樓雯

期刊文章

中國圖書館學報,2012(6)

9200

 

3

基於共現與耦合的館藏文獻資源深度聚合研究探析

邱均平、王菲菲

期刊文章

中國圖書館學報,2013(3)

8800

 

4

引文網絡中的文獻深度聚合方法與實証研究——以WOS數據庫中XML研究論文為例

邱均平、董克

期刊文章

中國圖書館學報,2013(2)

9100

 

5

基於知識圖譜的國內知識管理發展研究

邱均平、呂紅

期刊文章

情報學報,2013(5)

9200

 

6

基於CSSCI的情報學資源本體構建研究

邱均平、樓雯

期刊文章

情報資料工作,2013(6)

8100

 

7

跨學科發文視角下我國圖書情報學跨學科研究態勢分析

邱均平、余厚強

期刊文章

情報理論與實踐,2013(5)

6800

 

8

我國信息管理學發展現狀與趨勢

邱均平、余厚強、王菲菲

期刊文章

情報雜志,2013(3)

7400

 

9

近五年國際圖書情報學研究熱點、前沿及其知識基礎——基於17種外文期刊知識圖譜的可視化分析

邱均平、呂紅

期刊文章

圖書情報知識,2013(5)

7200

 

10

基於內容分析法的索引研究論文主題分析

邱均平、樓雯

期刊文章

圖書館工作與研究,2012(10)

6900

 

11

國外圖書情報領域可視化研究之分析

邱均平、趙月華、趙蓉英

期刊文章

情報理論與實踐,2013(1)

6800

 

12

基於引証關系的知識轉移模式及其實証研究——以知識管理研究為例

趙蓉英、吳勝男、陳瑞

期刊文章

情報雜志,2013(3)

7000

 

13

基於戰略坐標圖的我國館藏資源研究主題分析

趙蓉英、吳勝男

期刊文章

圖書與情報,2013(2)

7200

 

14

基於社會網絡分析方法的國內外信息計量比較研究

趙蓉英、李飛

期刊文章

情報科學,2013(2)

6300

 

15

基於CSSCI的中國知識產權的可視化研究

趙蓉英、劉紅紅

期刊文章

圖書館雜志,2012(10)

6200

 

16

基於共詞分析的近10年我國社會科學領域信息服務熱點研究

趙蓉英、戴亦舒

期刊文章

圖書情報工作,2012(12)

6500

 

17

基於實時交互網絡的企業知識共享案例分析

趙蓉英、陳必坤

期刊文章

情報學報,2012(11)

8200

 

18

領域本體構建與可視化展示研究

張玉峰、周磊、王志芳、 何超

期刊文章

情報理論與實踐,2012(10)

6500

 

19

大數據與關聯數據:正在到來的數據技術革命

劉煒、夏翠娟、張春景

期刊文章

現代圖書情報技術,2013(4)

6200

 

20

RDB2RDF標准及應用研究

夏翠娟

期刊文章

現代圖書情報技術,2013(4)

6000

 

21

SILK關聯發現框架綜析

朱雯晶、夏翠娟、劉煒

期刊文章

現代圖書情報技術,2013(4)

7200

 

22

OPAC混搭關聯數據應用研究

鐘遠薪、李田章、劉煒

期刊文章

現代圖書情報技術,2013(4)

6500

 

23

面向語言信息處理的語義研究——合著者的社會網絡分析

陳秀娟

期刊文章

情報科學,2013(2)

6300

 

24

國外應用研究的前沿進展及熱點分析

畢強、王雨

期刊文章

現代圖書情報技術,2013(7)

6800

 

25

基於計量分析的數字文獻資源語義化研究

王菲菲

學位論文

武漢大學博士學位論文

21萬

 

26

領域本體構建方法及實証研究──以測繪學領域為例

余凡

學位論文

武漢大學博士學位論文

17萬

 

27

面向數字資源聚合的語義化共詞分析研究

瞿輝

學位論文

武漢大學博士學位論文

12萬

 

28

基於耦合關系的學術信息資源深度聚合研究

杜暉

學位論文

武漢大學博士學位論文

14萬

 

29

語義網關鍵技術發展現狀的國內外比較研究

汪姝辰

學位論文

武漢大學碩士學位論文

3.5萬

 

30

基於XML/RDF的數字圖書館互操作模型研究

曹潔

學位論文

武漢大學碩士學位論文

3.5萬

 

31

館藏數字資源深度聚合模式研究

譚文韜

學位論文

武漢大學碩士學位論文

3萬

 

32

基於領域本體與網絡分析的專家知識推薦模型研究

李艷紅

學位論文

武漢大學碩士學位論文

3.5萬

 

33

基於計量分析的數字資源聚合研究

徐燦

學位論文

武漢大學碩士學位論文

3萬

 

34

基於社會標簽共現分析的Web挖掘研究

陳晨

學位論文

武漢大學碩士學位論文

3萬

 

(課題組供稿)

(責編:趙晶)