舊版網站入口

站內搜索

雲計算環境下的信息資源集成與服務研究中期檢測報告

2016年11月29日15:41來源:全國哲學社會科學工作辦公室

一、研究進展情況

1.研究進展

自2014年7月以來,國家社會科學基金重大項目“雲計算環境下的信息資源集成與服務研究”在首席專家、咨詢專家、各子課題負責人及全體項目組成員的共同努力下,按項目計劃順利完成了預期研究任務和項目管理目標。主要研究進展如下:

1.1雲計算環境下的信息資源集成與服務的系統框架(子課題1)

在2012年至2014年期間已完成的研究成果(基於雲計算環境下的Hadoop的索引創建方法及其索引方法﹔基於雲計算環境下的海量文本數據的一種相似度衡量﹔大數據的壓縮、清洗、分析和挖掘)的基礎上,側重完成了以下研究工作:

(1)進一步凝練研究對象和研究環境的針對性,加強研究結論的問題導向性:在研究對象方面,突出了課題研究對象的特殊性——多源、異構、海量和動態的碎片化信息資源﹔在研究環境方面,突出了雲計算及其四個基本特征:虛擬化、彈性計算、經濟性、按需服務。因此,系統框架設計具備較強的針對性和實用性。

(2)體系結構的優化:以碎片化管理、分層實現、彈性計算、負載均衡、故障恢復和數據連續性保障為主要設計目的,將系統框架分為存儲、計算、集成和服務四個層次。其中,信息存儲層的關鍵問題為分片、復制及數據一致性保障﹔信息計算層則主要解決數據流和控制流的分離﹔信息集成層的關鍵問題則碎片信息的溯源與集成﹔信息服務層主要解決的是個性化服務及數據驅動型服務。

(3)碎片信息資源的全生命期管理:重點研究雲計算環境下的碎片信息資源的生成、傳播、演化、跟蹤、關聯、分析、集成與利用的基本原則和關鍵技術。相關研究成果:論文《Knowledge Fragmentation and Its Connectivity Assurance》已被第13屆智力資本、知識管理與組織學習國際會議(3th International Conference on Intellectual Capital和Knowledge Management & Organisational Learning)錄用﹔專著《數據科學》(清華大學出版社)中討論了數據連續性保障問題。

1.2雲計算環境下的信息資源存儲和組織模式研究(子課題2)

研究內容主要涉及推薦算法和信息網絡挖掘兩部分:推薦算法包括基於張量分解、隨機決策樹的推薦算法以及符號網絡的正負關系預測算法,信息網絡挖掘主要是不確定圖上的SimRank計算和結點相似度計算。

(1)推薦算法:主要包括符號社會網絡中正負關系預測算法研究、CROWN:結合上下文信息進行新聞推薦、大數據與推薦系統、基於高效張量分解的上下文感知推薦算法以及基於隨機決策樹的上下文感知推薦算法。相關研究成果:Shaoqing Wang, Cuiping Li, Kankan Zhao, Mengwei Lan, and Hong Chen “Fusing Hierarchical Information in Context-aware Recommendations”已投稿Dasfaa2016。

(2)信息網絡挖掘:主要包括不確定圖上的SimRank計算、多關系網絡中結點之間相似度計算以及分析SimRank,Personalized PageRank和P-rank的誤差估計。相關研究成果有Lingxia Du, Cuiping Li, Hong Chen, Liwen Tan, Yinglong Zhang, Probabilistic SimRank computation over uncertain graphs, Information Sciences, Volume 295, 20 February 2015: 521-535(CCF B類)、Jing Xu, Cuiping Li, Hong Chen, Hui Sun. SimRank Based Top-k Query Aggregation for Multi-Relational Networks. WAIM 2015. (CCF C類)和Yinglong Zhang, Cuiping Li, Chengwang Xie,Hong Chen, Accuracy Estimation of Link-based Similarity Measures and Its Application, Frontiers of Computer Science, 2015:1-11(CCF C類)。

1.3 雲計算環境下的信息資源集成方法研究(子課題3)

主要以提供具有集成化的、支持大數據的、虛擬化的“資源池”為研究目的,重點研究了雲計算環境下的信息資源的碎片化處理、碎片數據的傳播與管理、碎片數據的質量控制、個性化知識圖譜的生成和 數據驅動型信息集成等特定研究問題,並在以下幾個方面取得了一定的研究進展:

(1)雲計算環境下碎片信息的預處理:主要研究雲計算環境下的信息資源,尤其是碎片信息資源的預處理原則、方法、流程和技術,為信息資源集成效果和效率的提升奠定數據基礎。

(2)雲計算環境下的碎片信息管理及語義標注:主要研究雲計算環境下的信息資源,尤其是碎片信息資源的管理要求、審計、版本戳管理和其他元數據管理的方法、技術與工具,並以語義集成為目的進行語義標注。

(3)雲計算環境下的碎片信息資源的數據驅動型集成:主要研究如何採用個性化集成和語義標注方法,將雲計算環境下的信息資源,尤其是碎片信息資源集成為數據驅動型知識圖譜。

相關研究成果已被第13屆智力資本、知識管理與組織學習國際會議(3th International Conference on Intellectual Capital和Knowledge Management & Organisational Learning)錄用﹔論文《基於開放度的可控自管理科技數字資源集成平台構架》發表在中文期刊《情報理論與實踐》﹔更多研究成果正在投稿之中。

1.4雲計算環境下的信息資源服務模式研究(子課題4)

主要針對信息資源和計算資源從個人計算機和企業服務器向雲端遷移的過程中服務模式的轉變,重點進行了雲計算環境下信息資源服務特征分析、模式構建和採納行為、法律問題等方面的研究,為雲計算環境下信息資源服務模式與方法的進一步奠定了較好的基礎。主要進展如下:

(1)雲計算環境下的信息資源服務特征分析:系統地梳理了雲計算技術給信息分析與服務帶來的關鍵問題、挑戰與發展趨勢,既從頂層設計的角度提出了對策建議,也從微觀上提出了技術優化與改進策略。相關研究成果已在《圖書情報工作》、《情報雜志》、《中國信息年鑒》等國內相關領域的重要刊物上發表。

(2)信息資源服務模式構建:重點研究了知識共享、知識服務和政務雲服務模式,提出了模式構建的關鍵要素、組織模式、運行機制和實現模型等,解決了信息資源服務的實踐問題。相關研究成果已在《情報理論與實踐》、《情報雜志》、《圖書館論壇》、《圖書館學研究》等國內相關領域的重要刊物上發表,並形成碩士學位論文一篇。

(3)雲計算信息服務採納:重點研究了政府、企業與個人作為主體對雲計算信息服務的採納行為與影響因素,提出了雲計算採納行為模型與相關研究的未來研究焦點,分析了組織或用戶對雲計算信息服務採納的態度和行為,為該領域的研究提供了研究基礎。相關研究成果已在《中國圖書館學報》上發表,並形成博士學位論文兩篇。

(4)信息資源服務的法律問題:重點研究了政府信息資源在開放與服務的過程中所依據的我國現有法律、法規及國外立法相關情況與法律適用現狀,並結合典型案例反映信息資源開發、利用的實踐問題,提出了《政府信息公開條例》與《檔案法》對信息資源服務的雙重規制,尋求了適合我國國情的解決途徑。相關研究成果已在《檔案學通訊》上發表。

1.5 雲計算環境中的學科知識信息資源集成與服務平台架構與評估(子課題5)

在已有研究成果(學科資源雲平台構建、學科資源獲取與集成、學科知識展示與服務的理論)的基礎上,優化了學科資源雲平台的設計與實現。本子課題實現了EventTeller系統較好地支持實時抓取相關Web頁面數據,並自動過濾不相關網頁,利用網頁標題、摘要、發布時間更好的計算新聞網頁相似度,並支持在線事件偵測和展示。目前已實現的主要功能模塊有:在線事件偵測,計算新聞網頁相似度,並設計了實時計算詞語權重算法,建立倒排索引以及使用新聞標題索引來過濾不相關網頁﹔融入更多類型的資源,實時抓取事件相關圖片,微博等﹔話題追蹤,設計了基於鄰域更新的算法來解決事件頁面集合更新﹔利用分布式系統進行數據存儲及信息抽取,利用Hadoop的HDFS文件系統,存儲實時抓取的數據。

1.6雲測試管理與服務示范性應用模式研究(子課題6)

本課題對雲計算環境下的信息資源集成應用案例進行了廣泛的調研分析,並重點針對圖書館RFID通用數據交換平台和思源探索雲平台這兩個實踐案例進行了深入的研究,總結出應用評價與示范性應用模式。課題主要進展如下:

(1)雲計算環境下信息資源的集成特點與平台應用評價研究:以當前圖書館海量的數據信息資源作為研究對象,重點研究了大數據環境下,信息資源的幾個典型特征以及讀者對於信息資源的獲取需求。提出了建設雲數據平台的方案,並以思源探索雲服務平台為例,從館員、讀者等不同的角度出發,給出了一套完整的應用評價體系,對於其它雲服務或雲測試平台的評價具備很好的指導意義。

(2)基於雲的協同創新平台與學科服務研究:在雲計算平台和協同創新工作理念的背景下,分別從系統平台和學科服務實踐的角度,開展了深入的研究分析工作。對當前主流的一些雲學科資源平台進行了分析比對,總結出了一些建設面向學科協同創新的信息資源集成與服務系統的通用模式與特征﹔通過這種特征與模式的提煉,給未來的系統建設提供建設性的框架與參考依據,從而設計出更好用、更智能化的學科信息資源系統。同時在服務上也提出了一些新的策略與建議,從而能更好的提升服務的水准。相關研究成果已在《大學圖書情報學刊》等國內核心刊物上發表。

(3)RFID雲通用數據交換平台研究:重點研究RFID雲通用數據交換平台中的數據交互問題和平台管理模式,提出了圖書館RFID應用的一種新模式,該RFID雲服務平台已正式在圖書館投入使用,對該平台進行了大量的RFID應用端功能測試與使用,包括各種前端設備的使用與數據交互,從而能夠總結出一套行之有效的雲服務應用與管理模式,進而推廣到其它應用或其它領域。另外在標簽轉換、盤點等設備的使用過程中,積累了大量的前端交互數據,並結合圖書館管理系統等其它系統的數據,做了海量的數據分析比對等工作,提出了RFID雲服務平台應用中的數據分析策略與實際應用模式。

(4)圖書館思源探索平台實踐研究:圖書館思源探索平台是一套基於雲計算環境的資源發現系統,系統在本地存儲少量數據,絕大部分數據都分散在雲端的各個子系統上。系統通過OAI、JSON、X-service、Web Services、deep linking、OpenSearch、plug-ins、adaptor等接口從其他數據庫自動抓取數據。目前思源探索包含的基本數據源包括圖書館的原始書目數據、電子資源和自建數據庫資源等,思源探索系統的后台數據庫定期會從配置好的多個數據庫中收割相關數據,滿足用戶對館藏資源的檢索需求﹔網絡資源,從點評網、豆瓣網等獲取到網絡平台的資源數據以及本地資源的附屬信息,例如書評和封面等內容﹔商用數據庫資源,系統即時從各個商用數據庫收割至思源探索的數據資源中心,存放在雲端,供讀者進行一站式的資源檢索。從信息資源的特征和資源訪問查詢的需求入手,以思源探索系統為例,研究了雲平台的搭建與設計模式,並與同樣類型的雲平台進行了詳細的比對分析,從數據分析的角度分析了平台的運行現狀,並最終給出一套雲服務平台完整的應用評價體系和應用模式推薦。

2.調查研究與學術交流

課題組特別重視調查研究與學術交流,特別是跨子課題的交流與合作,多次召集各子課題負責人和部分代表交流各自的研究進展、存在問題和解決思路,確保了項目研究的整體性。例如:

(1)2014~2016年,在文獻研究的基礎上,根據研究要點到北京、天津、河北、長春等地信息機構進行了有針對性的調研,對理論研究進行了實証分析﹔

(2)2015年4月,參加在首爾舉行的ICDE 2015國際會議﹔

(3)2015年6月,參加在青島舉行的WAIM 2015國際會議﹔

(4)2014~2015年,對思源探索平台的使用進行了問卷調研分析,並對雲服務平台相關的一些文獻資料進行了收集整理工作﹔

(5)2014~2015年,對國內外雲計算採納相關文獻進行系統的調研,在此基礎上提出個人雲存儲用戶採納行為模型,然后,對雲存儲的個人用戶進行調查研究,通過訪談調研和發放問卷兩種方式,對模型進行了實証和進一步解釋﹔

(6)2015年,參與 “2015中國信息資源管理論壇”﹔

(7)2015年,參與在泰國曼谷舉行的智力資本、知識管理與組織學習國際會議(International Conference on Intellectual Capital和Knowledge Management & Organizational Learning)。

(8)2014~2015年,參加IBM大數據分析師資培訓。

3.成果宣傳推介

(1)2015年10月,課題首席專家杜小勇教授和盧小賓教授在《中國信息年鑒》發表特約論文《雲計算環境下的信息資源集成與服務》﹔

(2)2014年10月,課題組向國家社科基金委提交成果要報《關於加強我國雲端信息資源管理工作的幾點建議》﹔

(3)2015年6月,課題組提交的研究報告《大數據背景下政府數據資源的可持續管理與利用機制研究》等作為國家發改委制定相關政策提供了重要參考,並接到來自國家發改委高技術產業司的感謝信。

(4)在課題官網http://deke.ruc.edu.cn/static/icloud/index.html。上定期發布課題研究成果。

二、研究成果情況

自立項以來,本課題已完成研究成果有87項,其中專著/教材3部、標准2項、發明專利申請5項、軟件著作權申請9項,發表論文67篇(國際發文26篇)、年鑒特邀稿1篇,具體如下表所示。

序號

成果名稱

作者

成果形式

出版社或刊物名

出版或刊發時間(年/月)

1

開放源代碼社區啟發下的知識共享組織模型研究

肖源, 楊哲倫, 郝杰

論文

圖書館學研究

2016.1

2

個人雲存儲用戶採納模型及實証研究

王建亞,羅晨陽

論文

情報資料工作

2016.1

3

企業雲服務採納模式及影響因素研究

王濤

論文

博士學位論文

2016.6

4

基於流式計算的網絡輿情分析模型研究

高歡

論文

情報學報

已錄用

5

信息分析視角下的大數據分析平台構架研究

肖源,郝杰,劉瑩,王濤

論文

情報科學

已錄用

6

雲架構下智慧政府服務模式研究

霍亮

論文

現代情報

已錄用

7

Random Partition Factorization Machines for Context-Aware Recommendations

Shaoqing Wang等

論文

WAIM2016, Nanchang, China.

2016.6

8

Learn to recommend local event using heterogeneous social networks.

Shaoqing Wang, Zheng Wang, Cuiping Li

論文

APWeb2016, Suzhou, China.

已錄用

9

面向學科化服務的高校雲協同創新支持實踐

郭晶等

論文

大學圖書情報學刊

已錄用

10

信息分析的若干核心問題探討

朝樂門等

論文

情報理論與實踐

2016.2

11

電子文件管理系統測試工作的對比研究

朝樂門等

論文

北京檔案

2016.4

12

Knowledge Fragmentation and Its Connectivity Assurance

朝樂門等

論文

13th International Conference on Intellectual Capital, Knowledge Management & Organisational Learning

已錄用

13

數據科學

朝樂門

教材

清華大學出版社

2016.7

14

信息資源管理術語及概念體系

安小米

專著

中國標准化出版社

2016.1

15

GB/Z 32002-2015 信息與文獻 用於文件管理的工作過程分析

安小米

國家標准

中國標准化出版社

2015.12

16

分布式系統與雲計算概論(第二版)

陸嘉恆

教材

清華大學出版社

2013.12

17

Big data challenge: a data management perspective

陸嘉恆

論文

Frontiers of Computer Science

2013.7

18

一種基於代價敏感支持向量機的遙感圖像自動解譯方法

陸嘉恆

發明專利

201310170288.2,2013.05.10

2013.05.10

19

基於Hadoop的索引創建方法及其索引方法

陸嘉恆

發明專利

201310302669.1,2013.07.17

2013.07.17

20

一種基於海量文本數據的相似度衡量方法

陸嘉恆

發明專利

201310335123.6,2013.08.02

2013.08.02

21

分布式海量Web數據爬取共享系統

陸嘉恆

發明專利

201310471593.5, 2013.10.11

2013.10.11

22

友好的XML圖形化搜索系統軟件V1.0

陸嘉恆,林春彬

軟件著作權

2013SR035944,2013.04.22

2013.04.22

23

海量Web數據信息自動爬取與半自動化抽取系統軟件V1.0

陸嘉恆

軟件著作權

2013SR116778,2013.10.31

2013.10.31

24

海量非結構化數據管理系統測試軟件[簡稱:NSRunner] V1.0

陸嘉恆,蔡曉華

軟件著作權

2013SR131745  2013.11.25

2013.11.25

25

A Skylining Approach to Optimize Influence and Cost in Location Selection

Juwei Shi,Hua Lu,Jiaheng Lu,Chengxuan Liao

論文

DASFAA/2014 B類

2014.1

26

pandasearch: a fine-grained academic search engine for research documents

Feiran Huang,Jia Li,Jiaheng Lu 等

論文

 ICDE/2014 A類

2014.1

27

面向學術的精准搜索系統軟件 [簡稱:CS Serach] V1.0

陸嘉恆,顧向南

軟件著作權

2014SR049788 2014.04.25

2014.04.25

28

基於學術搜索系統的人名自動提示軟件[簡稱:Scholar_AutoComplete] v1.0

陸嘉恆,蔡曉華

軟件著作權

2014SR136332,2014.09.11

2014.09.11

29

大規模圖數據處理系統軟件V1.0

陸嘉恆,楊華

軟件著作權

2014SR026073 2014.03.04

2014.03.04

30

面向學術搜索的圖片爬取系統軟件V1.0

李德陽,陸嘉恆

軟件著作權

2014SR202098 2014.06.30

2014.06.30

31

開放環境下面向學術應用的論文信息自動獲取系統軟件V1.0

趙嘉迪,陸嘉恆

軟件著作權

014SR204396 2014.10.30

2014.10.30

32

MapReduce-Based SimRank Computation and Its Application in Social Recommender System

Lina Li, Cuiping Li等

論文

IEEE Bigdata Congress, 2013

2013.6

33

On Perspective Aware Top-k Similarity Search in Multi-Relational Networks

Yinglong Zhang, Cuiping Li, Hong Chen

論文

DASFAA 2014.

2014.4

34

信息網絡中一個有效的結點相似度度量

張應龍,李翠平,陳紅

論文

軟件學報

2014.11

35

Accuracy Estimation of Link-based Similarity Measures and Its Application

Yinglong Zhang, Cuiping Li, Hong Chen

論文

Frontiers of Computer Science

2015.1

36

 Probabilistic SimRank Computation over Uncertain Graphs

 Lingxia Du, Cuiping Li, 等

論文

 Information Sciences

2015.1

37

基於用戶信任和張量分解的社會網絡推薦

鄒本友, 李翠平等

論文

軟件學報.

2014.12

38

國外智慧城市知識中心構建機制及其借鑒研究

安小米

論文

情報資料工作

2013.4

39

面向智慧城市發展的信息資源管理協同創新策略構想

安小米

論文

情報資料工作

2013.4

40

詞語位置加權TextRank的關鍵詞抽取研究

夏天

論文

現代圖書情報技術

2013.9

41

融合LDA 與TextRank 的關鍵詞抽取研究

夏天等

論文

現代圖書情報技術

2014.7

42

大數據時代的政府信息資源管理:國外數字連續性戰略及借鑒

安小米

論文

智慧城市

2014.1

43

Vocabularies of ISO/TC46/SC11 Publications

安小米

標准

the 30th ISO/TC46/SC11 meeting, Washington D.C., US

2014.5

44

電子文件管理系統的技術特征

朝樂門

論文

現代圖書情報技術

2013.4

45

電子文件管理系統測試方法研究

朝樂門

論文

檔案學通訊

2014.6

46

數據空間及其信息資源管理視角研究

朝樂門

論文

情報理論與實踐

2013.11

47

Mass Collaborative Knowledge Processing on the Amazon Mechanical Turk

朝樂門

論文

International Journal of Computer Science Issues

2014.2

48

一種電子文件管理系統的自動化測試方法及系統

朝樂門、杜小勇、薛四新

發明專利

CN201410045487.5

2014.12

49

雲計算環境下電子文件管理的關鍵技術研究

薛四新,朝樂門,田雷

論文

北京檔案

2013.1

50

雲計算環境下的信息資源的集成與服務研究

盧小賓、杜小勇、朝樂門

論文

《中國信息年鑒》特約論文

2015.1

51

Google三大雲計算技術對海量數據分析流程的技術改進優化研究

王濤、盧小賓

論文

圖書情報工作,

2015.3

52

大數據時代信息分析的關鍵問題、挑戰與對策

官思發,朝樂門

論文

圖書情報工作,

2015.3

53

計算機輔助信息分析及其發展趨勢研究

熊志正、朝樂門

論文

圖書情報工作,

2015.3

54

《檔案法》規制下的政府信息公開問題探析

盧小賓、高歡

論文

檔案學通訊

2015.6

55

美國競爭情報軟件發展現狀及對我國的啟示

官思發,李宗潔

論文

圖書情報工作

2015.4

56

大數據環境下知識服務關鍵要素與實現模型研究

官思發,李宗潔

論文

情報理論與實踐

2015.12

57

政務網絡信息生態鏈中的可信雲服務模式構建

王濤﹔曲榮華﹔洪先鋒

論文

情報雜志,

2015.4

58

Scalable and noise tolerant web knowledge extraction for search task simplification.

Jun He, Y. Gu, H. Liu, J. Yan, H. Chen.

論文

Decision Support Systems

2013.9

59

Predicting Microblog User's Age based on Text Information.

Y. Li, T. Liu, H. Liu, Jun He and X. Du.

論文

The 14th International Conference on Web Information System Engineering

2013.9

60

The Study of UHF-RFID Data Model Construction in University Libraries

GUO Jing etc.

論文

The Electronic Library

2014.5

61

Design and Implementation of a Subject Librarian Training Program for University Libraries in China

GUO Jing etc.

論文

Reference & User Services Quarterly

2014.2

62

A Comprehensive Concept Map for Adequate Protection and Effective Management of Personal Information in Networked Chinese Services.

An X, Bai W, Deng H, Sun S, Dong Y, Zhong W, Hu J (2015).

論文

The Electronic Library

2015.6

63

Mass collaborative knowledge management:Towards the next generation of knowledge management studies

朝樂門

論文

 Program

2015.4

64

The information resources utilization index: a case study in China

朝樂門等

論文

Program

2016.1

65

元分析方法在信息分析中的應用

陳鶴陽,朝樂門.

論文

 情報資料工作, 2015.6

2015.1

66

CROWN: A Context-aware RecOmmender for Web News

Wang S, Zou B, Li C, et al.

論文

Data Engineering (ICDE)

2015.4

67

GPUTENSOR: Efficient  Tensor  Factorization  for  Context-Aware Recommendations.

Benyou  Zou, Cuiping  Li,  Liwen  Tan  and  Hong  Chen.

論文

Information Sciences

2015.4

68

Probabilistic SimRank computation over uncertain graphs

Hong Chen, Liwen Tan, Yinglong Zhang

論文

Information Sciences

2015.2

69

SimRank Based Top-k Query Aggregation for Multi-Relational Networks.

Jing Xu, Cuiping Li, Hong Chen, Hui Sun.

論文

Web-Age Information Management. Springer

2015.12

70

符號社會網絡中正負關系預測算法研究綜述

藍夢微,李翠平,等

論文

計算機研究與發展

2015.2

71

大數據與推薦系統

李翠平, 藍夢微等

論文

大數據

2015.3

72

大數據分析研究現狀、問題與對策

官思發,孟璽,李宗潔,劉揚

論文

情報雜志

2015.5

73

大數據知識服務關鍵要素與實現模型研究

官思發

論文

圖書館論壇

2015.6

74

政務網絡信息生態鏈中的可信雲服務維度構建

王濤,張蘇,曲榮華等

論文

情報雜志

2015.4

75

雲環境下政務信息生態鏈運行機制研究

張皓月

論文

碩士學位論文

2015.6

76

Developing a Comprehensive Regime for Personal Information Protection in Networked Chinese Public Sectors

Xiaomi An等

論文

Management

2015.3

77

雲計算採納行為研究現狀分析

盧小賓, 王建亞.

論文

 中國圖書館學報,

2015.1

78

 電子文件管理系統的測試方法研究

朝樂門.

論文

檔案學通訊

2014.6

79

電子文件管理系統研發的重點與難點分析

朝樂門.

論文

檔案學通訊

2014.1

80

基於開放度的可控自管理科技數字資源集成平台構架

董宇, 安小米, 錢澄,等

論文

情報理論與實踐

2014.11

81

 中國政府網站移動瀏覽器兼容性研究

夏天, 陳杰, 魏小貞,等

論文

現代情報

2014.11

82

大數據下基於異步累積更新的高效P-Rank計算方法

王旭叢, 李翠平, 陳紅.

論文

軟件學報

2014.09

83

現代國家治理的雲端思維——信息治理能力與政府轉型的多重挑戰

安小米.

論文

人民論壇·學術前沿

2015.02

84

 Location-Based Recommendation Using Incremental Tensor Factorization Model

Zou B, Li C, Tan L, et al.

論文

Advanced Data Mining and Applications Springer

2014.11

85

 Explicit semantic path mining via wikipedia knowledge tree

Xia T, Chen M, Liu X.

論文

Proceedings of the American Society for Information Science and Technology

2014.6

86

Fast Approximation of Shortest Path on Dynamic Information Networks

Jin J, Shi X, Li C, et al.

論文

 Web-Age Information Management. Springer

2014.5

87

信息資源開發利用指數數據處理系統

朝樂門等

軟件著作權

登記號 2015SR226408

2015.9

其中,自2014年7月以來,比較有代表性的成果簡介如下:

(1)雲計算採納行為研究現狀分析。在中國圖書館學報上發表了論文《雲計算採納行為研究現狀分析》。論文採用定量和定性相結合的方法,對外文數據庫中雲計算採納行為研究的文獻進行梳理和分析。研究發現:應重視發展中國家和中小企業雲計算採納行為研究,以促進他們應用雲計算技術;個人層面的雲計算採納行為將成為一個重要的研究主題;需要構建符合雲計算技術特征的實証模型;需要結合應用情境分析雲計算採納行為的影響因素,雲計算的安全、隱私、信任將成為本領域關注的焦點。論文通過對雲計算採納行為研究現狀的分析,為我國該領域的研究提供研究思路和理論基礎。

(2)基於GFS、MapReduce和Bigtable的信息資源集成方法。在《圖書情報工作》上發表了論文《Google三大雲計算技術對海量數據分析流程的技術改進優化研究》。論文針對傳統海量數據分析處理數據細節方式所導致的分析質量與效率問題, 通過對Google三大雲計算技術——GFS、MapReduce和Bigtable進行文獻調查、內容分析和技術分析,梳理出Google雲計算技術在數據處理、技術架構和算法模型等方面的部署創新和設計改進,並與傳統本地數據分析處理方式與細節進行比較分析,提出海量數據分析流程在存儲和訪問、組織與管理以及並行處理3個方面的技術優化與改進策略。其中提出的解決方案對本課題信息服務的構建中數據處理和技術架構等方面,有一定參考和指導意義。

(3)基於隨機決策樹的上下文推薦算法。隨著信息的爆炸式增長,推薦系統成為一個重要的工具,它可以有效地幫助用戶找到喜愛的物品。用戶的行為(如點擊、購買、轉發、評論等)是基於特定的環境的,稱為上下文。上下文包括時間、地點,心情,同伴等。在實際的應用中,上下文可以很容易地被收集到。相對於傳統的僅基於用戶-物品二元交互的推薦系統,上下文推薦可以顯著地提高推薦性能。現有的工作中,已經有很多上下文推薦方法被提出。其中,因子分解機是一個很有影響力和流行的模型。因子分解機把用戶-物品-上下文交互表示為潛在因子的線性組合,並且平等地對待每一個用戶、物品、上下文因子,而不能很好地捕獲用戶、物品、上下文之間崔在的層次信息。實際上,層次結構能夠在不同水平上捕獲更豐富的上下文信息,應該被充分利用以提高推薦質量。直覺上,在局部同質的上下文環境下,用戶傾向於產生相似的評分。我們提出隨機分割因子分解機,採用隨機決策樹層次化地分割上下文以便於更好地捕獲復雜的局部交互。在決策樹的每個節點上,我們探索因子分解機中潛在因子之間的相似度,採用k-means聚類方法分割用戶-物品-上下文元組。每個節點上的數據子集被期望有更好的交互影響。我們在三個公開數據集上與現有的最新的5個上下文推薦模型做對比實驗,實驗結果表明,我們提出的隨機分割因子分解機具有良好的性能。相關研究成果“Random Partition Factorization Machines for Context-Aware Recommendations”已經發表於中國計算機學會推薦的國際會議WAIM2016。

(4)基於異構社交網絡的推薦模型。現有的社交網絡蘊含多個異構的社交信息,如Meetup、豆瓣同城等基於事件的社交網絡連接線上和線下兩種社交網絡,伴隨用戶和事件的急劇增長,有必要把相關事件推薦給用戶。現有的推薦系統的研究已經表明,充分利用社交網絡信息能夠顯著地提高推薦性能。直覺上,用戶是否會對某一事件進行響應取決於他自身的興趣偏好和好友的行為。我們提出異構社交泊鬆因子分解模型(HSPF)。HSPF模型組合在線和離線社交網絡到一個框架中,並把好友之間的關系強度集成到模型中。我們在Meetup數據集上測試我們提出的模型,實驗結果表明,我們提出的HSPF模型戰勝了現有的模型。相關研究成果“Learn to recommend local event using heterogeneous social networks”已經被中國計算機學會推薦的國際會議APWeb2016錄用。

(5)圖書館的RFID應用中構建雲數據平台的設計方法。主要探討了圖書館的RFID應用中構建雲數據平台的設計思路與方法,按照規范來設計平台,所有的RFID前端應用如自助借還、標簽轉換、盤點設備、自動分揀設備等通過網絡和雲數據平台進行數據交互,從而完成其功能應用並實時記錄各項操作中的大數據日志記錄。主要觀點是通過建設一個圖書館RFID雲數據平台,首先將大量的RFID交換數據匯總在一起存儲並使用﹔其次通過接口形式提供服務,靈活性更好,可實現前端任意RFID設備的隨意接入﹔最后通過遵守數據模型和通用數據交換規范,各個圖書館都能方便地互相交互RFID數據,實現大區域RFID雲共享雲應用的目標。其中提出的解決方案對本課題雲測試服務模式的研究有一定參考和指導意義,通過對該RFID雲服務平台的設計與搭建,可進行大量的RFID應用端功能測試,從而能夠對本課題的雲測試管理方式提供一點的借鑒意義,可總結出一套行之有效的雲服務應用模式,進而推廣到其它應用或其它領域。相關研究成果《RFID通用數據交換平台建設研究》在《圖書情報工作》上發表。

                                                    課題組供稿

(責編:沈王一)