旧版网站入口

站内搜索

“基于语义的馆藏资源深度聚合与可视化展示研究”中期检查报告

2014年01月27日14:46来源:全国哲学社会科学工作办公室

①研究计划总体执行情况及各子课题进展情况:项目开题至今,项目总体执行按原计划进行,已基本完成项目总体的基础研究,已有17篇核心及以上期刊论文、10篇学位论文的研究成果。主要对涉及整个课题的基本理论问题和关键技术展开研究,为后面的子课题研究打下必要的理论、方法和技术基础。这个部分的研究内容主要包括:①当代馆藏资源的类型、状态和特征分析;②本课题研究的国内外调查和比较分析;③馆藏资源语义化、深度聚合与可视化的基本理论问题研究;④馆藏资源语义化、深度聚合与可视化的关键技术研究;⑤馆藏资源语义化、深度聚合与可视化的关系研究。由于子课题分配依据项目计划由前至后分配,子课题1、2、4、5涉及到基础研究的内容,因此四个子课题负责人和参与人员按照计划进行了研究,并发表成果。

②调研及学术交流情况:针对高校图书馆的馆藏资源,博士学位论文“领域本体构建方法及实证研究――以测绘学领域为例”收集了武汉大学图书馆中测绘学领域的词表和期刊论文。其他文献资料和整理工作均已在发表和录用的成果中体现。目前进行的学术交流和国际合作活动包括2012年6月29日邀请美国Drexel University的胡小华教授作了“基于社会标签的网络知识挖掘与搜索研究”的报告;资助博士研究生王菲菲参加美国马里兰召开的ASIS&T 75th Annual Meeting;资助博士研究生瞿辉等人参加2012年全国情报学博士生论坛;资助博士研究生楼雯参加2012年全国知识组织与知识链接学术交流会;资助博士研究生李小涛等人参加标准编写培训班;资助博士研究生董克、硕士研究生余厚强参加2012年循证科技政策研究研讨班。

③代表性成果简介:代表性成果博士学位论文“基于计量分析的数字文献资源语义化研究”面向国家创新体系建设和知识经济发展的要求,从数字图书馆知识组织的基本原理出发,综合运用体与语义、计量学网络科等领域方法工具创新性地提出基于计量分析的数字文献资源语义化理论与应用模型,并尝试构建创新性地提出基于计量分析的数字文献资源语义化理论与应用模型,并尝试构建面向数字文献资源知识组织与检索应用的计量本体,继而实证分析面向数字文献资源知识组织与检索应用的计量本体,继而实证分析验证了该语义化本体模型的可操作性和实用,充分现了基于计量关系馆藏数字文献资义化本体模型的可操作性和实用,充分体现了基于计量关系馆藏数字文献资源的语义化关联揭示和知识重组与聚合;力图利用计量思路源的语义化关联揭示和知识重组与聚合;力图利用计量思路改善馆藏数字资源在知识组织与共享等方面的效率水平,提高图书馆服务能力和字资源在知识组织与共享等方面的效率水平,提高图书馆服务能力和利用率,为未来数字图书利用率,为未来数字图书馆发展和交叉学科方法论体系建设提供有益的引导帮助。

代表性成果博士学位论文“领域本体构建方法及实证研究—以测绘学领域为例”以本体构建抽象方法为指导,把本体构建工作划分成概念获取、关系获取和形式化三个部分,在对叙词表和文本两种不同数据源进行综合运用的基础上,对文本中的信息进行了基于组词规则和N-gram算法的概念提取、基于扩展互信息和上下文信息的概念过滤、基于加权算法和信息熵的核心领域词汇的筛选、基于空间向量相似度的等级关系提取、基于语法规则和扩展关联规则的非等级关系提取和基于Jena的形式化处理,最后以测绘学叙词表和文献为例,基于以上方法构建了测绘学领域本体,对方法的可用性进行了实证研究。通过对基于语言学和统计学的概念提取方法以及基于字和词的相似度方法的对比,对互信息和关联规则方法的扩展,以及对加权算法和信息熵的综合,本文提供了一套构建本体的方法,并对现有的方法进行了改进,不仅丰富了本体构建的方法,而且为形成本体构建的一般方法提供参考。

代表性成果中国图书馆学报发文“基于计量分析的馆藏资源语义化理论研究”在揭示目前馆藏资源语义化方法存在问题的基础上,引入信息计量学的分析方法,结合语义网的相关理论和方法,构建了基于计量分析的馆藏资源语义化理论模型。通过对信息计量学和语义网进行理论和可视化应用的类比研究,发现信息计量学从定义、主要规律、馆藏资源元数据的关系研究到元数据的可视化展示都与语义网的理论、应用非常类似。基于计量分析的馆藏资源语义化方法在语义关系深度、计算机自动处理程度、可重复性和实用性方面比基于元数据和领域本体的馆藏资源语义化方法更好。把计量分析方法应用到馆藏资源语义化中,不仅可以提高馆藏资源的应用效率,解决基于元数据和领域本体的语义化的不足,还能够促进交叉研究和学科发展。

代表性成果中国图书馆学报发文“基于共现与耦合的馆藏文献资源深度聚合研究探析”从共现与耦合的理论原理出发,着眼于计量学中共现与耦合方法在馆藏资源聚合中的应用,从文献特征关联、利用过程关联、知识关联、用户需求关联四维角度探讨了典型的八种馆藏文献资源聚合模式,分别是基于机构、学者、主题、知识、文献、期刊、用户需求的关联聚合以及研究主体-研究客体-研究载体交叉关联聚合,并构建了基于共现与耦合的馆藏数字文献资源聚合四层模型。该模型涵盖从馆藏数字文献资源的初始数据准备到共现路径与计量方法的设计,再到不同资源聚合模式和聚合深度与层次的引入,直至针对用户需求的聚合结果获取,串联了资源与用户之间的整个路径。

代表性成果中国图书馆学报发文“基于共现分析的语义信息检索研究”利用文献调研、共现分析和构建本体等方法,设计了基于共现分析的语义信息检索和流程,并利用武汉大学图书馆的书目检索系统中“世界考古”类目的数据进行了实验分析。经过文献调研可以总结出目前语义信息检索主要集中在基于本体的查询技术、语义标注问题和语义关系检索等方面的研究,发现语义信息检索目前只能做到表层相关的检索;构建的基于共现分析的语义信息检索模型包括规范器、分析器和本体构建器三个部分,其中分析器是本模型的核心;经过实验分析发现共现分析可以应用于语义信息检索,并比较得出基于共现分析的语义检索比传统检索更人性化、具引导性。

代表性成果中国图书馆学报发文“引文网络中文献深度聚合方法与实证研究——以WOS数据库中XML研究论文为例”以WOS数据库中XML研究论文所构成的引文网络为例,利用引文关系权重与文献节点权重确定核心文献,并在此基础上从阈值和权值"高地"两个角度对核心文献进行聚合。研究发现:文献核心程度的确定过程充分考虑了不同引用实质上的重要程度区别,据此计算得到的引文和文献节点权重能够准确反映文献的质量;阈值聚合能够迅速发现整个学科发展过程中最核心的文献和引文;权值"高地"聚合分析结果更为多样,并能弥补阈值聚合在揭示次重要子结构方面的不足,发现整个知识体系发展过程中丰富的研究维度。

代表性成果情报资料工作发文“基于CSSCI的情报学资源本体构建研究”首次提出了资源本体的定义和概念,文章探索一种新的构建本体的方法,并为本体自动构建技术提供参考。数据来源为CSSCI中2001年到2010年情报学的8290篇文献,利用统计分析、共现分析和语义相似度计算等方法,依照本体构建原则与常用的本体构建步骤,构建情报学资源本体。其类目及等级体系依CSSCI标引字段建立,最终包括七个类目的78291个实例、182109对语义关系对。构建过程与成果表明:自动构建技术尚须完善;资源本体是本体研究中新的突破点;语义相似度与共现分析的结合定量化描述概念间关系。

代表性成果现代图书情报技术发文“RDB2RDF标准及应用研究”在对RDB2RDF映射语言的功能需求和Direct Mapping、R2RML这两种映射语言进行文献调研和试验研究的基础上,分析RDB2RDF的功能需求,研究Direct Mapping和R2RML的逻辑框架、语法规则、使用方法和实施方案,得出这两种映射语言互为补充、将提高数据转换的质量和促进关联数据应用的结论。

代表性图书与情报发文“基于战略坐标图的我国馆藏资源研究主题分析”以中国学术期刊全文数据库、网络出版总库以及中国博硕士学位论文全文数据库为信息源,以"馆藏资源"为主题检索了与之相关的学位论文。对高频关键词进行聚类,并进行了关键词类团粘合度、向心度以及密度的计算,从而我国馆藏资源的主流研究主题,通过绘制战略坐标图考察了我国馆藏资源研究各个主题的发展现状及研究地位,给出了加强我国馆藏资源研究的建议。

④成果宣传推介情况:项目开题论证会于2011年12月25日在武汉大学信息管理学院召开。各子课题负责人于2012年底向首席专家报送子课题一年来的工作简报。由于子课题2负责人身体有恙,本课题于2013年4月向社科规划办提出变更子课题负责人的申请并得到批准。

阶段性成果

序号

成果名称

作者

成果形式

刊物名或出版社、刊发或出版时间

字数

转载、引用、获奖等情况

1

基于计量分析的馆藏资源语义化理论研究

邱均平、余凡

期刊文章

中国图书馆学报,2012(4)

9000

人大复印报刊资料转载

2

基于共现分析的语义信息检索研究

邱均平、楼雯

期刊文章

中国图书馆学报,2012(6)

9200

 

3

基于共现与耦合的馆藏文献资源深度聚合研究探析

邱均平、王菲菲

期刊文章

中国图书馆学报,2013(3)

8800

 

4

引文网络中的文献深度聚合方法与实证研究——以WOS数据库中XML研究论文为例

邱均平、董克

期刊文章

中国图书馆学报,2013(2)

9100

 

5

基于知识图谱的国内知识管理发展研究

邱均平、吕红

期刊文章

情报学报,2013(5)

9200

 

6

基于CSSCI的情报学资源本体构建研究

邱均平、楼雯

期刊文章

情报资料工作,2013(6)

8100

 

7

跨学科发文视角下我国图书情报学跨学科研究态势分析

邱均平、余厚强

期刊文章

情报理论与实践,2013(5)

6800

 

8

我国信息管理学发展现状与趋势

邱均平、余厚强、王菲菲

期刊文章

情报杂志,2013(3)

7400

 

9

近五年国际图书情报学研究热点、前沿及其知识基础——基于17种外文期刊知识图谱的可视化分析

邱均平、吕红

期刊文章

图书情报知识,2013(5)

7200

 

10

基于内容分析法的索引研究论文主题分析

邱均平、楼雯

期刊文章

图书馆工作与研究,2012(10)

6900

 

11

国外图书情报领域可视化研究之分析

邱均平、赵月华、赵蓉英

期刊文章

情报理论与实践,2013(1)

6800

 

12

基于引证关系的知识转移模式及其实证研究——以知识管理研究为例

赵蓉英、吴胜男、陈瑞

期刊文章

情报杂志,2013(3)

7000

 

13

基于战略坐标图的我国馆藏资源研究主题分析

赵蓉英、吴胜男

期刊文章

图书与情报,2013(2)

7200

 

14

基于社会网络分析方法的国内外信息计量比较研究

赵蓉英、李飞

期刊文章

情报科学,2013(2)

6300

 

15

基于CSSCI的中国知识产权的可视化研究

赵蓉英、刘红红

期刊文章

图书馆杂志,2012(10)

6200

 

16

基于共词分析的近10年我国社会科学领域信息服务热点研究

赵蓉英、戴亦舒

期刊文章

图书情报工作,2012(12)

6500

 

17

基于实时交互网络的企业知识共享案例分析

赵蓉英、陈必坤

期刊文章

情报学报,2012(11)

8200

 

18

领域本体构建与可视化展示研究

张玉峰、周磊、王志芳、 何超

期刊文章

情报理论与实践,2012(10)

6500

 

19

大数据与关联数据:正在到来的数据技术革命

刘炜、夏翠娟、张春景

期刊文章

现代图书情报技术,2013(4)

6200

 

20

RDB2RDF标准及应用研究

夏翠娟

期刊文章

现代图书情报技术,2013(4)

6000

 

21

SILK关联发现框架综析

朱雯晶、夏翠娟、刘炜

期刊文章

现代图书情报技术,2013(4)

7200

 

22

OPAC混搭关联数据应用研究

钟远薪、李田章、刘炜

期刊文章

现代图书情报技术,2013(4)

6500

 

23

面向语言信息处理的语义研究——合著者的社会网络分析

陈秀娟

期刊文章

情报科学,2013(2)

6300

 

24

国外应用研究的前沿进展及热点分析

毕强、王雨

期刊文章

现代图书情报技术,2013(7)

6800

 

25

基于计量分析的数字文献资源语义化研究

王菲菲

学位论文

武汉大学博士学位论文

21万

 

26

领域本体构建方法及实证研究――以测绘学领域为例

余凡

学位论文

武汉大学博士学位论文

17万

 

27

面向数字资源聚合的语义化共词分析研究

瞿辉

学位论文

武汉大学博士学位论文

12万

 

28

基于耦合关系的学术信息资源深度聚合研究

杜晖

学位论文

武汉大学博士学位论文

14万

 

29

语义网关键技术发展现状的国内外比较研究

汪姝辰

学位论文

武汉大学硕士学位论文

3.5万

 

30

基于XML/RDF的数字图书馆互操作模型研究

曹洁

学位论文

武汉大学硕士学位论文

3.5万

 

31

馆藏数字资源深度聚合模式研究

谭文韬

学位论文

武汉大学硕士学位论文

3万

 

32

基于领域本体与网络分析的专家知识推荐模型研究

李艳红

学位论文

武汉大学硕士学位论文

3.5万

 

33

基于计量分析的数字资源聚合研究

徐灿

学位论文

武汉大学硕士学位论文

3万

 

34

基于社会标签共现分析的Web挖掘研究

陈晨

学位论文

武汉大学硕士学位论文

3万

 

(课题组供稿)

(责编:赵晶)