旧版网站入口

站内搜索

《基于多维度聚合的网络资源知识发现研究》中期检查报告

2016年03月11日14:39

一、 研究进展情况

1. 研究计划总体执行情况及各子课题进展情况

总体上,本项目组成员依据项目的研究计划和时间安排,基本完成了预期的研究目标。目前,本课题的研究工作和进度基本与研究计划吻合,主要对项目的总体研究框架,子课题一和子课题二展开了广泛而深入的研究。具体来说,本课题的研究工作与进度如下:

1.1研究架构

课题组在进一步了解本课题相关领域理论研究和实践进展的基础上,完善了研究架构,确定了研究重点和难点,进一步明确了任务分工。在此基础上,制定了最终的研究方案。形成了一篇研究成果《基于多维度聚合的网络资源知识发现》(已经录用),该论文详细论述了基于多维度的网络资源知识发现框架。该框架依据知识发现的基本流程(数据准备->数据挖掘->解释与评估),从网络信息资源的结构信息、网络内容信息和网络使用信息三个维度,分别探讨三个维度上的网络信息资源的知识发现方法,而后在上述研究基础上,探讨面向全网络资源多维度聚合的知识发现方法。由此可见,该知识发现框架既遵循知识发现的一般规律,具有可靠的理论基础,同时又针对网络资源的特性,具有针对性。最后,论文又依托该框架,以科技成果资源为应用对象,设计了基于多维度聚合的网络资源知识发现框架的应用实施方案。通过上述分析可知,本论文作为项目初步研究成果,具有提纲挈领的作用,为后继的研究提供了方向和实施方案。

1.2子课题一研究进展

子课题1的研究已经全面展开,重点研究了四个方面的内容:网络资源的关联结构特征研究,网络资源关联网络中的知识分布研究,网络资源关联网络的演化研究,网络资源关联网络中的用户行为研究。具体来说,各部分的研究情况如下:

(1) 网络资源的关联结构特征研究

对网络资源关联网络结构形态进行研究,重点考察了以下几个方面的内容:首先,对关联网络的基本特征进行统计分析,通过度分布、聚类系数的统计分析考察关联网络知识节点的离散聚合特征,通过特征路径长度分析考察知识节点的连通性和距离;其次,进一步研究了关联网络中的社区结构,从中观层次分析知识的集聚特征和领域划分,通过对研究网络的层次结构研究领域关键词的层次性,通过对网络自相似形态的分析考察关联网络的对称性和复制性;最后,以模体和群落为对象分析了网络资源的中观结构,探寻从微观个体到宏观结构的联系。论文《网络资源的关联结构探析》正在撰写中,论文架构已经搭建,实验数据已经搜集。

(2) 网络资源关联网络中的知识分布研究

本部分重点研究了网络资源关联网络中的知识特征与规律。已经形成论文《网络资源关联网络中的知识分布规律研究》(正在撰写),该论文主要通过统计分析关联网络的节点分布,识别关键知识节点;通过研究连接分布,分析关联网络的中心节点/中心连线;通过研究关联网络知识单元的作者分布,寻找网络中的关键的知识生产者;通过研究作者合作关系,探索关联网络中的知识合作和知识迁移;通过研究关联网络中的机构分布,寻找知识创造的核心群体;通过知识节点产生时间的分布研究,分析知识节点的增长老化特征;通过对网络资源类型的时序统计分析,探索资源的分布和资源生产的发展趋势。

(3) 网络资源关联网络的演化研究

本部分重点研究了在大数据环境下,网络资源关联网络动态演化特征,通过分析与实证研究,我们发现一方面网络资源关联网络的结构形态是随时间动态变化的,另一方面网络资源关联网络的结构演化形成网络中的小世界效应和无标度特征。小世界效应表现知识单元的强关联性,无标度反映知识节点的非均匀性。此外,通过研究网络中心性的迁移规则,分析了中心迁移和新知识产生的关系,通过研究了网络中的弱链接,讨论了新知识的演化和发现。

(4) 网络资源关联网络中的用户行为研究。

有关网络资源关联网络中的用户行为研究主要探索了:用户的检索和使用路径的形成规律和内在动因。并形成了论文《社会化标签系统中基于社会网络的知识推送网络演化研究》(已经发表),具体来说,主要是利用网络分析方法,将社会化标签系统中基于社会网络的知识推送网络构造方法描述为六个步骤。借鉴演化理论,将基于社会网络的知识推送网络演化动力归纳为内生动力和外生动力。移植生物进化论的相关理论,提出多重动力机制作用下基于社会网络的知识推送网络演化周期性模型: 每个周期的起点就是新一轮社会网络的构建,每个周期内部的演化过程分为选择阶段、遗传阶段、变异阶段。该知识推送网络演化模型,为向用户提供主动推送服务提供了依据。

1.3子课题二研究进展

课题2网络资源语义揭示与多维度聚合已经展开初步的研究。具体来说,主要是对海量网络信息资源的多粒度分割、语义提取、语义标注、多维度聚合等几个方面进行了探索,并形成了相关研究成果《基于有序分类的文本多粒度分割与语义标注研究》(已经投稿),网络通常以一篇web文档作为网络信息资源组织的基本单位,信息组织的粒度过粗,这也直接导致很难实现检索即所得的信息资源精准定位服务,更难完成网络信息资源的多维度语义关联,实现网络信息资源的关联集成服务。为解决网络信息资源组织存在的上述问题,该论文采取有序分类的方法对网络信息资源的多粒度分割与语义标注进行了研究,提出了基于有序分类的文本多粒度层级分割与语义标注方法,该方法在总体上采取自下而上的分层聚类的方法来实现网络内容信息的层级分割,构建出一棵文档分割树。该结构的突出优势是可以实现信息资源的多粒度组织。在对网络内容信息进行多粒度分割的同时,进行各个粒度层次上的语义提取与关联,并形成论文《Research on fine-grained linked data creation for digital library resources》(已经投稿),具体来说,采取潜在语义分析的方式进行文档分割树各个粒度层次上的语义提取,而后,基于相似度计算、基于规则推理,借助D2R,SILK等工具,实现各个粒度层次上的语义关联,将各个文档分割树关联成多粒度的语义网络结构(也即关联数据),实现网络内容信息的多粒度多维度的语义关联,进而满足网络用户的多粒度的信息需求,实现检索即所得的集成知识服务,降低用户负担,提高用户满意度。

2. 调查研究及学术交流情况

(1)文献资料收集

通过图书馆、期刊网、互联网、内部参考、简报等渠道大量收集了国内外与本课题相关的文献。下载了期刊论文438篇,学位论文30余篇,会议论文120余篇,此外还通过各种渠道获得了时新的PPT,研究手稿等重要的研究资料,并对这些资料进行了分类,整理。

(2)学术会议与交流

为分享研究成果,征得其他专家学者的帮助,项目成员也开展了广泛的学术交流。具体来说:已在11th International Conference on Knowledge Management上投稿,该会议将于2015年11月在日本举行。

(3)国际合作

为与项目组的国外专家开展广泛的合作,派遣多名项目成员去国外访学,在国外专家的指导下深入开展项目的研究工作。

3. 研究中存在的主要问题、改进措施,研究心得、意见建议

随着项目研究的不断拓展和深入,在项目研究中也遇到了一些问题。这些问题给项目的顺利开展带来了不小的困难。具体来说,主要体现在以下几个方面:

(1)随着项目研究的不断扩展,各子课题研究的内容也越来越丰富,这势必会造成各个子课题内部,以及子课题之间的研究内容之间的联系越来越复杂,使得整体把握项目的内在联系变得越来越困难。

(2)随着项目研究的不断深入,各子课题探索的内容也越来越专指,这势必会造成各子课题之间关联性的降低,甚至脱节,使得项目研究偏离研究的核心内容。

为解决上述问题,保证项目研究的顺利进行,项目组经过讨论,对项目组的成员结构进行了调整。除设立“学术秘书”负责整体协调各子课题的研究进展之外,还在各子课题之间设立了“跨子课题研究专员”,该研究专员负责两个子课题之间的衔接。

二、 研究成果情况

三、 代表性成果简介

(1)《基于多维度聚合的网络资源知识发现框架研究》(已经录用)

该论文详细论述了基于多维度的网络资源知识发现框架。该框架依据知识发现的基本流程(数据准备->数据挖掘->解释与评估),从网络信息资源的结构信息、网络内容信息和网络使用信息三个维度,分别探讨三个维度上的网络信息资源的知识发现方法,而后在上述研究基础上,探讨面向全网络资源多维度聚合的知识发现方法。由此可见,该知识发现框架既遵循知识发现的一般规律,具有可靠的理论基础,同时又针对网络资源的特性,具有针对性。最后,论文又依托该框架,以科技成果资源为应用对象,设计了基于多维度聚合的网络资源知识发现框架的应用实施方案。

(2)《社会化标签系统中基于社会网络的知识推送网络演化研究》(已经发表)

该论文主要是利用网络分析方法,将社会化标签系统中基于社会网络的知识推送网络构造方法描述为六个步骤。借鉴演化理论,将基于社会网络的知识推送网络演化动力归纳为内生动力和外生动力。移植生物进化论的相关理论,提出多重动力机制作用下基于社会网络的知识推送网络演化周期性模型: 每个周期的起点就是新一轮社会网络的构建,每个周期内部的演化过程分为选择阶段、遗传阶段、变异阶段。

四、 阶段性成果清单

[1] 基于多维度聚合的网络资源知识发现. 夏立新,陈晨,王忠义.论文.情报科学杂志.录用.9274字.

[2] 社会化标签系统中基于社会网络的知识推送网络演化研究.易明,毛进,邓卫华,曹高辉.论文.中国图书馆学报.2014年3月.16373字

[3] Inferring microbial interaction networks based on consensus similarity network fusion.Jiang Xingpeng, Hu Xiaohua. 论文,Science China.2014年11月,4024字.

[4] Social network analysis on a topic based navigation guidance system in a public health portal. Journal of the American Society for Information Science & Technology. Zhang, J., Zhai, S., Liu, H., & Stevenson, J.(2015年已录用)

[5] Optimization of the Subject Directory in a Government Agriculture Department Web Portal. Journal of the American Society for Information Science & Technology. Zhang, J., Zhai, S., Stevenson, J. & Xia, L.(2015年已录用)

[6] 大数据时代情报危机的发展演变及其应对策略.夏立新,陈燕芳.情报学报(二审)。

(责编:李叶)