旧版网站入口

站内搜索

大数据时代知识融合的体系架构、实现模式及实证研究中期检查报告

2017年12月11日13:44来源:全国哲学社会科学工作办公室

一、 研究进展情况

1、课题开题与子课题进展情况

课题“大数据时代知识融合的体系架构、实现模式及实证研究”自立项以来,认真组织、积极探讨,按照项目预定计划及国家社会科学基金各项规定执行。项目整体进展顺利,召开课题启动会1次,邀请校内外专家进行指导把关;课题组及各子课题之间定期召开讨论会,讨论项目进展及下一步研究计划。其中课题核心成员约10人坚持每周开组会。

截至2017年7月底,共发表学术论文4篇,其中英文论文1篇(SCI收录),中文论文3篇。项目首席专家或子课题负责人学术报告14人次,其中在全国性全学术会议上学术报告7次,专题报告2次,博士生在海外报告2次,国内报告3次。子课题负责人刘晓娟老师与化柏林老师在本课题研究的基础上,进一步拓展研究,并分别以“社交媒体视域下科研评价的理论与方法研究”与“基于多源数据融合的情报用户需求探测研究”为题申报国家社会科学基金面上项目,并于今年获批。具体情况如下:

(1)已发表论文

[1] Hui Xie, Guangjian Li, Yongjie Yan, and Sihui Shu, “Evolution of Bounded Confidence Opinion in Social Networks,” Discrete Dynamics in Nature and Society, vol. 2017, Article ID 3173016, 5 pages, 2017. doi:10.1155/2017/3173016. ISSN: 1026-0226.(SCI检索)

[2] 祝振媛,李广建.“数据-信息-知识”整体视角下的知识融合初探. 情报理论与实践, 2017(2)

[3] 刘晓娟,李广建,化柏林.知识融合:概念辨析与界说[J].图书情报工作,2016,60(13)

[4] 李广建,刘晓娟,王昊贤.知识融合研究进展. 载《信息资源管理研究进展》,武汉大学出版社,2017年

(2)拓展项目

2017年国家社会科学基金面上项目

[1] 社交媒体视域下科研评价的理论与方法研究.刘晓娟.北京师范大学

[2] 基于多源数据融合的情报用户需求探测研究.化柏林.北京大学

2、调查研究及学术交流情况

(1)调研数据整理

知识融合项目组自立项以来已准备各项支撑数据与实验数据,目前已通过各种渠道与方式获取LIS领域在WoS上文献题录数据近30万条,通过arvix获取开放全文数据1123000篇,约1个TB,下载专利数据近1百万条等,另外还有主题词表、情感词表、领域本体等支撑数据,收集并整理了一些微博等社会媒体数据。

(2)文献资料收集整理

项目组广泛搜集各类文献资料,截至2017年7月底共收集与项目相关的学术期刊论文200余篇,讲稿PPT30余份,学术著作20余部。

(3)学术交流

[1] 李广建. 数据挖掘、知识融合与知识服务,2015全国知识组织与知识链接学术交流会,2016 年 9 月19-21 日,武汉

[2] 李广建. 数据挖掘、知识融合与知识服务, 2016年京津冀信息资源管理高峰论坛 2016年11月17-18日,保定

[3] 李广建. 大数据时代的知识融合 2016全国知识组织与知识链接学术交流会,2016年12月10-12日,北京

[4]张智雄. 基于对象计算的知识揭示和组织——四类不同知识的揭示和组织应用方法. 2016全国知识服务与情报工程学术交流会,2016年12月8-9日,北京

[5] 化柏林. 面向智能情报的知识抽取. 2016 全国知识服务与情报工程学术交流会,2016年12月8-9日,北京

[6] 李广建. 基于大数据技术的可配置计算型情报分析系统设计与实现,首届数据分析与知识发现学术会议,2017年6月8-9日,北京

[7] 李广建. 基于机器学习的情报分析比较方法研究与实现,数据驱动知识发现:情报学与数据科学的交互与融汇国际研讨会,2016年6月19-22日,北京

[8]王晓笛《A Study on LDA Topic Modeling Topic Word Interpretation Aided by Automatic Methods》.亚太信息学院论坛(the Asia-Pacific Forum of Information Schools,APIS2016)和第18届亚太数字图书馆国际会议(18th International Conference on Asia-Pacific Digital Libraries,ICADL2016),2016年12月5-9日,日本筑波(注:该论文获博士生论坛的最佳论文奖)

[9] 徐敏. Research on frontier topic detection based on probability outbreak and correlation analysis. APIS2016 & 18th International Conference on Asia-Pacific Digital Libraries,ICADL2016),2016年12月5-9日,日本筑波

3、学术会议与学术交流活动

(1)学术会议

项目开题论证会

2016年3月8日,北京大学信息管理系李广建教授主持的国家社会科学基金重大项目“大数据时代知识融合的体系架构、实现模式及实证研究”开题论证会在信息管理系507会议室召开。出席论证会的专家有:中国社会科学院学部委员、国家社科规划办图书馆?情报与文献学学科规划评审组组长黄长著研究员,中国科学技术信息研究所党委书记赵志耘研究员,中国国防科技信息中心主任刘林山研究员,南开大学信息资源管理系柯平教授,中国人民大学信息资源管理学院副院长卢小宾教授。北京大学校长助理、社会科学部部长王博教授出席了此次会议。开题论证会由黄长著研究员主持。

王博教授首先代表学校对出席论证会的各位专家表示热烈欢迎和感谢,并对李广建教授获批国家社科基金重大项目表示祝贺。他充分肯定了课题组在项目申请中取得的成绩,并指出,能取得国家社科基金重大项目是一件好事,但是将项目做好才是最终目的,今天各位专家为项目把脉论证,课题组要认真领会并充分吸收专家的建议,为高水平地完成项目任务奠定基础。王博教授还表示,学校社会科学部会大力支持课题组的研究工作,并预祝项目顺利完成。

项目首席专家李广建教授从课题研究内容的设计、研究的改进和实施方案等三个方面进行了汇报,论述了四个子课题的内容构成和相互关系,并提出了本课题研究可能的四个创新点以及目标成果。他针对课题申报过程中的评审意见,从知识融合的概念辨析、新文献的计量分析与跟踪、实验数据的准备与计划三个方面介绍了项目的改进情况。四位子课题负责人北京大学信息管理系申静教授、化柏林助理教授,中国科学院文献情报中心张智雄研究员,北京师范大学政府管理学院刘晓娟副教授分别就大数据时代知识融合的理论研究、知识融合体系架构研究、知识融合技术方法与实现模式研究、知识融合系统原型与实证研究进行了汇报。

本次论证会中,专家对课题研究中的重点、难点、关键问题,以及可能产生的重要突破点等都提出了一系列具有重要价值的具体建议,使得课题组成员进一步拓宽了研究思路,明确了研究任务。课题组成员围绕具体研究问题与专家们进行了深入交流,李广建教授代表课题组感谢专家们的宝贵建议,并表态说,课题组成员将会通力合作,按时保质完成课题工作,力争产出高质量高水准的科研成果。

(2)专题报告

[1] 2017年5月31日下午,子课题负责人张智雄研究员受邀到中科院兰州文献情报中心作题为《丰富语义组织揭示的研究与实践》的学术报告,兰州文献情报中心相关业务部门人员及研究生60余人参加了报告会。

[2] 2017年4月28日上午,子课题负责人化柏林研究员受邀到中国人民大学信息资源管理学院作题为《针对学术文献的句子级知识抽取》的学术报告,并与该学院的师生进行了交流。

(3)国际合作

2016年7月5-8日,课题组成员化柏林赴德国参加第19届信息融合国际会议,在会议期间聆听了国际同行的报告,并与一些人员作了交流。回国后与课题组成员进行了分享。

4、成果推介与宣传

2016年03月16日中国社会科学网报道了“李广建教授主持2015年度重大项目开题论证会召开”,http://www.cssn.cn/skjj/skjj_jjgg/201603/t20160316_2925137.shtml

由于本项目基础工作量较大,目前尚未形成重大研究成果。课题组将悉心组织,全力攻克关键技术问题,在一到两年内多报送成果。

二、 研究成果情况

代表性成果简介:

[1] 论文《知识融合:概念辨析与界说》(图书情报工作,2016) 的基本内容、主要观点与学术价值:

通过充分调研和分析,在理论和实践层面汲取以往研究中的观点和成果,一方面选取不同时期和不同领域的知识融合概念的典型表述,并分别提取“处理对象”“融合过程”以及“融合结果”3 个关键要素; 另一方面通过知识融合系统体系架构的剖析来进一步明确知识融合的研究范畴与边界。综合概括得到一个相对完整的知识融合概念定义,并从流程角度对知识融合概念进行分解。

文章认为,知识融合是面向知识服务和决策问题,以多源异构数据为基础,在本体库和规则库的支持下,通过知识抽取和转换获得隐藏在数据资源中的知识因子及其关联关系,进而在语义层次上组合、推理、创造出新知识的过程,并且这个过程需要根据数据源的变化和用户反馈进行实时动态调整

知识融合是一个随技术环境和社会环境不断发展变化的概念,并可应用于多个学科领域,然而目前学术领域对知识融合的概念界定还缺少一致的理解,对其进行辨析有利于推动后续研究。

文章结合当前的理论和实践研究,选取来自不同年代、不同学科领域的典型概念表述和系统体系架构,从中提取共同特征,把握知识融合的核心要素; 同时也对其中存在的差异进行了探究,以便判别知识融合的边界与范畴,进而综合概括得到一个相对全面的知识融合概念的定义,以期明确知识融合概念的内涵与外延,为下一步的理论研究和系统开发奠定基础。

[2] 论文《“数据-信息-知识”整体视角下的知识融合初探》.(情报理论与实践, 2017)的主要内容与观点:

文章在调研融合研究文献的基础上,利用内容分析法梳理知识融合概念产生的背景与演进情况,并从“数据—信息—知识”整体视角,揭示数据融合、信息融合以及知识融合相关研究的发展渊源、研究演进与应用趋势等方面情况。

本文选取“数据—信息—知识”三者融合的整体视角梳理融合研究的不同侧重点,得到以下结论: ①传统的数据融合相关研究的关注点集中在网络异构数据的集成、多传感器图像与影像的融合等方面,对数据的集成是主要侧重点。传统的信息融合相关研究的关注点集中在多传感器的信息融合的技术与方法方面上,研究更倾向于对传感器收集的信息的处理与整合。②大数据背景环境下,数据融合与信息融合研究的内容日益趋同,研究边界并不十分清晰,均侧重于多传感器信息与数据的融合以及异构数据的集成。③知识融合关注点集中在数字资源的整合、网络文献的集成、异构数字化资源整合、企业知识库组织、本体的构建等方面,对文献与知识的融合是研究的主要侧重点。知识融合的研究明显不同于数据融合与知识融合,主要侧重在知识库的建设、知识地图的构建、本体的构建等方面,这些方面更强调语义和资源之间关系的组织与表达。

课题组供稿 

(责编:王瑶)