旧版网站入口

站内搜索

罗敏 姜涛:数字人文与跨越国界的史料共享

——以抗战文献平台为例

罗敏 姜涛2019年06月20日10:01来源:中国社会科学报国家社科基金专刊

作者系国家社科基金抗日战争研究专项工程项目“抗日战争与近代中日关系文献数据平台建设”课题组成员,中国历史研究院研究员、助理研究员

2019年1月,习近平总书记在致中国历史研究院成立的贺信中强调,历史学研究要“立足中国、放眼世界,立时代之潮头,通古今之变化,发思想之先声”。诚然,中国的史学研究必须扎根本国土壤,在此基础上勇攀国际高峰,才能真正产出贯通中西、跨越国界、具有世界影响的成果;而作为史学研究的基础,在大数据和数字人文大潮下,历史资料的收集、整理与呈现更应充分挖掘国内外海量资源,秉持开放获取的理念,实现公开、公益、共享。

国家社科基金抗日战争研究专项工程“抗日战争与近代中日文献数据平台”(以下简称“抗战文献平台”,网址:www.modernhistory.org.cn)目前已正式上线。抗战文献平台收录1949年以前各类数字化近代文献近1500万页,包含档案、图书、期刊、报纸、照片、音视频等多种形式,平均保持每月100万页的增长速度,向海内外用户永久公益开放。

数字人文与北美东亚图书馆协会年会

2019年3月,抗战文献平台项目组成员受邀参加在美国召开的北美东亚图书馆协会年会,并在大会上作主题报告,首次在海外宣讲抗战文献平台成果与理念,与北美学者面对面交流。北美东亚图书馆协会是北美亚洲研究协会下属的主要委员会之一,自1958年成立以来,一直致力于促进北美地区东亚图书馆馆员间的交流与协作,以增进各东亚馆的信息互通与馆藏建设。近年来,北美东亚图书馆协会更加注重与东亚地区各综合性、研究性图书馆的学术往来。此次年会有多位来自中日韩等地的学者、图书馆员、出版界人士参加,算得上是全世界东亚资料馆藏界的盛会。

与一般外界想象不同的是,如今图书馆界会议的重点,已不再是讨论纸本图书报刊的采集与整理,而更多直击数字时代的数字馆藏。从20世纪90年代起,北美东亚图书馆协会年会便逐年增加数字资源的讨论比重,而此次年会主题更是清一色的“数字流”:“数字学术时代下东亚图书馆与馆员面临的机遇与挑战”“数字人文、中国研究与资源的版权保护”“数字学术时代的中国研究中图书馆员的角色”等。数字、数字化、数字人文、数字学术等语汇成为会议关键词,凸显了“数字”一词对传统纸本收藏机构的重要意义。而相较于传统纸本资料可移动性差、保存时间有限的缺点,读者可以享受到技术进步带来的便利,随时随地、超越时空地读取“数字”资料。

中国数字人文发展的优势与短板

在中国哲学社会科学界,“数字学术”“数字人文”的概念兴起较晚,但近几年随着国内信息技术与通信行业的飞速发展,数字人文与数字人文的重要载体——研究型数据库建设获得重要突破。与历史学相关的研究型数据库相继涌现,不仅数据体量颇大,个别数据库还突破了储存与检索的单一功用,正朝着提供问题导向的结构化数据的方向发展。更为重要的是,在参与抗战文献平台建设过程中,我们亲身体会到在中国特色社会主义条件下,数字学术发展的独特优势与后发之力。根据轻重缓急与数据资源的保存情况,我们国家可以同时牵头多家学术机构,集中力量办大事,而不是在保守各自资源的情况下单打独斗,重复建设,造成资源的浪费。抗战文献平台由中国社会科学院与国家档案馆、国家图书馆合作建设,并与国内外多所高校达成近代中国资料共享互通协议,大大提高了数据采集与录入效率。而北美数字人文由于起步较早,精细化、特色化的数字人文实践已经形成某种固定模式,加之市场化环境主导与信息技术应用成本高居不下,目前仍鲜有大规模数据平台供学者使用。

当然,北美数字人文毕竟已是一套集学术机构、数据库公司、营销团队与用户群体为一体的成熟产业链,与之相较,国内人文学科的数据库建设仍有不少差距。以抗战文献平台为例,首先,在规模性数据的标引与运算上需要重点突破。数据的结构化处理是数字人文产品走向精尖的必经之路,这一方面考验数据标引的技术能力与跨学科知识,另一方面,前期需要投入大量经费,投入与产出之间又有延迟与性价比的问题。如何在提高技术的同时做到投入产出比最大化,是大批国内数据库团队面临的重要课题。其次,应用模式亟待拓展。抗战文献平台目前鼓励用户免费注册,以下载高清图像,这符合国内用户的使用习惯。但在海外市场,IP控制下的机构订阅使用仍是最佳选择。通过服务器架设与IP设定,抗战文献平台便可以给海外各高校提供更加稳定的访问体验与个性化服务。再者,学术顾问团队与技术团队的深度合作模式有待加强。只有在深度合作情境下,数据库才能兼顾学术前沿价值与技术革新能力,做到学术资源与技术呈现的无缝接轨。数字人文的高速发展能否持续,关键在于解决这一问题,而其基础又是学科界限的打破与复合型人才的培养。

数字人文时代的史料共享与讲好中国故事

此次年会的另一个重要主题是“开放共享”。在互联网与移动通讯时代,信息的传播与获取基本已不再受地域与时效的影响;同样,人文学科领域数字化资源的开放获取也是不可阻挡的趋势。“数字人文”的出现本身带有两层期许:一是资料的“结构化”处理,例如搜索、排列乃至高级的逻辑分析,皆是“结构化”的表现;二是资料不限地域快速获取,假如投入大量成本建设的数据库只供“闭门”使用,或需要支付高昂使用费才能“一睹芳容”,这不仅不符合“数字人文”的理念,更是一种巨大的资源浪费。抗战文献平台在筹备阶段便确定了公开、公益、共享的理念,整合大量抗战与近代中日关系相关史料,让社会大众近距离了解历史、学习历史,让学者更便捷地获取资料、促进研究。在此次年会上,抗战文献平台的开放共享理念与不懈实践获得了在场听众的赞许。一些北美的中国研究者表示,如果没有开放便捷、内容丰富的数据库,他们可能需要耗费精力申请高额资助才能远涉重洋到中国查阅资料,而学术资助本身是“不平等”的,有多种因素的制约。对不少国外研究者而言,平等开放抗战文献平台不啻为一项“福利”。还有学者兴奋地告诉项目组,他研究北京城市史多年,一直未能找寻到的北京地方小报,辗转在抗战文献平台上寻获,且能免费下载,这不仅节省了大量时间与金钱,也便于让世界了解中国。

进一步言之,任何共享都是双向的行为,数字人文共享也不例外。数字人文时代数据资源的“共享”不仅意味着资源获取方(感兴趣的社会公众、目的性更明确的研究者)单方面实现更加便捷的获取,更含有资源提供方(数据平台的整合者、提供者)向前者提供知识服务、汲取资源价值的优势。抗战文献平台立项伊始,便旨在向用户提供最优质的史学知识服务。如今面向海外用户,抗日战争与近代中日关系相关史料整合与上线的过程,便是使封存在“史籍”中的文字、故事和精神“活起来”“走出去”的过程。通过多元整合、高质多量史料的数字呈现与跨越国界的共享,抗战文献平台有信心向世界讲好中国故事。

2019年,中美建交已届40周年。这段时间,美国挑起的贸易战,使中美两国互利互赢的合作前景蒙上了阴影。但是,全球化趋势不可逆转,人类命运共同体的愿景也不可阻挡。其中,跨越国界的史料共享不仅是这一趋势的体现,更有助于互相理解各自的民族历史与记忆,尊重彼此自主选择的社会制度和发展道路,从而在文化充分交流的基础上,实现国与国之间平等互惠、和平友好的交往。为此,抗战文献平台愿在数字人文、开放共享的时代浪潮下,贡献绵薄之力。

(责编:孙爽、程宏毅)