舊版網站入口

站內搜索

羅敏 姜濤:數字人文與跨越國界的史料共享

——以抗戰文獻平台為例

羅敏 姜濤2019年06月20日10:01來源:中國社會科學報國家社科基金專刊

作者系國家社科基金抗日戰爭研究專項工程項目“抗日戰爭與近代中日關系文獻數據平台建設”課題組成員,中國歷史研究院研究員、助理研究員

2019年1月,習近平總書記在致中國歷史研究院成立的賀信中強調,歷史學研究要“立足中國、放眼世界,立時代之潮頭,通古今之變化,發思想之先聲”。誠然,中國的史學研究必須扎根本國土壤,在此基礎上勇攀國際高峰,才能真正產出貫通中西、跨越國界、具有世界影響的成果﹔而作為史學研究的基礎,在大數據和數字人文大潮下,歷史資料的收集、整理與呈現更應充分挖掘國內外海量資源,秉持開放獲取的理念,實現公開、公益、共享。

國家社科基金抗日戰爭研究專項工程“抗日戰爭與近代中日文獻數據平台”(以下簡稱“抗戰文獻平台”,網址:www.modernhistory.org.cn)目前已正式上線。抗戰文獻平台收錄1949年以前各類數字化近代文獻近1500萬頁,包含檔案、圖書、期刊、報紙、照片、音視頻等多種形式,平均保持每月100萬頁的增長速度,向海內外用戶永久公益開放。

數字人文與北美東亞圖書館協會年會

2019年3月,抗戰文獻平台項目組成員受邀參加在美國召開的北美東亞圖書館協會年會,並在大會上作主題報告,首次在海外宣講抗戰文獻平台成果與理念,與北美學者面對面交流。北美東亞圖書館協會是北美亞洲研究協會下屬的主要委員會之一,自1958年成立以來,一直致力於促進北美地區東亞圖書館館員間的交流與協作,以增進各東亞館的信息互通與館藏建設。近年來,北美東亞圖書館協會更加注重與東亞地區各綜合性、研究性圖書館的學術往來。此次年會有多位來自中日韓等地的學者、圖書館員、出版界人士參加,算得上是全世界東亞資料館藏界的盛會。

與一般外界想象不同的是,如今圖書館界會議的重點,已不再是討論紙本圖書報刊的採集與整理,而更多直擊數字時代的數字館藏。從20世紀90年代起,北美東亞圖書館協會年會便逐年增加數字資源的討論比重,而此次年會主題更是清一色的“數字流”:“數字學術時代下東亞圖書館與館員面臨的機遇與挑戰”“數字人文、中國研究與資源的版權保護”“數字學術時代的中國研究中圖書館員的角色”等。數字、數字化、數字人文、數字學術等語匯成為會議關鍵詞,凸顯了“數字”一詞對傳統紙本收藏機構的重要意義。而相較於傳統紙本資料可移動性差、保存時間有限的缺點,讀者可以享受到技術進步帶來的便利,隨時隨地、超越時空地讀取“數字”資料。

中國數字人文發展的優勢與短板

在中國哲學社會科學界,“數字學術”“數字人文”的概念興起較晚,但近幾年隨著國內信息技術與通信行業的飛速發展,數字人文與數字人文的重要載體——研究型數據庫建設獲得重要突破。與歷史學相關的研究型數據庫相繼涌現,不僅數據體量頗大,個別數據庫還突破了儲存與檢索的單一功用,正朝著提供問題導向的結構化數據的方向發展。更為重要的是,在參與抗戰文獻平台建設過程中,我們親身體會到在中國特色社會主義條件下,數字學術發展的獨特優勢與后發之力。根據輕重緩急與數據資源的保存情況,我們國家可以同時牽頭多家學術機構,集中力量辦大事,而不是在保守各自資源的情況下單打獨斗,重復建設,造成資源的浪費。抗戰文獻平台由中國社會科學院與國家檔案館、國家圖書館合作建設,並與國內外多所高校達成近代中國資料共享互通協議,大大提高了數據採集與錄入效率。而北美數字人文由於起步較早,精細化、特色化的數字人文實踐已經形成某種固定模式,加之市場化環境主導與信息技術應用成本高居不下,目前仍鮮有大規模數據平台供學者使用。

當然,北美數字人文畢竟已是一套集學術機構、數據庫公司、營銷團隊與用戶群體為一體的成熟產業鏈,與之相較,國內人文學科的數據庫建設仍有不少差距。以抗戰文獻平台為例,首先,在規模性數據的標引與運算上需要重點突破。數據的結構化處理是數字人文產品走向精尖的必經之路,這一方面考驗數據標引的技術能力與跨學科知識,另一方面,前期需要投入大量經費,投入與產出之間又有延遲與性價比的問題。如何在提高技術的同時做到投入產出比最大化,是大批國內數據庫團隊面臨的重要課題。其次,應用模式亟待拓展。抗戰文獻平台目前鼓勵用戶免費注冊,以下載高清圖像,這符合國內用戶的使用習慣。但在海外市場,IP控制下的機構訂閱使用仍是最佳選擇。通過服務器架設與IP設定,抗戰文獻平台便可以給海外各高校提供更加穩定的訪問體驗與個性化服務。再者,學術顧問團隊與技術團隊的深度合作模式有待加強。隻有在深度合作情境下,數據庫才能兼顧學術前沿價值與技術革新能力,做到學術資源與技術呈現的無縫接軌。數字人文的高速發展能否持續,關鍵在於解決這一問題,而其基礎又是學科界限的打破與復合型人才的培養。

數字人文時代的史料共享與講好中國故事

此次年會的另一個重要主題是“開放共享”。在互聯網與移動通訊時代,信息的傳播與獲取基本已不再受地域與時效的影響﹔同樣,人文學科領域數字化資源的開放獲取也是不可阻擋的趨勢。“數字人文”的出現本身帶有兩層期許:一是資料的“結構化”處理,例如搜索、排列乃至高級的邏輯分析,皆是“結構化”的表現﹔二是資料不限地域快速獲取,假如投入大量成本建設的數據庫隻供“閉門”使用,或需要支付高昂使用費才能“一睹芳容”,這不僅不符合“數字人文”的理念,更是一種巨大的資源浪費。抗戰文獻平台在籌備階段便確定了公開、公益、共享的理念,整合大量抗戰與近代中日關系相關史料,讓社會大眾近距離了解歷史、學習歷史,讓學者更便捷地獲取資料、促進研究。在此次年會上,抗戰文獻平台的開放共享理念與不懈實踐獲得了在場聽眾的贊許。一些北美的中國研究者表示,如果沒有開放便捷、內容豐富的數據庫,他們可能需要耗費精力申請高額資助才能遠涉重洋到中國查閱資料,而學術資助本身是“不平等”的,有多種因素的制約。對不少國外研究者而言,平等開放抗戰文獻平台不啻為一項“福利”。還有學者興奮地告訴項目組,他研究北京城市史多年,一直未能找尋到的北京地方小報,輾轉在抗戰文獻平台上尋獲,且能免費下載,這不僅節省了大量時間與金錢,也便於讓世界了解中國。

進一步言之,任何共享都是雙向的行為,數字人文共享也不例外。數字人文時代數據資源的“共享”不僅意味著資源獲取方(感興趣的社會公眾、目的性更明確的研究者)單方面實現更加便捷的獲取,更含有資源提供方(數據平台的整合者、提供者)向前者提供知識服務、汲取資源價值的優勢。抗戰文獻平台立項伊始,便旨在向用戶提供最優質的史學知識服務。如今面向海外用戶,抗日戰爭與近代中日關系相關史料整合與上線的過程,便是使封存在“史籍”中的文字、故事和精神“活起來”“走出去”的過程。通過多元整合、高質多量史料的數字呈現與跨越國界的共享,抗戰文獻平台有信心向世界講好中國故事。

2019年,中美建交已屆40周年。這段時間,美國挑起的貿易戰,使中美兩國互利互贏的合作前景蒙上了陰影。但是,全球化趨勢不可逆轉,人類命運共同體的願景也不可阻擋。其中,跨越國界的史料共享不僅是這一趨勢的體現,更有助於互相理解各自的民族歷史與記憶,尊重彼此自主選擇的社會制度和發展道路,從而在文化充分交流的基礎上,實現國與國之間平等互惠、和平友好的交往。為此,抗戰文獻平台願在數字人文、開放共享的時代浪潮下,貢獻綿薄之力。

(責編:孫爽、程宏毅)