舊版網站入口

站內搜索

羅敏:抗戰文獻數據平台的使命與擔當

羅敏2020年09月01日11:01來源:中國社會科學報國家社科基金專刊

作者系國家社科基金抗日戰爭研究專項“抗日戰爭與近代中日關系文獻數據平台”課題組成員、中國歷史研究院近代史研究所研究員

為貫徹落實習近平總書記關於抗日戰爭史研究的重要講話精神,國家社科基金2015年啟動實施了抗日戰爭研究專項工程,批准由中國社會科學院、國家圖書館及國家檔案局牽頭,中國社會科學院近代史研究所承辦“抗日戰爭與近代中日關系文獻數據平台”(以下簡稱“抗戰文獻數據平台”)。在抗日戰爭史研究更加綜合、更具全球視野的當下,抗戰文獻數據平台不僅運用現代科學技術,創新抗戰史研究的手段、方法、載體,同時注重發揮互聯網等現代傳媒在人們工作和生活中的獨特作用,在深入挖掘抗戰史料,弘揚紅色歷史文化,推動學術產品服務社會等方面不斷開拓進取。

收集海量史料 弘揚紅色文化

抗戰文獻數據平台堅持“匯多庫於一”融合發展模式,涵蓋檔案、圖書、報紙、期刊、圖片、音頻、視頻、研究性著作等。截至2020年6月底,平台已上線報紙1000余種,期刊將近3200種,圖書54875冊,新上線圖書12000余冊,此外還包括檔案、圖片、音頻、視頻等資料,文獻總量已突破2500萬頁。抗戰文獻數據平台預計在建黨100年的光輝時刻,將文獻資源總量提升至3200萬頁,超過日本的“亞洲歷史資料中心”,成為東亞乃至整個太平洋地區規模最大、開放度最高的公益文獻平台。

與目前海內外同類數據庫相比,抗戰文獻數據平台的近代報紙文獻庫特色突出。平台上線近代報紙逾千種,已基本囊括了近代中國大部分主流報紙,在國內同類數據庫中處於領先水平。近代中國的四種“大報”——《申報》《大公報》《益世報》與《民國日報》均已上線,近代上海出版的各類小報、畫報,包括《福爾摩斯》《金鋼鑽》等也已經可以在線閱覽下載。地方報紙的大量上線,是抗戰文獻數據平台報紙庫的一大特色。這些地方報紙分布在中國許多中小城市,而非省會城市,更能體現出地域性與市民生活的面相,例如《徽州日報》(安徽屯溪)、《嘉陵江日報》(四川巴縣)、《新民日報》(河南許昌)、《新民日報》(安徽貴池)等。這些地方報紙的上線,為深化近代中國地域史、社會史研究提供了極具價值的史料來源。

抗戰文獻數據平台另一重要特色,是特別推出紅色文獻專題數據庫,放在平台首頁顯著位置。抗戰文獻數據平台推出近200種紅色文獻,其中既有抗戰時期各根據地編印的圖書,也有《紅色中華》《解放日報》《晉綏日報》等著名紅色報刊。平台還征集到美國哥倫比亞大學東亞圖書館珍藏的“卡爾遜檔案”的全部電子版。紅色文獻專題數據庫體現了抗戰文獻數據平台的公益性質和時代價值,是平台宣傳紅色文化的重要陣地。

目前,抗戰文獻數據平台已與上海交通大學戰爭審判與世界和平研究院實現資料對接,共享呈現。東京審判研究中心向抗戰文獻數據平台提供了東京審判的庭審記錄、証據文獻和詢問記錄等八萬件頁檔案文獻,供全球的平台用戶免費閱覽和下載。遠東國際軍事法庭庭審記錄從起訴書到判決書,其中包括大量的証人証詞、控辯雙方的發言記錄。平台向公眾開放這一史料,不僅有力地揭露了侵華戰爭期間日軍的暴行,同時也再現了國際反法西斯陣線為維護世界和平做出的努力,有利於破除日本右翼勢力對歷史的歪曲。此類文獻共享合作日漸增多,將有助於打破史料壁壘,避免數據庫重復建設,推動可持續發展的學術生態建設。

堅持技術驅動 優化閱讀體驗

數據呈現方面,抗戰文獻數據平台建立了國內以“服務平台使用者”為宗旨,全面開發前台檢索與閱覽、后台著錄與導入功能。實現了圖書、檔案、期刊、報紙、輿圖、音視頻、圖片等不同類型文獻的“同台展現”。與此同時,該平台還攻克了多個參與單位后台文獻的並行管理、多種類文獻的平台兼容、使用者與平台的信息交互等重大技術難題,創新性地實現了檢索結果多個關鍵詞疊加、圖書章節精准檢索、報紙萬年歷切換、文獻內容同頁面摘錄等功能。該平台充分合理地利用版面,通過賞心悅目的頁面和方便快捷的功能,方便讀者搜索、閱覽和互動交流。

在數據可視化上,抗戰文獻數據平台嘗試引入國際上流行並成為標准的IIIF(國際圖像互操作性框架)技術,是為電子書籍、手稿、地圖等專門研發的高清圖片傳輸及查看技術。集成IIIF后,在平台閱覽超高清圖片更加流暢清晰,並且與國際標准接軌。此外,本次迭代更新提供文獻數據可視化展示的功能。基於本平台產生的業務數據,增加時間、地圖上的可視化展示的功能,用戶可更加直觀了解搜索結果在時間軸上的分布,以及出版社等地點信息在地圖空間上的分布。

數據共享方面,抗戰文獻數據平台依托其業界領先的技術實力,供全球學界開放使用。抗戰文獻數據平台依托近代史研究所信息中心、圖書館、檔案館,在設計中廣泛征詢各級圖書館、檔案館、文博系統開發、開放的數據平台,並參考商業運營的數據庫,逐步完善電子文獻技術標准和著錄標准。本平台可提供完善的數據制作技術標准。這套著錄標准已經成為近代史學界的一個標杆。抗戰文獻數據平台可以將著錄標准平台無償提供給各學術機構,也可以協助學術機構完成文獻的電子化,導入本平台,免費開放給學界。

數據錄入方面,平台不僅針對中國近現代史的學科特點,制定了不同類型文獻的數據庫著錄標准,而且還探索出了一套業內領先的文獻著錄形式。平台開發的雲著錄系統具有在線著錄、在線審校、人圖分離等方面的特色,提高了著錄的效率與准確性,也便於審核與查驗,是文獻著錄領域的重大創新。

新冠肺炎疫情發生以來,平台的公益性、便捷性和專業性得到了更多研究者和歷史專業學生的廣泛好評。平台訪問量急劇攀升。2020年4月訪問人次近2萬,較去年同時期增長53.2%﹔訪問量達到50萬次,較去年同時期增長56.8%。2020年1月至4月,平台訪問人次達到6.5萬,訪問量總計18萬余次。

此外,抗戰文獻數據平台在全球多地產生了不小的影響力。日本、美國、加拿大、澳大利亞、英國、韓國、俄羅斯、新加坡、德國、法國均有不少研究者利用平台,研究中國近現代史。抗戰文獻數據平台的全球訪問人數近萬人次,全球訪問點擊量達到12萬余次。抗戰文獻數據平台用專業准確的史料與數據,使塵封在“史籍”裡的中國人民的抗戰故事、抗戰精神重新被發現,向世界傳播中國的立場與觀點。

新時代的歷史學必須有面向科技、面向公眾、面向未來的新氣象。研究者必須跨出研究的小圈子,利用互聯網、大數據等信息手段,推出更新更好的研究成果,並在歷史教育、歷史宣傳、歷史普及等方面發揮更大作用,履行更多責任。

(責編:孫爽、宋美琪)