舊版網站入口

站內搜索

清末民國社會調查數據庫建設的中期檢查報告【4】

2018年11月27日10:43來源:全國哲學社會科學工作辦公室

5.9書簽功能

書簽為用戶閱讀時可對當前頁增加取消書簽。

用戶再次進入閱讀時,可調出書簽列表,快速定位到書簽放置的頁面。

5.10批注及評論功能

可在閱讀頁面中用鼠標選取文字,則顯示“清除”“復制”“批注”“反饋”四個功能按鈕,如圖5-7所示。

圖5-7 批注及評論功能

清除:清除以往的批注﹔

與用戶綁定,隻可清除用戶自己的批注,管理員可清除所有批注。

復制:可復制文字到剪貼板(結合版權保護,復制字數可以控制)。

批注:可對選中的文字新建批注,並可選擇是否公開(選擇公開則變為評論)。

所示。

反饋:對選中的文字內容進行反饋。

二、調查研究及學術交流情況

(一)開題報告會

2016年3月27日上午9時,課題開題報告會在人民大學召開。來自中國人民大學、中國社會科學院、國家圖書館、北京大學、清華大學、北京師范大學、南開大學、福建教育出版社、上海精靈天下數字技術有限公司、中央民族大學、山西大學等單位的近30位專家學者以及課題組成員出席了會議。

北京師范大學朱漢國教授、中國社會科學院經濟所封越健教授、中國社會科學院近代史所金以林教授、北京師范大學歷史學院李志英教授、南開大學歷史學院李金錚教授以及清華大學社科科學學院經濟研究所龍登高教授擔任此次會議的評審專家。

人民大學洪大用副校長在致辭中表示,“清末民國社會調查數據庫建設”意義重大,它涉及社會學、經濟學、統計學、歷史學等多個學科,不僅有助於拓展史料、促進計量史學的發展,還有助於推動跨學科、跨學校的交流與合作。

(1)開題報告

首先,項目組首席專家黃興濤教授從該項目的學術追求、框架結構、研究方法、數據庫設計的重難點以及預期目標等方面,較為全面系統地介紹了項目的工作方案。他指出:清末民國興起了一種與傳統史料不同的新型史料——社會調查報告,這批史料數量很大,且對認知清末民國的中國社會狀況及現代社會學科如何被引入有很大的學術價值。這批材料數量過於龐大,紙質出版局限性較大,不過數據化時代的到來,使得我們可以通過建立數據庫的方式,來更充分地利用這批材料。申請本項目的目的即是要完成這一使命,也即在國內外已有研究和李文海、夏明方和黃興濤教授主編的《民國時期社會調查叢編》、《民國時期社會調查叢編》(二編、三編)基礎上,完成項目的第一期工程《清末民國社會調查索引》及包含5000萬字左右的數據庫。隨后,他詳細介紹了項目組的合作單位北京大學陳志武教授的團隊、上海精靈天下數字技術有限公司、國家圖書館、福建教育出版社的相關情況,以及子課題的負責人及分工。

在黃興濤教授報告完后,子課題負責人中國人民大學歷史學院夏明方教授、中國人民大學圖書館報刊部主任付小愛館員(受圖書館汪永紅書記兼副館長的委托),北京大學經濟學院的陳志武教授等,依次報告了各自的任務分工、前期准備和研究計劃:1.第二子課題組負責人汪永紅(委托中國人民大學圖書館報刊部主任付小愛館員發言)介紹了中國人民大學圖書館的紙質館藏資源、數據庫資源、館際互借服務以及對數據的存儲統計服務,分析了這些資源能如何為本項目提供文獻與技術支持。2.第三子課題組負責人夏明方教授首先談到了李文海老校長對於此項目前期工作曾經給予的支持,接著闡述了“清末民國社會調查數據庫建設”課題的緣由及意義,最后介紹了數據庫文獻的選擇范圍及如何進行數據庫的多維分類。3.第四子課題組負責人耶魯大學金融經濟學教授陳志武,用PPT界面展示了數據庫建設中全文檢索庫的建設構想及婚姻家庭專題庫的試點情況。

隨后,上海精靈天下數字技術有限公司負責人黃勍先生,從文檔的輸出格式、內容的編輯重組方法、數據庫后台的分類演示功能、版權保護等層面,對數據庫的技術實現方案進行了詳細的報告。

最后,福建教育出版社的負責人湯源生先生表示,將為課題組提供了《民國時期社會調查叢編》的數千萬字電子文獻。

(2)專家組評議

根據項目組成員工作進程,黃興濤教授、夏明方教授認為項目組成員的屬性表填寫預計三個月后完成,第一個月先交一份錄入表,如有任何問題再行調整。

(二) 屬性表錄入分工會議

2016年6月29日上午9時,由中國人民大學歷史學院黃興濤教授主持的國家社科基金重大項目“清末民國社會調查數據庫建設”屬性表分工會議,在中國人民大學清史所400會議室召開。上海精靈天下數字技術有限公司及課題組成員夏明方教授、邱志紅、李章鵬、伍婷婷、林展、陳鵬、杜佩紅等課題組成員參加了會議。會議由中國人民大學歷史學院林展講師主持,主要討論了數據庫建設屬性表錄入的分工及填寫要求。

項目負責人黃興濤教授介紹了數據庫建設的工作規劃,要求項目組成員的屬性表填寫在三個月內完成,第一個月先交一份錄入表,時間暫定為7月20號,如有任何問題再行調整。

經過項目組的內部討論,決定先以《民國時期社會調查叢編》為基礎,進行第一次數據庫的錄入工作,之后再以《民國時期社會調查叢編》(二編)為基礎進行錄入。中國人民大學清史所夏明方教授對屬性表的錄入進行了具體的分工,並表示:“屬性表是數據庫建設的基礎。將調查報告的內容進行屬性分類,對每一條數據進行屬性提取,再整理入庫,是十分關鍵的工作,希望每一位成員能認真完成”。

為了實現全文檢索,在多維分類表確立后,需要設置關鍵詞,進行錄入工作。上海精靈天下數字有限公司負責人高寶龍先生介紹了數據庫屬性表錄入要求:

(1)錄入編號命名規則:編號為12位數,前面4位為著錄者編號。錄入者編號為(邱志紅1001﹔伍婷婷1002﹔韓祥1003﹔陳鵬1004﹔李章鵬1005﹔杜佩紅1006﹔林展1007。中間三位表示《叢編》的卷號:一編為鄉村社會101,底邊社會102,城市(勞工)生活103,文教事業104,婚姻家庭105,宗教民俗106,少數民族107,人口108,社會組織109,社會保障110。二編為鄉村社會201,鄉村經濟202,城市(勞工)生活203,近代工業204,文教事業205,法政206,宗教民俗207,少數民族208,人口209,社會組織210,醫療衛生與社會保障211,華僑212。后面5位為調查編號。調查編號統一都從00001開始。

(2)調查形式分為兩部分:主要調查形式、調查形式。調查形式的分類為:問卷、實地調查、通訊、訪談、其他。

(3)時間格式:調查時間若有多個時間都要列出來,中間用英文分號隔開。

(4)調查地點分為:國、省、市、縣、縣以下。

(5)在“館藏地”一欄下增加“版本說明”。

(6)“備注”一項下移,原“備注”一項改為“該調查是否有表格”。

屬性表的內容在本課題開題時有一個初步的設計,在本次分工會議上,項目組又進過了仔細的討論,對屬性表做了優化調整。

(三) 數據庫建設進展報告會

2016年10月26日上午9時,由黃興濤教授主持的國家社科基金重大項目“清末民國社會調查數據庫建設”的數據庫建設進展報告會,在中國人民大學清史所400會議室召開。國家圖書館專家、上海精靈天下數字技術有限公司代表及課題組成員出席了本次會議。

會議由黃興濤教授主持,上海精靈天下數字有限公司的高寶龍先生介紹數據庫建設的總體情況,國家圖書館民國影印編輯室的李強主任及王濤助理擔任此次會議的評審專家。

會議首先由夏明方教授介紹了數據庫建設的總體要求和項目進度情況,夏明方教授明確了“數據庫建設預計在2016年年底完成一個基本雛形,2017年將數據庫中的調查全部錄入到數據庫中”。

(1)數據庫建設進展

隨后,上海精靈天下數字技術有限公司的高寶龍先生從數據庫的封面、檢索界面、閱讀器界面、專題閱讀界面進行了全方位展示。如下圖:

圖1.數據庫封面

圖2.檢索頁面

圖3.高級檢索頁面

圖4.閱讀頁面

(2)問題及意見

國家圖書館民國影印編輯室的李強主任、王濤助理及中國人民大學清史所夏明方教授對數據庫建設情況針對數據庫的建設情況進行了評議,指出了數據庫建設中存在的一些問題及修改意見:

閱讀器:

(a)原稿圖片與文字的風格太接近,容易讓人混淆,需要把文字的字體進行調整,以示區分。

(b)閱讀器左邊固定為原稿圖,右邊固定為文本抄錄(如遇抄錄一頁顯示不夠,則增加橫向滾動條)。單擊按鈕,全書應該隻顯示抄錄文本不顯示原稿圖﹔雙擊按鈕,則全書應該隻顯示原稿圖不顯示抄錄文字﹔再點擊按鈕,則顯示圖文對照。

(c)閱讀器中,“反饋”改為“糾錯”。

(責編:孫爽、閆妍)