旧版网站入口

站内搜索

清末民国社会调查数据库建设的中期检查报告【4】

2018年11月27日10:43来源:全国哲学社会科学工作办公室

5.9书签功能

书签为用户阅读时可对当前页增加取消书签。

用户再次进入阅读时,可调出书签列表,快速定位到书签放置的页面。

5.10批注及评论功能

可在阅读页面中用鼠标选取文字,则显示“清除”“复制”“批注”“反馈”四个功能按钮,如图5-7所示。

图5-7 批注及评论功能

清除:清除以往的批注;

与用户绑定,只可清除用户自己的批注,管理员可清除所有批注。

复制:可复制文字到剪贴板(结合版权保护,复制字数可以控制)。

批注:可对选中的文字新建批注,并可选择是否公开(选择公开则变为评论)。

所示。

反馈:对选中的文字内容进行反馈。

二、调查研究及学术交流情况

(一)开题报告会

2016年3月27日上午9时,课题开题报告会在人民大学召开。来自中国人民大学、中国社会科学院、国家图书馆、北京大学、清华大学、北京师范大学、南开大学、福建教育出版社、上海精灵天下数字技术有限公司、中央民族大学、山西大学等单位的近30位专家学者以及课题组成员出席了会议。

北京师范大学朱汉国教授、中国社会科学院经济所封越健教授、中国社会科学院近代史所金以林教授、北京师范大学历史学院李志英教授、南开大学历史学院李金铮教授以及清华大学社科科学学院经济研究所龙登高教授担任此次会议的评审专家。

人民大学洪大用副校长在致辞中表示,“清末民国社会调查数据库建设”意义重大,它涉及社会学、经济学、统计学、历史学等多个学科,不仅有助于拓展史料、促进计量史学的发展,还有助于推动跨学科、跨学校的交流与合作。

(1)开题报告

首先,项目组首席专家黄兴涛教授从该项目的学术追求、框架结构、研究方法、数据库设计的重难点以及预期目标等方面,较为全面系统地介绍了项目的工作方案。他指出:清末民国兴起了一种与传统史料不同的新型史料——社会调查报告,这批史料数量很大,且对认知清末民国的中国社会状况及现代社会学科如何被引入有很大的学术价值。这批材料数量过于庞大,纸质出版局限性较大,不过数据化时代的到来,使得我们可以通过建立数据库的方式,来更充分地利用这批材料。申请本项目的目的即是要完成这一使命,也即在国内外已有研究和李文海、夏明方和黄兴涛教授主编的《民国时期社会调查丛编》、《民国时期社会调查丛编》(二编、三编)基础上,完成项目的第一期工程《清末民国社会调查索引》及包含5000万字左右的数据库。随后,他详细介绍了项目组的合作单位北京大学陈志武教授的团队、上海精灵天下数字技术有限公司、国家图书馆、福建教育出版社的相关情况,以及子课题的负责人及分工。

在黄兴涛教授报告完后,子课题负责人中国人民大学历史学院夏明方教授、中国人民大学图书馆报刊部主任付小爱馆员(受图书馆汪永红书记兼副馆长的委托),北京大学经济学院的陈志武教授等,依次报告了各自的任务分工、前期准备和研究计划:1.第二子课题组负责人汪永红(委托中国人民大学图书馆报刊部主任付小爱馆员发言)介绍了中国人民大学图书馆的纸质馆藏资源、数据库资源、馆际互借服务以及对数据的存储统计服务,分析了这些资源能如何为本项目提供文献与技术支持。2.第三子课题组负责人夏明方教授首先谈到了李文海老校长对于此项目前期工作曾经给予的支持,接着阐述了“清末民国社会调查数据库建设”课题的缘由及意义,最后介绍了数据库文献的选择范围及如何进行数据库的多维分类。3.第四子课题组负责人耶鲁大学金融经济学教授陈志武,用PPT界面展示了数据库建设中全文检索库的建设构想及婚姻家庭专题库的试点情况。

随后,上海精灵天下数字技术有限公司负责人黄勍先生,从文档的输出格式、内容的编辑重组方法、数据库后台的分类演示功能、版权保护等层面,对数据库的技术实现方案进行了详细的报告。

最后,福建教育出版社的负责人汤源生先生表示,将为课题组提供了《民国时期社会调查丛编》的数千万字电子文献。

(2)专家组评议

根据项目组成员工作进程,黄兴涛教授、夏明方教授认为项目组成员的属性表填写预计三个月后完成,第一个月先交一份录入表,如有任何问题再行调整。

(二) 属性表录入分工会议

2016年6月29日上午9时,由中国人民大学历史学院黄兴涛教授主持的国家社科基金重大项目“清末民国社会调查数据库建设”属性表分工会议,在中国人民大学清史所400会议室召开。上海精灵天下数字技术有限公司及课题组成员夏明方教授、邱志红、李章鹏、伍婷婷、林展、陈鹏、杜佩红等课题组成员参加了会议。会议由中国人民大学历史学院林展讲师主持,主要讨论了数据库建设属性表录入的分工及填写要求。

项目负责人黄兴涛教授介绍了数据库建设的工作规划,要求项目组成员的属性表填写在三个月内完成,第一个月先交一份录入表,时间暂定为7月20号,如有任何问题再行调整。

经过项目组的内部讨论,决定先以《民国时期社会调查丛编》为基础,进行第一次数据库的录入工作,之后再以《民国时期社会调查丛编》(二编)为基础进行录入。中国人民大学清史所夏明方教授对属性表的录入进行了具体的分工,并表示:“属性表是数据库建设的基础。将调查报告的内容进行属性分类,对每一条数据进行属性提取,再整理入库,是十分关键的工作,希望每一位成员能认真完成”。

为了实现全文检索,在多维分类表确立后,需要设置关键词,进行录入工作。上海精灵天下数字有限公司负责人高宝龙先生介绍了数据库属性表录入要求:

(1)录入编号命名规则:编号为12位数,前面4位为著录者编号。录入者编号为(邱志红1001;伍婷婷1002;韩祥1003;陈鹏1004;李章鹏1005;杜佩红1006;林展1007。中间三位表示《丛编》的卷号:一编为乡村社会101,底边社会102,城市(劳工)生活103,文教事业104,婚姻家庭105,宗教民俗106,少数民族107,人口108,社会组织109,社会保障110。二编为乡村社会201,乡村经济202,城市(劳工)生活203,近代工业204,文教事业205,法政206,宗教民俗207,少数民族208,人口209,社会组织210,医疗卫生与社会保障211,华侨212。后面5位为调查编号。调查编号统一都从00001开始。

(2)调查形式分为两部分:主要调查形式、调查形式。调查形式的分类为:问卷、实地调查、通讯、访谈、其他。

(3)时间格式:调查时间若有多个时间都要列出来,中间用英文分号隔开。

(4)调查地点分为:国、省、市、县、县以下。

(5)在“馆藏地”一栏下增加“版本说明”。

(6)“备注”一项下移,原“备注”一项改为“该调查是否有表格”。

属性表的内容在本课题开题时有一个初步的设计,在本次分工会议上,项目组又进过了仔细的讨论,对属性表做了优化调整。

(三) 数据库建设进展报告会

2016年10月26日上午9时,由黄兴涛教授主持的国家社科基金重大项目“清末民国社会调查数据库建设”的数据库建设进展报告会,在中国人民大学清史所400会议室召开。国家图书馆专家、上海精灵天下数字技术有限公司代表及课题组成员出席了本次会议。

会议由黄兴涛教授主持,上海精灵天下数字有限公司的高宝龙先生介绍数据库建设的总体情况,国家图书馆民国影印编辑室的李强主任及王涛助理担任此次会议的评审专家。

会议首先由夏明方教授介绍了数据库建设的总体要求和项目进度情况,夏明方教授明确了“数据库建设预计在2016年年底完成一个基本雏形,2017年将数据库中的调查全部录入到数据库中”。

(1)数据库建设进展

随后,上海精灵天下数字技术有限公司的高宝龙先生从数据库的封面、检索界面、阅读器界面、专题阅读界面进行了全方位展示。如下图:

图1.数据库封面

图2.检索页面

图3.高级检索页面

图4.阅读页面

(2)问题及意见

国家图书馆民国影印编辑室的李强主任、王涛助理及中国人民大学清史所夏明方教授对数据库建设情况针对数据库的建设情况进行了评议,指出了数据库建设中存在的一些问题及修改意见:

阅读器:

(a)原稿图片与文字的风格太接近,容易让人混淆,需要把文字的字体进行调整,以示区分。

(b)阅读器左边固定为原稿图,右边固定为文本抄录(如遇抄录一页显示不够,则增加横向滚动条)。单击按钮,全书应该只显示抄录文本不显示原稿图;双击按钮,则全书应该只显示原稿图不显示抄录文字;再点击按钮,则显示图文对照。

(c)阅读器中,“反馈”改为“纠错”。

(责编:孙爽、闫妍)