一、研究进展情况
一、研究计划总体执行情况及各子课题进展情况
自2016年3月开题以来,至2018年6月,课题组已基本搭建起较为完整的数据库框架,完成了总容量约为18G(一G为1024M)的清末民国社会调查数据库。现在数据库中已经有约3200万字全文数据库、300万字原始文献库。在项目首席专家黄兴涛教授的带领下,课题组团队紧密合作,积极推进相关工作,总体完成进度已接近项目预计工作量的60%,项目进展顺利。目前数据库各子课题已经取得的进展如下:
子课题1已对清末民国社会调查中调查的概念、调查活动的背景、调查的性质进行了深入分析,课题组成员讨论“清末民国社会调查数据库建设价值”的论文《新世纪中国的史料整理与人文社会科学研究》已发表在《光明日报》理论版,受到学界关注。在此基础上,子课题1根据调查报告的特点以及历史学和其他社会科学学者的需求,设计出了数据库的总体结构和功能属性,已经初步搭建好数据库的基础架构,数据库平台建设预计可在2019年上半年完成。
子课题2依据子课题3编制的文献目录索引,查找、复制了原始社会调查文献约近18G,建立了规模为300万字的原始文献库,上述原始文献已基本被扫描并转变为pdf格式,并导入到原始文献库中与全文数据库一一对应。
子课题3已完成原始社会调查文献目录索引的编制(约50万字),包括调查文献的名称、类型、调查时间、调查地点、调查主体、调查内容、出版机构、出版时间以及文献来源等各类信息。该索引根据社会调查的内容,将社会调查分为“综合”、“环境”、“政治”、“经济”、“军事”、“法律”、“社会”、“宗教”、“文化”、“教育”、“民族”、“华侨”、“社会调查理论与方法”十三大类,每大类又根据文献条目之多少逐级细分(不论分成几个层级,其最后一级分类所在条目,均按著作或刊布时间依序排列)。有些类别条目较多,但涉及不同地区,则一般以地域予以分类。其中“综合类”调查,主要指对某一特定地区的综合性调查,涉及自然环境、政治、经济、社会、文化等诸多方面。为便于检索,据其调查范围之大小,分为“全国及跨省区”、“省域”、“县域”、“城镇”、“村落”、以及包括“铁路沿线”等其他小类。“环境”类调查,主要包括“环境概况”、“资源”、“灾害”等几个方面。其中“资源”包括“气象与气候”、“地质”、“矿产”、“土壤与水资源”、“生物”(含森林植被、动物等)、“物产”等;“灾害”指的是水、旱、蝗、震以及传染性疾病等各类灾害。其他各类情况,概述如下:政治——政治概况、国家行政、地方行政、基层自治、对外关系等;经济——经济概况、农业、手工业及工业、商业、财政、金融与经济关系、经济组织等;军事——军事概况、武装力量、战争、后勤;法律——法律概况、司法体制、司法行为、民商事习惯;社会——社会概况、人口、婚姻与家庭、社会阶层、社会组织、社会问题与社会运动、风俗习惯、医疗卫生、社会保障等;宗教——宗教概况、佛教、道教、基督教、伊斯兰教、民间宗教;文化——文化概况、新闻、出版、文艺、体育、文博、其他;教育——教育概况、各类教育、教育管理、教学内容与方法、师资队伍、学生学习与生活等;民族——民族概况、族别;华侨——华侨概况、国内华侨、海外华侨。
目前,子课题3已开始着手建立清末民国社会调查基本信息库,编纂出版国内外第一部有关清末民国社会调查文献的大规模专门性目录索引——《民国社会调查目录索引》及《清末社会调查资料集》。子课题3已与上海图书馆合作,利用社会调查的关键词如“调查、统计、概况、研究、踏查、考察、考查、视察、旅行、个案、分析、普查、清查、估计、报告、指数、社区、测验、参观、情形、事情、状况、年鉴、抽样、选样、样本、人种、民族志、民族研究、惯行、观察、清丈、查田、登记、比较、豫察、勘察、实地、田野(原野)、现状、观感、查察、试验、查视、视学、实况”等等,检索出调查条目1069371条。
子课题4通过将数据输入、校核与处理,将原始文献转换为word格式,搭建起完整的全文数据库,已完成项目规划(共5000万字)的全文检索库。目前,数据库基本能够实现项目规划的绝大部分功能。同时子课题4也完成了婚姻家庭专题应用库的表格录入工作,后期将对社会调查中的数据进行编码和重组,然后进行统计分析或绘制地图,实现可视化和量化分析。
数据库内容和功能展示
作为数据库项目,本课题的中期成果和最终成果主要是数据库,下面对已经初步完成的数据库的结构、内容和功能进行展示。这里展示的主要是前端的主要功能,部分一般数据库都有的常见功能未列出,后端的管理平台,由于仍在完善,也没有列出。下面首先列出展示内容目录,然后是详细的展示。
目 录
1.结构化导航(专题阅览)
1.1主题呈现
1.2自由外部链接
2.检索功能
2.1全文检索
2.2高级检索
3.分类导航(多维分类)
3.1多维度交叉导航
3.2主维度切换
3.3筛选条件
4.云书房
5.阅读
5.1流式排版
5.2接排功能
5.3翻页方式
5.4目录
5.5切换大图
5.6图文对照
5.7字号调节
5.8日夜模式切换
5.9书签功能
5.10批注及评论功能
1.结构化导航(专题阅览)
结构化专题阅览是本系统的主页面。
1.1主题呈现
可以结合深度聚合化的阅读体验,挑选不同类型的调查,以主题化的形式对某些内容进行整合、重组,推送到前端。
本数据库设计的专题包括“综合”、“环境”、“政治”、“经济”、“军事”、“法律”、“社会”、“宗教”、“文化”、“教育”、“民族”、“华侨”、“社会调查理论与方法”等共13个专题,如图1-1所示。
图1-1主题呈现
![]() |