旧版网站入口

站内搜索

清末民国社会调查数据库建设中期检查报告

2017年12月08日13:21来源:全国哲学社会科学工作办公室

一、 研究进展情况

1、课题开题与子课题进展情况

自2016年3月开题以来,至2017年7月,课题组已经基本搭建起较为完整的数据库架构,完成了总容量约为8个G(一个G为1024M)的清末民国社会调查数据库。现在数据库中已经有约2000万字全文数据库、300万字原始文献库。另外,课题组还完成了约50万字的文献目录索引,以及“婚姻家庭”专题数据库的表格录入工作。总体完成进度已经接近项目预计工作量的一半,项目进展顺利。

子课题1已经对清末民国社会调查中调查的概念、调查活动的背景、调查的性质进行了深入分析。在此基础上,已经根据调查报告的特点以及历史学和其他社会科学学者的需求,设计出了数据库的总体结构和功能;并对数据库的建立制定了可行性方案和具体操作方案。在此基础上,已经初步搭建好数据库的基础架构。

子课题2依据子课题3编制的文献目录索引提供的信息,查找、复制了原始社会调查文献,已经建立了规模为300万字的原始文献库。上述原始文献已经被扫描并转变为pdf格式,同时已经导入到原始文献库中与全文数据库一一对应。

子课题3已经完成约50万字的原始社会调查文献目录索引的编制,包括调查文献的名称、类型、调查时间、调查地点、调查主体、调查内容以及出版机构、出版时间以及文献来源等各类信息。该索引根据社会调查的内容,将社会调查分为“综合”、“环境”、“政治”、“经济”、“军事”、“法律”、“社会”、“宗教”、“文化”、“教育”、“民族”、“华侨”、“社会调查理论与方法”十三大类,每大类又根据文献条目之多少逐级细分,且不论分成几个层级,其最后一级分类所在条目,均按著作或刊布时间依序排列。有些类别条目较多,但涉及不同地区,则一般以地域予以分类。其中“综合类”调查,主要指对某一特定地区的综合性调查,涉及自然环境、政治、经济、社会、文化等诸多方面,不论这一地域,是一个村庄,市镇,还是省县行政区,或是港口、铁路沿线等地。为便于检索,据其调查范围之大小,分为“全国及跨省区”、“省域”、“县域”、“城镇”、“村落”、以及包括“铁路沿线”等其他小类。“环境”类调查,主要包括“环境概况”、“资源”、“灾害”等几个方面。其中“资源”包括“气象与气候”、“地质”、“矿产”、“土壤与水资源”、“生物”(含森林植被、动物等)、“物产”等;“灾害”指的是水、旱、蝗、震以及传染性疾病等各类灾害。其他各类情况,概述如下:政治——政治概况、国家行政、地方行政、基层自治、对外关系等;经济——经济概况、农业、手工业及工业、商业、财政、金融与经济关系、经济组织等;军事——军事概况、武装力量、战争、后勤;法律——法律概况、司法体制、司法行为、民商事习惯;社会——社会概况、人口、婚姻与家庭、社会阶层、社会组织、社会问题与社会运动、风俗习惯、医疗卫生、社会保障等;宗教——宗教概况、佛教、道教、基督教、伊斯兰教、民间宗教;文化——文化概况、新闻、出版、文艺、体育、文博、其他;教育——教育概况、各类教育、教育管理、教学内容与方法、师资队伍、学生学习与生活等;民族——民族概况、族别;华侨——华侨概况、国内华侨、海外华侨。

子课题4已经建立了约2000万字的全文检索库,通过将数据输入、校核与处理,通过将原始文献转换为word格式,从而建立了完整的全文数据库。已经完成项目规划4000万字的50%。上述内容已经全部导入到数据库之中,目前,数据库已经能够基本实现项目规划的绝大部分功能。

子课题4同时也已经完成了婚姻家庭专题应用库的表格录入工作,后期将对社会调查中的数据进行编码和重组,然后进行统计分析或绘制地图,实现可视化和量化分析。

2、调查研究及学术交流情况

1、开题报告会

2016年3月27日上午9时,课题开题报告会在人民大学召开。来自中国人民大学、中国社会科学院、国家图书馆、北京大学、清华大学、北京师范大学、南开大学、福建教育出版社、上海精灵天下数字技术有限公司、中央民族大学、山西大学等单位的近30位专家学者以及课题组成员出席了会议。

北京师范大学朱汉国教授、中国社会科学院经济所封越健教授、中国社会科学院近代史所金以林教授、北京师范大学历史学院李志英教授、南开大学历史学院李金铮教授以及清华大学社科科学学院经济研究所龙登高教授担任此次会议的评审专家。

人民大学洪大用副校长在致辞中表示,“清末民国社会调查数据库建设”意义重大,它涉及社会学、经济学、统计学、历史学等多个学科,不仅有助于拓展史料、促进计量史学的发展,还有助于推动跨学科、跨学校的交流与合作。

2、课题组落实评审专家意见会议

为了落实开题报告会各位评审专家的意见和建议,课题组全体成员于2016年3月27日下午2:00-4:00在中国人民大学清史研究所会议室召开了项目组讨论会,在黄兴涛教授、夏明方教授的主持下,曹新宇、伍婷婷、林展、陈鹏、韩祥等课题组成员针对评审专家的意见,深入讨论了数据库设计中的属性表及多维分类表问题,对原有的设计计划、课题组的工作进度及子课题的成员分工做出了相应的调整,并具体部署了近期的有关工作。

3、属性表录入分工会议

2016年6月29日上午9时,由中国人民大学历史学院黄兴涛教授主持的国家社科基金重大项目“清末民国社会调查数据库建设”属性表分工会议,在中国人民大学清史所400会议室召开。上海精灵天下数字技术有限公司及课题组成员夏明方教授、邱志红、李章鹏、伍婷婷、林展、陈鹏、杜佩红等课题组成员参加了会议。会议由中国人民大学历史学院林展讲师主持,主要讨论了数据库建设属性表录入的分工及填写要求。

4、数据库建设进展报告会

2016年10月26日上午9时,由黄兴涛教授主持的国家社科基金重大项目“清末民国社会调查数据库建设”的数据库建设进展报告会,在中国人民大学清史所400会议室召开。国家图书馆专家、上海精灵天下数字技术有限公司代表及课题组成员出席了本次会议。

5、属性表填写进展情况汇报会议

2016年11月7日下午14时,由中国人民大学历史学院黄兴涛教授主持的国家社科基金重大项目“清末民国社会调查数据库建设”属性表分工会议,在中国人民大学清史所400会议室召开。课题组录入成员邱志红、李章鹏、伍婷婷、林展、陈鹏、韩祥、杜佩红参加了会议。会议由中国人民大学历史学院林展讲师主持,议题包括属性表录入的进展情况汇报及数据录入中的问题。

6、“数字人文”与清史研究学术会议

2016年5月28-29日,课题组与中国人民大学《清史研究》编辑部在北京合作举办了“数字人文与清史研究”学术会议。来自北京大学、中国人民大学、中国社科院、北京师范大学、复旦大学、陕西师范大学、上海交通大学、河南大学、苏州大学、南京师范大学以及香港科技大学、耶鲁大学、哈佛大学、台北“中研院”等海内外14家学术单位的30余位专家学者参加了本次工作坊。

课题组首席专家黄兴涛教授在工作坊上指出,数字人文发展在目前史学研究中所代表的开创意义,在某种程度上构成了梁启超百年前所提出“新史学”新的起点。历史学者应该积极发挥作用,做出一些具有示范性的、典型的数据库。数据库的建设使史学站在了一个新的高点,其资料、视野的广阔性有助于克服目前史学研究中“碎片化”的倾向。大家要紧紧抓住史学的本质,即“反思性的再现过去和反思过去”的基础上做出高质量的数据库,推进史学的进一步发展。

课题组成员林展向与会专家介绍了本课题的总体规划和设计,得到与会专家的指导和好评。

3、学术会议与学术交流活动

除了上述会议外,课题组与上海精灵天下数字技术有限公司就数据库建设相关的问题就行了12次沟通会议。

另外,项目组成员林展两次被中国社会科学院近代史研究所邀请,介绍本课题的进展和相关经验。

4、成果宣传推介情况

本项目在推进过程中,通过中国人民大学科研处共计上报两期工作简报:

2016年4月《工作简报》第1期

2017年1月《工作简报》第2期

二、 研究成果情况

1、黄兴涛、李章鹏:《现代统计知识和观念的传入与清末新史学》,《史学史研究》2016年第3期。

本文对于现代统计知识和观念传入中国的过程进行了系统梳理。为“清末民国社会调查数据库”结构的搭建提供了重要的背景知识和理论支撑。

文章发现,在1897年之前,以具体统计事例为载体的西方统计知识和统计观念已经传入中国,1897年后,经日本消化吸收的社会统计学理论开始系统地引入,这对清末和民国统计的影响广泛而深远。清末时,梁启超等人把统计材料汇编为历史,陈黻宸等人明确主张以统计法来研究和表述历史,他们固然受到西方史学理论的影响,但现代统计知识、观念和外来成果所施予的直接刺激也不容忽视。

清末时已有人在史书编纂、地方志纂修和具体历史问题研究方面,尝试使用统计分析法,这构成为清末中国新史学有机的组成部分。可以说,“历史统计学”的有关意识和实践,在当时已经悄然酝酿、生发。只不过,清末尚没有人明确提出“历史统计学”的概念。这一任务直到20世纪20年代才由梁启超、丁文江等人大体完成。清末学人在使用统计图表分析历史问题时,绝大多数都还没有真正重视起数字,更没有产生如何以精确的数字科学有效地分析和表述历史的普遍观念和系统见解。这是其明显不足。实际上,清末民初时的中国史学,还远不具备重视量化统计分析的社会文化基础。甚至迄今,我们的史学在这方面仍有很多的课要补、很长的路要走。

2、林展:《新世纪中国的史料整理与人文社会科学研究 ——以<民国时期社会调查丛编>为例》,《光明日报》2016年4月6日第14版。

本文以《民国时期社会调查丛编》为例,讨论了新世纪史料整理的重要性,以及建立“清末民国社会调查”数据库的必要性。

文章认为,史料不仅是史学研究的基础,也是众多人文社会科学研究的重要基础。20世纪初梁启超倡导的新史学,如果脱离了史料的发掘整理,将是难以想象的。新世纪以来我国的史料整理工作,虽然借助于计算机与网络技术,呈现出异乎寻常的突飞猛进态势,但总体来说,并不尽如人意。一个突出的特点是,影印出版的史料大幅度增长,而经过历史学者核对、比勘、系统分类的史料整理相对减少。这一现象对历史学乃至整个人文社会科学可能产生的负面影响,迄今也没有得到足够重视。

难能可贵的是,尽管现行科研评价体制对史料整理工作并没有给予足够的重视和支持,但仍有少数富有远见、不畏艰难的学者,基于对学术研究规律的信念,投身到大规模史料的系统整理工作之中,并对历史学研究乃至其他人文社会学科带来积极的影响。《民国时期社会调查丛编》(以下简称《丛编》)系列就是其中的一个显例。

我们发现,《丛编》在他引方面呈现下面的特征。其一是总体引用次数比较高,据不完全统计,从2005年至2014年,累计引用数量接近1000次。其二,引用次数呈现逐年升高的趋势。其三,影响的范围广,除中国大陆地区外,中国台湾地区、日本、美国、澳大利亚等地都有学术著作引用,涉及学科包括历史学、社会学、政治学、教育学、经济学、心理学等。就期刊而论,自2005年至2014年,引用《丛编》的期刊论文一共有289篇,分布在199种期刊上。

这表明,以《丛编》为代表的专业化史料整理工作,具有重要的学术价值。当然,现有的专业化史料整理工作也存在局限性,比如出版成本高、周期长、容量有限、难以进行原文对照、无法进行全文检索等。有鉴于此,专业化史料整理工作需要在历史学者专业知识的基础上,充分利用计算机技术,建设大规模集成式的历史数据库,从而为国内外同行搭建一个重要的基础性资料平台。

课题组供稿 

(责编:王瑶)