一、研究进展情况
主要内容:
总体进展情况
当前我国人口发展进入深度转型阶段,人口自身的安全以及人口与经济、社会等外部系统关系的平衡都将面临不可忽视的问题和挑战,加强我国历史人口数据梳理和人口发展战略研究,深刻把握我国人口发展变化的历史规律对积极应对人口问题,促进人口政策和相关经济社会政策配套衔接等具有重要价值。
自课题研究工作启动至今,“中国人口数据综合集成应用平台建设(1949-2015)”课题已经完成研究计划中设定的阶段性任务,并在基础资料收集、指标评估与调整、数据深入分析、平台建设与可视化、研究成果交流与推广五个方面均取得阶段性进展,为研判我国人口发展变化的趋势与特点,推动人口发展战略及健康中国建设提供了数据基础。
第一,基础资料收集与整理。经过长期努力和大量的基础性工作,课题组已初步完成了1949年-2015年期间全国及31个省(直辖市、自治区)的人口、生育、死亡和家庭数据指标的收集、整理与电子化工作,为相关研究者提供了丰富且直接可用的历史人口基础数据。课题组成员围绕“总量、结构和分布”三个维度,收集整理了来自国家统计局、公安部、教育部、民政部、国家卫生健康委、联合国人口司以及各省相应部门的统计数据,综合分析了历次人口普查和1%抽样调查数据、历年1‰人口抽样调查数据、户籍登记数据、学籍登记数据、婚姻和殡葬登记数据、世界人口展望数据、全国生育状况抽样调查、中国家庭追踪调查数据、相关统计年鉴等统计资料,现已收集全国及31个省历年的人口、生育、死亡和家庭数据指标上万条,并完成了早期纸质版本人口数据的电子化处理。
第二,核心指标评估与修正。通过多源数据的比对与评估、内部一致性分析和核查,课题组基于已收集完成的历史数据指标开发逻辑校核程序,发现了大量的因数据来源不同而产生的同一队列指标内存在的不一致问题,并对现有统计数据中初步发现的问题分别进行了评估、修正、填补和回推,有效地解决了我国历史人口指标中普遍存在的质量问题,保证了数据的准确性和一致性。现已完成了1949年-2015年部分的出生人口数据、死亡人口数据、家庭人口数据的校核和回推,下一步将继续综合运用年龄别移算法、工具变量法、贝叶斯统计模型、多元回归统计技术、多维家庭人口预测方法、计算机模拟仿真技术等多学科研究方法对缺失数据、奇异值、有偏数据进行多次估计和修正。
第三,数据深入分析与挖掘。围绕中国人口数据综合集成应用平台建设,课题组产生了一大批优秀的人口数据分析和研究成果,陆续发表在《人口研究》《人口学刊》《人口与计划生育》《统计与决策》《人口与社会》等学术期刊。1、采用John Wilmoth等人开发的二维模型完成全国及各省市1949年到2015年历年0-100岁年龄别死亡率的修正,并基于修正数据的基础上编制了1949年到2015年历年全国及31省的生命表(含平均预期寿命指标);2、基于全球疾病负担测算结果,采用Lee-Carter模型对1990年到2015年全国及31省市的健康预期寿命进行了测算;3、完成《中国分区域死亡模式及其变动趋势》、《中国死亡人口规模、结构和分布数据(1949-2015)分析报告》;4、基于官方发布的调查手册、电子问卷、用户指南、数据字典以及相关研究论文为分析对象,从前期设计、调查实施过程和质量控制三个方面对全球31个家庭追踪调查进行梳理和比较,并对家庭调查数据的质量评估和调查方法进行深入分析;5、围绕生育主题开展了深入分析与研究,如山东省的历史生育水平及生育模式的深入分析,13省生育间隔政策对二孩生育时间及时期生育水平的影响分析,基于120县人口监测系统数据开展的生育政策调整后的生育水平及模式变化分析等;6、围绕死亡数据库建设,完成31省六普数据质量评估报告,“四普、五普、六普”死亡数据的评估与调整研究,中国区域死亡模式鉴别研究。
第四,数据平台与成果可视化。课题组初步构建了中国人口数据综合集成应用平台人口核心指标体系,可为研究机构和政府部门提供数据咨询服务及应急反应支持。当前已经完成中国人口数据综合集成应用平台初步设计方案,系统梳理了主要人口数据资源,包括全员人口库、互联互通数据平台、统计年鉴和历次普查资料、120监测县数据、微观调查数据,世界银行、联合国人口司、美国人口咨询局等世界人口数据资料,以及国家统计局发布的全国及分省人口年鉴数据,进行统一的整合、加工、处理,为形成可视化的数据分析平台奠定基础,后续将建立分析标准、指标定义及计算方法。
第五,成果推广、交流与讨论。课题研究成果积极与学界同仁交流分享,推动了人口基础数据质量评估方法的发展。课题组成员在2017年中国人口学年会、全国人口普查与研究方法研讨会、加强人口发展战略研究报告会、健康中国理论与实践的全国学术研讨会等国内会议上交流分享,在第四届亚洲人口学会年会,国际健康预期寿命组织(Reves)学术年会、美国人口学会年会(PAA2017)、欧洲人口大会(EPC2018)等国际会议上发言讨论。除出席国内外会议进行国际学术交流外,课题组还与德国马普人口研究所、维也纳人口研究所、人类生育数据库、华盛顿大学进行深入访问、交流与合作,提高了人口历史数据质量评估方法的丰富度与科学性。
总体来看,按照计划完成了预期的工作,其中包括数据的收集、数据的整理分析及成果的发表。目前,按研究计划进展,尚有一些数据的收集工作、数据的分析研究及平台建设尚待完成。
子课题一:中国人口总量、结构和分布数据(1949-2015)
(一)研究计划总体执行情况及子课题进展
基于国家统计数据、公安户籍数据、教育部学籍数据进行校核回推了1949年到2015年的出生人口数据、死亡人口数。
? 采用回推的方法完成全国1949年到2015年历年年龄别人口估计,形成了1949年到2015年的分性别、分年龄的历史人口数据,并估算了16个省份1949年到2015年的分性别、分年龄的历史人口数据,形成了全国及其31个省市的年末/年中总人口、0-100岁年龄别人口规模、男性/女性人口、分省常住人口/户籍人口、自然增长率、0-14岁少儿抚养比、0-20岁少儿抚养比、65岁及以上老年抚养比、总抚养比、0-14岁少儿儿童占比、0-20岁少儿抚养比、65岁及以上老年人口占比等指标数据。
? 基于国家统计数据、公安户籍数据、教育部学籍数据进行校核回推了1949年到2015年的出生人口数据,计算了粗出生率。基于国家统计局的普查和1%人口变动调查以及1‰人口抽样调查数据,梳理了主要年份的分孩次年龄别生育率数据,并根据相关模型估算了1949年到2015年全国及31个省市自治区的出生人口数(分一孩出生数、二孩出生数、三孩及以上出生数)、出生率、总和生育率、年龄别育龄妇女生育率、平均生育年龄(平均初育年龄、平均二孩生育年龄、平均三孩生育年龄)、分孩次年龄别生育率(一孩年龄别生育率、二孩年龄别生育率、三孩及以上年龄别生育率)等指标的数据。
(二)调查研究及学术交流情况、文献资料收集整理、学术会议、学术交流、国际合作等
1. 参加3次国际学术会议
? 2018年6月11日到6月29日前往德国马普人口研究所进行学术交流,就全国和分省普查时点数据的死亡率的质量进行评估,采用contour decomposition方法分解了男性和女性在1981年到2010年的年龄别死亡变动规律,并结合中国台湾、美国、日本同期的死亡率数据变动规律校正了2010年六普的死亡数据。
? 2017年6月参加由国际健康预期寿命组织(Reves)所承担的2017年学术年会,并作大会主旨发言,发言的题目是《基于个体健康预期寿命的测算研究》。
? 2018年7月11日到7月15日前往上海参加第三届亚洲人口学会年会,在"性别、老龄化和健康"的中国专题学术研讨会发表了题目为“中国低生育率进程的结构性特征”的学术报告,对20世纪90年代以来中国低生育率的分孩次结构、年龄别结构、城乡结构、区域结构等特征进行了分析,描绘了中国低生育率的结构特征以及背后的数据质量特征。
2. 邀请国际知名专家开展系列讲座和培训
? 2017年11月15日:邀请美国全球临床与转化研究院首席科学家张风雨教授做“基因组时代的人口学研究与精准医学”的专题讲座
? 2018年6月28-7月12日:邀请南安普敦大学的Sabu Padmadas(教授)来中心进行学术交流与访问
3.在CSSCI刊和北大核心期刊上发表论文6篇,均署名得到本课题的资助
(详见成果清单)
子课题二:中国家庭人口总量、结构和分布数据(1949-2015)
(一)研究计划总体执行情况及子课题进展
基于国家统计局历次人口普查数据、国家统计局历年1‰人口抽样调查数据、联合国人口司2017年世界人口展望数据、全国生育状况抽样调查、中国家庭追踪调查数据、各省历次人口普查和1‰人口抽样调查等数据,当前已经完成全国及31个省份的平均家庭户规模、家庭总户数、集体户户数、家庭户数人数、家庭户男性人口数、家庭户女性人口数、分家庭户规模的户数和人数及其占比(一人户、二人户、三人户、四人户、五人户、六人户、七人户、八人户、九人户、十人及以上户)共1000余个统计指标的资料收集工作。正在对已收集完成的历史数据进行多数据源比对、内部一致性分析和核查工作,已经初步发现现有统计数据中存在的各类问题,下一步计划运用工具变量法、贝叶斯统计模型、多元回归统计技术、多维家庭人口预测方法、计算机模拟仿真技术等多学科研究方法对缺失数据、奇异值、有偏数据进行重新估计和修正。
(二)调查研究及学术交流情况、文献资料收集整理、学术会议、学术交流、国际合作等
1. 已完成原始资料收集整理、正在评估和修正的数据指标列表如下:
? 平均家庭户规模。重点计算1949年到2015年全国及31个省市自治区的平均家庭户规模(平均家庭户人数)。
? 家庭户规模。重点计算1949年到2015年全国及31个省市自治区的家庭户规模(家庭户数)。
? 家庭户人数。重点计算1949年到2015年全国及31个省市自治区的家庭户人数,包括家庭户男性人口数、家庭户女性人口数。
? 集体户规模。重点计算1949年到2015年全国及31个省市自治区的家庭户规模(家庭户数)。
? 集体户人数。重点计算1949年到2015年全国及31个省市自治区的集体户人数,包括集体户男性人口数、家庭户女性人口数。
? 分家庭规模户数。重点计算1949年到2015年全国及31个省市自治区分家庭户规模的户数和人数及其占比(一人户、二人户、三人户、四人户、五人户、六人户、七人户、八人户、九人户、十人及以上户)。
? 平均初婚年龄。重点计算1949年到2015年全国及31个省市自治区的平均初婚年龄,包括男性平均初婚年龄和女性平均初婚年龄。
? 平均结婚年龄。重点计算1949年到2015年全国及31个省市自治区的平均结婚年龄,包括男性平均结婚年龄和女性平均结婚年龄。
? 批准登记结婚对数。重点计算1949年到2015年全国及31个省市自治区的批准登记结婚对数。
? 申请登记离婚对数。重点计算1949年到2015年全国及31个省市自治区的申请登记离婚对数。
? 批准登记离婚对数。重点计算1949年到2015年全国及31个省市自治区的批准登记离婚对数。
? 判决登记离婚对数。重点计算1949年到2015年全国及31个省市自治区的判决登记离婚对数。
? 恢复结婚对数。重点计算1949年到2015年全国及31个省市自治区的恢复结婚对数。
? 内地居民登记结婚对数。重点计算1949年到2015年全国及31个省市自治区的内地居民登记结婚对数。
? 涉外及港澳台结婚对数。重点计算1949年到2015年全国及31个省市自治区的涉外及港澳台结婚对数。
? 结婚率。重点计算1949年到2015年全国及31个省市自治区的一般结婚率,分性别和城乡。
? 初婚率。重点计算1949年到2015年全国及31个省市自治区的初婚率,分性别和城乡。
? 总和初婚率。重点计算1949年到2015年全国及31个省市自治区的总和初婚率,分性别和城乡。
? 再婚率。重点计算1949年到2015年全国及31个省市自治区的再婚率,分性别和城乡。
? 一般离婚率。重点计算1949年到2015年全国及31个省市自治区的一般离婚率,分性别和城乡。
? 总和离婚率。重点计算1949年到2015年全国及31个省市自治区的总和离婚率,分性别和城乡。
? 离婚结婚比。重点计算1949年到2015年全国及31个省市自治区的离婚结婚比,分性别和城乡。
? 女性不婚率。重点计算1949年到2015年全国及31个省市自治区的女性不婚率,分城镇和农村。
? 男性不婚率。重点计算1949年到2015年全国及31个省市自治区的男性不婚率,分城镇和农村。
? 未婚人口。重点计算1949年到2015年全国及31个省市自治区的男未婚人口,分城镇和农村。
2. 文献资料收集整理
为更好地借鉴国内外家庭数据评估和调查的方法,我们对各类家庭追踪调查的官方发布的调查手册、电子问卷、用户指南、数据字典以及相关研究论文为分析对象,从前期设计、调查实施过程和质量控制三个方面对国外主要的家庭追踪调查进行梳理和比较。前期设计主要包括调查发起情况、调查主题、样本规模和识别标准四个方面;调查实施过程主要包括问卷设计、调查方式和调查工具三个方面;质量控制主要包括样本追踪策略改进以及数据质量评估方法两部分内容。同时,将分析精力主要集中于美国收入动态追踪调查、德国社会经济追踪调查、英国家庭追踪调查和南非收入动态调查等四项独立组织的调查,也涉及了欧盟家庭追踪调查和世代与性别调查两项集团运作的调查。既覆盖了历时最长的调查项目,又包含了新近开展的调查项目;既覆盖了发达国家,又包含了发展中国家;既覆盖了民族国家,又包含了国家联合体。主要涉及的调查数量如下:
调查名称 调查国家 开始年份
1 国家长期追踪调查 美国 1966
2 生活水平调查 瑞典 1968
3 收入动态追踪调查 美国 1968
4 荷兰社会经济追踪调查 荷兰 1984
5 德国社会经济追踪调查 德国 1984
6 卢森堡社会经济追踪调查 卢森堡 1985
7 法国家庭追踪调查 法国 1985
8 比利时社会经济追踪调查 比利时 1985
9 波兰家庭追踪调查 波兰 1987
10 中国健康与营养调查 中国-美国 1989
11 英国家庭追踪调查 英国 1991
12 俄罗斯监测追踪调查 俄国 1992
13 匈牙利家庭追踪调查 匈牙利 1992
14 健康与养老调查 美国 1992
15 印度尼西亚家庭生活调查 印度尼西亚 1993
16 劳动收入动态调查 加拿大 1993
17 日本消费者动态调查 日本 1994
18 欧盟家庭追踪调查 欧盟 1994
19 意大利家庭追踪调查 意大利 1997
20 韩国劳动和收入追踪调查 韩国 1998
21 中国健康长寿追踪调查 中国 1998
22 瑞士家庭追踪调查 瑞士 1999
23 家庭动态追踪调查 中国台湾 1999
24 澳大利亚家庭、收入和劳动力动态调查 澳洲 2001
25 墨西哥家庭生活调查 墨西哥 2001
26 世代与性别调查 —— 2004
27 中国家庭追踪调查 中国 2008
28 国家收入动态调查 南非 2008
29 香港社会动态追踪调查 中国香港 2011
30 中国健康与养老追踪调查 中国 2011
3. 学术会议与交流
? 2017年中国人口学年会,在人口统计分析方法分论坛上交流了“家庭追踪调查中应答时间的影响因素研究”一文,对家庭追踪调查并行数据的分析进行讨论。
? 2017年8月30日-2017年9月15日,作为访问学者赴德国马普研究所学习交流,重点学习家庭人口分析及预测技术。
? 2018年7月11日-14日参加第四届亚洲人口学会, 在人口统计分析方法分论坛上交流了“问卷调查中应答时长与质量控制策略”一文,对家庭追踪调查的质量控制提出建议。
(三)研究中存在的主要问题、改进措施、研究心得、意见建议
1. 我国关于集体户/家庭户类型的划分标准出台较晚,因此1949-2015年间真正开始有集体户数据的时间起点较为靠后,且缺少集体户人口特征的数据统计和分析,因此集体户数据指标需同时结合普查数据和公安户籍登记数据进行双向比对核查,初步估计普查年份的集体户比例,进而估计其他年份的集体户户数和人口数,最终得到各年份的集体户人数、集体户男性人口数、集体户女性人口数。
2. 家庭户规模与生育行为、家庭结构变化的关系:家庭现代化理论认为,家庭规模的大小和家庭结构核心化成为确定家庭现代与否的标准,现代社会中占据主导位置的应该是核心家庭。四次人口普查的数据变化是否为家庭现代化趋势的反映?家庭规模的缩小与家庭代际关系存在怎样的关系?家庭规模是否还受到其他因素的影响?造成户均人口变化一方面是因为生育的子女数量,另一方面与家庭结构有关,即核心家庭的出现和普遍化是导致家庭规模缩小的重要原因,但对上述观点尚未得到明确的检验。因此,在结合前人研究的基础上,通过对中国建国后至今这段时期六次人口普查的原始数据对家庭规模的变化趋势进行分析是有必要的,但除了研究家庭结构对家庭规模的作用分析之外,对生育数量、队列、户籍等因素的作用也应该予以重视。
3. 婚姻数据的复杂性及解决思路:在数据收集和评估过程中发现,我国结婚登记和离婚登记数据均存在很大的偏差。首先,分年龄初婚率中15-20岁群体被严重低估,受法律限制,民政登记数据中缺少对该年龄段结婚人口的信息登记,但在普查年份的结婚数据分析中发现,15-20岁人口结婚事件仍然占据一定比例,尤其是在农村和少数民族地区,因此需要通过普查数据对低年龄段的结婚率进行二次调整和评估才可使用。其次,分年龄离婚率中30-40岁群体被严重低估,离婚事件的统计来源并不单一来自于民政部门,近些年份法院判决离婚的数量迅速增长,因此在计算年龄别离婚率时如果不考虑法院判决离婚数量,将产生较大偏差。当前主要问题是法院判决离婚统计数据缺少部分年份数据并且和民政登记的口径不一致,需要进行二次估计,然后将两种口径的离婚统计数据整合汇总,才可得到完整准确的离婚统计数据。
子课题三:中国出生人口总量、结构和分布数据(1949-2015)
(一)研究计划总体执行情况及子课题进展
自项目启动以来,该课题围绕出生人口的数量、生育率及生育年龄的相关数据进行基础出生数据的大力收集及数字化工作,尤其是2000年以前缺乏电子版/光盘版的各个年份,努力补充各年、各省数据的完整性。目前已完成1949-2015年全国及各省基础数据收集及整理。
具体来看,普查年份的省级数据相对较为完整,但1%人口抽样调查的数据集各省出版进度不一致,以2015年1%人口抽样调查为例,目前尚有11省(区)(山东、安徽、内蒙古、吉林、山西、新疆、辽宁、西藏、湖北、四川和湖北)仍未出版本省的2015年1%人口抽样调查数据集,导致相关历史出生人口数据难以获得。其他年份也存在部分省份的数据空白。
在前期收集数据的基础上,对部分省份的多源数据开展多源数据质量评估。基于年龄别生育率、队列生育率、终身无孩率等指标的评估显示,在部分省份出现了同一出生队列的终身生育率2015年1%人口抽样调查的结果甚至低于2010年的普查结果,终身无孩率高于2015年1%人口抽样调查结果的异常现象。而基于年龄平移的出生人口性别比显示,同一出生队列的2015年1%人口抽样调查的结果与2010年普查、2000年普查也存在较大差异。这均说明了各个不同数据来源中同一队列指标的不一致问题。再以早期1980-1990年的数据为例,《中国生育数据集》中的结果与各省含有1990年总和生育率及年龄别生育率的相关出版物(如各省《跨世纪的中国人口》)结果有一定出入。
(二)调查研究及学术交流情况、文献资料收集整理、学术会议、学术交流、国际合作等
1. 调查研究:围绕子课题的研究主题,开展了部分数据的初步分析与研究。研究涉及部分省份的生育水平及生育模式的变动,包括:
? 山东省的历史生育水平及生育模式的深入分析,评估了该省婚育政策变动对时期生育水平和终身生育水平的影响。分析过程中进一步强化山东省普查、人口变动抽样调查及120县人口监测系统的相关生育数据收集及相关指标的差异对比,深化了多数据来源特征及差异的了解,为后续各省生育数据的评估、分析及应用基础了前期经验;
? 13省生育间隔政策对二孩生育时间及时期生育水平的影响分析。分析对比了13省从1984-2016年的分孩次生育率、分孩次生育年龄及生育间隔,并分析了同时期的时期生育水平及孩次递进比,评估不同时期不同的生育间隔政策对各省二孩生育时间及二孩生育水平、时期总和生育率的影响,丰富了相关省份二孩生育的相关研究,并进一步增强了对相关省份多种数据来源的出生人口数据及相关指标的认识;
? 生育政策调整后的生育水平及模式变化——基于120县人口监测系统数据的分析重点对照分析2014年单独两孩政策调整和2016年全面两孩政策调整后的总和生育率、一孩生育率、二孩生育率及生育年龄等指标的变化,检验政策效应,为未来我国出台相关家庭友好型的社会政策提供基础资料。
2. 资料收集:除常规普查数据资料、1%人口变动抽样调查、统计年鉴等常规数据资料的收集、数字化外,进一步扩大其他涵盖1990年以前各省各时期的其他历史出版物,包括地市级年鉴、地方志、以出生及生育为主题或包括相关内容的论文集等资料,丰富各省的数据来源,尽力补齐相关年份数据。
分省 已有数据的年度 已有数据(册)
安徽 1989、1995、1996、2000、2002-2015 18
河北 1989、2000、2005、2010、2015 5
江西 1989、2000、2005、2010、2015 5
北京 1989-1991、1998、2000-2003、2005、2010、2015 11
山西 1989、2000、2010 3
黑龙江 2000、2005、2010、2015 4
山东 1989、2000、2005、2010 4
江苏 1989、2000、2005、2010、2015 5
湖北 1989、2000、2010 3
湖南 2000、2010、2015 3
浙江 2000、2005、2010、2015 4
四川 2000、2005、2010 3
吉林 2000、2010 2
辽宁 1989、2000、2005、2010 4
云南 1989、1990、1991、1995、2010、2015 6
陕西 1989、1995、2000、2005、2010、2015 6
甘肃 1989、2000、2010、2015 4
贵州 1989、2000、2005、2010 4
天津 1989、1995、1997、1998、1999、2010、2015 7
重庆 2005、2010、2015 3
青海 1989、1990、1995、2000、2005、2010、2015 7
西藏 1995、2000、2010 3
宁夏 1989、2000、2005、2010、2015 5
新疆 1989、1990、1994-1999、2001、2005、2010 11
上海 1989、2000、2005、2010、2015 5
内蒙古 1989、2000、2010 3
广西 1989、1990、2000、2005、2010、2015 6
福建 1989、2000、2005、2010、2015 5
广东 1989、2000、2005、2010、2015 5
海南 1989、1994、2000、2005、2010、2015 6
河南 1989、2005、2007-2016 12
全国 1949-2016 25
3. 学术会议与交流:截至目前一共投稿9次学术会议,其中国际会议5 次, 国内会议4次,国际会议发言(含即将发言)5次
投稿及发言主题分别涉及“我国生育政策调整后的生育政策调整后的生育水平及模式变化”、“婚育政策对山东省生育水平波动及生育模式变迁的影响”和“生育间隔政策对二孩生育水平、生育时间和生育间隔的影响分析”。
? 2017年4月27-29日,参加美国人口学会作年会,作专题发言
? 2018年4月27-29日,参加欧洲人口大会,作专题发言
? 2017年7月18-23日,参加中国人口学会年会,作大会发言
? 2017年12月4-5日,参加 “生育转变与社会政策应对”国际研讨会,作大会发言
? 即将参加国际会议:2018年9月10-12日:参加生育推迟国际研讨会,拟作专题发言(Postponement of Parenthood: Causes and Consequences)、2018年9月3-6日:参加伦敦政治经济学院和意大利博科尼大学联合主办生育推迟研讨会(Conference on the Postponement of Parenthood co-organized by the MPIDR, LSE, and Bocconi University),拟作专题发言、2018年12月5-7日:参加维特根斯坦中心2018年年会暨人类生育数据库第三次研讨会(Wittgenstein Centre Conference 2018-3rd Human Fertility Database Symposium),拟作专题发言
? 除出席国际会议进行国际学术交流外,课题组还与维也纳人口研究所、人类生育数据库(Human Fertility Database)进行深入学习,掌握人类生育数据库的标化、数据收集及指标计算、数据修正等技术与方法、根据历年出生人口的月度分布对全年的出生人口进行估计、间隔孩次递进比及基于间隔孩次递进比的一孩到二孩的生育间隔计算、数据平滑及拆分等方法,为后期缺失年份数据的补齐、估计及拟合做好技术储备。
(三)研究中存在的主要问题、改进措施、研究心得、意见建议
目前面临地区数据缺失及早期年份数据缺失的双重挑战;另外相对于庞大的数据收集、数字化、校对及评估的工作量,需要投入大量的人力、财力,课题经费较为紧张;下一阶段将重点解决数据缺失及插值等问题,为人口估计方法提出很高要求;同时针对出生数据的现状,撰写相关情况分析。
子课题四:中国死亡人口总量、结构和分布数据(1949-2015)
(一)研究计划总体执行情况及子课题进展
已完成“三普”、“四普”、“五普”、“六普”等分省、分城乡、分年龄死亡率、预期寿命、婴儿死亡率等有关死亡指标方面的数据;并对死亡数据进行了初步评估,在此基础上对中国的死亡模式进行了初步鉴别与分析研究。
(二)调查研究及学术交流情况、文献资料收集整理、学术会议、学术交流、国际合作等
1. 资料收集:根据课题任务书要求,本子课题目前收集到的数据指标包括:
? 死亡率。1982年、1989年、2000年、2010年全国及31省市自治区的分性别、分城乡年龄别死亡率。
? 死亡人口数。1982年、1989年、2000年、2010年全国及31省市自治区的分性别、分城乡年龄别死亡人口数和总死亡人口数。
? 平均预期寿命。1982年、1989年、2000年、2010年全国及31省市自治区的分性别的平均预期寿命、男性平均预期寿命、女性平均预期寿命。
? 婴儿死亡率。测算1949年到2015年全国及31个省市自治区的婴儿死亡率。1982年、1989年、2000年、2010年全国及31省市自治区的分性别、分城乡的婴儿死亡率。
2. 对数据进行了深入分析:
编制了1949年到2015年历年全国及31省的生命表,完成了四篇研究报告
? 完成全国1949年到2015年历年全国和分省粗死亡率、死亡人口数据的校准和估算,开发逻辑校核程序,完成了1949年到2015年全国及31个省市自治区的死亡人口数、死亡率、年龄别死亡率(0-100岁)、婴儿死亡率、五岁以下婴儿死亡率、孕产妇死亡率、平均预期寿命(男性、女性和不分性别)、健康预期寿命(男性、女性和不分性别)指标数据的分析。采用John Wilmoth等人开发的二维模型完成全国及各省市1949年到2015年历年0-100岁年龄别死亡率的修正,并基于修正数据的基础上编制了1949年到2015年历年全国及31省的生命表(含平均预期寿命指标)。
? 基于全球疾病负担测算结果,采用Lee-Carter模型对1990年到2015年全国及31省市的健康预期寿命进行了测算。
? 对31省六普数据进行质量评估,找出存在的主要问题,对数据进行校正,形成分析报告
? 对“四普、五普、六普”死亡数据进行评估与调整研究,找出数据存在的问题,探寻死亡规律,形成分析报告
? 对中国区域死亡模式进行分析,找出不同区域的死亡模式特点,为后续数据平滑与处理提供依据,形成《中国分区域死亡模式及其变动趋势》、《中国死亡人口规模、结构和分布数据(1949-2015)分析报告》
3. 学术会议与交流:
? 2017年6月,参加由西安交通大学主办的全国人口普查与研究方法研讨会,做了题为《中国分区域死亡模式及其变动趋势》学术报告。
? 2017年12月,参加由重庆人口学会主办的加强人口发展战略研究报告,做了题目为《重庆人口健康预期寿命测算研究——基于疾病负担的视角》学术报告。
? 2017年12月,参加由中国人口报、重庆人口学会主办的健康中国理论与实践的全国学术研讨会,做了题为《健康预期寿命的概念、理论与方法》的学术报告。
? 2018年6月7日:邀请国际知名疾病负担专家华盛顿大学Christopher Murray(教授)、王海东(博士)来中心进行专题讲座
? 2018年7月20-25日:邀请联合国人口司顾大男博士进行“人口估计方法”的专题培训
? 与维也纳人口研究所、华盛顿大学、人类死亡数据库(Human Mortality Database)进行深入学习,掌握人类死亡数据库的标化、数据收集及指标计算、数据修正等技术与方法、根据历年死亡人口的月度分布及全年死亡人口进行估算、数据平滑及拆分等,为后期缺失年份数据的补齐、估计及拟合做好技术储备
(三)研究中存在的主要问题、改进措施、研究心得、意见建议
随着时间的推移,中国死亡数据质量逐年下降,中国三普死亡数据质量较好,得到国际公认,但随后“四普”、“五普”、“六普”均存在严重的死亡漏报,其中“六普”婴儿死亡漏报水平高达70%以上,老年死亡率的漏报同样严重。死亡数据中间成人组相对来说比较稳定,两头不太稳定,这对数据的评估和对中国死亡模式的确认带来很多不确定性,需要新的数据和方法进行进一步评估和鉴别。
子课题五:中国人口数据综合应用平台和可视化(1949-2015)
(一)构建了中国人口数据综合集成应用平台人口核心指标体系
系统梳理了主要人口数据资源,包括全员人口库、互联互通数据平台、统计年鉴和历次普查资料、120监测县数据、微观调查数据。数据分析维度主要是时间维度和空间维度,其中时间维度为日、月度、季度、年度数据;空间维度可具体到省、市、县、乡、街道。数据指标分为原始汇总指标、二次生成指标和带入模型计算的指标。其中,原始指标指可直接从资料中汇总的指标、二次生成报告指标指需要通过原始指标汇总计算的指标,其体系结构如下:
(二)提出了中国人口数据综合集成应用平台初步设计方案
1总体设计
根据中心目前已经搜集的世界银行、联合国人口司、美国人口咨询局等世界人口发展国外数据资料,以及国家统计局发布的国内人口分省年鉴数据,进行统一的整合、加工、处理,建立标准分析指标定义、计算方法,形成可视化、GIS化的数据分析平台,为中心内外专家、领导提供数据咨询服务及应急反应支持。
? 应用范围:人口中心
? 服务对象:3类用户(中心内部用户、卫计委系统用户、外部专家及公众用户)
? 数据范围:人口和计划生育业务数据、人口统计和普查数据(中国、世界)、抽样调查数据、非结构化的文献资料及网络信息
? 基本应用:数据处理、数据统计、基于GIS的数据展现是系统关键支撑
2功能设计
中国人口数据集成分析平台主要包括三方面的内容:数据的信息展现、应用功能和数据获取。
? 数据信息展现
数据信息展现通过WEB的方式进行服务。用户可以浏览WEB网页进行数据、信息的浏览、查看。系统结合WEB GIS技术,对各类需要实时展现、可视化发布的人口数据进行图形化的展现,为用户提供站网信息查询、数据可视化发布、数据统计分析、在线交互等服务。数据信息展现包括以下服务内容:
人口信息查询:结合WEB GIS提供数据的最新信息的查询和检索,各级站网信息的访问提供权限控制,提供人口信息检索、数据搜索、地图检索;
数据可视化发布:以WEB方式实现部分可以进行展现的分省空间的动态可视化发布,并支持将来可视化发布产品类别的扩充;
数据统计分析:根据人口数据统计方法对检索获得的数据进行统计运算,以统计分析图形、表格和文字的方式显示结果,提供下载服务。数据分析提供综合分析和展现服务;
在线交互:使系统具备数据格式转换工具、收集用户意见和建议,提供数据更新发布手段、实现对收集的信息分类整理、综合归纳。
? 应用功能
包括出生人口监测及预警、人口计划生育形势分析、人口迁移流动及城镇化分析、行政单元人口数据时空对比、全球人口发展形势对比、人口详细分类及主要指标等。
? 数据获取
数据获取服是指从光盘、EXCEL人口数据文件、统计局网站数据下载、数据年鉴文献等,进行配置,并根据配置策略预处理、完整性一致性检查。数据访问具有用户身份认证功能;数据导入可监控和统计;记录存入系统日志中;数据获取信息记录日志,记录内容包括用户、请求源地址、数据分类、数据文件、数据量和操作时间等信息。
3数据分析
数据目前暂定三类,一类来自于世界银行的“世界发展指数WDI”及联合国人口司、世界卫生组织、美国人口咨询局等其它国际机构的人口相关数据,一类来自于国家统计局的统计数据,第三类为非结构化数据。
“世界发展指数WDI”是按国别分类的1338个指标,从1960年到2013年时限范围内的数据,数据方式为EXCEl文件。
“年度人口统计数据”,主要包括按全国及不同省统计的“总人口数”、“人口出生率、死亡率和自然增长率”、人口平均预期寿命、“人口数”(人口抽样调查)、“户数、户人口、及户规模”(人口抽样调查)、“按户口登记状况人口数”(人口抽样调查)、“人口年年龄构成和抚养比”(人口抽样调查)、按婚姻状况人口数(人口抽样调查)、按教育程度人人口数(人口抽样调查)、15岁以上文盲人口(人口抽样调查)、按家庭规模分的户数。
4设计实现方案
整个系统划分为四个层次:
(1)服务访问层
服务访问层是为系统服务的对象提供多种服务访问的方式,进而定义不同服务对象的访问方式。系统的服务对象划分为三大类,如:中心内部用户、卫计委系统用户、外部专家及公众用户。系统为用户提供的服务访问方式包括WEB浏览器访问,预留业务访问接口其他业务系统可以通过定义接口调用的程序实现服务接口调用和服务访问。
服务访问层连接服务用户与系统服务的一个平台,是用户访问服务的技术协议层。根据不同的服务访问方式为用户服务接入方式,本项目以浏览器访问服务:
的用户提供一个WEB门户,用户可通过HTTP协议实时访问服务门户,这种方式主要针对的是部门用户以Web页面的方式查询、检索所需的数据信息信息;
(2)服务核心层
服务层是系统的核心服务池,是系统为满足用户的服务需求组织设计的功能服务。服务层的规划与设计总共可划分为四个系统:分别是以服务总线和服务池为核心的服务体系、以元数据和数据定位、获取、传输为核心的交换体系、以任务调度为核心的管控体系、以配置、策略核心的运维体系。在四个体系的支撑下,为用户提供及时的、高质量的可扩展功能服务。
系统的整个服务体系是以面向服务的服务总线(ESB)进行组织和封装,在
服务总线的服务总控下,将数据系统的所有服务内容进行集中注册和统一服务供给。同时,服务总线除提供服务注册的功能服务外,还提供服务请求的任务调度、以及请求任务(服务)节目表生成、任务(服务)管理、任务(服务)执行监控、安全管理等等。
系统的核心服务内容是人口数据资料。为保障系统用户请求服务的便捷性、实用性,数据体系的设计中,我们将提供数据传输组件、元数据管理组件、目录管理组件等服务组件的支撑,保障数据服务系统数据处理的稳定、安全、可靠。
系统为保障系统服务的稳定和系统安全,需要有一个系统管控体系作为系统的管控核心。在系统服务构建过程中,我们将以用户管理组件、权限管理组件、GIS引擎、任务调度引擎和业务流程管理组件作为系统管控体系的基础,利用这五个服务组件和引擎提供的管控服务对系统进行综合的管理和控制。
(3)服务支撑层
服务支撑层是根据系统建设的需求,利用一些成熟稳定的,有成功实施案例的开源软件,以及一些自主开发的软件作为整个服务系统的服务支撑,来保质快速构建系统。服务支撑层定义有应用中间件、消息中间件、Web Gis、元数据管理软件、业务流程管理软件、内容管理软件、报表软件。
(4)服务数据层
服务数据层是系统的数据支撑层,它为系统提供的服务数据提供数据支持,同时对服务数据进行综合管理。根据系统的服务数据特性,同时保障服务数据的安全前提下,对服务数据层进行数据管理技术实现设计。服务数据层包括RDBMS和文件系统,RDBMS存储管理的数据有缓存文件管理信息、元数据、运行管理信息、用户权限信息等等。
5系统的WEB框架
对于本项目,我们拟采用SSH ( struts+spring+hibernate)目前较流行的一种Web应用程序开源框架。其中使用Struts作为系统的整体基础架构,负责MVC的分离,在Struts框架的模型部分,控制业务跳转,利用Hibernate框架对持久层提供支持,Spring做管理,管理struts和hibernate。
本项目我们利用面向对象的分析方法根据需求提出一些人口分析模型,将这些模型实现为基本的Java对象,然后编写基本的DAO(Data Access Objects)接口,并给出Hibernate的DAO实现,采用Hibernate架构实现的DAO类来实现Java类与数据库之间的转换和访问,最后由Spring做管理,管理struts和hibernate。
6应用系统设计
应用系统暂定为七个模块,首页、国内数据、国外数据、主题数据、模型管理、数据处理、系统管理。
二、文献资料收集整理
1历史资料扫描入库清单
图书名称 扫描页数
备注
上海市 第三次人口普查资料汇编(下) 523 整本扫描
河北省1990年入口普查资料(三) 721 整本扫描
河北省1990年人口普查资料(二) 899 整本扫描
河北省1990年人口普查资料(四) 937 整本扫描
河北省1990年人口普查资料(一) 912 整本扫描
河北省1990年人中普查资料(五) 933 整本扫描
黑龙江省1990年人口普查资料(一) 871 整本扫描
黑龙江省1990年人口普查资料(三) 771 整本扫描
黑龙江省1990年人口普查资料(二) 873 整本扫描
黑龙江省1990年人口普查资料(四) 727 整本扫描
辽宁省1990年人员普查资料(上) 762 整本扫描
辽宁省1990年人口普查资料(中) 1036 整本扫描
辽宁省1990年人口普查资料(下) 1088 整本扫描
江苏省1990年人中普查资料(下) 933 整本扫描
浙江省1990年人口普查资料 (中) 750 整本扫描
浙江省1990人口普查资料 (上) 576 整本扫描
吉林省1990年人口普查资料(二) 908 整本扫描
吉林省1990年人口普查资料(三) 746 整本扫描
吉林省1990年人中普查资料(四) 731 整本扫描
吉林省1990年人中普查资料(一) 665 整本扫描
江苏省1990年人口普查资料(上) 1004 整本扫描
山西省1990年人口普查资料(上) 579 整本扫描
山西省1990年人口普查资料(下) 1191 整本扫描
山西省1990年人中普查资料(中) 990 整本扫描
浙江省1990年人口普查资料下 870 整本扫描
2001年中华人民共和国全国公县市人口统计资料 316 整本扫描
2006年中华人民共和国全国分县市人口统计资料 318 整本扫描
2011年中华人民共和国 全国分县市人口统计资料 319 整本扫描
中华人民共和国人口统计资料汇编1949-1985 1005 整本扫描
2数字化录入清单
图书名称 表数量
中华人民共和国人口统计资料汇编1949-1985 468
2001年中华人民共和国全国分县市人口统计资料 316
2006年中华人民共和国全国分县市人口统计资料 318
2011年中华人民共和国全国分县市人口统计资料 319
中国城市统计年鉴(1991-2016) 260
3光盘资料清单
详见《中心图书馆人口数据资料(1949-2015)馆藏情况汇总表》
(三) 研究中存在的主要问题及建议
1. 人口指标数量庞大,关系复杂,系统梳理和采集录入数据需要长期聘用多名专职人员进行工作,研究人员也需要花费较多时间进行指导和协调。
2. 数据平台的设计和开发需要软件开发专业技术人员进行实施,鉴于目前IT工程师工时费用较高,需要投入较多经费才能聘请到专职程序员予以保障软件平台开发工作。
二、研究成果情况(可另加附页)
主要内容:
代表性成果简介
刘鸿雁等. 中国人口发展追踪调查问卷设计手册(待出版)
家庭是社会的细胞,其发展变化可以反映一个社会时代的基本变化特征。中国家庭发展追踪调查是国家卫生健康委员会主导的官方的家庭发展追踪调查,力求获得当前社会经发展条件下家庭结构、家庭规模的变迁数据、了解家庭代际关系的变化、了解全生命周期人群的健康、经济发展的特征,为促进以家庭为中心的政策和方案的制定,加强对家庭的支持,提高家庭发展能力,使家庭成为促进经济社会发展的动力提供支撑。一个调查的实施过程包括调查设计、抽样设计和样本抽取、问卷设计、调查系统开发、调查员培训、质量跟踪监控、数据上报和数据汇总、分析研究以及调查的监督检查和考核评估工作等。在诸多工作环节中,问卷设计是基础和前提。
《中国人口发展追踪调查问卷设计手册》介绍了中国家庭发展追踪调查的背景、设计理念与设计过程;问卷调查方法的特点、问卷的类型和问卷的适用范围;问卷设计的原则、问卷设计在调查中的地位、问卷设计技巧和步骤;家庭户问卷、儿童问卷、青少年问卷、成年人问卷、老年人问卷以及村居问卷的指标体系、结构,具体问题、答案的设计方法、设计中遇到的问题、电子化过程中的注意事项、追踪问卷的设计经验和建议。《中国人口发展追踪调查问卷设计手册》可以充分反映家庭发展追踪调查在问卷设计方面的经验,促进研究者、社会实践工作者了解家庭发展追踪调查问卷的设计的理论基础、设计过程,为今后问卷设计,尤其是追踪调查问卷设计提供了需要借鉴和参考的内容。
刘鸿雁等.《国际人口政策参考》
人口是影响社会经济发展的基础性因素,如何促进人口发展,达成人口与资源、环境之间的平衡,一直为社会各界所关注。人类发展的历史表明,一个国家或地区的人口发展模式与其社会经济状况、传统文化观念和相关人口政策密切相关。各国的工业化进程和社会经济发展存在差异,人口发展模式不尽相同,采取的人口政策有所不同。即使同一个国家,在不同时期、不同发展阶段,其人口政策也在不断调整。人口政策反映了政府对人口现状以及未来人口发展的判断,但由于各国经济基础的差异、人口惯性的作用、文化习俗的传承、执行力的局限以及人口政策调整时机的选择均会对人口政策的实施效果产生影响。
在过去四十多年里,中国实施了强有力的计划生育政策,人口快速增长得到控制,生育率下降到更替水平以下。当前中国人口的主要矛盾已经不再是人口数量增长过快,而是人口结构失衡(人口老龄化突出、抚养比上升、出生性别比失调等)、人口与经济社会资源环境协调和可持续发展的问题。为适应中国人口形势的变化,2013 年,中国政府出台“单独两孩”政策,即夫妇双方一方为独生子女的家庭可以生育两个孩子。2015 年底,中国政府出台“全面两孩”政策,政策目标从“控制人口增长”转向了“促进人口长期均衡发展”。在中国人口政策转变过程中,可以借鉴国际经验与教训,制定与中国国情相适应的社会政策,促进人口政策的有效落实,推动经济社会协调发展。
不同国家的人口发展走向不同,其特点也不尽相同。对不同阶段、不同背景下,不同国家人口发展的成功经验和失败案例进行深入分析,并探讨不同政策背景下人口发展的规律,可为中国的人口发展政策提供借鉴。为此,《国际人口政策参考》收集和翻译了 5 大洲 25 个国家和地区的人口发展资料、相关法律条文与政策文件,并选择部分国家和地区人口与计划生育政策及其实施效果进行比较分析,世界各国和地区人口政策法规的整理,是一项具有很强的政策性和重要理论价值的研究,可以为我国人口和计划生育政策的完善提供科学的理论依据和有价值的借鉴。
黄匡时,刘鸿雁.中华人民共和国成立以来中国历史人口数据的比对分析——基于《世界人口展望》2017年修订版的深度解读
本文以世界人口展望2017年修订版对中国历史人口的估计数为基础,比对了国家统计局1950年到2015年的历史人口数据,发现,世界人口展望对我国的历史人口数据估计要比国家统计局对历史人口数据估计要高。本文还对世界人口展望数据的一些假定进行了分析,建议科学看待世界人口展望对中国历史人口数据的估计和对未来人口数据的预测。
历史上不同年份的出生人口形成了现有人口的不同年龄结构,更是未来人口预测的基础。如果对历史人口没有弄清楚就无法获得正确的基础年份的人口数,更无法对未来作科学预测。比如我们在测算全面两孩政策实施后对未来出生人口和总人口的影响,如果无法对当前育龄妇女数以及她们的生育史了解清楚,那我们就无法估算出科学的全面两孩政策目标人群数。没有一个可靠的目标人群数更无法对这些目标人群的未来生育行为进行预测。所以,历史人口是打开未来人口的关键钥匙。
首先,比对了国家统计局1950年到2015年的历年统计数据和联合国2017年世界人口展望数据,为回推和估计1949年到2015年的历史统计数据提供了重要基础;其次,分析了国家统计局和联合国世界人口展望数据的基本假设,有助于深刻认识历史数据的质量,为修正历史人口数据提供参考。
该文被“大国人口”微信公众号广泛转载,影响广泛。
黄匡时,刘鸿雁.基于改进的Lee-Carter模型的二孩生育间隔研究
文章基于国家卫生计生委2013年全国121个出生人口监测县的全员人口数据库,采用改进的Lee-Carter模型将1980年到2013年每年20-50岁妇女的二孩生育间隔分解成年龄别的二孩最小间隔、年龄别的二孩间隔弹性和二孩间隔的时间效应三部分。研究发现:二孩最低生育间隔为1.2-1.7年,年龄越大,二孩生育间隔的最小值越大;年龄别的二孩生育间隔弹性呈现s型变动,20岁到30岁之间在平稳中波动,而30岁之后到45岁二孩生育间隔弹性呈现线性增加的态势,不过45岁之后略有下降;在1986年到1996年的10年间,二孩平均生育间隔的时间效应为负,但是1980年至1985年以及1997年至2013年这两个时期的二孩生育间隔的时间效应为正。二孩生育间隔的这些特征有助于加深对二孩生育间隔的年龄别规律和随时间波动规律的认识。
本研究所使用的数据和方法以及研究结论对深入认识我国的生育水平的结构性特征,特别是二孩生育间隔、二孩平均生育年龄、二孩总和生育率等变动具有重要意义。首先,本研究基于全国121个人口监测县的全员人口微观个案生成的关于1980年到2013年20岁到50岁的二孩平均生育间隔的面板数据是认识我国二孩生育间隔的宝贵数据,其结果可以为当前乃至将来建构更为完整的生育数据提供参考。其次,二孩生育间隔的研究有助于深入理解我国生育水平的进度效应(Tempo),现有文献均发现,我国不同时期的生育水平明显受到进度效应的影响。而理解和认识二孩生育间隔的基本规律将为认识我国总和生育率和分孩次的总和生育率的进度效应具有重要意义。第三,二孩生育间隔的研究将为认识我国低生育率进程的结构性特征,尤其是孩次结构性特征具有重要意义。目前我国关于低生育进程的研究颇多,但是从二孩间隔的角度去分析低生育率进程的研究却不多,本研究将为未来的低生育率研究提供参考。第四,本研究采用改进的Lee-Carter模型进行历史数据拟合分析,本文的分析结果对预测未来的二孩平均生育间隔具有重要意义。未来可以依据改进的Lee-Carter模型对二孩平均生育间隔进行预测,比如假定未来年龄别的二孩平均生育年龄的最小值(ax)不变,并假定年龄别弹性(bx)不变(这个可以假定变化,由此设置多情景),根据时间效应的未来线形变动趋势可以外推kt,由此得到未来每年的年龄别的二孩平均生育间隔。有了未来每年的年龄别二孩平均生育年龄,预测未来的二孩的平均生育年龄和二孩总和生育率乃至未来的总和生育率和分孩次总和生育率将更加准确。
该文被“人口研究”刊发,反响强烈。
史毅, 刘鸿雁. 家庭追踪调查的国际经验与中国启示
国内家庭追踪调查数量不断增加,但存在起步晚、调查轮数较少的问题。本文以PSID、GSOEP、BHPS、EHCP、NIDS的官方文本及相关研究为对象,分析了调查前期设计和执行过程的经验及问题,以期对改进调查方法提供借鉴。研究发现,两年一轮的调查间隔和“交替核心”问题的设置有助于实现成本节约和数据连续性之间的平衡;调查完整性的需求推动调查对象转向年龄段的全覆盖,问卷模块增加的同时访问时间有所延长;家庭数据的数量和复杂性强化了对CAPI系统依赖性,丰富了质量评估的工具和手段;完全标准化的跨国联合调查难以实现,但逐步引入标准问题模块的方式值得借鉴。
国外家庭发展追踪调查随着调查技术和分析方法的改进而产生较大变化,主要表现为七大趋势:调查性质转为官方发起,科研机构执行;调查目的从政策评估转向经济社会研究;调查对象从成年人转向年龄段的全覆盖;调查间隔由短变长,从一年转向两年;问卷模块由少变多,访问时长增加迅速;调查工具在纸质问卷基础上发展出计算机辅助访问系统;调查方由单一国家进行向国际联盟运作转变。国外家庭发展追踪调查的主要趋势、经验与教训,可以为中国家庭发展追踪调查提供一定的借鉴和参考。
张丽,史毅. 西部少数民族的流动选择与收入回报研究
文章以流动选择为出发点,使用CSSC数据分析了西部地区少数民族流动迁移行为的特点及其对收入回报的影响。研究发现,少数民族的流动性较弱,但流动之后进入少数民族聚集区居住的现象较为普遍。少数民族聚集区作为一种安全空间,为少数民族流动人口提供了文化和经济的双重庇护,选择在聚集区居住的少数民族流动人口平均收入比其他少数民族流动人口高22%。但是,聚集区的经济庇护功能具有明显的局限性,对聚集区内的少数民族原住居民而言,生活在聚集区反而意味着更低的收入;对聚集区内的少数民族流动人口而言,聚集区对收入提升虽具有积极作用但也并非长期有效。因此,在提升少数民族人力资本水平和流动性的同时,缩小区域差距也是促进少数民族发展的重要途径。
如何看待少数民族在迁移流动过程中聚集区的功能和作用?事实上,聚集区不仅可以为少数民族流动人口提供文化庇护功能,也可以为其提供经济庇护功能。对西部少数民族而言,即使通过教育提升了人力资本,很多人仍希望能在风俗习惯、语言和观念等方面同质性较强的群体中居住生活,这进一步凸显出了聚集区的文化庇护功能。同时,大多数少数民族在主流社会中仍面临就业和待遇选择的困难,而流动群体通过聚集区找到工作的时间明显更短,降低心理成本的同时,也提高了信息获取速度和信息真实性,这在某种程度上显示出聚集区的经济庇护功能。当然,聚集区带来的经济庇护功能也具有一定的局限性。一方面,聚集区的经济庇护作用仅对流动人口有效,少数民族聚集区内的原住民收入显著低于非聚集区内的原住民。另一方面,聚集区对少数民族流动人口的影响也具有阶段性。从长远来看,借助社会资本进入聚集区的个人更倾向于选择通过强关系求职,越依赖于别人介绍安排进入工作的个体在经济上更受限制。因此,西部少数民族的流动和聚集行为对收入增加有一定积极作用,但是贡献有限,因为并不是所有少数民族都能在流动和聚集中受益,对于人力和社会资本匮乏、缺乏流动的个体来说,流动聚集行为的限制作用更为凸显。风险的不确定性问题因此得到了证实,其他研究也证实了个人条件的优劣、拥有社会资本的优劣是影响个人流动收入的关键因素。少数民族流动群体在流动过程中面临着不确定风险,虽然聚集是避免外在风险的有效方式,使得部分人通过聚集受益,但是从长期看来也将产生于其流动动机相悖的后果。缺乏人力资本和社会资本的流动群体不但不能改善当前的生活状况,反而更容易陷入贫困的恶性循环中,最终处于越来越不利的地位,更容易成为社会不稳定的诱发因素。因此,有效提升少数民族文化教育水平、缩小区域差距、加强社会保障是促进社会治理尤其是少数民族发展的重要工作。
史毅,张丽,罗小琴. 问卷调查中应答时长与质量控制策略
家庭调查质量的测量一直是方法研究中的难题,衡量数据质量最常见的方式是使用其他调查数据对关键变量进行比较,但该方法需要大量其他成功调查的支持,并且只能得到相对结论。同时,尽管国内外已经开始重视对平行数据的使用,但主要集中于对无应答问题的研究,对于应答时长的分析几乎是空白。应答时长反映了被访者对问题的理解程度与应答意愿,对其分析有助于更好地发挥平行数据对于质量评估的重要价值,对当前的社会调查也可以起到指导借鉴的作用。因此,本研究依托中国家庭发展追踪调查的并行数据和调查数据,重点分析了问卷调查过程中应答时间与调查质量控制之间的关系,对问卷应答时间的主要影响因素进行量化分析的同时,为问卷调查质量改进提供了具有一定参考价值的建议。
基于中国家庭发展追踪调查的并行数据和调查数据,重点分析了调查过程中应答时长问题,比较了信息应答、逻辑计算、隐私信息和逻辑判断类问题应答时长的组间差异,并分析了调查环境、访问员和被访者特征对应答时长的影响与作用。研究发现,理解阻力是应答时长增加的主要影响因素。调查过程中的理解阻力主要受被访者理解能力、跨文化表达能力和问题复杂程度三个方面的影响,在问卷设计中增强口语化程度、减少文化敏感性和简化逻辑计算程序有助于提升应答效率。同时,调查员质量与调查效率之间存在双重效应,熟练程度和受教育程度较高的调查员有助于减少逻辑判断类问题的应答时长,但会增加主观判断类问题的应答时长。如何在保证问题能够得到充分解释的同时又不产生过度解读,将是问卷设计和调查员培训过程中需要重视的主要问题。
张翠玲,刘鸿雁,王英安. 婚育政策对山东省生育水平波动及生育模式变迁的影响分析
山东省户籍育龄妇女的生育行为长期受严格的生育政策约束,不同时期主导性的政策类型不同,生育水平和生育模式呈现出鲜明的阶段性特征。20世纪90年代和2000年以来,晚婚晚育政策和二孩间隔政策的变动导致时期生育率的剧烈波动。相关晚婚晚育和二孩间隔政策实施及取消,不仅导致平均生育年龄变动,生育行为的年龄分布也发生了本质变化。2013年以来间隔政策取消及生育政策调整后二孩生育率强势反弹,然而其对提升时期总和生育率的贡献幅度,被同样迅速下降的一孩生育率部分抵消。当前山东省的生育模式仍不稳定,存在诸多进一步强化自愿推迟生育的影响因素,并将进一步消极影响时期生育水平。基于省及以下地区的婚育政策变动开展生育模式分析,有助于深化对各地生育转变和婚育推迟的同质性和异质性认识,从而辅助判断未来我国人口出生形势。
张翠玲,托马斯?索波特卡. 生育间隔政策对二孩生育水平、生育时间和生育间隔的影响分析
中国生育数量政策和间隔政策的变化对各省的二孩生育时间、二孩生育间隔以及时期总和生育率产生了强烈的影响。各时期的生育间隔政策通过将二孩生育进行压缩或分散到更长的时间,导致了二孩生育间隔变动及基于间隔的二孩生育率变动,从而影响了不同阶段的时期生育指标和时期生育水平波动。生育间隔政策出台和收紧导致TFR2 和PPR12 下降,间隔政策放松及取消导致TFR2 和PPR12 上升(见图1)。10 年间隔的孩次递进比(PPR12-10)显示不同间隔政策导致不同间隔年的二孩分布以及政策驱动的二孩间隔模式的演化过程。随间隔政策出台,PPR12-10 曲线从左倾斜过渡到右倾斜,间隔政策放松后再次偏向左侧。峰值二孩生育间隔从2 年逐渐向更长的政策性间隔年限转变。间隔政策取消后峰值生育间隔逐渐向2 年回归。各时期的生育间隔政策通过将二孩生育进行压缩或分散到更长的时间,导致了二孩生育间隔变动及基于间隔的二孩生育率变动,从而影响了不同阶段的时期生育指标和时期生育水平波动。本研究揭示了生育间隔政策导致的地区和时期差异, 丰富了二孩生育间隔模式及变动规律的相关认识,深化了生育间隔政策变动在我国生育转变中作用的理解,也证明了生育间隔政策在解释我国生育行为的省际差异中的作用。
张翠玲,刘鸿雁,托马斯?索波特卡.生育政策调整后的生育水平及模式变化——基于120县人口监测系统数据的分析
开展了我国2014年人口政策相继调整后的生育水平及生育模式变动分析,重点对照分析2014年单独两孩政策调整和2016年全面两孩政策调整后的总和生育率、一孩生育率、二孩生育率及生育年龄等指标的变化,检验政策效应,为未来我国出台相关家庭友好型的社会政策提供基础资料。
三、下一步研究计划
下一步研究计划
2018年7月—2018年12月:
将继续综合运用年龄别移算法、工具变量法、贝叶斯统计模型、多元回归统计技术、多维家庭人口预测方法、计算机模拟仿真技术等多学科研究方法对缺失数据、奇异值、有偏数据进行多次估计和修正,得出各种指标数据,撰写学术论文,撰写研究报告。各子课题研究计划如下:
? 子课题一:中国人口规模、结构和分布数据、自然增长率、年龄结构和抚养比、分省人口规模变动、分省年龄结构和抚养比等相关数据的进一步数据清理、比对、校核
? 子课题二:中国家庭人口规模、结构和分布数据、平均家庭户规模、家庭户规模、家庭户人数、集体户规模、集体户人数、分家庭规模户数等数据的进一步数据清理、比对、校核
? 子课题三:出生率、出生人口、总和生育率、年龄别生育率、平均生育年龄、分孩次年龄别生育率等数据的进一步清理、比对、校核
? 子课题四:死亡率、死亡人口、平均预期寿命、健康预期寿命、婴儿死亡率等数据的进一步数据清理、比对、校核
? 子课题五:数据库数据形成表单、表单关联;数据平台数据集成、数据抽取和计算;可视化及人机交互的可视化界面、人机交互界面;基本功能应用统计分析与展示功能
2019年1月—2019年12月:
各子课题继续撰写和完善研究报告、撰写总课题报告、讨论、修改与完成最终研究成果,出版相关成果,召开成果发布会。
(课题组供稿)