旧版网站入口

站内搜索

基于分位数回归的时空数据分析及应用研究

2022年05月24日08:52

北京工商大学罗玉波主持完成的国家社会科学基金项目《基于分位数回归的时空数据分析及应用研究》(项目批准号为:12CTJ008),最终成果为同名研究报告。课题组成员有:魏传华、王康、尹玉良、郭丽娟、王轶凡、张静、王琴英。

一 研究的目的和意义

时空数据广泛存在于社会经济、气候、生态环境等领域之中。随着计算机能力及数据可获得性的增强,“时空数据”分析和建模已成为空间统计中重要的研究方向。时空数据的特殊性也使统计学的研究和应用面临巨大的挑战和机遇。该成果将分位数回归这一重要建模思想运用到时空数据的分析之中,丰富了这一领域的研究,进一步拓宽了分位数回归模型适用的领域,进一步完善了分位数回归的方法和理论,进一步丰富了时空间数据分析的统计理论和方法工具库;应用研究表明,新模型和方法可以更多地揭示和解释数据中的信息,为相关决策提供更有利的依据。

二 成果的主要内容

该成果的研究内容主要包括两大部分,一部分是模型和方法研究,另一部分是应用研究。方法和理论研究部分,对时空数据分析领域最新的方法和模型,以及面板数据分位数回归、时空数据分位数回归三个领域的最新进展进行了综合分析,在这基础上,建立了半参数的时空数据模型,以及时空数据分位数回归模型,并研究了参数估计和检验方法。应用研究方面,该成果基于实际数据,利用现有时空计量模型和该成果所建立的模型,研究了微观房价(学区房)影响因素、夜间灯光数据代表的城市化水平、省域间价格的收敛、国内市场一体化、经济波动对经济增长的影响等重要课题。研究报告主要结构如下。

1.模型和方法研究部分

成果的第二章是对空间统计和分位数回归的基本总结和介绍。第三章综述了时空计量模型经典和最新的模型设定和估计方法。第四章分析了面板数据分位数回归和时空数据分位数回归的最新研究成果,分析了可进一步研究的方向。

成果的第五章,研究了几类时空数据的半参数回归模型。具体包括:部分线性空间自回归固定效应模型,变系数空间自回归固定效应模型,时空可加模型、混合时空加权回归模型,以及半参数似乎不相关空间误差分量模型。研究了模型的设定,模型参数估计方法,估计的统计性质,以及模型检验,模型的选择、缺失数据处理等系列统计问题,并借助于Bootstrap等计算密集型技术对模型性进行统计推断。通过数值模拟,说明了估计方法的有效性。

成果的第六章,在他人已有研究的基础上,引进了基于贝叶斯分析的,空间面板数据分位数回归模型。讨论了在贝叶斯框架下两类模型的设定和估计,一类是对随机效应项引入空间相关性的模型,第二类是假设随机效应满足空间自回归模型。本部分用到MCMC计算、Gibbs抽样的计算密集型方法对模型进行参数估计和统计检验。通过模拟研究分析了估计方法的有效项。最后通过长三角城市房价的时空数据,分析了模型的实际应用效果。

2.应用研究部分

应用研究部分包括第七章房价数据的分析、第八章夜间灯光数据分析和第九章经济收敛性问题。

第七章,利用北京市西城区的一千多条二手房价数据,根据特征定价法的原理,利用分位数模型,研究了房屋的多种属性对于二手房价的影响。特别是研究了所谓的学区房效应。通过实证研究表明,整体上看,学区房因素能够使房屋单位面积均价大约提高10.7%。另外,通过线性分位数混合效应模型,我们还估计了每所小学带来的溢价大小。分位数的分析结果也表明,学区房带来的影响是整体性的,即学区房在各条件分位点上的影响基本一致。

第八章对分位数回归方法在夜间灯光数据分析中的应用进行了初步探索。首先对夜间灯光数据(DMSP/OLS)进行了较为详细的介绍,特别是夜间灯光数据的处理方法。然后以四川、重庆两地县级区域灯光数据为例,在β收敛模型下,进行了实证分析。夜间灯光数据所代表的城市化水平,显著存在空间相关性。实证研究也表明,考虑了空间效应的分位数模型分析下所得到的县域城市化收敛速度高于没有考虑空间因素的计量模型。

第九章是利用空间计量模型,围绕经济收敛问题展开的研究,一共包括三个主题。第一,我国区域食品价格差异收敛性检验,回答我国区域价格差异是否收敛的问题。实证研究的结果表明,1994年以后我国食品价格收敛速度表现出了先减弱后增强的U型动态变化轨迹。近年来我国食品价格收敛速度出现减缓趋势,对此,三期叠加的宏观经济形势、有所抬头的贸易壁垒、食品消费结构升级、地区收入差异以及地区人口规模差异可能是其主要原因。第二,价格收敛视角下中国国内市场一体化的影响因素研究,以价格收敛为切入点,考察我国市场一体化的影响因素。实证研究得出地区经济发展水平、地方保护主义、对外开放程度、交通设施、地理位置等五个因素均为我国市场一体化影响因素的结论。我国东中西部的市场一体化程度依次递减。第三,转型期中国省际经济波动对经济增长的空间溢出效应。实证检验了中国省际经济波动对经济增长的空间溢出效应及其中间传导机制:在资源错配较为严重的中国,经济波动在淘汰本地区低效率投资项目和企业、优化投资结构从而对本地区经济增长产生正向直接效应的基础上,又通过虹吸效应吸引邻近地区的优质要素资源,对其投资结构产生不利影响,进而对其他地区的经济增长产生负向的空间溢出效应。不仅如此,由于地区间经济发展具有空间联动性,经济波动的空间溢出效应会产生空间反馈效应,经济波动对经济增长的影响在传递到其他地区后又反作用于本地区。并且,由于累积效应的存在,经济波动的直接效应和空间溢出效应均表现出长期大于短期的动态特征。经济波动对经济增长的影响会通过地区之间的循环反馈作用引发一系列动态调整,直到形成新的均衡。这一过程可视为中国经济波动对经济增长的影响路径。

随着时空数据资料更加丰富地积累以及获取的便利性增加,围绕这一数据类型展开的统计分析研究必将越来越有理论研究价值和实用价值。实证分析结果也表明,更加合理的分析技术,能够更充分地利用数据信息,得到的结论将更加具有参考价值,对于指导社会经济活动有重要意义。

三 成果的突出特色

研究成果在方法和理论研究方面具有一定的创新性,在应用研究方面探讨了几类重要的社会经济问题,使用了大量的实际数据,研究结论具有较高的参考价值。

(1)建立了部分线性时空数据模型。在前期研究的基础上,针对时空数据,建立了几类新的半参数时空数据模型,并讨论了模型参数估计和推断的方法。部分线性空间自回归固定效应模型,变系数空间自回归固定效应模型,时空可加模型,混合时空加权回归模型,以及半参数似乎不相关空间误差分量模型,这几类模型主要是在传统经典空间模型中,引入了半参数元素,从而扩大了空间模型的适用范围。

(2)建立了一类贝叶斯分析框架下的时空数据分位数回归模型。这部分的研究主要贡献是,在通常面板数据分位数回归的基础上,将随机效应项引入空间相关性,并采用完全贝叶斯的方法进行模型的参数估计。这一模型和估计方法是对现有研究的重要补充。

(3)应用研究的问题和数据采用方面具有一定特色。在应用方面,我们将空间统计模型和分位数模型方法引入房屋价格、夜间灯光数据、我国经济收敛性等问题的研究当中。结合相关的理论,通过新的数据分析方法引入,在这些热点问题的分析和研究中,发现了一些新的现象和特征。另外,数据采集方面,充分利用开放的R软件平台,以及现代互联网技术获取数据,例如通过网络爬虫、百度高德地图开放平台等取得研究所需的价格和地理信息数据。

四 成果的价值

(1)成果学术价值。从方法理论研究层面,项目的研究成果所提出和建立的半参数空间面板数据模型和相应的估计方法、贝叶斯空间分位数回归模型及估计方法,具有一定的理论价值,丰富了时空数据分析、空间计量经济学等相关领域的研究。

(2)成果应用价值。项目所针对的研究对象为时空数据,这类型的数据在自然科技领域或者人文经济领域都广泛地存在,因此研究报告的成果,在区域经济分析、城市化问题等领域有着较为广泛的应用前景。

(责编:王小林、黄瑾)