旧版网站入口

站内搜索

基于大数据的反社会行为预测研究中期检查报告

2019年12月02日13:46来源:全国哲学社会科学工作办公室

一、研究进展情况

主要内容:

①研究计划总体执行情况及各子课题进展情况

本重大研究项目具有鲜明的深度跨学科性质,融合数学基础研究与大数据研究。重大项目立项批复以来,首席专家带领课题组成员积极按照《立项计划书》开展相关研究,按步骤推进总体研究计划与子课题等方面研究。2018年6月召开开题会。2017年至今,重点推进反社会行为大数据预测的基础研究与大数据算法研究。在反社会行为类型建模、反社会行为类型坐标化建设、负能量释放理论、能量释放过程预测、大数据算法研究、人类群体行为建模、网络反社会行为、网民心理与行为参数测算、网络舆情动态演化机制研究、网络群体行为预测等方面在《Applied Mathematics and Computation》《Physica A》《Journal of Computational and Applied Mathematics》发表SCI/SSCI收录论文7篇,均为JCR一区(近三年最高)。其中中科院Top期刊论文2篇,CSSCI论文4篇。五个子课题按计划推进,进度分别为50%,40%,60%,50%,70%左右。2019-2021计划在反社会行为一体化建模、网络舆情行为概化建模、群体反社会行为一体化建模、大数据GIS地图交互可视化、PC与移动App端开发等研究,目标是建立大数据智能化社会系统。

②调查研究及学术交流情况

调研任务为大数据社会治理模式与反社会行为案例收集。2017年11月至2019年7月,国内进行11次实地调研。调研地点涉及湖南、四川、江西、湖北、贵州、广东、上海、浙江、陕西、新疆、山东等地。2018年8月至2019年7月,首席专家吕鹏教授访问首尔大学,对韩国的大数据治理模式与反社会行为进行实地调研,地点涉及首尔、江陵、釜山、蔚山、世宗等地,场景涉及地铁、广场、商场等。2017-2019至今,阅读并整理核心文献资料320篇。参加学术会议10余次。挖掘大数据案例600例,整理现实反社会行为案例200余例(媒体公开报道且具有全国影响力案例)。赴韩国等进行国际合作与交流,与首尔大学社会学系、首尔大学公共管理学院建立合作进行中韩反社会行为对比研究。参加国际学术会议6次。在韩国主讲讲座两次,与美国、印度、法国、韩国、日本等学者会议交流14次。

③成果宣传推介情况

拟于2019年10月召开成果发布会,计划进行三次;

④研究中存在的主要问题、改进措施,研究心得、意见建议;

包括:(1)研究中新发现“王朝周期律仿真模拟”应是反社会为核心研究部分。常规反社会不引发系统性风险,“王朝周期律仿真模拟”预测系统性风险,提供重大历史借鉴与超然性改革思路,迫切需要纳入研究课题; (2)原计划“反社会行为大数据预测预警应对平台”建设具有重大工程性质,包含七个子系统功能模式。

二、研究成果情况

主要内容:

①代表性成果简介

成果1:基于“能量算法”建构人类反社会行为预测模型

基于大数据的反社会行为预测研究,核心是要找到一种大数据算法。因此,本研究基本科学问题是互联网虚拟空间的人类行为规律研究。研究团队在此领域做出了开创性研究,借助自然科学理论嵌入社会现象刻画,研发出“能量算法”。反社会行为其本质是一种负能量释放,负能量积累导致负能量释放,类型包括个体反社会、群体反社会(网络舆情事件、网络谣言传播)等。以负能量为例,个体负能量累积受到发展水平、社会剥夺、群际比较、经济收入、健康特征、家庭关系、偶发事件等复杂性因素影响。人类反社会行为(群体事件或网络舆情事件)本质是能量累积与能量释放过程。基于“能量守恒”,能量积累等于能量释放,即个体、组织与国家均倾向于维持内在秩序平衡。能量过程四阶段包括能量输入(Prepare)、能量燃烧(Outbreak)、能量峰值(Peak)与能量转化(Vanish)。“能量算法”将自然科学与社会科学知识进行桥接与融合,从复杂性视角证明能量规律的普适性。基于能量视角与能量算法,可以实现对各种反社会行为类型的建模预测。本重大项目将大数据时代的互联网谣言传播过程与舆情危机事件作为突破口,实现“基于四个参数预测网络反社会行为动态全过程”,具有重大实践价值。研究得到国家部委肯定,相关成果作为工作基础获国家民委《涉民族网络舆情大数据研究》课题立项。

成果2:网络反社会行为个体参与倾向5‰规律研究(参数一)

本重大项目的研究范式为“社会物理学”,参数一为5‰,用于“能量输入”阶段预测。2018年发表在著名跨学科英文期刊Physica A (IF=2.5, JCR2017一区)的研究论文《Exploring the Participate Propensity in Cyberspace Collective Actions: The 5‰ Rule》,为SCI/SSCI收录论文。通过网络群体事件的大数据挖掘与分析,发现存在“千分之五”规律。互联网空间中,网络浏览与网络参与量之间存在稳定的比例关系约为5‰。互联网与大数据正在成为网民生活不可缺少。网民全部行为展示为一个谱系,包含渠道(Access)、浏览(Browse)、参与(Participate)、线下(Offline)四个阶段。四个阶段存在三个转移概率(transition probability)。当前研究主要集中在第二个转移概率,即PBP。现实情况下,互联网信息的浏览量(Browse)是巨大的、无规则的、分布差异巨大的。互联网信息的参与量(Participate)也是巨大的、分布无规则的。但二者比值是非常有规律的。网络舆情事件案例采集自BBS网站天涯论坛(bbs.tianya.cn)。有一部分的值大于5‰,大部分的值小于5‰,总体均值接近5‰。故而,称之为“千分之五”规律。进而可以获得PBP的分布特征规律。如果一旦获得稳健的PBP分布特征,就可以在更大规模、更大样本的情况下实现为网络群体事件与网络舆情事件的大数据轨迹动态预测。代入在线浏览量动态数值,就可以预测实际参与量。

成果3:网络群体反社会行为参与概率影响因素研究(参数一)

网民个体的网络舆情事件参与概率为千分之五,也可以认为网络舆情事件的参与概率为千分之一。2018年发表在中科院top期刊Journal of Computational and Applied Mathematics (IF= 1.88, JCR一区)研究论文《Structural effects of participation propensity in online collective actions: Based on big data and Delphi methods》,为SCI/SSCI收录论文。已经研究了数学期望(5‰),还需要研究不同事件与个体参与的异质性及其影响因素。网络群体事件分为准备、爆发、峰值、消散四个阶段。其中,在能量输入阶段存在“千分之五”规律。网络浏览与网络参与量之间存在稳定的比例关系,约为5‰。故而,称之为“千分之五”规律。需要指出的是,5‰只是online collective action的平均值,具体到每一个事件的参与倾向存在异质性。该论文具体研究网络群体事件的参与倾向及其影响因素。网络舆情事件存在结构性影响因子:其一是利益导向。即网民参与网络舆情事件的基础是因为有利益关联;第二是规则导向,即参与者认为公共政策与相关规则的不公平是参与和发起网络群体事件的原因;其三是道德公益导向。个体参与事件不是因为利益受损,也不是因为规则不公,反而是一种非直接相关的形态。利益导向(Interest-based)、规则导向(Rule-based)、道德公益导向(Moral-based)共同构成个体参与网络舆情事件的结构性动因(structural factors)。结构性动因决定个体参与网络舆情事件的过程。

成果4:基于能量峰值时刻预测群体反社会行为持续时间(参数二)

参数二为Ratio,该参数刻画峰值出现时间与总体持续事件duration的相对关系。2018年发表在Physica A(IF=2.50, JCR2017一区)的研究论文《Big data prediction of durations for online collective actions based on peak’s timing》发现群体行为峰值的出现时间(Tp)与群体事件持续时间(Span)二者比率稳定,分布呈现高斯-正态分布关系,且通过仿真模拟和大数据案例双重科学验证。

成果5:基于反社会行为持续时间预测能量峰值高度(参数三)

参数三为Rate。参数Rate是峰值高度与持续时间的比值。2018发表在中科院Top期刊Communications in Nonlinear Science and Numerical Simulation(IF= 3.967, JCR一区)的研究论文《Predicting durations of online collective actions based on Peaks’ heights》的大数据挖掘结果表明,持续时间(Span)与峰值高度(Peak)二者比值稳定,其分布服从广义高斯-正态分布关系即对数正态分布。参数三结合参数二,可以代入持续时间(Span)测算峰值高度(Height),进行双重验证。

成果6:群体反社会行为能量释放过程特征预测(参数四)

参数四为Strength。计算能量释放激烈程度用于过程轨迹动态预测。研究论文题为《The Strength Distribution and Combined Duration Prediction of Online Collective Actions: Big Data Analysis and BP Neural Networks》发表在Physica A(IF=2.50, JCR2017一区)。基于参数二与参数三,可以得到共同趋势三角形(common trends)。但是现实观测到的群体事件过程是非线性的,这就需要加一个参数即Strength予以刻画。Strength是总参与量与总持续时间的比值,代表全过程平均参与度。Strength值越大,能量释放过程越平缓,越具有持续韧性;Strength越小,能量释放过程越突然、越陡峭即越sharp。参数四为曲线形态调节参数,非必要型参数,但是可以让过程预测更加符合观测数据,且可以实现对特定子类型行为的定向逼近。

成果7:整合四个参数的人工智能与链式预测规则

鉴于峰值实际、峰值高度与能量释放均与能量释放持续时间duration存在数学关系,可以通过神经网络与人工智能算法进行。可以通过动态调整参数权重与路径系数进行实时最优化预测。基于四个参数的有序使用,可以实现任意反社会行为行为(网络舆情事件)的当下预测,不依赖未来数据。该链式规则为:首先基于参数二预测duration,进而根据duration预测参数峰值高度。基于参数二与参数三,可以得到演化过程三角形(common trends),已经可以满足设计要求。但是如果要刻画动态演化过程,尤其是具体、高清的运行过程,则进而依据参数三预测动态演化过程。

成果8:网络舆情信息传播机制ABM建模及其仿真模拟

2018年发表在著名跨学科英文期刊Applied Mathematics and Computation (IF=1.632,JCR一区,中科院Top期刊) 最新研究论文《Heterogeneity, judgment, and social trust of agents in rumor spreading》,为SCI/SSCI期刊收录论文。作为一种典型的人类特定群体、特定目标的合作机制,网络群体事件与网络谣言传播得到研究者的重视。数学建模与预测是研究谣言信息传播已经被广泛运用。使用微观行为建模来进行研究。这些模型来自SIR 模型的变种。在此模型中,一种基于个体之间互动的微观模型被提出来以研究谣言信息的传播过程。个体与邻居互动进行。首先是第一个人进行信息传播,传播给最近的邻居,每传播一次,听说次数增加1。个体具有异质性,当听说次数触及个体阈值的时候,个体就会决定传播,变成一个谣言传播者。通过观测特定参数的仿真模拟结果,并与现实大数据过程案例进行动态比对,就可以反向推测现实世界的真实参数分布特征。

成果9:网络谣言传播线性与非线性特征及其平滑预测

2019在著名跨学科英文期刊Physica A (IF=2.132)发表最新研究论文Two-stage predictions of evolutionary dynamics during the rumor dissemination,为SCI/SSCI收录论文。谣言信息传播具有线性特征与非线性特征。作为一种宏观现象,信息传播需要在微观层面上得到微观行为支撑。使用ABM智能体建模具有理论可行性与现实操作性,这在大数据与移动互联网时代显得十分必要。本研究通过ABM建模来研究互联网虚拟空间中的微观信息传播机制与表现。需要指出的是,该特征形态在互联网虚拟空间具有很大的代表性,有相当部分案例符合两阶段特征。

仿真模拟的结果表明,谣言与信息传播过程存在非线性特征与线性特征,两个泾渭分明的特征之间存在过渡性点D。具体而言,OD是线性传播与人数增加阶段,DE是非线性传播与人数增加阶段。在线性阶段OD, 信息与谣言传播的渗透率增加的非常厉害,这是所谓的信息爆发阶段。在非线性阶段DE,谣言与信息传播的渗透率开始减缓,直至增加至100%。我们使用OLS方法对仿真模拟过程OD与结果进行估计,预测精度很高达到98%–99%,这非常接近100%;对于非线性过程同样进行估计,发现存在二次效应,结果表明预测精度也可以达到98%。基于非线性过程与线性过程的高精度估计与拟合,我们将两个阶段进行整合成一个完整的信息与谣言传播过程即OE=OD+DE。于是可以得到非常完整的传播过程,通过平滑化处理,得到非常接近观测案例的全过程平滑曲线。

成果10:基于“能量算法”的分类型反社会行为过程轨迹预测

代入优化训练之后的参数估计,即可获得平滑大数据轨迹预测,包括总体预测与分类型预测。

成果11:基于ABM的曲线拉伸、概化过程与双向匹配验证

基于大数据收集的案例,都可以按照数据拉伸原则(scaling)进行变换处理,核心目标是S型曲线。因为S型曲线是社会系统、经济系统乃至自然界生态系统的普适性演化形态。基于ABM的仿真模拟过程就是通过参数调整实现S型曲线特征,是的参数仿真模拟过程与现实发生的案例具备最大程度匹配。将数据x-y方向变换参数再次代入过程(即使用其反函数),实现曲线形态的反向拉伸,还原原始状态,进而实现原始案例的大数据精准预测。

三、下一步研究计划

“以史为鉴,可以知兴衰”(《旧唐书?魏徵传》),课题组最新认为“国家兴衰大数据预测”应是本重大项目“基于大数据的反社会行为预测研究”的头等大事。因此在推进原计划研究的基础上,追加“王朝周期律仿真模拟”。拟将生命周期规律与能量过程算法作为主要预测工具,结合历史大数据进行基于大数据与仿真模拟的研究。中国历史兴衰过程受“王朝周期律”支配。先后出现数十个王朝、朝代或政权。尽管皇家姓氏、政权国号、持续时间、人口规模、疆域面积等特征各异,但都存在“兴起—鼎盛—衰亡—灭亡”循环往复。 王朝周期即“寿命”或长或短,既有长寿命(夏、商、周、汉、唐、明、清)也有短寿命(秦、隋、新莽、后唐、后汉等)。无论历经几代君主、疆域面积多大、文化何其繁荣,均不能逃脱“王朝周期律”命运框定。历代王朝治国理政与兴衰更替研究为当代国家与社会治理、社会主义建设、高质量发展提供预测指导。

(1)王朝国运兴衰周期律规律及其可预测性:90与130年

正所谓“眼看他起朱楼、眼看他宴宾客、眼看他楼塌了”。“兴衰周期律”已经成为王朝“大限”与“诅咒”,似乎冥冥中兴衰更替自有“天数”或“定数”。王朝兴衰周期律的所谓“定数”与“恒常”客观上体现为王朝(正史承认)核心特征变量的分布特征:(1)王朝寿命。王朝平均寿命为130.48年,即王朝寿命期望向130年靠拢(约两甲子)。若计算从秦汉到明清的封建专制时期,平均寿命为88.65年约90年。当然各朝代周期或寿命存在异质性,围绕均值上下波动产生一定程度的偏差。考察王朝寿命分布。一部分朝代持续时间在400年以下,但是也存在长周期情况,例如周朝约800年。唐朝、两宋、明清约300年,更有短者如新莽15年。鉴于王朝寿命呈现偏态分布,进行对数化处理,发现Span分布接近对数正态分布。故而王朝寿命Span近似服从均值为4.08,标准差为1.33的对数正态分布,即Log(Span)~N(4.08,〖1.33〗^2)。这种分布在中国和世界都存在,西方学者对全世界帝国王朝的研究也存在类似的偏态分布特征 ;(2)王朝疆域。统计各王朝的最大疆域面积,平均面积为394.8万km2,标准差为365万km2。就分布特征而言,也存在类似的偏态分布特征。小于平均值的朝代非常多,大于平均值的朝代依然存在。例如元朝、清朝疆域分别为1400万与1297万km2。取对数发现王朝疆域Area分布接近为均值为5.50、标准差为1.02的对数正态分布,即Log(Area)~N(5.50,〖1.02〗^2);(3)峰值人口。统计各代峰值人口,平均峰值人口4041万。取对数后接近均值为7.66标准差为1.06的正态分布,即Log(Pop)~N(7.66,〖1.06〗^2)。历代王朝核心特征可以用随机变量(寿命、人口、疆域等)分布函数表征。均值则揭示王朝周期存在的“天道恒常”规律。例如,王朝更替的“五德终始说”、“天道恒常”、“天命轮回”可被解读为王朝寿命Span服从的某种有规律如对数正态分布。因此,采用随机变量刻画社会核心特征。

(2)反社会行为、国运兴衰、王朝周期、任期时长、全球帝国、沙尘暴、地震分布、生物多样性的“天地人”大系统宏观规律的内在统一性

“宏观涌现背后的规律往往是简单的、朴实的、普适的”。首席专家吕鹏教授坚持将自然科学与社会科学统一考察,打通“天、地、人”将自然现象与社会规律进行统一的系统性考察。吕鹏研究表明,自然现象中的沙尘暴、地震分布、生物多样性的分布与社会现象的国运兴衰、王朝周期、执政年限、全球政权等存在相同的特征规律。这表明,自然现象与社会现象的宏观涌现在系统层面存在统一的基础。因此,申请者将自然现象与社会现象可以纳入同一系统范畴进行考察。

不仅王朝周期寿命存在幂律分布特征,各朝各代的皇帝执政时间也存在类似特征。对中国历史朝代上的皇帝在位时间进行大数据分析,发现其仍然服从LogN(>t)=C-dt的幂律分布特征。

中国历史上,按照疆域范围可以划分为大一统王朝与割据政权。在秦汉到明清的信史中,区分两类常见类型,即大一统王朝(Unified Regimes)与割据王朝(Separate Regimes)。历史大数据分析结果表明,无论是大一统王朝还是割据王朝都服从LogN(>t)=C-dt幂律分布。

日本历年天皇(n=130)在位时间与中国皇帝执政时间(n=276)进行比较研究。可以发现在中国、日本两国的皇帝在位时间均存在LogN(>t)=C-dt的分布特征。中国历史上的皇帝在位时间分布为一条直线,日本皇帝分布的趋势也是直线。区别是,日本皇帝的在位时间比中国皇帝更长。需要指出,LogN(>t)=C-dt的幂律分布图通过标准化变换,就可以完美转化为寿命概率图。由公式可知,max?(LogN(>t))=C且min?(LogN(>t))=0。如下式所示,标准化之后的幂律分布函数被直观地解读为“帝王执政在位时间超过t年”的百分制概率。

(LogN(>t)-min?(LogN(>t)))/(ma x?(LogN(>t))-min?(LogN(>t)))=(LogN(>t)-0)/(C-0)=(C-dt)/C=100%-dt/C

打通“天、地、人”进行建模仿真将自然现象与社会规律进行统一的系统性考察。帝国寿命周期、皇帝在位时间属于社会现象,即“人”的范畴。那么自然现象中也存在相同的幂律分布函数,即 LogN(>t)=C-dt。例如,沙尘暴与地震分布就属于“天”的范畴(天灾),生物界的生物多样性就属于“地”的范畴。相关学者对沙尘暴爆发持续时间分布特征的研究已经充分表明,沙尘暴持续时间超过特定时间t(分钟)的频数同样服从相同的分布特征(Liu,2012)。

不仅是沙尘暴,相关学者(Liu, 2017)对沙地震爆发持续时间的分布特征研究结果表明,同样存在LogN(>t)=C-dt的分布特征函数。

除沙尘暴、地震之外,生物界的物种多样性分布也符合类似的幂律分布特征。研究发现,物种的生存时间也存在LogN(>t)=C-dt的分布特征函数。

(3)基于生命周期与能量过程函数的王朝仿真模拟

前期研究的“生命周期理论”与“能量算法”可应用于群体事件、网络舆情事件、农民起义、社会运动、反社会行为等,这些直接决定国家生命力。基于此,采用生命周期函数刻画王朝社会结构合理化程度及王朝“气数”。中国古代社会始终是传统社会,以农耕文明为基本特征。历朝历代采取“重农抑商”国策,宋元时期稍宽松。土地作为核心的社会资源参与财富生产与分配过程,土地资源分配结构决定封建专制王朝的社会结构与生命力。结构合理的王朝的社会有机体是健康的、负能量(农民起义等)是少的、生命力即“气数”旺盛。

反之,结构异化王朝的社会有机体是不健康的,表现为负能量释放与爆发(农民起义、天灾人祸等)。大部分民众不拥有土地与生产资料,上层建筑庞大、官僚集团臃肿。各地豪杰、匪盗、绿林丛生,百姓参与支持反社会分子推翻封建朝廷。底层失落精英与上层野心家都会发动利益受损、挣扎在温饱线的民众进行改朝换代,即生存底线型革命或“馒头革命”。

那么,核心问题是如何精确测算王朝在某个时刻t的健康程度或生命力(气数)。如下式,基于吕鹏的“生命周期理论”开发生命周期函数,计算全生命周期任意时间节点t时候的王朝生命力。王朝生命力与反社会力量是一对矛盾,服从如下规律。二者相互补充,积分之和为100%。

(4)社会系统建模与仿真模拟的历史大数据信息收集

拟开展基于历史大数据的社会系统仿真模拟。鉴于“生命周期”与能量过程的数学建模、主体设置、核心算法、仿真模拟等相关工作日臻成熟。核心工作变成基本参数信息收集。代入相关参数,将自进行仿真模拟过程。拟收集第一类信息为社会上层建筑核心参数,如皇权、宦官、外戚、相权、文官(党争)等数据。

第二类拟收集数据为社会有机体系统信息,含疆域、河流与人口等,最核心参数为人口。人口增长带来资源稀缺,导致王朝覆灭、人口减少,周而复始。

拟收集数据第三类为自然系统的数据。传统中国是农业社会,温度是粮食产量的决定性因素。拟结合国内外温度研究的数据与历史记载进行加权处理。

(6)总体执行方案推进计划

第一、基于GIS的基础数据互联互通

作为社会病症,反社会行为根源于社会有机体的不健康状况,其发生概率与社会结构特征变量息息相关,且与环境、水文、气象等因素也存在相关性。预测反社会行为的首要工作是打通基础数据,实现属地数据互联互通。目前这些变量数据处于孤立与区隔状态(信息孤岛),散布在民政、气象、建筑、经济等政府部门和大型互联网公司。应打破数据壁垒,将吸管数据整合使用,发挥大数据组合预测的优势,以提高反社会行为大数据模型预测的精度。拟整合使用的关键变量包括:国民经济、社会发展、历史事件、公共安全、地理气象、水文建筑、环境生态等。第一步实现省级数据与历史数据(panel data)互联互通,第二步推进市县级数据联通,研究基础初步具备。以GIS单位统摄基础数据库,基于此进行大数据反社会行为预测。反社会行为大数据预测结果同样是以地理信息坐标形式给出,这要求采集到反社会行为的GIS信息。

第二、反社会行为宏观结构因素分析

反社会行为的首要原因是社会出现结构性问题。结合数据挖掘、传统研究与文献研究梳理,锚定影响反社会行为发生概率的关键宏观结构变量。初步表明,收入分配、城镇化速率、工业化速率、社会心态、民生状况、地域性格、历史数据、社会张力、社会情绪、社会戾气等深刻影响反社会行为的发生,这些因素发挥解释变量作用(Xs)。被解释变量是反社会行为/事件的发生概率、发生地点、发生场域、事件类型、呈现形态、暴力程度、激烈程度、持续时间、演化路径等(Ys)。“面预测”指的是对反社会行为发生概率等的预测,这些宏观结构变量主要承担宏观趋势预测即“面预测”功能。重点构建解释变量与被解释变量的函数关系,实现对群体突发事件发生概率、事件类型、表现形态、激烈程度与演化路径等的“面预测”。“面预测” 发挥事前预测的作用,属于总体性预测,是反社会行为预测的研究基础。随着数据库样本的扩展,将动态纳入新因素变量以优化大数据“面预测”进程。

第三、反社会行为微观个体因素分析

“面预测”服务于事前预测,一旦反社会行为或事件已经发生将使用“点预测”,此时宏观社会结构因素不再适应。针对具体反社会行为与事件“点预测”主要使用微观个体因素变量。反社会行为不仅受到宏观结构因素影响,同时受到微观个体因素影响。微观个体因素主要指反社会行为的参与者内在固有的属性特征。反社会行为实施者或反社会事件参与者具有高维度、多方面的异质性,包括反社会倾向异质性、性格倾向异质性、风险偏好异质性、社会网络异质性、主观效用异质性、参与成本异质性、视野角度异质性、衰减系数异质性等多源异质性。个体微观因素发挥“点预测”功能,基于此实现对特定反社会行为、特定激发情境与特定演化过程轨迹的针对性预测。研究将整合宏观“面预测”与微观“点预测”,建立综合性“点面预测模型”,整合事前概率预测(面预测)与在线实时预测(点预测)功能。

第四、反社会行为预测模型锤炼(training)

反社会行为大数据预测采用“点面预测模型”,拟通过持续迭代动态训练并优化大数据预测模型。基于反社会行为大数据案例数据库,初步建立大数据预测模型是容易的。但是,预测模型的锤炼是一个细致漫长的过程,需要结果不断锤炼才能获得数据拟合度与预测精度相对最高(BLUE)模型。拟采用多种实验方法与关键技术获得反社会行为相关变量的真实参数估计: (1) 实验方法。包括真人场景实验、计算机仿真模拟实验、典型反社会案例分析、动物(小鼠)实验、大数据监测、互联网实验、微信微博实验、社会情绪策略等;(2)分析技术。综合大数据分析、数据挖掘、网络文本分析、神经网络分析、panel data分析、贝叶斯估计、关联分析、聚类判别分析、动态视频分析、倾向值匹配、策略特征矩阵分析、风险收益比分析等研究方法。持续提升、优化预测性能,服务大数据精准应急管理。

第五、反社会行为大数据预测预警应对系统

“反社会行为大数据预测预警应对平台”,包括七个子系统: (1)神经感知系统。让“灵敏变量”发挥神经元作用,先期侦知征兆反社会行为; (2)动态预测系统。基于社会宏观因素个体微观因素,综合运用各种分析手段对特定类型反社会行为进行精准预测; (3)风险预警系统。基于大数据预测结果,设置I、II、III、IV等反社会风险等级,定期绘制动态风险地图; (4)信息传递系统。相当于医院“转诊导诊系统”,将各类型反社会行为相关信息传递到对应的专业部门与人员; (5)工作应对系统。对特定类型反社会行为进行有效应对,主体是专业化机构与专家(政府部门、专家学者、社会工作者、心理咨询师、公安人员、谈判专家等); (6) 资源派遣系统。将特定类型反社会行为解决涉及的必要装备物质进行精确派遣; (7)调整反馈系统。针对预测偏差进行反馈与调整,持续提升预测预警结果的稳健性与精确度。

第六、王朝周期律仿真模拟研究推进技术路线【追加研究】

社科重大项目所追加的研究内容(王朝周期律仿真模拟)具有紧迫性与战略性。其研究推进按照八个阶段有序进行。

具体包括:(1)首先对王朝帝国进行生命周期函数构建,其构建过程与反社会行为(群体事件)一致;(2)生命周期函数采用“能量算法”建模,通过计算能量动态过程刻画王朝帝国生命力;(3)对历史上各时期参数进行重点收集,首期收集汉唐宋元明清等大一统王朝与国外典型帝国数据(波斯帝国、罗马帝国等);(4)对收集到的参数数据进行大数据挖掘与非线性处理,工作目标是获得参数分布特征,这些参数特征将直接用于仿真模拟的构建;(5)ABM建模仿真。其哲学思维支撑为系统论与随机论,将参数核心特征赋值随机变量,将不同层次行为体作为复杂随机系统的必要元素。基于收集到的历史大数据参数信息与能量模型,采用ABM智能体建模方法,构建三级相互制约的行为体复杂系统(Complexity)。以个体、家庭为微观行为体即micro-level Agents, 以地方(州、郡、路、道、省)为中观行为体即mediate-level agents,为国家生命周期函数(刻画国家兴衰、政权生命力、反社会概率等)为宏观涌现目标变量(宏观行为体)进行仿真模拟。国家之所以作为宏观行为体即macro-level agents是因为:一是历史上存在诸多割据政权,他们之间的互动关系影响历史进程;二是历史上即使是大一统王朝也会与周边少数民族政权产生直接互动;(6)首期工作重点模拟夏朝、商朝、周朝、汉朝、唐朝、宋朝、元朝、明朝、清朝等中国大一统政权,第二期工作模拟五胡十六国、魏晋南北朝、五代十国等割据政权并存的历史时期;(7)在国际比较方面,将西方历史上的帝国纳入考察范围,首期选择罗马帝国与波斯帝国。选择二者的共性理由为二者都是著名帝国,特性理由是罗马帝国在欧洲,波斯帝国在中亚地区,具有地缘代表性;(8)历史研究的最大价值是为当下提供参考与借鉴价值。基于历史王朝仿真模拟,可以在很大程度为当下社会问题的解决与改革变法提供基于历史宏大视角的解决方案,为人民民主专政的中国特色社会主义国家长久地跳出“周期律”提供基于历史大趋势与全球历史智慧的“超然性”改革措施与解决方案。

课题组供稿

(责编:孙爽、艾雯)