旧版网站入口

站内搜索

中外关系数据库建设中期检查报告

2019年11月18日14:13来源:全国哲学社会科学工作办公室

一、研究进展情况

主要内容:

一、研究计划总体执行情况及各子课题进展情况

为了评估中国周边外交环境,课题组整理了中外关系数据来分析中国与外交关系。

二、调查研究及学术交流情况

(1)调研数据及文献整理运用

为准确衡量中外关系,本课题探究了大量相关数据库,包括:

一、中国权威的外交新闻网站

二、西方整理的各类别专项数据库:关于军事冲突,有乌普萨拉冲突数据项目(Uppsala Conflict Data Program)与奥斯陆国际和平研究机构(International Peace Research Institute, Oslo)联合制作的“武装冲突数据集”(UCDP/PRIO Armed Conflict Dataset, Version 4-2014a)。关于国内政治治理,有Property Right Protection(PRS Group’s International Country Risk Guide)。关于经济风险,有PRS Group’s International Country Risk Guide。国内风险有IMF数据,投资风险主要从法律政策变动风险、贸易保护主义风险、能源价格波动风险、通货膨胀风险、汇率风险等进行评估。关于社会状况,包括人口密度、民族数量, “世界概况(World Fact book)”。关于与中国经贸关系,即与中国贸易往来,有COW数据库的“国际贸易数据集”(International Trade Dataset, version 3.0)。关于各国的军费开支,有斯德哥尔摩冲突数据库。

三、西方整理的外交事件数据库:本课题组参考了大量关于冲突的事件数据。其中重要的数据库有以下几项:国际学界常用的奥布莱恩(O’Brien)研究的综合冲突早期预警系统(the Integrated Conflict Early Warning System),该系统采用从多种渠道获得关于175个国家的650万条新闻,并用机器编码将之建构成数据集。宾夕法尼亚州立大学的“计算事件数据系统”项目(The Computational Event Data System),该项目尝试将网络上的大量关于冲突的新闻转换成事件数据。“政治动荡预测项目组”(Political Instability Task Force, 简称PITF,此前也称国家失败预测项目组State Failure Task Force),该项目试图预测各国政治动荡,建立对于全球政治稳定性问题的预警系统。

四、引入网络大数据: “综合冲突早期预警系统”(the Integrated Conflict Early Warning System,ICEWS),以及使用电脑自动编码的google提供的 GDELT全球事件数据项目(GDELT Event Database)。其他大数据来源,包括GIS地理信息系统(Geographic Information System或 Geo-Information system)和全球夜间灯光数据。

五、全球新闻媒体,包括《纽约时报》、《华盛顿邮报》、英国《镜报》、《卫报》、《路透社》、《法国新闻社》、新加坡《联合早报》、《海峡时报》、马来西亚《新海峡时报》 、《先锋报》、《当今大马》、《星报》 、《星洲日报》 、印尼《雅加达邮报》、《指南针报》、菲律宾《星报》、《马尼拉公报》、泰国《曼谷邮报》柬埔寨《柬华日报》、韩国韩联社、朝鲜朝中社、俄罗斯俄通社、日本《朝日新闻》、《读卖新闻》。

本课题组根据以上资料来源,通过整理海量新闻事件,建立了1950年至今的中国与美国、日本、俄罗斯、英国、法国、德国、印度、巴基斯担、澳大利亚、越南、印尼、韩国、欧盟外交关系事件库。与传统的数据库往往以年为单位不同,这一数据库对于双边关系的衡量细化到以月为单位。例如,研究人员可以得到每个月中美关系正面事件的分值,负面事件的分值以及中美关系的分值。而且从具体事件看,该数据库也细化到了以日为单位,例如研究者可以知道哪一天发生了双边首脑会晤或外长会晤等外交事件。每一个事件均被细分成多个维度。因此,这一数据库对于学者们研究中国外交的特点,发现其规律具有明显帮助。

(2)学术会议

2015年10月至今,本课题组每月召开中国对外数据统计分析会议,包括中国各高校专家和助理学生15人左右,至今已召开40多次。会议对每个月的中外关系进行数据挖掘、量化衡量、规律探究、经验总结和关系预测,有效提高了本课题组对中外关系的预测和预警成功率。

围绕课题内容,课题组举办了各类国内的学术会议,包括:2015年12月举行的“从清华路径到道义现实主义”学术研讨会,2018年7月举行的 “中美关系再思考”研讨会, 2018年7月举办的“大数据与国际关系研究”学术研讨会。

(3)学术交流

在项目进展过程中,本课题组与机构进行了密切的交流与合作。

(4)国际合作

课题组也举办相关的国际会议,2016年12月在清华大学举行了“中国学者争论国际关系”国际研讨会,该会议由澳大利亚格里菲斯大学和清华大学国际关系研究院联合主办,来自格里菲斯大学、美利坚大学、剑桥大学、亚利桑那州立大学、内华达大学以及国内各高校的20余位专家学者参加此次会议。

三、成果宣传推介情况

(1)成果发布会

由于本课题成果尚未彻底完成,当前还没有召开成果发布会

(2)《工作简报》报送情况、国家社科基金专刊投稿及采用情况

本课题组将在下一阶段积极将现有成果投稿给《工作简报》和国际社科基金专刊。

四、研究中存在的主要问题、改进措施,研究心得、意见建议

(1)主要问题

本课题总体进展顺利,相关研究成果陆续完成。研究成果的主要问题是:首先,本项课题只研究了1950年至今中国与七大国(美、日、俄、英、法、印、德)和五个周边国家(韩、巴、印尼、越南、澳大利亚)的外交关系数据,囿于人力所限,没能对中国与世界所有国家的外交关系进行数据梳理。其原因在于,为了确保数据的精确性,本课题只采用了人工编码的方法。

其次,课题在进程方面与国家社科规划办沟通不及时。

(2)改进措施

对于以上两项问题,将通过以下措施进行改进。

首先,采取人工编码与机器编码相结合的方法,争取将中外关系衡量扩展到世界各国。

其次,进行及时的沟通汇报。

(3)研究心得

首先,本数据库是关于中国外交关系的第一个具体到国别的双边关系数据库。在国际关系领域,目前国外已经有一些比较成熟和权威的数据库,然而,国外的数据库大多集中于西方资料,缺少与中国相关的数据,因此我国需要建立与本国相关的数据。在数据建设中,关键是要找到可以量化的变量,通过对变量的数据进行整理,可以有助与于推进学界研究进展。本数据库解决了对中国外交相关变量和指标的衡量问题:关于中国外交,本数据库不仅仅是衡量双边关系的具体程度和分值,还按照所属领域性质,将所有相关维度区分为经济类、安全类、政治类和文化类。例如,对于中国对于某一国家的外交关系,我们可以根据中国与这一国家的经济往来、贸易协议、军事交流以及首脑互访等指标加以衡量。其中,上述指标都可以数量化,因此,就可以建立对中国对不同国别的双边关系的数据库。

第二、本课题组在分解事件维度时,按照国际关系专业的特性,将每一事件分成众多维度。由于以上维度都可以直接变成国际关系领域的研究变量,这可以直接帮助研究人员进行研究。

第三、本课题组借助大数据挖掘和机器学习算法,有效地提高了预测的准确率。本课题组对于数据维度、变量和指标进行了精心的整理。不同于ICEWS和GDELT采取自动编码的方式,本课题组采用人工编码,确保了数据的准确性。从数据维度上看ICEWS在CAMEO系统中总共有20大类超过300种不同的事件类型。而GDELT又将300多类的事件最终分成四个大类,即言语合作(verbal cooperation)、现实合作(material cooperation)、言语对抗(verbal conflict)和现实对抗(material conflict)。但以上维度容易忽视事件发生双方的具体外交人员及其职务、以及合作或冲突的程度。

第四、本数据建立了完善的入库数据的真伪判别机制,能够更真实地表达双边关系的特性。在大数据时代,有些研究人员会直接根据爬虫等数据挖掘技术,将相关新闻报道直接算入数据,但是这会导致数据库噪声太大,需要多重清洗。如果清洗不干净的话,可能会出现以下问题:对于某一事件,可能有多个新闻来源报道,则在挖掘时可能重复记入,导致数据库不精确。此外,机器编码还有可能在对事件编码时错误抽取关键变量。

(4)意见建议

本课题组根据中外关系的大量数据,能够观察到中外关系变化的趋势,对于中外关系的变化能进行成功预警,并且可以探究中国外交的深层原因、尝试找到可行的解决方案。

首先,成功对于中美关系的竞争状态进行了早期预警。早在2017年,课题组就发布报告《2018年中美关系恶化但无冷战危险》。

其次、成功预测中韩关系在萨德事件后不会明显恶化。对于中韩关系,本课题组预测,尽管“萨德”事件发生后,有人担心未来中韩关系会因此而持续恶化,但是根据本课题组对2000年以来中韩关系变化的衡量,课题组认为“萨德”事件对中韩关系的负面影响不太严重,双边关系恶化程度不大(《“萨德”事件后中韩关系不会过度恶化》,《国际政治科学》2016年第4期)。根据课题组对中韩关系的衡量,自建交以来,中韩关系逐年稳步提升。在下图中比较了中韩关系和中日关系自2000年以来的变化,从中可以看出,在2000年,中韩关系与中日关系水平接近,然而“钓鱼岛事件”等矛盾导致中日关系急剧恶化,相较而言,中韩关系曲线稳中有升,因此课题组预测,“萨德”问题对中韩关系未来变化的负面影响依然有限。

第三、课题组成功对于中越关系作出了正确判断。对于中越关系,根据我们的长期跟踪研究,认为南海仲裁案对中越关系的影响是负面的,但尚不足以致使双边关系严重恶化。南海仲裁案结果发布后,越南政府无意改变南海地区的现状,也无意为了南海争端与中国全面对抗,故此中越关系可以维持现状。(《2017年底前中越关系不会严重恶化》《国际政治科学》2016年第1卷第3期)

二、研究成果情况

主要内容:

一、代表性成果简介

(1)基本内容

研究成果分为三部分:首先、建立了两个数据库:①定量衡量的1950-2014年的中国与大国关系数据库,②定量衡量的1950-2014年的中国与周边中等国家关系数据库。

第三、完成了专著 1 本,发表中文 CSSCI 论文 18篇。自2015年以来课题组每月跟踪中外关系变化,并且每季度发表对于中外关系衡量结果的报告,在CSSCI期刊《国际政治科学》发表了11篇中国对外关系的预测报告:此外,课题组成员在权威的国际关系期刊上,根据本数据库和定量衡量发表了一系列相关研究,期刊包括《中国社会科学》、《世界经济与政治》和《当代亚太》等。课题组就在整理数据库的基础上,出版了专著1本:阎学通与齐皓的著作《中国与周边中等国家关系》(社会科学文献出版2015年版)。

(2)主要观点

本课题的主要目标是结合大数据挖掘和机器学习模型对中外关系进行衡量、预测,有效提出对外环境合理应对的建议。

(一)双边关系衡量赋值

本项目主要方法是对双边关系进行定量衡量,核心是解决从事件赋值向关系赋值的转化,首先是对数据来源进行选择。其次是将数据来源中与我们的研究对象和研究范围有关的事件进行筛选和归类。第三是在“冲突-合作”这一维度上,根据对双边关系的影响力大小将已发生事件转换成一维的事件分值。第四是把事件分值进一步转换成对双边关系的影响值。最后把由事件导致的双边关系的变化值叠加在上个月双边关系的分值上,得到当月的双边关系分值。

要有效衡量国家双边关系友好或敌对程度,其核心问题是解决从事件赋值向关系赋值的转化。我们的基本设想是,双边关系是由众多事件组成的,这些事件随着时间的推移形成了一个“事件流”,对双边关系的衡量需要在事件累积和流动两个维度上同时进行衡量。也就是说,对事件影响力进行累积是我们衡量的起点,测量事件影响力随时间流动的变化是衡量的过程,双边关系现状是衡量的终点。将事件分值转化为双边关系分值的合理性,将取决于转化后的双边关系分值能否与实际经验相一致,至少要有很强的相似性。为此,我们设计了如下定量衡量双边关系的流程。为此,我们设计了如下定量衡量双边关系的流程。

(二)中国外交数据库编码

为了更好地体现中外关系,使数据库中的各个维度有利于对中外关系的研究,本课题组对具体事件的编码维度做了如下划分。按照外交事件的具体内容划分细类,对于具体事件的不同维度,课题组将之划分为五大类别。

综上可知,以上编码是我们可以针对具体研究问题进行研究的基础。

(三)双边关系预测

本课题组根据中外关系的大量数据,能够观察到中外关系变化的趋势,对于中外关系的变化能进行成功预警,并且可以探究中国外交的深层原因、尝试找到可行的解决方案。

在对采集的数据建模中,本课题组也采用了大量适宜的模型,以提高预测的准确率和对深层因果机制的探究。课题组综合采用传统回归方法和机器学习算法,包括以下模型和方法: ①Logit模型,这一回归对因变量为分类数据的情况进行回归,最后得出自变量对因变量概率变化的影响。②面板数据模型,包括动态面板模型和空间面板模型,本研究应用面板数据模型从抽象层面综合分析中国与诸大国和周边国家历年来外交关系走势,判断核心影响因素,进而预测未来中国外交的情况!③时间序列预测:回归预测对自变量的要求很高,若不能穷尽所有有影响的自变量,则可能预测准确度较差。时间序列预测是根据变量的过去变化推断其未来趋势。适用于自变量过于复杂,难以建立精确模型的情况。时间序列分析的实质是找到数据间的相关性,最后留下白噪声(white noise)。在看似无序的数据中,分离出规律和无序。本课题将这一模型应用于双边关系预测。④朴素贝叶斯模型,这一模型是根据特征预测出其类别。但是因为朴素贝叶斯模型假设属性之间相互独立,这个假设在实际应用中往往是不成立的,在属性个数比较多或者属性之间相关性较大时,分类效果不好。而在属性相关性较小时,朴素贝叶斯性能最为良好。课题组采用这一模型进行事件预测,即预测未来三个月是否会发生首脑访问等重大事件。⑤隐马尔科夫模型(HMM),该模型假设模型的当前状态仅仅依赖于前面的几个状态。n阶马尔科夫模型中n是影响下一个状态的(前)n个状态。 一阶马尔科夫过程包括状态、pi向量和状态转移矩阵。本课题组将之应用于对中国与美国、日本、俄罗斯、英国、法国、印度和德国的双边关系进行预测。预测的时间段为未来三个月双边关系的变化。预测的内容包括两方面:一方面是关系走向预测,即未来三个月双边关系是升、降还是平?另一方面是变化程度预测,即如果预测未来某个月双边关系会上升,那么将上升多少?⑥基于不完全信息的信号博弈。

(3)学术价值

本课题的学术价值是:首先、本数据库是以中文权威材料为基础的第一个最全的中国外交数据库。尽管西方也有关于中国的研究。但往往来源于西方媒体,其研究结论可能受报道偏向引导。本数据库资料来源权威。除此之外,本数据库根据课题组成员的语言和研究专长,发掘研究对象国相关政府机构和重要媒体对双边关系信息的发布和报道。这样的双向数据收集可以增加信息来源的多样性,通过比对双方对同一事实的不同反应,有助于全面地记录事实并增加赋值的客观性。这为中国与周边国家关系研究提供了大量原始数据和研究方法方面的启示,近几年来出现大量应用“数据库”数据或者以此方法研究中国与其他国家关系的学术论文。

其次,本数据库借鉴了大数据GDELT,对传统数据库进行了补充,找出国际关系大数据挖掘的具体领域。同时,本课题组也采用大数据应用的机器学习算法,如隐马尔科夫(HMM)模型、神经网络分析等,用于对未来的关系变化的预测。建立在数据基础上的关系研究可以为中国与周边国家外交提供有价值的关系走向预测,帮助政策机构了解中国与周边国家关系的阶段性趋势。

(4)社会影响

本课题组对相关数据进行了长期细致整理,得到了社会的广泛关注。

研究成果受到同行广泛好评:此项数据库被国内外学者广泛应用:例如美国哈佛大学教授Iain Johnston应用该数据分析中美关系,参见Alastair Iain Johnston, “Stability and Instability in Sino-US Relations: A Respnse to Yan Xuetong’s Superficial Friendship Theory”, The Chinese Journal of International Politics, 2011, Vol.4. No.1, pp.5-29。国内学者李巍、张萌、庞昌伟、郭锐、王箫轲、徐奇渊、陈思翀等也应用此数据库进行研究,成果发表于各CSSCI杂志!

第三、本课题的核心成果——中外关系数据受到社会广泛关注,被中国电子科技集团公司第二十八研究所采用。

三、下一步研究计划

在项目推进的这几年期间,大数据挖掘与机器学习、深度学习等建模技术突飞猛进,为了更好提高项目研究质量,与时俱进,本项目希望在以下方面继续展开进一步的深入研究工作。

1、对相关数据进行深入挖掘与整理

(1)本项目组希望将中外关系数据从原来的1950-2014年扩展至1950年-2018年

由于本项目立项时间为2015年,因此项目组在初期工作时将外交数据库的整理截止时间设定为2014年。

(2)本项目组希望引入GDEELT等大数据作为新的数据来源

在本项目组的初期工作中,为了保证数据的权威性,采用的数据来源主要为国内权威新闻媒体和网站。然而在英文大数据中,GDELT全球事件数据项目(GDELT Event Database)提供了全球100多种语言的媒体、网页上的事件信息,时间跨度为1979年至今。数据量上亿,包括国家、事件类型、地理位置等多个维度。因此本项目组希望在下一阶段将GDELT纳入数据来源,增加本数据库的完整性和权威性。

(3)本项目组希望扩大双边关系衡量的研究对象数量

在项目组的初期工作中,研究对象包括大国和周边国家:美国、日本、苏联(俄罗斯)、英国、法国、德国、印度、韩国、印尼、澳大利亚、越南、巴基斯坦。在下一阶段的工作中,本项目组希望可以将既有的数据库中对双边关系的衡量作为测试集,采用交叉验证( Cross Validation) 法,将从大树数中挖掘到的数据集作为训练集,用训练集建模,用测试集加以检验。从而可以将双边关系衡量模型推广到中国与其他各国的关系,进而衡量中国与其他国家外交关系的赋值。

2、改进事件的编码体系,使用人机结合的方式,将人工编码与机器编码有效结合

(1)改进事件的编码体系

在数据库中,对各变量维度的编码是核心内容。在编码分类上,西方的事件数据库中,主要的研究动机是希望适用于冲突领域,因此其事件的划分类型和具体维度往往围绕冲突相关的变量而进行展开。在分析中国外交事件时,有些对于双边关系影响重大的类别,在CAMEO或者 ICEWS系统等西方常用编码系统中则受到忽视。例如GDELT大数据库使用的编码体系也是CAMEO系统。在CAMEO系统中,共分为20大类,包括的事件有300个以上。在GDELT数据库中,这300多类事件划分为四个类别:口头合作类(verbal cooperation)、事实合作类(material cooperation)、口头冲突类(verbal conflict)和事实冲突类(material conflict),具体的维度有事件的发生时间、事件主动方的国家名、事件接受方的国名、事件的性质、事件的影响、该事件在各网址新闻等数据来源中被提及的次数,事件被报道时的语气,事件发生地的地理经纬度、数据录入时间、事件的信息来源等。因此,为了更好地体现中外关系,在新的数据库中,将提供有利于分析和衡量中外关系程度的变量作为编码系统。

(2)采用事件的自动编码软件,使用人机结合的方式,将人工编码与机器编码相结合

本数据库的核心内容是对外交事件的编码。数据库内容中,最重要的就是对变量维度的编码,因为这直接决定了研究的内容和方向。在西方创建的事件数据库中,早期大量采取人工编码方式。查尔斯·麦克莱兰 (Charles McClelland)对外交史采取了人工手动编码的方式。随着计算机技术的进步,一些研究项目开始采取计算机自动编码的方式。在上个世纪80、90年代,美国堪萨斯事件数据系统(Kansas Event Data System,KEDS)利用WEIS的事件编码系统通过计算机自动编码新闻事件。此外还有一些常用的编码系统:Conflict and Mediation Event Observations(CAMEO),the Integrated Data for Event Analysis (IDEA) (这一编码系统被以下项目使用the Protocol for Nonviolent DirectAction (PANDA)),斯洛德特还开发了使用这个编码系统的软件(Textual Analysis by Augmented Replacement Instructions ,TABARI)。随着大数据挖掘的深入发展,西方一些科研项目采取了大数据挖掘和自动编码相结合的结束。21世纪的项目the Integrated Conflict Early Warning System(ICEWS)针对亚太地区收集数据,这一项目采用的自动编码程序为BBNACCENT。目前美国最新开发的新编码系统是Political Language Ontology for Verifiable Event Records(PLOVER),编码软件是Python Engine for Text Resolution And Related Coding Hierarchy,PETRARCH-2。

本数据在下一步将建立人机结合的编码方式,以完善入库数据的真伪判别机制。在大数据时代,很多数据是直接根据爬虫等数据挖掘技术,将相关新闻报道直接算入数据,但是这会导致数据库噪声太大,需要多重清洗。如果清洗不干净的话,可能会出现以下问题:对于某一事件,可能有多个新闻来源报道,则在挖掘时可能重复记入,导致数据库不精确。此外,机器编码还有可能在对事件编码时错误抽取关键变量。

为了避免以上数据挖掘和机器编码的常见失误,本数据库将建立了人工编码和机器编码结合的入库数据的真伪判别机制,主要依靠专业人士人为甄别。对于相关新闻和数据的真伪,可以由专业人士进行初步筛选,然后将所得数据给相关研究领域的专家进行判别,看数据结果与专家感觉是否一致,若差异不大,可以认为数据没有大的疏漏。最后根据数据库的研究问题,寻找数据库来源以外的其他权威资料来源,根据多个资料对数据进行检验,从而增强数据的真实性。因此,本数据库依据专家检验和史料核实建立判别机制,可以保证数据库内容的准确性。

(课题组供稿 )

(责编:孙爽、艾雯)