当40亿部手机、10亿部电脑,随时随地都在向分布在全球各地的服务器发送数据,近6亿手机网民随时上传和交流数据信息,研究者看到,大数据浪潮,汹涌来袭。与互联网的发明一样,这绝不仅仅是信息技术领域的革命,更是在全球范围启动政府管理改革、加速企业创新、引领社会变革的利器。作为政府管理的一个重要信息通道的舆情监测,也在大数据时代面临巨大的考验,需要推动从间接舆情搜集管理的模式,迈向间接舆情和直接舆情相结合的新阶段,推动舆情监测和社会管理更加科学化。
一、形势描述:大数据时代的含义及其对社会各个领域带来的科学化冲击。美国IBM公司把大数据概括成了三个V,即大量化(Volume)、多样化(Variety)和快速化(Velocity)。这三个特点同时也反映了大数据所潜藏的价值(Value),我们可以认为,这四个V就是大数据的最基本特征。《纽约时报》网站2012年3月21日刊载文章称,“大数据时代”已经降临,在这一领域拥有专长的人士正面临许多机会。文章指出,“大数据”正在对每个领域都造成影响。举例来说,在商业、经济及其他领域中,决策行为将日益基于数据和分析而作出,而并非基于经验和直觉;IBM数据顾问的职责是帮助企业弄明白数据爆炸背后的意义--网络流量和社交网络评论,以及监控出货量、供应商和客户的软件和传感器等--用来指导决策、削减成本和提高销售额。在科学和体育、广告和公共卫生等其他许多领域中,也有着类似的情况--也就是朝着数据驱动型的发现和决策的方向发生转变。哈佛大学量化社会科学学院(Institute for Quantitative Social Science)院长加里·金(Gary King)称:“这是一种革命,我们确实正在进行这场革命,庞大的新数据来源所带来的量化转变将在学术界、企业界和政界中迅速蔓延开来。没有哪个领域不会受到影响。”麻省理工学院斯隆管理学院的经济学教授埃里克·布吕诺尔夫松(Erik Brynjolfsson)提出,如果想要理解“大数据”的潜在影响力,那么可以看看显微镜的例子。显微镜是在四个世纪以前发明的,能让人们看到以前从来都无法看到的事物并对其进行测量--在细胞的层面上。显微镜是测量领域中的一场革命。吕诺尔夫松进一步解释称,数据测量就相当于是现代版的显微镜。举个例子,谷歌搜索、Facebook帖子和Twitter消息使得对人们行为和情绪的细节化测量成为可能。2012年2月于瑞士达沃斯召开的世界经济论坛上,大数据是讨论的主题之一。这个论坛上发布的一份题为《大数据,大影响》(Big Data, Big Impact)的报告宣称,数据已经成为一种新的经济资产类别,就像货币或黄金一样。以纽约市为首的警方部门也正在使用计算机化的地图以及对历史性逮捕模式、发薪日、体育项目、降雨天气和假日等变量进行分析,从而试图对最可能发生罪案的“热点”地区作出预测,并预先在这些地区部署警力。
二、现实分析:大数据时代的技术、政治、文化意义理论分析。综合来看,大数据,是一个包含文化基因、政治态势、经济走向、营销理念的金矿。这个金矿有这样几个特点:(1)后台化。诸如腾讯、百度等这样的网络公司有能力借助大型高速计算机存储和管理散布在论坛、聊天、社区、微博、手机等传播终端的海量信息,这些信息从前端来看,是由用户各自加密码自我保护的,但在后台还有一个技术出口,端口是由这些网络数据公司依法把控的。(2)可控制。在大数据技术角度来看,借助高速计算机技术,互联网就是一个饭店的大堂,各个栏目、社区、群、组、甚至是私秘的聊天,在管理者来说,就像饭店大堂里用帘子隔开的所谓“包间”,都是通过技术“中控”看得一清二楚的,就像是站在饭店的二楼,看一楼天井中的大堂食客一样。(3)精准化。“一叶知秋”的文化寓言在互联网大数据时代可能成为现实,原因是这样的判断基于海量信息的科学化分析。比如,社会/社交网络上的微弱联系以及独立、偶然的信息呈现,在传统的统计技术下,就像地下贫铁矿,对开采技术要求高,开采价值也不大;但现在,高速计算机系统可以将这样的微弱联系进行历时空的对比交叉分析,从而可以探测/预测更多信息,原来近乎神话的“蝴蝶效应理论”变成现实--突然爆发在现实中的一个事件,可以借助大数据分析最终追踪到网上一个帖子甚至一句话、一个短信、一个人。从理论上来说,后台的这些数据是一个闪闪发光的信息金矿,如果能够加以合理、合法的利用,新型传媒终端对传统社会管理机遇远大于挑战--研究的内容开始涉及如何采集庞大的数字化数据集合,用来科学预测和阐释网络上的集体化行为。
三、问题概括:大数据时代对舆情监测和管理带来的冲击。以往的舆情收集一般是由专业研究人士、智库机构和内参机制等通过社会调查、访谈、统计和定性的方法,针对媒体报道、论坛BBS、社会上出版流通的出版物、聊天工具等进行概约化的统计、分析和判断,得出一些社会现象和事件描述性特征以及趋势预测。一言以蔽之,既往的舆情研究是对于“已经”物理呈现在研究者“眼前”的文本的统计和分析,其对于研究者的社会、政治、文化素养要求很高,对于资料来源广度以及信息覆盖程度要求很高。但是,在大数据时代,所有的文本都已经数字化呈现和流动的前提下,一方面是呈现在研究者面前的物理文本相对数量呈下降趋势,更多的文本以电子的形式分布在不同的传播终端;另一方面,数字技术催生的传播形式的多元化,使得有关各个方面情况描述、叙说和分析的文本绝对数量呈急剧上升趋势,举例来说,腾讯QQ一个月积累下来的文字量即可以达到7200万字,这是一个海量的信息流通。
如此,就给舆情的监测、统计和管理带来相当大的问题。一方面,海量的数字信息使得既往的研究者运用传统的研究方法搜集舆情信息已经呈现出愈发捉襟见肘的状态;另一方面,海量的数字信息及其高度的分散程度(包括手机、BBS、论坛、QQ、各种聊天工具、甚至是商务通讯工具、博客、微博以及日新月异的传播终端等)给研究者搜集信息带来相当大的难度。这样的直接结果就是囿于信息数量以及信息搜集难度的极度扩张和研究手段的相对萎缩,使得研究者得出的结论愈发带有主观臆断、片面性、临时性、阶段性、闪烁性,从而使得舆情分析的质量呈现相对下降的趋势,借助这样的舆情分析带来形势误判的风险呈现不断加大趋势,这样的一种状态,作为国家的管理者不可不察。
四、对策建议:把握大数据时代机遇,推动舆情监测和管理更加科学化的对策。大数据时代给政府管理带来的是双刃剑。一方面,数据流是越来越大,管理难度加大;但另一方面,相对于以往纸质文本的呈现形式和传播形式,电子文本的传播形式更容易通过高速计算机和搜索工具进行检索和监控,这是一个重大的思路,也是避免对数字媒体产生恐慌的理论根据。数字技术推动政府的管理之手不断地后退,真正地朝向“看不见的手”的管理模式进步,数字技术给中国提升管理水平提供了一个物理性的机遇和条件。
为把握大数据时代的机遇,提升舆情监测管理以及社会管理的科学化水平,建议如下:
(1)尽快完善数据管理立法,确保一些大型门户网站和网络数据公司合法使用后台数据,尤其注意不能因为单纯的商业利益将这些后台数据出售给境外的分析机构,此则带来的损失直接涉及到国家信息和文化的安全;
(2)从思想上确立走直接舆情和间接舆情相配合的道路。从理论角度来看,大数据时代的统计分析,通过后台数据监测、统计以及精准化的分析和定位,提供量化的科学数据,即所谓直接的舆情;如此,以往的间接舆情报告就相当于传播学研究的焦点组访谈,又再一次通过专业人士的眼光对数据进行分析,更能有效地印证舆情质量。二者交相配合,将极大地提升舆情分析科学化水平和舆情报告的精准性、对策的针对性。
(3)整合以往的舆情监测统计分析单位,或者归口依法管理,或者在宣传部下设立大数据舆情监测管理部门,对口协商广电、报纸等传统媒体信息以及门户网站、商业网络和数据公司,开发数据洪流,呈现真实舆情。如果说大数据的特点是海量和非结构化,那也是不全面的。大数据带来的挑战还在于它的实时处理。在当今快速变化的社会经济形势面前,把握数据的时效性,是立于不败之地的关键。而由专门的机构和人员,运用前沿的技术,则似可以有效把握大数据时代给中国提供的提升社会管理水平的历史性机遇。