数据新闻,又叫
数据驱动新闻。是指基于数据的抓取、挖掘、统计、分析和可视化呈现的新型
新闻报道方式。数据新闻在大数据技术的推动下发生质和量的飞跃。数据新闻是随着
数据时代的到来出现的一种新型
报道形态,是数据技术对新闻业全面渗透的必然结果,它的出现在一定程度上改变了传统新闻
生产流程。
产生历程
第一个利用数据进行的新闻报道可追溯到1821年5月5日。
卫报历史上第一份报纸的
头版新闻:
曼彻斯特在校小学生人数及其平均消费统计。这份数据可以从卫报的网站上下载到原版的PDF数据。
数据新闻不是一夜之间就有的。它的萌芽是从计算机辅助报道(computer assisted reporting)开始的。20世纪50年代,美国就有媒体记者利用
大型计算机对政府提供的数据库中的信息进行分析,以调查和发现
新闻事实。记者在政府机构、企业等所发布的有限数据中,发现新闻选题或者将这些数据作为佐证发现、拓展深度的重要资料。而在如今大数据的背景之下,记者能够获取和利用的数据量相较而言是那时的无数倍。
数据新闻有别于
精确新闻和
数字新闻。精确新闻由美国学者、新闻记者
菲利普·迈耶在20世纪60年代提出,指记者在采访新闻时运用调查、实验和
内容分析等
社会科学研究方法来收集资料、查证事实,从而报道新闻。这类新闻报道20世纪70年代风行于
美国新闻界。80年代,
中国新闻界开始运用这种新闻报道方法。它的特点是用精确的具体数据分析新闻事件,以避免主观的、人为的错误。它侧重于微观的具体调查、实验和内容分析。而数字新闻,则指以数字、公式、字母等静态形式来辅助文字报道。所说大数据新闻,显现的是对大数据的挖掘与处理的结果,可以通过复杂的交互式、动态化的图片和视频来呈现这类新闻。
功能与优势
在大数据新闻制作上已经积累了经验的国际媒体有《
卫报》《
纽约时报》《
华盛顿邮报》等,但它们也处于探索阶段。通过对国内外
代表性媒体的大数据新闻实践进行研究,可以总结出大数据新闻的四个功能,即描述、判断、预测、
信息定制。
新闻叙事
《
卫报》网页2012年1月5日发布了一个有关“
阿拉伯之春”的大数据新闻报道。报道利用动态图表,以
时间轴为主线描述了自2010年12月一
突尼斯男子自焚至2011年12月的一年间,17个
阿拉伯国家发生的一场政治运动。网民可以通过这个四维动态的报道,清楚地从宏观到微观,全面了解阿拉伯之春在不同国家的不同表现形式。图表上方设置了时间的推拉按钮,网民推拉到自己想观看的
时间点,可以清楚地看到相同时间点上不同国家发生的相关事件。画面的下方是各个国家的标签,网民也可以通过国家标记,来关注某个具体国家在纵向时间轴上的政治演变进程。不同的
政治事件用不同颜色来标示:绿色为群众性抗议活动,
浅蓝色为国际上的相关反应,黄色为政治事件,红色为政权更替。如果网民想了解某个事件的具体内容,点击不同颜色的标示,随即获取深度报道的链接。这种新闻报道方式,将涉及十几个国家、时间跨度长达一年的复杂的“
阿拉伯之春”,以明晰的动态方式呈现出来,纯文字报道难以达到这样的
传播效果。
大数据新闻还能够描述那些看不见的短期过程,比如流言如何在社交网络上传播。《
卫报》通过
追踪分析260万份
推特内容,利用可视化动态图表描述了从流言开始传播到辟谣结束的整个过程。它也是以时间为轴,利用圆圈大小、颜色变化来描述整个过程,绿色的圈代表散布流言的推文,红色的圈代表更正这个流言的推文,灰色的是中立的评价推文,黄色的是对流言持怀疑态度的推文。圈的大小代表了推文的影响程度,圈越大影响程度越大。如果想了解具体的内容,点到哪个圈,屏幕旁边即刻呈现这个圈所代表的推文的发布者、发布日期、转推人数等等信息。通过这个动态的
演进过程,人们可以清楚地看到,社交网络并不像一般想象的那样,是一味扩散虚假消息的场所。其实在假消息出现不久,社交网络上各种辟谣的消息就已经出现了。
从这两个例子可以看出,大数据新闻的报道方式能够在宏观上对某个事件看得更加清楚与全面,事件复杂的演进过程以及这个过程中的各个方面,都能描述得直观且有趣。
事实判断
2011年8月,一个黑人穆斯林男子乘出租车在
伦敦街头遭到警方拦截,双方发生枪战,该男子当街死亡。两天后,约300人聚集在伦敦市中心的警察局进行抗议,后来演变成持续多天的骚乱事件,抗议者引燃了汽车、商店和公交车。当天夜里,伦敦其他地区也发生了类似袭警、抢劫、纵火等事件。一些
媒体评论指出,这与
贫富差距有关。
英国首相卡梅伦接受采访时,声称骚乱事件与贫富差距无关。
英国《
卫报》记者利用大数据的
分析结果,做了关于这一事件的
系列报道,其中的一个报道主题,便是骚乱与贫困有没有关联。记者利用
谷歌融合图表,在
伦敦地区地图上标记出骚乱分子的居住地信息(黄色点)、实际发生骚乱的地点(灰色点),以及贫困地区分布(越偏红色表示越贫穷)。根据这张伦敦市中心的图,网民可以将图扩展到整个
大伦敦地区来看,也可以聚焦到具体的街区放大来看,观察每个被标记的骚乱点的人流从哪里来,到哪儿去,从而清楚地看到贫苦与骚乱之间存在的某种关联。这种关系的表达,比起单纯的文字报道来,表现清晰,说服力强。
预测走向
2013年“十一”长假期间,九寨沟发生游客大量滞留现象并引发
群体性事件。如果
新闻媒体或旅游当局能够在此前运用中国的局部大数据进行
预测性报道,完全可以避免这样的群体性事件发生。因为传媒可以根据这方面的大数据,提前报道在哪个具体时间段内,有多少人从哪些地方前往九寨沟,其中男人、女人、老人、儿童各有多少等等。
这只是一个小例子,大数据能够预测社会和人们日常生活中的各个方面。通过挖掘大数据,传媒在技术上可以制作出可视化、交互式的图表,告知很多事项。微观的如流行疾病来袭、交通拥堵情况;宏观的如
经济指数变动、某种社会危机的来临等等。百度开辟了“
百度预测”网页,以“大数据,
知天下”的口号推出,预测的产品有高考、世界杯、
电影票房等等。它们后期准备上线的产品扩展到了更广的领域,比如金融预测、房地产预测等等。
信息定制
利用大数据的分析结果,满足网民的信息个性化要求,是国外媒体的最新尝试。例如Five thirty
eight数据博客,在2014年5月23日新辟
读者来信专栏“亲爱的莫娜”。其第一期开篇语阐释的目的是:“我开这个专栏是为了帮助读者回答一些生活中重要的或者严肃的问题,比如我是不是很正常、我处在世界的哪个地位层面等等,目的不是为了给读者答疑解惑,不是告诉读者应该做什么和不应该做什么。恰恰相反,我提供数据来解释、描述你的经历。”
综观这个专栏,读者的提问五花八门,比较严肃的如:“美国有多少人从来没有喝过一滴酒?”“美国有多少男性空乘人员?”也有比较私人的如:“我该多久换一次袜子?”“
婚前同居会不会导致离婚”等等。专栏作者利用美国范围内的大数据,即刻将分析结果告知当事人,但避免给出
指导性意见,仅告知各种数据的分析结果,让网民自己依照分析结果来处理自己面临的问题。这个专栏与传统的纸媒读者来信专栏不同,不是通过星座、血型、
生辰八字或伪装成阅历丰富的专家,来提供些心灵鸡汤式的回答,只用数据来说话。
这种尝试在媒体中并不少见。2011年,
BBC广播公司曾根据2012年政府的
财政预算联合
毕马威会计师事务所做了一个
预算计算器,用户只需要输入一些日常信息,例如买多少
啤酒,用多少汽油等,就能够算出新的预算会让你付多少税,2012年生活会不会更好。
根据
用户需求提供个性化的
大数据服务,是未来的发展趋势。这些报道有一个共性,媒体都致力于以用户的需求为中心,利用大数据诠释宏观
社会现象对用户的影响,或者回答用户困惑的问题。媒体可以精准定位,经过后台计算,按照用户的接收习惯、工作习惯和生活习惯将服务推送到用户眼前。
解决对策
媒体工作者需多渠道的
收集数据。从公开的数据库或者是政府部门、企业、机构中获取数据,从这些海量信息中判断和选择有
表现力的数据。当媒体工作者获取数据之后,便开始处理和整合数据。将与
新闻报道无关的
数据筛选、过滤后,剩下有用的数据进行整合汇编,形成新的报道内容。以“百度
人口迁徙”为例,百度利用软件,将人们购票的时间、地点、性别、年龄以及出发站、终点站进行统计,形成数据库,不仅可供
新闻工作者使用,政府和企业等也可利用这些数据,创造出不同的价值。 由此可见,海量数据的收集与整合对于数据新闻来说是一大挑战。新闻工作者通过数据的挖掘和分析,寻找出有价值的
相关性,继而增加对相关事件
发展趋势的预测性,新闻和数据相结合创作出精确和
深度报道,成为
大数据时代的新闻业务发展方向。
凸显把关人的重要性
截止2014年中国的网民规模高达6.52亿,在信息碎片化的时代,相当多的网民在网上浏览新闻,因此数据新闻的把关尤为重要。数据
新闻需要大量的数据、
数据分析处理,不仅仅是要有技术水平,更需要一双慧眼,分得清“真数据”和“假数据”,而且还要选择重要的数据和信息进行报道,为受众提供更细致、精确的新闻,又快又准的报道新闻,数据新闻的把关在
数据时代更为重要。
数据新闻学是一门交叉的学科,数据新闻的产生给传统的新闻工作者提出了挑战,传统的新闻
创作理念和方式,要求新闻工作者具备采写编评等
基本专业技能,但已无法满足大数据时代下数据新闻的创作。因此,对于当前的新闻工作者应具备以下媒体素养:
a.熟练运用计算机能力。在如今
信息爆炸的时代,互联网的地位
不容忽视。互联网时代,尤其是
社交网络、电子商务与
移动通信把
人类社会带入了一个以“
PB”(1024TB)为单位的结构与非结构数据信息的新时代。大量的数据和信息摆在新闻工作者面前,传统的计算机无法处理大量的、无规律的数据,需要
云计算进行分析、处理、统计,因此,对于当今的新闻工作者提出了更高的要求,必须熟练运用计算机,以便处理大量的数据和信息。
b.分析
处理数据能力。数据新闻与传统的文字
图片新闻不一样,数据新闻需要大量的数据,新闻工作者可以通过数据发现问题、
提出问题,也可以先有了问题之后,再去收集相关的数据。而拥有大量数据后,必须对其进行分析和处理,将不需要或不相关的数据过滤掉,剩下有价值的数据加以分析整合,供新闻编辑使用。
德勤在美国
华盛顿特区的研发创新团队招聘数据记者,其中最重要的要求就是要具备分析数据的能力,由此可见,数据新闻记者必须具备较强的数据分析和处理的能力,才能胜任此工作。
c.可视化平面
设计能力。数据新闻的可视化表达为新闻行业注入了一股新鲜的血液,让数据新闻充满希望与活力。数据新闻的可视化图片将不同的时间和空间联系在一起,将繁杂的数据简单化,便于受众理解,更有利于受众参与其中,满足不同受众的各方面需求。数据新闻的可视化是其一大特点,因此对于新闻工作者来说,应熟练掌握
可视化技术,学会识图制图以及各种表格的制作。
数据新闻特征