B10:书评周刊·社科
 
前一天  后一天

数字版首页 > 第B10:书评周刊·社科

用大数据对抗“粉色糨糊”

2014年07月19日 星期六 新京报
分享:
涂子沛,信息管理专家、科技作家,微软高级程序员,中国人民大学中国调查与数据中心客座研究员。著有《大数据》、《数据之巅》。现居美国硅谷。
《数据之巅:大数据革命,历史、现实与未来》
涂子沛
中信出版社
2014年5月
全书从美国建国之基讲起,通过阐述初数时代、内战时代、镀金时代、进步时代、抽样时代、大数据时代的特征,系统梳理了美国数据文化的形成,阐述了其数据治国之道,论述了中国数据文化的薄弱之处以及未来数据世界的远景。
《大数据》
涂子沛
广西师范大学
出版社
2012年7月
本书通过讲述美国半个多世纪信息开放、技术创新的历史,详细阐述了数据创新给公民、政府、社会带来的种种挑战和变革。
扫描二维码,阅读“对话涂子沛”全文。

  我对定量分析的方法向来持有戒心,认为数字可以被人“按摩”,抚平成为别人所需要的模样。可是有一天,家里小孩的一个新说法,让我的成见有所松动。我想带他们去快餐店吃饭,过去他们很喜欢,他们这次不愿去了,说有些快餐店用的牛肉饼,可能是“粉色糨糊”(pink goo)。所谓粉色糨糊,是指将牛肉,牛杂碎甚至其他一些不卫生的东西一起搅了。你以为你吃的是牛肉,谁知道里面是什么东西?人的观念何尝不是这样?好多被我们接受的结论,你可能以为是事实,但里头掺杂了多少私利、偏见,还有舆论影响?天知道。

  解决思维的“粉色糨糊”,应多倚重数据。《大数据》作者涂子沛先生最近又出了一本新著《数据之巅》。他的上一本书,在国内产生的社会影响近年少有,谈论大数据,已蔚然成风。

  数据讲史有直接的指导意义

  《数据之巅》比起《大数据》脉络更为清晰。纵线为美国历史,包括美国第一个百年的三个时代:初数时代、内战时代、镀金时代,以及20世纪后数据成熟期的量化时代、抽样时代、开放时代、大数据时代。

  除了写大数据的成长,也让人从一个新鲜视角,认识美国政体的设立、演变、成熟的过程,如科学决策方法的出现、机构的设置等。比如,在“初数时代”,书中写道了参众两院的结构设置,人口统计中黑人计数方法等。对于比较成熟的美国社会制度,数据是一个非常好的切入口。作者用数据梳理了美国的历史,他让我们看到,美国走过的路,有一些我们正在走,或者将要走。比如美国的“镀金时代”,工业化提速,城市化加快,和中国现实不无类似,此间统计与数据所促成的革新,对我们就有直接的指导意义。

  作者不仅仅是审视了美国的发展,还布了一条横线,由外而内,增加了对于中国大数据发展的关注。书中最为精彩的一部分,说的是美国人戴明,如何使用基于统计数据的质量管理思维,影响了日本的工业制造,使得日本产品给人的印象,从劣质产品快速转化为质量一流的产品。作者呼吁中国也引入这种统计思维和数据文化,改进“中国制造”的质量,继而提升在国际竞争中的地位。

  我们正在成为“量化的自我”

  而在民间,数据革命也在悄然开展。计算机、手机、可穿戴技术的日渐普及,使得普通人也开始自觉不自觉地接触、产生数据。大数据的土壤正在形成。虽然有隐私问题需要持续关注,数据的采集越广泛,也就越可靠,越有用。

  现在一个很流行的说法,是“基于证据”。教育者说基于证据的学习策略,医生们说基于证据的医治。这种“证据”来自哪里?最主要的渠道就是数据,作者给我们交代了信息、数据、知识层层递进的证据。

  大数据也可以变做“小数据”,亦即人们实际生活中可用的数据,我们跑步时所戴的跑步手环,可帮我们采集锻炼的数据,我们还可下载相关手机程序,控制自己的饮食。我们正在成为“量化的自我”。 □南桥(翻译家、作家)

  【对话涂子沛】

  大数据要用数据来创新

  在大数据中挖掘知识

  大数据时代,不应仅限于“用数据说话”,而是要通过数据获得启示、发现新的知识和规律。

  新京报:你的《大数据》是国内掀起大数据热的第一本书,对于“大数据”,你最新的思考是什么?

  涂子沛:就像胡适说“差不多先生”、黄仁宇说“中国的问题在哪里”,是“数目字管理”,但是怎么样“数目字管理”,他没有开出方案来,我现在就是承接他这个话题,用大量的案例来展现、论证如何“用数目字来管理”,把这个概念往深处去做。在大数据的时代,人类使用数据,不应该仅仅局限于用数据说话、用数据来支持自己的观点,而是要通过数据获得启示、发现新的知识和规律。

  新京报:现在关于大数据,观念上已经完成,问题主要集中在具体的应用层面吗?

  涂子沛:对,但是观念上完成也是仅限于精英层面的,对于大众来说还是很难,要把“观念”转变为“意识”,知道用数据说话。但是用数据说话还不够,大数据时代不是仅仅用数据说话,“用数据说话”是小数据时代的事情;而“大数据时代”是要从数据中挖掘出知识来。

  人类新文明建立在数据之上

  将“大数据”从科技符号转化为文化符号,把一个精英的话题普及大众,进入中华民族的文化基因。

  新京报:“数据之巅”具体什么含义?

  涂子沛:使用数据的巅峰状态有两个:第一,通过大量的数据整合挖掘出新的知识;第二,机器自动的使用数据,产生智能,大数据的影响是最终迈向一个“智能型”的社会,虚拟化的社会,进入了一个人工的在线世界,这些都是因为数据衍生的,人类新的文明,建立在数据之上。

  新京报:为什么想到写这本《数据之巅》?

  涂子沛:《大数据》出版之后,大家认识到,大数据不仅仅可以应用到商业领域,还和透明政府、开放社会有关,大数据可以用来治理国家。在这本书里我想通过追溯数据文明的历史,把一个科技话题、科技符号的“大数据”转化为一个文化符号,把一个精英的话题,转化为一个大众话题。

  数据文化是尊重事实,追求精确,提倡逻辑和理性的一种文化,中国近百年之所以落后,就源于数据文化的匮乏,如果中华民族有数据文化的话,整个民族的面貌会焕然一新。所以我想通过这本书的努力,把一个科技符号变为一个文化符号,把它普及到大众,成为一个文化符号,进入中华民族的文化基因,即“数据文化”。

  采写/新京报时事访谈员 高明勇 实习生 孟亚旭

更多详细新闻请浏览新京报网 www.bjnews.com.cn