财新传媒 财新传媒

阅读:0
听报道
书名:大数据
豆瓣评分:7.7分(640人评价)
博主评价:
未评价很差较差还行推荐力荐
来自豆瓣读书资源
涂子沛 著,《大数据:正在到来的数据革命》,广西师大出版社2012年版

2012年底印度新德里强奸案引发抗议潮后,印度内政部宣布,将为在新德里有强奸前科的人建立数据库。靠数据打击强奸还真不是笑话。去年我听过前纽约市长朱利安尼的一次演讲。听他的描述,他最得意的政绩是他在任时纽约犯罪率的下降。这在很大程度上有“大数据”的功劳。朱利安尼在任期间,让警方使用 Compstat系统,在犯罪高发地段,去事先伏击,预防犯罪,而不是被犯罪分子牵着鼻子走,结果犯罪率大幅度下降。

过去,麦肯锡等外企招人,会问“中国有多少加油站”这种貌似无厘头的题目。出题人的思路是想考察应聘者解决问题的思维模式。有了好的思维模式,用以解题所需的数据细节,公司可通过研究部门采集。出题者可能是把数据当作了单纯的工具。读罢涂子沛先生的《大数据》一书后,我发现数据里也能挖出真知灼见来。商界这种情形多得很。沃尔玛就通过数据挖掘,发现飓风来袭时,Pop-tarts销售量很高。Poptarts是一种甜品,平常不会想到飓风中它会畅销,是数据挖掘让人看到了这一有趣的商机。

美国的政务中广泛使用数据也让人印象深刻。美国通过社会安全号,将人们的数据带向了很多数据库。人们买房子,可从本郡的法务大楼网站上,查到房子以前售价等信息。搬到一个小区,大家也可以查潜在性犯罪者的信息,好保护家人安全。美国政府网站上即可获取很多数据,且多属“公共领域”(public domain)的数据,由于是用纳税人的钱采集整理,公众有权免费使用,而无侵犯版权之忧。

《大数据》一书的开篇说的是奥巴马,他上台的第一天签署的五个政府文件之一,是《透明和开放的政府》,宣布放松对总统文件的管制。他所签署的第二份总统备忘录是《信息自由法》,开篇引用了美国大法官路易斯·布兰代斯(Louis Brandeis)的名言《阳光是最好的防腐剂》,重塑政府的透明和开放之风。

不过,信息自由在美国的进步,也是个一波三折的过程。书中描述了数据开放化中的有趣史话,如肯尼迪、约翰逊等总统对数据开放的阻挠。奥巴马当选后,其政府也因白宫访客登记等问题不透明,与华盛顿责任道德公民中心较过劲。政治本身也是协商和妥协的过程,像马拉松而非百米跑。进步需要体制内有人对相关议题穷追不舍。“《信息自由法》之父”约翰·摩斯(John Moss)就是这样一个议员,不达目的不罢休。推动信息自由,也有媒体、民间组织和公民个人的死磕之功。 《大数据》作者引用了《提摩太书》里“那美好的仗我已经打过,当跑的路我已经跑尽”,向那些争取信息自由的人致敬。人活一辈子,可以打很多仗,有很多仗不值得打,有的关系他人福祉,这种美好的仗值得去打。信息自由之争,就是美好的仗。

此书预言政府信息自由的浪潮将波及很多个国家。美国政府正在推动数据的开源化,让其它国家,可移植美国data.gov的平台。包括英国、挪威在内的发达国家,和墨西哥和肯尼亚等发展中国家,先后进入了基于数据开放的“开放政府联盟”。由于数据本身暗藏的力量,这种联盟一旦做大,会成为信息联合国,可共同挖掘的数据资源威力巨大。

中国政府和各级部门能否按数据说话做事,决策能否走向开放和透明,要看政府和民间力量的推动力度。依据数据来决策是好事。数据本身,可描述现状,好的也可让人预测走向。我跟一些美国人交流时,说到中国,很多人最大的抱怨是“不可预知”(unpredictable)。 我们的近邻日本,虽然首相、内阁更换频繁,但是大家觉得这里有规律可循,所以不会感觉政局不稳。政府决策,应越来越多地参考包括民意调查在内的数据。数据越多,质量越好,对决策的科学化就越有帮助,也越能减少因为数据不对称造成的摩擦。

中国的网络和手机绝对人数均为世界第一。手机的普及率尤其高,数据采集的条件非常好。技术条件,未必落伍于其它国家,但是拍脑袋决策的思维根深蒂固。人们过于信奉个人智慧,认为半部论语即可治天下,这是很可怕的事。即便圣人在世,其预见力也有限,难和海量数据匹敌。书中引用胡适的说法,称中国盛产 “差不多先生”国家,也难怪“拍脑袋”官员有生存的土壤。

 “大数据”一书内容精彩,写作也非常出色。书的资料非常翔实,案例繁多且描述生动。 如同一条主干,旁生了各种枝节,让人经由大数据,认识到美国社会究竟如何运作,例如联邦政府的运作,游说团体如何施加影响,医保公司和其科学家的博弈等。书里还介绍了一些值得国内进一步关注的人物或者图书,比如信息学专家塔夫特(Edward Tufte)。 塔夫特提倡用高效率的图形图表,让普通人也能接触、认识专业化数据。

作者可能是受美国“什么也不假设”(assume nothing)写作训练的影响,对于诸多被一些人视作“常识”的东西也一一透露,比如美国一项法案通过的流程,美国政府下辖的部门,数据的存储单位等。一些马虎的或自负的写作者将这些视作人人都该知道的常识而按下不表。涂先生治学严谨,写作认真,一一娓娓道来,让人感觉此书既专业也扫盲。

由于此书的出版,中国去年刮起了“大数据”的小旋风,时任广东省委书记的汪洋还专门在对广东财政厅的讲话中推荐此书。 过去的一年已经好评如潮。美中不足处,在我看来,是对“大数据”的潜在风险和危害说得不多,只在关于隐私的章节中说了一点。许倬云先生在序言中说的一番话让人警醒:“作为一个史学工作者,看惯了世间的灾难和创伤”,要大家警惕“双刃剑的特性”,包括“在权势独占这一工具时,可能出现的危险。”虽有此危险存在,大数据实在有诸多好处,值得学着利用。一旦别的国家,别的机构,别的企业都用数据治理的,决策有的放矢,而我们数据不能自理,站在数据鸿沟的另外一侧,危险或许更大。

《世界日报》2013/2/24
话题:



0

推荐

南桥

南桥

1248篇文章 4年前更新

安徽桐城人,现居美国,在美国高校从事课程设计工作,业余从事文学翻译,曾译有《河湾》、《一个唯美主义者的遗言》 、《老谋深算》、《万灵节》、《布鲁克林有棵树》、《两个世界之间:赛珍珠传》、《另类的英雄:萨特传》 、《地之国》、《转吧,这伟大的世界》等。他还是多家报刊的撰稿人或专栏作者。 感谢大家来访。除特别说明外,博客文章均属原创,未经授权,谢绝转载 与引用。如商业性网站或者平媒使用,请支付稿酬(联系地址berlinf@yahoo.com,或在文章后留言告知)。 违者将追究法律责任。

文章