财新传媒
位置:博客 > 南桥 > 大数据里的大数惧

大数据里的大数惧

古代皇帝的言行举止,“动则左史书之,言则右史书之。”(《礼记》)一举一动,都有《起居注》这样的常规记录。后世皇帝可以看,皇帝本人不能看。
 
今日,我们享受皇帝待遇:我们发圈、点赞,都一一被记录了下来。我们逛京东逛淘宝的购物路径,包括逛到了哪个页面,停留了多久,有没有行动,网站都一一记录下来。这新时代的《起居注》,我们自己看不到,商家会看到。神秘的大数据会根据你发的怀孕报告,定制从奶粉、尿布到保险的各种个性化广告。如果你是男的,没发过怀孕图片,那你总会用手机买东西吧?如果你用苹果手机,说明你可能是高消费人群,价格还高些。这个你不比较也不知道,大数据总是这么悄悄地进村,打枪的不要。
这种普适记录,也就是涂子沛《数文明》中说的“泛在计算”。这种计算另外一大用处是治安管理。摄像头密布的“天网”,在很多城市已经成型,且造就了诸多都市传奇:一次张学友演唱会,就能让警方捕获几十个嫌疑犯。天网能跟踪犯罪分子的车辆行驶轨迹,最终神不知鬼不觉将其抓获。天网甚至让警方识别闯红灯的路人。这种普适记录,可追随人的一生。涂子沛计算过:人之一生全部用视频记录下来,也只需两万块钱的硬件。
 
对于城市和国家管理者来说,数据就是力量:摄像头多了,路上的交警就少了,但是执法的效果却是一样的,甚至更好。效率也非同凡响:“采集即录入、录入即比对、比对即发现。”司机刚闯红灯不久,账单就寄往他家了。老实说,这是让人极为不适的情景。我也没做过什么大的坏事,但生活在他人的监控之下,感觉被自在,貌似是有案在身,带上了GPS监控假释在外。这种大数据成了囚笼。也有一些组织,对于数据过于迷信,这也制造了数据过度入侵的机会。有些高校,连学生打开水、去浴室洗澡,都要下载应用,这样的使用,使得数据使用过于琐屑,过于无厘头,反而画蛇添足,增添不便。
 
《数文明》中对数据侵犯隐私的表达了担忧,却认为大数据的大部署利大于弊。例如,基于大数据的智慧城市做好了,会向便民的方向发展。人们可自觉行动,利用智慧城市实现即时自助。例如,水电煤缴费,通过统一平台联通起来,应该不是难事。有些城市公用服务的整合做得已经很神奇了。据说有位大妈电动车失窃,直接用微信扫描城市二维码,调阅录像,然后开启报警页面,将小偷截图发给警方。这一切一气呵成,大妈完成之后说不定可以继续去跳广场舞,而不需要跑断腿找这个部门调阅录像,然后拷贝,提交给警方等等。警方则可根据她所发来的信息迅速破案。书中这种案例比比皆是,但多点到为止 —— 新的案例每天都在网络上极速传播,无需再去验证普适记录的存在。
 
作为涂子沛的忠实读者,我拜读过他“大数据三部曲”中的前两部《大数据》与《数据之巅》。他在这两本书中一件主要工作是唤醒:作者像布道一样传播数据意识,试图打破“差不多先生”的思维习惯。商业文化兴盛的环境,让涂子沛的著作洛阳纸贵,一时间在全国各地飞机场书店里,涂子沛的大作无所不在。他是一个启蒙者。中国互联网(尤其是移动互联网)千人千面的个性化定制,和千人千价的移动商务,和大数据的概念可谓一拍即合,也让大数据的概念飞在风口,潮在浪尖,在中国迅速风行,其热门程度甚至超过英美等发达国家。“大数据”成了一种商业富矿和机遇,向“大数据”淘金的机构、商家、创业者如过江之鲫。
 
政府的规范化治理虽然在前两本书也多有提及,真正“着陆”是在《数文明》中。从企业管理、城市治理的角度看,数据都是可以给领导者增添力量的,这包括本人更喜爱的小数据。《数文明》立足于中国本土的数据开发和采掘,希望创造而非跟随潮流。如作者本人所言,前些年他在美国匹兹堡的政府机构和硅谷商业机构任职,范例多为舶来品。“外来和尚好念经,”这些国外的经验,也曾激发出人们的好奇。回国后,涂子沛先是在阿里巴巴任高管,第一手接触了中国一流企业的大数据建设实际。此后,他自主创业,在南京、苏州、杭州、广州多地,担任城市数据化 —— 或称“城市大脑” —— 的架构和策略设计。书中就描述了不少来自他工作一线的大数据报告,很接国内地气。
 
此书从前两本书的唤醒意识,发展到激发行动。 “最多跑一次”的政府办公效率提升,部分可归功于涂子沛倡导的数据共享愿景。他在办事的时候观察到,有些政府部门虽在一个大楼里,甚至在同一层,跑一次是可以,硬件是硬了,不过软件上还不够软:每个部门要分别复印资料,重复劳动,浪费资源。他提出政府部门数据资源的共享,此举可让政府办事效率突飞猛进。这也让人担心:一旦政府部门里出现不良用心之人,大批量数据被泄漏,人人的《起居注》都大白于天下,恐为歹人所用。这是大数据建设中功用和隐私、公权和私权、组织和个人之间开展的长期拉锯战。
 
隐私方面的担忧,让数据暗藏“数惧”。大数据在握的人,可以利用人性弱点“钓愚。”未来社会,恐会裂变为数据权贵、数据中产和数据穷人。数据权贵将掌握很多信息,借此扩大自己的控制。“我并不贪婪,我只想我的数据连接另外一片数据。”普通人的权益保护,需同步考虑。而今,听说大数据已经开始杀熟了。顾客底细和底线被过度暴露之后,价格不是更便宜而是更贵了。服务的定制更方便,千人千面,“多个算法在云端合谋,整个社会几乎无知无觉,也没有任何还手之力。”数据对于商家和政府机构是富矿,但普通人更需要的“数据产权”。我感谢涂子沛在这些方面提出的担忧,和提出的相应的解决思路。
 
此书先于时代,描述了一个基于数据的未来社会。这社会也可以说“未来已来”,很多智慧社区、智慧城市已有所实践,或早有雏形。书中提出的观点和方案,读来让人耳目一新。关于智慧城市的建设思路,作者认为应该是“众智加人工智能。”无人驾驶技术,从谷歌到百度,研究者甚多,可是事故频发,如何解决?作者逆向思维,提出提高无人驾驶安全的方法,未必全是改良汽车,也包括改造道路。他还在书中提出了大数据普及带来的社会心理学上的效果。“当一项技术被大面积普及、渗透全社会时,它就变成了一项社会技术。社会技术的成功并不仅仅取决于其有效性,也取决于其对大众心理的影响和威慑。”例如,当摄像头密布时,人们在行为上就会收敛得多。
 
此书文字极好,可读性强,生就一张畅销的面孔。书中例子来自古今中外,作者信手拈来,无拘无束。文史哲,数理化,计算机、公共管理,作者都如入无人之境,看来是下了很多功夫。涂先生的渊博学识,和不慌不忙的叙述方式,在下颇为欣赏,也多受启发。不过更让人掩卷沉思的,是在这个量化自我、普适记录的时代,你我各自如何选择,如何管理大数据给我们提炼出来的数字自我。
 
原载于《南方都市报》
推荐 4