【南青焦点】大数据时代变革了谁? - 南大青年

人一见到新东西,在理智介入之前,会产生会两种反应:兴奋和恐惧。这两种东西,就形成了新东西的神秘感。

大数据也是这样。有人兴奋地说大数据能带来深刻的变革,有人害怕地说大数据能带来深刻的变革。那大数据到底在干啥?它到底能带来什么?

在我看来,大数据什么新鲜事都没有做,但它真的能带来深刻的变革。

在没有电脑的解放战争时期,林彪随身会带一个小本子,里面其它什么都不记,就记每次战斗的战报。只不过记得非常详细:要分别统计缴获的机枪长枪短枪;俘虏要分清军官和士兵;击毁的和还能用的汽车要按大小和类别分类统计,等等。我估计为他整理战报的人都会觉得他不可理喻。可是,人家林元帅在辽沈战役的时候就靠这个小本子找到了廖耀湘的指挥部。理由就是:元帅发现一场遭遇战中缴获的短枪与长枪的比例、击毁的小车与大车比例、俘获或歼灭的军官与士兵的比例均偏高。元帅据此判断,指挥部就在那块战场附近。

这就是大数据。别看它现在热得发烫,其实只是把林元帅做的这种事搬到电脑上做了。毕竟这个世界上真的没有多少人有林彪元帅这样的洞察力。

可就这么一搬,美好的事情真的发生了。

在一个工业研究所里,有一群闲得发慌的攻城狮,他们在汽车的驾驶座上装了360个压力传感器,然后写了个程序学习这些传感器采集的数据。结果这个装有各种程序的座位不仅能判断坐在上面的是不是车主,还能判断车主是不是在疲劳驾驶。好吧我漏掉了一个数据,准确率是98%。

沃尔玛公司写了个程序分析了很多顾客买东西的记录之后,做出了一个常人看来很难以接受的决定:把啤酒和尿布摆在一个货架上。结果此举显著促进了啤酒和尿布的销量。

有n群不知道在想什么的程序员,把用户浏览网页时鼠标在哪里停了多长时间、点击了哪些链接、搜索了什么东西之类的都记录下来,然后根据这些算出你现在喜欢什么,想找什么。于是就有了各大网站上的“猜你喜欢”。

哦对了,还有一件美好的事情,就是小黄鸡和微软小冰出现了。他们学习了不知道多少人类的交流,终于,他们真能说人话并且和人对话了。

美好的事情实在太多,就不再举了吧。很多专家在回答什么是大数据的时候,都真的会搬出一堆数据来。什么从2007年开始,人类一年产生的数据量就超过了人类有史以来储存的数据总量;什么互联网上的数据每年将增长50%;什么在接下来的8年中人类所产生的数据量将超过40 ZB(从GB到ZB依次要经过TB、PB、EB,进率都是1024)等等。他们说大数据,是在说一种时代背景,即数据已经多到没法通过人脑和主流的工具管理和处理,这么一个现状。

这个说明散发着人类本身的无力,我不喜欢。我认为,现在大数据这么火,无非是因为电脑比人更适合干这活而已。

早在人类开始使用数学的时候,我们就在关注怎么分析数据。比方说我们发现,通过比例、均值、方差之类的数字特征能反应一些事实(例如前文中林彪抓廖耀湘的时候,就是比例在反映战场的特征)。还发现了好多衡量东西之间“有关系”的方法,例如我们高中学的相关系数。但是,这些方法有归有,你真的想用这种方法探索世界吗?

我就举一个例子。有哪位同志可以在做高中的统计题的时候没想过借助计算器,就自己算?或者降低点要求,我让你算10组均值,每组200个随机数,允许你用计算器。这个任务做下来谁不会觉得烦?

没错,为了我们的结局不像那些极端化的富士康员工一样,人类本能是会远离这种枯燥机械的工作的。

人类还有一个缺陷。为了减少一些工作量,我们会学到一种东西叫经验。经验多或者善用经验去推理的人我们认为他聪明。例如上面尿布的例子。人类会想,尿布是婴儿用的,啤酒是大人喝的,八竿子打不着,他俩之间能有啥联系?这个问题就这样被忽略了。可它们之间还真的有联系:丈夫下班回家时接到坐月子的老婆电话,买些尿布回来。于是丈夫在拿到尿布的时候发现旁边正好有啤酒,于是就会顺便买一些。

由于人类的追求比较丰富,而且很聪明。人类很清楚,数据分析这个活,自己做还容易出岔子,容易漏情况,交给计算机做就挺好。于是在20世纪六七十年代,集成电路计算机(第三代计算机)刚走出实验室不久,就出现了专门分析数据的语言S语言和分析数据的专用软件spss。然后,数据挖掘、机器学习、分布式系统、物联网技术等技术的长足发展,让计算机收集、处理那么大的数据不会太吃力,随着数据越积越多越全,计算机的优势自然就体现出来了。

我说大数据能带来深刻的变革,就是这么回事。这就像人的游历,无论你去还是不去,大好河山就在那里,你看到了,你就有新的成长。大数据只是让我们看到了一些我们错过的东西,仅此而已。

不过仅仅是这样,大数据就能把诸如推荐、优化、认知之类的好多事情做得很出色了。不过,这也产生了很多尖锐的问题。

刚才说的沃尔玛公司还写了一个程序,根据人在这个世界上留下的痕迹判断他现在需要买什么。乍一看没什么,这就是一般的推荐系统。可有一天,一个父亲就找到沃尔玛公司说它损害他还在上高中的女儿的名誉。因为这套程序认为她女儿怀孕了,为她推荐了好多孕妇用品。可事实是,她女儿真的怀孕了。于是大数据就得到一个雅号:比你更了解你。不过,这会不会让你活得不舒服?

亚马逊最开始就是个卖书的。为了让自己显得有态度一些,请了很多书评员,给书写书评,帮助提升书的销量。可是大数据来了,亚马逊也写了一套推荐系统。消费者被这套精湛的推荐系统感动了,因为这套推荐系统总能推荐出顾客喜欢的书。于是自然而然的,靠推荐系统提升的效益远远甩下了书评员。于是万恶的资本家裁掉了所有书评员。

我们常说科学技术是双刃剑。当科学技术真正威胁到你的生存方式时,你才会真正感觉到这把剑是多么凌厉。

大数据会带来很多问题,比如收集数据能力强的、手头有很多数据的人就形成了数据寡头,会具有足以破坏规则的影响力。又比如持续发酵的隐私问题,等等。但是相对于好多社会学方面的影响,对我们普通人冲击最深的我想还是生产方式在革命。很多工作岗位即将消失,很多人赖以糊口的生存技能将被计算机毫不留情地淘汰,例如上面可怜的亚马逊书评员。谷歌在实验自动驾驶的汽车。若是这种技术铺开,那出租车司机是不是也要绝迹了?前几个月的海尔,为了适应大数据时代,裁掉了一万多人,几乎全是中层干部。他们招谁惹谁了?

其实在历史的每时每刻几乎都有一部分始终对世界持悲观论调。可事实上,这个世界真的没有这么绝望,很多岗位消失,也就意味着很多岗位生成。我想,这也是我们人类面临的一次试练。我们必须要学会学习,学会对自己负责。在这个时代,先进的东西淘汰了我的饭碗,是再正常不过的事。关心则乱,太在乎过去,真的会绊住走向未来的脚步。我们要习惯更新,在我们IT界,这叫“快速迭代”,而且是件好事。我们没必要去社交网站上无脑喷;更没必要说社会“不公”,翘着二郎腿要求社会救你。不想只靠社会救济过日子,我们就要自己迭代自己。那有些人又要问了,现在比较安全的职业是啥呢?哈哈,我哪知道啊,只能一边走一边看了。

大数据带来的真正变革,就是人自己的变革,变得习惯变化,不再害怕未来。

 

注:本栏目文章内容仅代表作者个人观点,不代表南大研会任何观点及立场。

(文/郭晨 南京大学计算机科学与技术系硕士研究生 编辑/高原 程吟 采编/李焱枫)