出版热潮中的大数据

李杰 原创 | 2014-07-25 12:18 | 收藏 | 投票 编辑推荐

随便上网搜索或者在机场书店浏览一下,铺天盖地都是各种“大数据”——《大数据时代》《驾驭大数据》《决战大数据》《大数据营销》《大数据云图》《数据之巅》等十余种图书,都在推荐序列。而在各行业的销售分析会中,大数据也几乎成为口头禅,数据部的地位也直线上升——用阿里巴巴副总裁车品觉的话说,数据部不应该只属于技术团队或者运营团队,而是应该直属于CEO的战略决策部门。那么,大数据和以往的数据分析有何不同,在这些形形色色的介绍大数据的图书中,他们的相同点和差别又在哪里?

在目前所流行的“大数据”主题系列图书中,主要可分为三种:一是介绍大数据,并以此来预测未来的社会形态与生活方式,如迈尔-舍恩伯格的《大数据时代》和西尔弗的《信号与噪声》。自从IBM为建设“智能城市”,从而提出“big data”(大数据)这个概念之后,人们并没有意识到这和传统的数据分析有何差别。直到互联网迅速普及之后,赛博空间已经使地球变成为一个村落,每一件事情的关联和突变往往令人措手不及,人们才意识到以往的数据样本已经难以适应调研和预测的需求,尤其是在有着不同肤色、语言、信仰和价值观的国际大都市,一个事件所引发的连锁反应,往往不是其他事件的几何级数的增加,还会出现量子级的巨变。以往我们说一只蝴蝶漫不经心地拍动几下翅膀,可能在两周后引起美国得克萨斯州一场灾难性的风暴,往往是指一个偶然性的事件,但其时只要放在大数据的框架内,人们完全可以找到其发生的必然性的逻辑。随着人群高速而无秩序的移动时代的到来,这种偶发性事件将变得越来越频繁,影响越来越大,传统的数据分析在准确性越来越令人怀疑,而对于结果的偏差,则只能用“黑天鹅”来进行解释。

所以,现代化和全球化的来临,使原来局限在不同地域和领域的人们拥有了更多地选择,大数据时代是建立在每一个人充分自由选择、自由迁徙、自主决策的基础之上的。以往通过数据样本来预测人群的动向,现在只能用来预测动物,每个活生生地个体在不同时间爆发时,所作出的选择和决定,不仅他人想不到,即便是他自己,也往往难以置信。这些看似没有逻辑的现象和芜杂的数据背后,其实有一种相互的关联,而大数据,正是通过各种不同的算法,找出这种关联性,从而避免灾难和恐慌。在《信号与噪声》中,西尔弗指出,哪些是有用的信号,哪些是干扰的噪声,人们很难用直觉来判断。数据的积累异常丰富,对于各种事件的评估也会用概率来进行统计,但如何通过有效的途径和方式,来进行数据挖掘,将偶发事件与必然事件进行区分——只有经过对大数据的分析才能形成各自需要的信息,才能从信息中产生知识,才能造就智慧型社会,在避免陷阱的时候,还能抓住神奇的黑天鹅。

另一种“大数据”图书,则是若干从业者根据自己的工作经验所撰写的实战型读本。代表作有阿里巴巴副总裁车品决的《决战大数据》,以及奥美互动纽约子公司董事总经理麦德奇的《大数据营销:定位客户》。作为淘宝和支付宝的数据部门负责人,车品觉看到的数据样本不仅是全球最大的,而且是变化最快的,以往相对固定的数据样本不存在了,在他眼前的是一座不断喷涌、创出各种世界高度的活火山。所以,在他看来,大数据首要的功能并非是预测未来,而是指如何在海量的数据中,分析出商家和顾客的交易中的“痛点”和“盲点”,还原他们的本质需求,使他们的最广泛需求能最先得到满足,而未来,则是对大数据进行分析和人们的思考相互磨合的一个过程。

同样,作为知名广告商奥美的经理人,麦德奇更重视的是精准营销——购物冲动中,人的心理行为与情感变化,会在瞬间发生转移——大潮流还是小趋势的选择,正如真理是藏在大多数人心里还是掌握在少数人手中,让人难以判断。如何利用大数据对目标客户进行精准定位——判断哪些客户是因为需求购买,哪些客户是因为广告购买,哪些客户是因为价格购买,哪些客户是因为口碑购买,是为了事半功倍,更是为了提高企业的投入产出比。而在《驾驭大数据》中,国际数据分析研究所的Bill Franks则从如何分析数据、打造大数据分析团队着手,将各种分析方法和分析人才所必需的素质逐一进行了介绍。否则,你会发现任何一种预测和分析,背后都有数据支持——若不会从“三千弱水”中取出那“一瓢饮”,大数据时代的来临,会使得人们陷入数据恐慌之中。

第三种则是大数据对于中国的意义,代表作当属涂子沛的《大数据》《数据之巅》。中国以前是小农经济社会,历代人重视的都是前辈口耳相传的经验,很少对当下的情况做一个数据上精确的统计,而只有每个人的观点与诉求能在数据中得到反映,才能真正实现民主、科学的决策。胡适批评“差不多先生”,黄仁宇求索“数目字管理”,都是“爱之深而责之切”的心态。毛主席说过“没有调查就没有发言权”,他在长期深入群众、实地考察的工作中,以考察报告、社会分析的方式为新中国站起来找到了正确的道路,而在大数据时代,公共决策的重要依据将是各地域各行业数据汇聚起来的大数据,由此而进行的决策才会更加科学,更加实事求是。

从国家的宏观层面而言,业务工作的管理数据,民意社情的调查数据,以及对大自然、动植物的特点和变化进行监控而产生的环境数据,一直是美国政府的三大数据来源。这三种数据,其发展各有先后,收集方式各不相同,数据量也大小不一,而且,彼此相互交叉,有重复又有差异。如何准确的收集数据,如何采用严密的逻辑和规则去挖掘数据,从而做出准确的判断,是考验决策者耐心、细心和智慧的关键,同时,将这些关系到民生的数据采集和分析方法尽可能公开,则是决策民主化、科学化的重要方式,惟其如此,才能消灭误解和谣言,赢得人们的理解和支持。否则,仅有的抽样的民意调查难免令人猜测和争论,因为,永远有一个“沉默的大多数”存在。

杨振宁先生曾认为,《易经》对中华文化的影响,在于有归纳而无推演式的思维方法,这是近代科学为什么没有在中国萌生的原因之一。这句话放在大数据的思维方式中,可以理解为,中国古代人就有收集大数据的意识,但却缺乏对大数据进行精确分析和反复推演的意识,在“兼收并蓄”之后,就得出了“天人合一”的终极结论。事实上,没有考虑到个体差异、实施步骤和细节的公共决策,无论大方向如何正确,都会累积矛盾,而这些,如果能正确使用大数据,就能获得最大多数人的好评。 

大数据热中的冷思考 

在经历了《蓝海战略》、《长尾理论》之后,对企业经营管理提出系统的方法论上的观点,应当属“大数据”。与以往企业经营的战略思考不同的是,大数据更多带有浓厚的技术色彩,是企业在经营与创新中,越来越重视理性分析和技术手段的结果,其背后的主要支撑点在于,互联网与电子商务行业的飞速发展,已经使得所有的行业都不得不开始思考,如何在营销中采用互联网思维,如何在信息时代对自己的企业进行精细化管理。

IBM把大数据概括成3V,即大量化(Volume)、多样化(Variety)和快速化(Velocity)。这些特点概括了大数据的基本特征,也反映了大数据潜藏的价值。与传统的数据样本相比,大数据是指无法在—定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。那么,大数据时代对我们每个人又意味着什么?我们又该如何接受并拥抱这个时代呢?

    首先,大数据是创业者进行精细化运营的操作指南。早在上个世纪,日本丰田汽车就以零库存的管理效果而闻名于世。当时,我们还认为这只适用于汽车和房子、奢侈品等耐用消费品,而在快速消费品领域,尤其是有所创新的新产品,生产和销售的数量主要依靠记忆和经验,而在全球大市场的年代,商品的种类在迅速增加,而且,根据各地的不同情况会有很大的变化,这就要求生产的商品数量需要根据数据分析来作出调整,从而尽可能的在企业运营中减少失误和浪费,增加效益。

大数据时代的来临,并不意味着经济发展会继续高速增长,相反,它是在经济增长到了一定阶段、出现滞涨之后所需要采取的策略。这也就是说,它不是将你企业经营的成绩从0增加到60分,而是让你从60分增加到80分。以往粗放式经营的种种问题,在高速增长的态势下,往往难以引起人们的重视,而一旦增长放缓,以往积累的问题又开始集中爆发,甚至已经有人开始追问经济发展的意义和作用,那么,根据各种数据科学统筹、精细化运营就显得尤为重要。

其次,大数据将重构我们认知世界和生活的方式。以往传统媒体的精英人才,在转型互联网之后往往会有一个困惑:精心采访和组织的内容并没有获得广大网民和广告商的完全认同,似乎人们对信息和数据的需求,不仅仅是权威和深度,更重要的是“大”而“全”——“我是来看回帖的”的心态,往往高居榜首。而每个网民,在获取信息之后,也学会了在公共场域如何发言,如何聆听并尊重他人的意见,从单纯的接受到积极地参与,在坚持自己的价值观的同时,试着学会达成共识。在此基础上,点击率、用户数与评论和互动所形成的大数据体系,也比单纯的发行量和收视率的标准要科学得多。这就是在传统媒体的广告收入增长乏力、甚至下降的今天,互联网广告仍然保持了高速的增长的原因所在。

此外,在我国目前的城镇化进程中,突出的问题是大城市越来越大、拥挤不堪。一大拨年轻人在“逃离北上广”之后,又选择了“回到北上广”,重要原因在于,小城市的基础建设薄弱,信息化程度低,几乎与大城市的快节奏完全脱离。而在美国,65%以上的人口都居住在小城市,微软、苹果、亚马逊等世界级的大企业,无一例外都在小城市,而不是如同中国一样扎堆在超大城市。究其原因,是因为其完备的大数据体系,使小城市人们的生活质量——无论是信息、娱乐还是商品,都完全可以和大城市同步。再加上相对低价的生活成本和良好的自然环境,人们自然就愿意选择小城市了。

第三,如雷军所说,“大数据时代,个人隐私保护是用户关注的焦点,要切实防止个人信息泄露。”在云计算和大数据的时代,对用户个人信息的收集,必须获得用户的许可,那种通过种植木马病毒、广告代码对用户进行恶意骚扰和倾销的行为,通过“人肉搜索”侵犯他人日常生活的行为,以及在各种垃圾短信减少之后,蜂拥而起的广告电话,都需要制定相关的法律予以严惩。原本散落在中介、银行、保险、航空公司等机构间的个人隐私数据,在被信息共享之后,又被系统整合、相互印证,消费者的个人基本信息,甚至性格、爱好以及生活轨迹等信息将被他人一览无余,使得用户感觉自己如同“透明人”,原本为用户制定贴心的个性化服务,一旦被陌生企业利用,则成了用户逃离大数据的最主要原因。在斯诺登事件爆发之后,美国政府的“棱镜”计划曝光,个人隐私再一次成为人们关注的焦点。这说明,大数据如同核武器,在心术不正的人那里,贻害无穷,但如果用于发电或作为能源,则造福全人类。

    最后,大数据确实能帮助人们预测未来的趋势,但这并不是说,未来就藏在大数据之中。抛开黑天鹅效应不说,未来的亮点一定与天才的创新有关,而这一点,基于历史和现实的数据中,只能提供方向和可能,却不能成为模型和藩篱,以往数据积累证明失败的案例,未尝不会酝酿着新的更大的成功——黑莓的智能手机并未形成规模,但苹果的iphone却空前成功;克林顿提倡无纸化办公并未得到世界响应,但贝佐斯的kindle却震撼了整个世界。某种程度上,创业企业其实更多的是需要创意和营销推广,因为它需要足够的时间来让用户来认识他的产品,而这一点,往往有时只能依靠人们的直觉和毅力,毕竟,每个消费者的购物冲动,并不是在看了数据分析报告之后才产生,而说服消费者的工作,大数据还难以完全胜任。

李杰 的近期作品

个人简介
资深电子商务运营专家,媒体专栏作者。
每日关注 更多
李杰 的日志归档
[查看更多]
赞助商广告