价值中国 - 财经商业新媒体
读书
正在读取登录信息...

不懂数据不可怕,可怕的是不懂数据造假术

书评人:徐跃东 2009-04-22 14:55 赞[0] 收藏

在这个信息繁复的时代,用最新的科技建设最完美的信息高速公路可以使我们以最快的方式获得信息,可并不能阻止我们以最大的善意被欺骗。如果有限的生命去索求每个信息的真伪,估计所有脆弱的小心灵都经受不了那么多直白的谎言。所以,有时候闭目塞的听说些“我不知道,别告诉我真相”之类的bullshit,不但是保持身心健康的需要,甚至已经成为维持脆弱心灵蹒跚前行的必要了。

但,时运不济,总是有些信息会漏过重重设防,不经意间就落入法眼,还试图成为我们的朋友和助手,左右我们的观点和意见。为了提高自己的说服力,它们常常着重描述自己出身的纯正,再者,就顶一个帽子 ——“据统计”。我们常被这三个字害了,还没处说理。有次,某偏远县到外地招商,材料上写着“据统计,本县主城区内去年住宅商品房平均售价XXXX/平米”,房产商跟地价合一起算了利润很高,就派人兴冲冲地去了。下车一看就傻了,整个县城只有两条街,两个商品住宅楼盘,合一块整一年就卖了不到十套,其中两套还是别墅,而且是这两个开发商老板自己住的。招商材料里只写了“售价”,可没说有没有按照这个价格成交。即便真是成交价,靠这样数量的样本做决策投资,造出来的房子估计得卖十年。可见,没有语境的统计数字靠不住。

有语境的也不一定能信得过。有专业文章研究工业租金的模型。同样的模型,代入伦敦的GDP说明伦敦的工业租金水平,好使;代入巴黎的GDP说明巴黎工业租金水平,也好使;用上海的GDP说明上海的工业租金水平……,不好使。作者使劲一琢磨,模型里其它都不变,就把GDP换成发电量来说明上海的工业租金水平,这回也好使!所以,文章最后总结:上海的电表数字水分不大。

统计数字的这些圈套,都是老把戏。达莱尔·哈夫(Darrell Huff)在上世纪50年代就发现“统计”这貌似神秘的语言就常常被出于主观或者客观的原因而滥用,常常无法描述应该表达的客观事实,更有甚者,还误导读者形成与事实情况大相径庭的看法和决定。他出于武装读者的头脑,提供自卫技巧的目的,于1954年出版了《How to Lie with Statistics》一书。持续50年的畅销和再版,帮助了一代又一代的读者看穿统计背后的“骗术”,找到值得信赖的事实。

事实和关于事实的信息常被混为一谈。如果事实是天然存在的,那么关于事实的信息都是在认知过程中经过了人为加工。因此,当事实特征转变成信息时,自然就会在描述上有尺度和角度的偏差。在这里,尺度,就是标准与对比;角度,就是样本与描述。“统计”作为描述事实数量的工具而存在,也不可避免的在这两个范畴中的破绽重重。而《How to Lie with Statistics》就是一本破绽说明书。在书中,破绽类型介绍的详尽明了,虽然事例略显陈旧,但描述依然生动有趣,表达清晰。

跟“破绽”联系在一起的双方,必有一个倒霉。就像古代武将在两军阵前单挑,技高一筹的常常“卖个破绽”,把对手一把擒来。也有遇到时运不济的,“露出破绽”,被对手一枪刺于马下。虽然说技巧运用之妙,只能存乎一心,但我们至少不想成为那个倒霉蛋。一旦对手祭起“统计数字”这个法宝,我们就算出于自卫需要,也得事先好好看看这本书。

顺便说一句,对于学有余力的读者,把它当“骗子宝典”也是很好的选择。

统计数字会撒谎

作者:(美)达莱尔•哈夫著

出版社:中国城市出版社

出版时间:2009-03-01

谁在关注这篇书评
  • 个人名片 中文实名
广东联合出版公司 | 机械工业出版社 | 南京大学出版社 | 清华大学出版社 | 时代光华 | 人民邮电出版社 | 文汇出版社 | 中国经济出版社 | 中国青年出版社 | 中信出版社
浙江大学出版社 | 作家出版社 | 湛庐文化 | 长江文艺出版社 | 华章经管 | 经济日报出版社 | 中国城市出版社 | 财政出版社 | 中华工商联合出版社 | 新星出版社
重庆出版集团 | 人民文学出版社 | 中资海派 | 电子工业出版社世纪波公司 | 中国电力出版社 | 道中财富 | 含章行文 | 同舟人文化 | 华章同人