再遇大数据(cee)

王国树 原创 | 2014-03-16 21:01 | 收藏 | 投票
 记得去年什么时候,大数据就被抄的火热。有幸今日南山图书馆沙龙,我们再遇大数据话题,个人也深得启发思考。
图片
1、 跟随大数据的思维模式“是什么”,求解什么是大数据?

沙龙上,虽没有这个话题,但在个人的发言中,也已点名 ,我们必须思考的这一问题:什么是大数据。顾名思义,大量的数据,再加上分析汇总,就是大数据,尤其被互联网企业所推崇。

2、与统计学孰优孰劣,这是沙龙上的互动问题。

个人感觉部分人,还是有点个人偏向,就互动了此问题。我们可以追溯人类的决策史,我们经历了三个阶段,俗称“拍脑袋 ”搞决策-复杂演算-理性分析。这里面的拍脑袋搞决策,如果是莽夫搞,那叫不靠谱,如果是智者搞,那现代文明叫专家系统。至于复杂演算,暂且不说,统计学和现在的大数据,应该属于现代文明的理性分析,如果在延伸点,可以改叫智能决策。
宏观看,大数据就是统计学在互联网时代的一个互联网统计学产物 ,属于包含关系。围观看,大数据是基于日常监测的一种积累效应分析。

3、因果关系与相关关系。

沙龙当中提到,我们往常研究的是“为什么 ”,所为的因果关系。如今大数据是研究“是什么”,所为的相关问题。对于这个问题,个人的看法是,是什么,研究多了,就是为什么。相关关系本身求得就是因果关系。我们所有的工作都是在解决问题,通过相关关系的大量积累研究,出现的必然是因果关系。这也就是为什么,答案可能多种,但真理永远不变。

4、因为第3点的探讨,也引出了个人对大数据的进一层思考。

大数据的本质,就是一种量化研究,他的关键点就是基于互联网信息技术条件下的,全样本采样、收集、分析方法,与别的方法比较,就是以量取胜。如果没有信息技术的可靠参考和处理,,大数据也就是一种资源消耗大、并不怎么靠谱、最笨的统计方法 。因为所有的计算和信息处理都是人为设计约束条件或参考模型,而非自然或社会生态自发,但我们研究事物本质时,它的准确性,就很难信服。个人结构设计毕业,为什么我们在研究陌生结构时,会进行破坏实验,就是对计算数据的验证和纠偏。

5、智能机器或专家系统与部分智者孰优孰劣

其实这个问题,相对比较傲一点。首先人或智者就是一个高度智能的机器和系统,虽不能面面俱到很厉害,但某些方面足以独立解决问题。而智能机器和专家系统,只是人类智慧的结晶,切无自生和成长特征。所以结果就是,智能机器、专家系统是需要,但根本的更需要智者,因为它们本身就是智者的复制品,相比最大化收益。第三方观点:孰优孰劣,本身就不应被探讨。

6、沙龙未碰撞的观点:大数据陷阱。
图片
a、模型陷阱,模型不准确,可能造成的结果偏差;
b、数据采集不全,不是大数据或互联网就真的数据准确,因为至少现今互联网未能面面俱到和网民时间的随意性等等,都会和抽样调查一样会有偏差,并且对数据采集准备工作要求技术较硬。
c、 个人隐私风险。用于研究无妨,但因为个人隐私信息的价值永恒,一旦被犯罪分子盗用,我们的社会就会因为互联网数据而失信,个人俗称互联网紊乱。

7、去数据化思维。
图片
大数据是一种思维,去数据化也是一种思维,个人去年年底微信上有提。 基于答案和人类日常的“生命”经历和积累,利用关键提取和事实验证的方法,来预测或计划执行目标的思维,即为去数据化思维。也是一种互联网思维模式,再此不做赘述,改日再叙。

转载请注明出处,欢迎交流指正,微信号:m642883416 

 

个人简介
一个完美主义者,一个思想者和一个实践者,我享受“思想驱动身体的生命体验”,享受“产品与用户的一体化解决方案”。 “归零之心,空杯之为-Wisdow of Crowd”,诚心为友,渴求知识-stay hungry
每日关注 更多
赞助商广告