谈谈云计算发展史及其影响

李德毅 原创 | 2011-09-22 14:03 | 收藏 | 投票 编辑推荐
关键字:

  现在CIO难当问题在哪里呢?因为信息技术和信息产业发展太快。所以,你得跟得上技术和产业。我们讲全球的信息化,或者我们国家的信息化,应该讲两句话,一个是信息技术和信息产业的迅速发展,这个大家都理解。第二句话是对全社会各行各业全方位的渗透。所以,这一句话把我们信息官搞得很辛苦。

  我今天讲一讲云计算,希望大家能够跟上时代的步伐再往前走一步。图灵机大家都知道,是我们计算机的一个理论模型。1936年产生的,是一个天才的数学家图灵,他说数学问题可以用一种模型来表述它,也可以做一些解。后来冯·若伊曼就把计算机按照图灵的模型做出来了,之后1944年和1945年的时候,全世界第一台计算机出来了。所以不管在哪一个机群或者是网络,还是网格还是并行和分布的,基本上都是在图灵机上干活,所以我们都把它叫做面向图灵的技术。现在我说beyond就是说它被超出了。有的同志看到我的题目爱把它写成超越了,我比较计较,超越就叫做跨过去了,超出了,因为云计算里面仍然有相当分量的图灵计算。但是它比图灵技术更广泛。所以我今天想讲一讲它超出了哪些地方。下面我讲五个问题:互联网改变了计算机和软件的工作模式;网络科学十年形成了对互联网的新认识;超出图灵机的云计算;云计算的基本任务;云计算对信息产业的影响

  第一,互联网改变了计算机和软件的工作模式

  年轻人爱看未来,我们老头子就爱看过去。我们有一句话叫做历史照亮了未来发展的道路。我们想一想从图灵机1936年24岁的天才数学家图灵写了这篇论文之后,我们世界发生了什么变化?其中一个重大的变化就是冯·若伊曼先生他要求图灵一起来做冯·若伊曼的计算机,把它物化了,说你这个模型是理论的,能否把它物化成一个物理的东西。后来到1968年就开始有软件工程的思想。大家想软件就像一个产业了,但是事情没有按照原先的三个大事件的轨迹往前走。到1969年美国国防部率先组建了一个网,叫做ARPANET,ARPANET不久被作为原形变成了Internet,84年到现在25年。所以现在是互联网的天下。后来又过了五年,我们大家对互联网不满足了,觉得互联网对我们老百姓离得太远,又有人发明了一个万维网,在互联网的基础上搞了一个超文本。所以,现在大家都在万维网上工作,特别不是搞IT行业的,因为信息是互联网的载体。所以基本上是在万维网上工作。

  1998年有两位全球著名的科学家发现网络可以把它作为一个科学问题来研究,我这里打了七个点,这七个点就是图灵机到现在,有几个重大的事件,甚至七个点对应了七个人,因为他们推动了社会的进步,实际上不止这七个点。大家看到后面有一大堆的里程碑,一个一个台阶往前走,所以要把这七个里程碑再细分,就有20几个里程碑。时间比较紧,我就说三个里程碑。我们耳熟能详的,特别是40岁以上的人都经历了的。所以你要把七个里程碑再往宏观来讲的话,就是三个里程碑。

  我们看看历史照亮未来发展的道路。这三个里程碑到底是什么意思?大家回顾历史,我们当年有三个速度大家应该记住,一个是通讯发展的速度,一个是存储器发展的速度,一个是微电子或者是集成电路发展的速度。通讯发展的速度我们把它叫做吉尔德速度。吉尔德先生说互联网的带宽每六个月翻一番,存储器的容量或者是存储器的性能价格比每九个月翻一番。微电子、集成电路或者CPU的性能价格比大概上是十八个月翻一番。我们知道这个社会应该是和谐发展的,通讯发展的非常快,六个月翻一番,集成电路是十八个月翻一番,存储器是十二个月翻一番,这个社会就要打破平衡了。我们国内很少有人说这个事情。正因为如此这三个翻一番,所以,我们这个社会就进入了网络时代或者是信息时代。但是通信比存储发展的快,存储比集成电路发展的还快,大家知道吗

  我想讲一个例子大家听一听,2000年的时候,我们计算机进入了各家各户,我们的端口速度是100MBPS。我是搞通讯出生的,我们当时搞程控交换机在一个城市里面,每一个端局的端口速度就是100MBPS。100M是一个什么概念呢?就是1500个化路端局,现在变成一家用了。所以,我们人类在享用通讯给我们带来的便捷。像我这个年龄的时候,我们以前部队离休干部都是小号,现在已经没有小号了,已经都是大号了。大号才一个化路,我们以前没有办法的时候,用一个东西并级,那就是说通讯的带宽不够,现在给一家1500个化路,这不是很奢侈吗?所以我们发财了,我们通讯是发财了,大家都没有想过这件事情。

  再看看无线进入3G时代,2MBPS走在路上,我们一边走路一边看图片,一边走路一边发邮件,一边走路一边听MP3。MP3里面的东西在哪里弄来的?在网上,因为通讯传输速度快,所以我们在享受着通讯科技进步给我们带来的便利。在这样情况之下,计算机发展也是很快的,所以IT公司就在想,怎么办,我们把通讯给用足了。我想举一个例子,我们一个人,因为工伤事故两个手断了,这就麻烦了,结果他就非常的刻苦他就拿两个脚来写字,这就叫做平衡性的发展。结果字写的很漂亮,人们发现他的脚潜力很大,现在我们通信、存储、计算机当然都是应用了,刚才我说了十八个月翻一番也很厉害。但是通讯发展更快,所以,网络就出现了。这不是很简单吗?网络出现了,我们就可以把很多事情拿在网上来做,而不一定在你自己家里做。

  这时候我们在家里做事情有什么问题,我们来看看图灵技术有什么问题。小伙子图灵他24岁写了一篇文章的标题叫做《论可计算机及其在判定问题中的应用》,中间有个词不太好念,什么原因呢?图灵发表这篇论文的时候,他用的是德语单词,所以我们现在好多做研究的他不看经典论文,他不一定对论文产生的背景了解。他为什么用德国单词呢?他这篇论文是回答德国大学家希尔伯特在1900年提出的著名的“23个数字难题”之中的第10个问题,问题涉及逻辑的完备性,即是不是所有数学问题在逻辑上都可以解的。这篇论文说:并不是所有的数据问题在逻辑上都是可解的,有一些数据问题是不可解的。哪些问题是可解的呢?他给了一个例子,也就是我们说的图灵机模型。他说一个自动计算机的理论模型,这样的论题可以做一些事情。可以把推理作为一系列简单的机械动作,被称作为图灵机的模型,有许多等价描述。歪打正着,图灵机模型到上世纪60年代却转变成用来说明可计算能力的模型。

  因为他的贡献之大,过了30年之后,人们决定设立图灵奖,用图灵的名字来说明计算机里的重大问题。所以从1966年开始就有图灵奖。到现在为止有几十位图灵奖获得者。几年之后冯·若伊曼要求图灵说我们把它物化一下,我们来做一个模型,做一个物理的计算机来实现你的模型。果然实现了,所以我们把计算机的诞生认为是冯·若伊曼先生的结果。冯·若伊曼说计算机是由控制器、运算器、存储器、输入设备和输出设备组成。但是冯·若伊曼比图灵又近了一步,他认为程序可以存储起来,存储的程序和一个数据没有差别,我们把存储的程序按照地址顺序进行操做,这就是机器指令。所以他的进步也很大,有了这个想法之后,慢慢的计算机才变成今天这个样子。

  程序设计和软件工程:在每一个层次上都能够进行程序设计。高级语言程序设计过程是“分析问题、建立数学模型、选择数据结构、设计算法、编程等等”。这些问题我想大家都清楚。

  Robert E·Kahn和Vinton G·Cerf他们两位因为在TCP/IP协议方面所取得的杰出成就,他们在2004年荣膺图灵奖,2005年获得美国总统颁发的总统自由勋章。又过了五年,伯纳斯·李将超文本引入互联网,创建万维网。他发明了两个东西:传输协议和超文本协议,有了这两个个东西以后,我们发现英特网上面有万维网,于是所有的东西都连在了一起。上面一直到GPS,下面到手机。在这个过程当中,工程师为了画图方便,就把网络用手隔一下,像云一样,用云作为LOGO表示网络资源,这个早就有了,不是什么新鲜玩意。

  现在我们到了一个无处不网、无时不网,人人上网、时时在线的时代。有一句话是这样说的,有电的地方就有互联网,有互联网的地方就有云计算。因为这个时代已经到了这个时候了,所以我们是否还在一台电脑上做事情?就好像爱迪生发生电的时候,每个人自己搞一个发电厂,在发电厂自己发电自己用。有人建议发电厂为什么不搞大一点?那就是上网了,所以说云计算并不新奇。

  我刚才讲了,通讯的发展速度、存储器的发展速度和计算机的复杂速度,我们大家都很享受这个发展速度。但是有一个问题更严重,信息的复制量开始了,网络环境下信息每18个月产生的数据量等于过去几千年的数据量之和。这一句话在当时还不敢讲,信息的速度比通讯的增长速度还快。联合国科教委组织说三个月翻一番,如果三个月翻一番和六个月翻一番这样信息发展太快了。所以人们一开始迷茫了,我们掉到了信息的汪洋大海里头了,因为那个是六个月翻一番,这个三个月翻一番,这怎么得了?这就是人们的一个诅咒信息的东西,这个东西到底是真的还是假的,这个东西垃圾太多了,大家都在抱怨。像我们部队的指挥所里面我们不需要这么多,你阻碍了我的决策。所以现在有一个词叫做数据挖掘或者信息挖掘,网络化数据挖掘。所以,我们并不需要这么多的信息,人们需要最感兴趣的最需要的信息。

  所以,这样一来的话,电脑已经不稀奇了。所以这个历史是一个特殊的历史阶段。所以现在出来了这样一个很时髦的话语,30年前电脑被送进千家万户;20年前,网络被送进千家万户;现在服务被送进千家万户。

  我想举一个简单的例子,我们北京大学要搞绿化,那我们北京大学的校长说要成立一个绿化队,雇30个人,给学校所有的树、花浇水、灌溉、除草。绿化队的队长说:不行,30个人不够,学校这么大,要雇100个人。后来慢慢发现绿化可以社会化,我们可以在北京找一个园林公关公司给他签一个合同,给他提一个要求,开会的时候你必须给我摆花。所以园林公司就全给所有大学服务了,这个大学校长很高兴,以后就可以把员工省了。这叫做园林社会,为什么要搞园林队呢?如果每家都搞一个员工队的话,我们没有那么多人力资源。但是有了园林公司的话,我们就可以省很多事。所以云计算一点都不复杂,我们安安心心做我们的事业,做我们公司的主渠道的工作,所以服务送进千家万户有可能了。

  我简单讲三个例子在我们计算机领域里,电子邮箱一开始出现的时候大家很时髦,每个人的名片上都有邮件地址。邮箱大家正常的想法是挂在自己家门口,后来慢慢人们发现电子邮箱不能挂在家门口,要是挂在家门口的话,要出差到外面邮件就看不到了。所以慢慢就把邮箱放到网络上了。gmail现在是免费邮箱,千千万万的人都用免费邮箱,但是邮箱的空间无限大,这样一来电子邮箱好像是一个免费的货物,但是他在做其他的生意把大家都吸引过来了。所以电子邮箱放在家门口就好像是绿化的需求,不一定要有自己的速度,也就是来回传递,到我这来要有最好的状态。

  第二个例子就是操作系统,操作系统我们看到Windows发展的历史。Windows操作系统的演化,由于Windows面向太多的企业、服务器和个人等不同应用,成为“千人一面”的操做系统,软件规模越来越庞大。操做系统对硬件配置要求越来越高,电脑耗能成为全球变暖的祸首之一。所以,这样一来操作系统到了今天。

  用户不需要千人一面的操做系统,用户需要的是便宜、简单、省电、多元、个性化的端机;很快的上网速度;个性化、轻量化的操作系统成为大势所趋。

  第三个例子是个人网页,我们以前建一个网页要多长时间。十多年前我们建一个网页可能需要一个礼拜,现在一个小孩子甚至是一个中学生可能拿一个鼠标点击一下建一个网页就只需要一个下午。 这是什么原因?是软件的发展。现在哪个公司的软件是自己写的?很多公司都不是自己写的。

  当然通信和网络还是一个问题,如果网络不是一个大问题的话,如果沟通不是一个大问题的话,我们应该怎么使用互联网?怎么样使用计算机?所谓网络就是IP连接,把所有的集成连在一起,这就是一个科普的定义。管理问题是计算机跟计算机是怎么样交互,我认为有三种:1、消息传递;2、数据交换;3、程序调用。所以,程序调用表现出来的新鲜的事物,如果不是固定的速度的话,我觉得也要有三个东西需要研究:

  一是计算机病毒,能够通过修改其他程序并把自身拷贝包含在其中而感染这些程序的程序,在计算机之间传播。

  二是网络蜘蛛,在万维网中各站点爬行,捕获网页内容。

  三是网络机器人,网络机器人就是这台机器控制另外一台机器。在这样的情况之下,我们看到互联网完全突破了图灵机的描述范畴。互联网上的计算机以交互为中心,此计算机可以影响彼计算机的运行状态和物理距离几乎无关;CPU只是网络上一个个自治节点中的可计算部分;结点可以是异构的;结点之间可存在弱耦合的关系。

  互联网的促成,集中统一的调度,顺序的、确定性的输入,不能描述互联网的工作机理。互联网成功实现了一群实现自我价值的人。有博客、播客和派克、威客。博客成为面向公众的个人信息发布系统,还衍生出移动博客、图片博客、群体博客等。威客是一个很好的东西,我帮人人,人人帮我。

  互联网是什么?它一定不是一台图灵机,互联网成为人人感知和认知不可或缺的装备,使得人的感知能力和认知能力挣脱了时间和距离的束缚,得到极大的延伸;互联网成为人与人之间沟通不可或缺的装备,使得人与人之间、人与社会之间沟通质量和效率得到极大的提升。

  社区是什么?社区成为网上从事某种专项事物的人群,或者从事某种专项服务。我特别想讲的是社区的思想,最好的社区,可大可小,专项可粗可细,而且这个社区是无穷无尽。社区的出现巧妙地解决了人工智能中无法解决的常识知识的界定和表达问题。

  这是我讲的互联网的发展改变了计算机和软件的工作模式。

  第二,网络科学的十年形成对互联网新的认识

  在1998年在资产杂志上有一个作者,他发表了一个模型,叫做小世界模型。他认为包括互联网在内的网络具有小世界的特点。不到一年,另外一个科学家在科学杂志上又发表了一篇文章,他发现二八定率。一批物理学家们很快转入对网络科学的研究,并又回到物理学家的门槛,这一批人很可敬可爱。

  网络是无界的,网络是一个无厘头。怎么样理解一些网络?我把这个结果告诉大家,理解一些包括互联网和社会关系网在内的这些网,如果它具有以下几个假设的话,它往往表现得很好的疏离度。

  互联网不是交响乐,没有总指挥,没有人为它规定开始、中间和结尾,在互联网发展史的任一时刻,都有协议和规范来定义它的架构,可是这一架构从来没有完整的规划,没有所谓的顶层设计。万维网亦然。

  如果具有以上性质的话,包括互联网、万维网在内,常常具有小世界现象的,无标度和不均匀性、脆弱性和鲁棒性并存,级联失效和连锁崩溃。

  所以,真正推动网络发展的,我认为应该是青年人,是一些70后们。好比举一个例子,Google的这个笑嘻嘻的小伙子,他发明了一个算法PageRank算法,因为这个算法,所以Google的搜索引擎取得了巨大的成就。中间这个小伙子他发明了HITS算法,现在成为美国最年轻的工程研究院院士。右边这个小伙子,他发明了GN算法。尤其是乔恩·克莱恩伯格2006年获得信息学领域最杰出数学成就奖。所以可以看到70后他们是推动网络前进的主力军。

  任何人,作为网络的端用户,其端机上的资源,包括计算资源、存储资源、软件资源和信息资源等和网络上的资源相比,都变得微不足道。无论用户是在进行网络计算、对等计算、还有信息搜索,哪些事情由端机承担?哪些事情由边缘网承担?我们看两个极端状况,一是,网络上没有任何信息资源,网络仅仅实现即时的交换,回到传统通信的交换时代。二是,所有信息资源都在主计算机(虚拟机)上,端机仅仅是人机即时交互,回到传统的主机/终端模式。

  然后迅速提出一个网格计算和云计算。我们看看网格计算的区别:依托专网或互联网,将部分处于不同地域的、资源参加的计算机组织起来,统一调度,利用闲散的计算资源,组成一台虚拟的“超级计算机”,形成超级计算能力。

  云计算:广大用户依托互联网上某些结点强大的信息资源,包括存储资源、计算资源、软件资源、数据资源、管理资源、为我所用,强调需求驱动、用户主导、按需服务,即用即付,用完即散,不对用户集中控制,用户不关心服务者在什么地方。所以这个可以叫做One for many。

  有了云计算,广大用无需自购软、硬件,无需将自己的软硬件系统交给他人托管,甚至无需知道是谁提供的服务,只关注自己真正需要什么样的资源或者得到什么样的服务。

  对于大量的中小企业,不再需要一开始就花费大量的投资来购买部署计算机软硬件设备和聘用维护人员;不必担心因为高估自身业务受欢迎的程度而过度部署造成资源浪费。买单买什么?买知识产权(许可证)?买硬设备?买软件?买配制?买电?买电子垃圾?买服务:通信带宽、存储空间、计算能力成为社会的公共基础设施。

  中小企业是云计算的最大受益者,用户应用成本的降低以及应用自由度的增加,是云计算带来的基本驱动力。很多地方都在说云计算就像水电一样,水电大家都知道是一个基础设施,信息是不会损失的,但是要求服务的时候我们是很仔细的。所以,信息的传输是双向的,不像电一样,你是发电的,我是用户,我只是耗电的,并不发电。但是在互联网当中,可能每个人都会产生信息,双重角色,是个性化、工业化的需求。在这种情况之下,我们看到由于通讯的发展、网络的发展,由于人的介入,网络是怎样超出了图灵机的模型的呢

  第三,超出图灵机的云计算

  从初始字符串到终态字符串,可认为是确定空间点到点的映射,无法解决不确定性问题;通过时钟频率把模拟量近似为数值量,并解决了读写磁头等动作的快慢,等粒度的细分决定了数字化程度,至于这样的近似是否可行,数值量如何返回模拟量,均不在图灵模型考虑之内;图灵模型中没有考虑输入输出的形式化方法,输入输出、人机交互没有出现在计算过程中。

  举一个例子,比如说在Google上打一个云计算,他给我们的答案是一样的,你打和我打都是一样的。我们现在是要知道你是一个退休干部,你只是想了解什么是云计算,给你500个解你可能都觉得多了,我可能是一个云计算的开发商,我可能要五万亿都不够,你怎么知道我们俩个用户之间的角色不一样,你给我们安排不同的方案?这叫做粒度计算。整个图灵的模式根本就没有人介入,输入和输出根本就没有,现在网络时代要把输入输出作为一个最重要的形式,所以图灵太局限了。

  我们这些科技工作者,尤其是计算机科技工作者不小心把图灵设成了一个可计算的模型,实在是有点悲哀。因为图灵说并不是所有的数据问题都在图灵上可解的,有一些是可解的,例如图灵模型。我们现在原有的人把图灵当成了老祖师爷,认为他解决了图灵技术的问题。图灵要是活着的话肯定很不高兴。所以我们可以看到这30年来,我们软件IT产业是怎么变化的,现在我们从软件定制到软件产品到企业解决方案,然后面向大众的成套软件,然后到网络增值服务,最后到云计算。从“以产品带服务”向“以服务带产品”方向发展。以前我是给你卖软件,给你做培训服务,叫做以产品带服务。现在我们以服务带产品,我替你杀病毒,以服务带产品。现在手机也是发展到了这个程度,你只要买几百块钱的花费,我把手机送给你。所以,以服务带产品的时代到来了。

  软件工程危机归根到底是图灵危机,由于我们过渡的关注CPU,忽视了人机交互,忽视了机器行为通过人群的参。图灵模型作用的扩大化,尽管图灵命题主要说的是数学的弱点在解决数学问题时图灵机不能够做什么,如停机的不可判定问题。但是计算机科学家们却逐渐开始讲图灵机用来说明可计算能力的模型,进而作为一种解决所有计算问题的模型,把图灵机作用扩大化了。

  我们看看图灵在发明了图灵模型之后,他自己做了一些什么事。图灵自己也认为图灵机并不适于作为解决计算问题的通用模型。包括图灵和图灵将获得者米尔纳,他们开始尝试试用交互机来扩展图灵的模型。所以这种情况已经很多了,包括图灵本人的尝试。

  所以,今天我来给各位CIO讲一个公式,希望你们能够记住,网络不等于世界上最大的计算机;网络不等于图灵机。

  超图灵计算模式,Wegner、Leenwen等人提出基于图灵机的交互机器模型,如Site机、交互机、多流交互机、持续图灵机等,企图扩展图灵机使其具有动态输入和输出能力。尽管已经证明这些模型的表达远远比图灵机强,但是他们是描述单个交互机系统,而不设计符合系统。实际上在图灵模式出来以后,很多人都在研究,但是都没有好好的用互联网这样的一种形势。

  网络计算强调把计算机嵌入到网络、环境或日常工作中去,让电脑笔记本消失,人们注意的中心回归到要完成的任务本身。

  1991年施乐公司前首席科学家Mark Weiser提出普适计算思想。例如,他在办公室门前建造了一个喷水池,用喷水量和水柱高度来模拟显示网络上的当年全球股价的走势。

  关注大众人机交互,我们可以看到一个游戏,我们举一个例子,好比说我们在网络上做一个游戏,有人说你看到这个图片有什么感想?我们两个人猜问题,大家可以看到图片上是一个小孩子在一个车上戴着一个帽子,好像在做一个游戏,实际上你是对这个图片在做一个图片标注。因为现在网络上我们需要的是图片的处理,图片处理就要进行标注,标注是谁标?是大家来标。比如说我给你一幅图,你说这个图是讲什么的?仁者见仁,智者见智,因此不同的人说出不同的场景,有的说是海滩、有的人说是大海,有的人说是人群,也有的人说是谈话,也有的人说是天空。如果这个图片要正好是卖铃铛的人,他肯定会想到这是一个铃铛。但是更多人认为这是一个海边的谈话。

  所以,云计算一个很重要的思想就是利用大众的人,你在这个过程当中,你是在做游戏吗?不对,你是在做程序的开发者,你是在编程,你是在帮他的忙。深圳有一家公司专门提供MP3的下载,你下载五首音乐,我就收你一点点小钱,但是你下载了五首音乐以后,我看这五首音乐都是谁的粉丝,我马上给你推荐这五首音乐的人。然后你看这还有好的,我要,然后又点了几首。这个公司一个老板六个员工,一年八亿人民币。你以为是你在做他的用户吗?不对。你点了这五首歌,我就知道有人对这五首歌很关注,你在做社会标注,我马上把你的标注拿出来作为一分子放在我的库里面。于是别人跟你这个步骤相关三首歌的时候,我就把另外两首歌也推荐给你。这个做法多聪明。

  我们想想人工智能,人工智能我干了一辈子,我就是搞人工智能的,我也写了一本书跟人工智能有关的。因为我们应对的就是把人类智能用图灵机能够理解的算法和语言符号填到图灵机里面去。从这个意义上来讲,人工智能工程师们就是图灵机的奴隶,很悲哀的。

  通过群体标注,图片如此分类;社区常识决定不同社区不同标注;对文本进行群体标注会如何?对视频图像进行群体标注又会如何?通过标注可否实现跨媒体检索?因此,互联网给我们一个很好的机会,就是用群体智能来捕捉图灵机智能。因此,云计算要是超出了图灵机计算,云计算的可能性更大,这就是我今天要讲的这个题目。

  因此一个新的理念出现了,大众既是软件的使用者,也是软件的开发者;既是服务的消费者,也是服务的提供者。图灵没有考虑过这样的群体智能产生的模式。维基百科的创始人吉米·威尔士想到了。我想我们的CIO都参加的大会很多,我建议你们多看看维基百科,不要光看Google,Google是老百姓看的,CIO要看的至少是看维基百科。

  为什么大家都喜欢云?天空中大量云滴构成的云,远观有形,近观无边,千姿百态,漂移不定,有时如朵朵棉花,有时一泻千里,或淡或浓。

  量子物理中的电子云,云计算一定是基于网络的。网络为大众提供了一个个虚拟的、丰富的、按需即取的数据存储池、软件下载和维护池、计算能力池、多媒体信息资源池、客户服务池,提供一个人与人沟通的便利点。

  我列了一个图表说明什么叫做云计算,我把它列举用水的生态循环。在地球上有很多的水库,Google也有水库,就是数据中心,或者叫做搜索引擎,它需要蒸发,蒸发形成就是服务的发布。服务可以聚合,而且聚合的大小与云滴可大可小,但是有用户需求的时候,又落到地面上。所以,人是调剂水生态环境不可或缺的一个社会群体……云计算是调节它的信息资源相互服务的一个不可或缺的社会。

  人工生命之父克里斯·兰顿有一个大胆的设想,他说,“生命的本质在于物质的组织形式,而不在于物质的自身”。把这一句话用到网络上就是,信息资源网络的本质在于信息资源之间的组织形式,而不在于承载信息的图灵机自身。云计算的提出有可能导致软件工程的重大变革,突破图灵机模型的束缚:不在于单台图灵机上的软件,而在于网络上软件之间相互作用。因此,引发对计算机CPU核、操作系统、交互这三者关系再认识。

  软件的网络化性质比单台图灵机上软件单元的性质更强烈地影响着网络软件的整体行为和特性,甚至出现涌现,如计算机病毒在全网的突然泛滥等。有了软件的几种服务之后,版本的概念消失了。因为所谓的版本是作为产品卖出去打一个包。因此软件将没有版本的概念,采用永远在用的软件开发模式。谷歌的Gmail,Gdoc已经采用。这种模式淡化了软件产品的生命周期,服务商可以无数次在线更新软件。

  因此,我们在云计算里面运用了三句话:一是,“Saas”改变了操作系统、中间件等作为产品配制在客户端的传统,软件可以租用;用户端可以零安装、零维护、零剩余。

  二是,出现同一个应用软件系统,同时租给许多不同用户使用。

  三是,PaaS:比如说亚马逊的一个虚拟计算单元,相当于1.2Ghz的Intel Xeon的32位处理器、1.7GB内存、160GB存储器,付费为每小时0.1美元,在S3上存储1GB的数据每个月只需0.16美元。

  第四,云计算的基本任务

  网络环境下信息资源的感知、存储、处理、发布、传播和租用;这个资源当然云包括计算在内。网络化数据挖掘:用户主导、面向领域的跨系统、跨媒体、即时定制的服务或者服务组合。其实我们已经感受到,现在手机上都做了定制服务,说你要什么单程的时刻表吗,定制一下,要航班和气象吗,只要定制一下就可以了。因为通讯相对来说便宜,再说,你通讯不用,他赚不到钱,他当然鼓励你多发短信。

  目前,太多的定义和太多的解释,使云计算成为“皇帝的新衣”。迫切需要业界的合理布局。所以,我们成立了云计算专家委员会。李开复、张亚勤等等这人都来到了云计算组。他们在做一些什么呢

  第一个是虚拟计算。

  第二个是变粒度和粗粒度计算;云滴在不同粒度上提供服务,云滴的弥散性——雾;云滴的聚合——云团;对服务资源不同层次的管理和动态扩大,从不同的粒度上对“云”所提供的服务资源进行处理,形成面向不同社区用户、不同使用目的、表现形态各异的云滴和云。WEB服务聚合,分布在网络中的WEB服务是云计算中的一个个“云滴”。这样一来,云计算用户才能选择不同的服务。

  第三个是:不确定性计算。不确定性有多种:随机性、模糊性。好比我们通过索索引擎进行搜索,同一个云计算关键字,我们有几千个几万个搜索结果,这就是搜索结果的不确定性。

  第四个是:软计算。根本上是定型定量转换计算。自然语言理解:词计算、语义计算、文本计算、语音计算等;语构、语义、语境理解;图形图像理解;流媒体理解。我们要在内容层面上做产品,而不是一天到晚卖服务器。

  也许,目前人们体积的云计算还仅仅是冰山上的一角。

  第五,云计算对信息产业的影响

  影响一:信息产业面临重新洗牌。

  大量的中小企业软件开发商面临着工作平台、工作对象、工作方式的重组;在云计算的大潮中是做大做强还是被淘汰?要么做大做强服务,成为“大款”;要么“傍大款”,依附发展。你想淘宝网的发展,淘宝网的发展告诉了我们一个真理,在家里就可以做买卖,现在很多人在家里就可以赚钱。

  如同电力时代高压传输问题解决之后,大规模甚至超大规模核电厂的建立一样,信息时代做大做强的大规模甚至超大规模的数据中心、信息中心、存储中心、软件中心、计算中心的建立,势必成为未来云计算的基本要素。

  影响二:软件产业结构面临调整。

  云计算使得信息服务的社会化成为可能,改变精细化了大众需求,催生新的市场和新的服务业;软件产业结构发生变化,基于内容的信息服务业所占比重越来越大。在基于内部服务更加集中化、专业化的同时,也更加碎片化、精细化。

  影响三:软件开发的组织方式面临改变。软件频繁地被重用和重组

  影响四:大众普遍参与形成群体智慧。

  影响五:网络端设备多元化、个性化。网络环境下泛在的计算:端产品IX更加简洁、多样;泛在的计算将成为重要趋势。

个人简介
李德毅,中国电子学会副理事长,中国工程院院士,欧亚科学院院士,中国人工智能学会理事长,中国电子学会云计算专家委员会主任委员,国家973项目首席科学家,国家和军队信息化专家咨询委员会委员
每日关注 更多
李德毅 的日志归档
[查看更多]
赞助商广告