未来的人工智能将去向何处?

王小川 原创 | 2016-04-19 12:23 | 收藏 | 投票 编辑推荐

  各位朋友大家好!今天过来分享我对于人工智能和硬件这件事情的关系的理解。我抬头第一眼看到咱们讲的是——新硬件生态。我们在提一个词叫“智能硬件”,其实每次提到这个词我反而焦虑。我们有时候弄了没有想明白的词做这个事情,可能带来很多风险。就像我们很多公司在做一个技术,这个技术能做什么、不能做什么,没有判断。要么产生恐惧感,要么产生盲目膜拜,不知道有什么意义,可能投资或者做事就偏了。

  当我们回到“新硬件”,反而给我留下空间诠释什么是智能。今年3月8号开始的一周时间,有一个Alpha Go、李世石的人机大战,人跟最顶尖的科技公司进行了一场较量。这场比赛的赛前很有意思,我们回顾一下,当时Google一发布我就兴奋了,因为两年前我看到了他们的生物科学的发展,很可惜自己没有把气场攒起来。我跟清华的同事和实验室都提到这个想法,但是没有提做“下围棋”这件事情,说这件事情太难了。没有参与这件事情是挺可悲的事情。

  有很多朋友说,你这么积极在这件事情上,包括2月份就在知乎上写文件说Google会赢。没有参与,围观总是可以的,所以这个事情参与了比较多心思。赛前的时候,我发现大部分人看好。有两类人不看好,第一类人是围棋选手,尤其是参加世界大赛拿到9段的选手,包括聂卫平。我在五局棋里面参加了两局,我跟大家讲我对围棋理解不同,虽然知道规则,但是根本没有办法判断这个局面好不好,所以下棋比赛当中我就看一件事情,就知道这个比赛人是否会赢。我就看教练的脸色,脸色越难看机器胜算越大,最后教练崩溃了,最后机器赢了。

  我讲这个例子是,我们似乎面临一些威胁,曾经擅长的思考能力开始有机器侵入进来。一个围棋选手的情况,就是一个机器把你的成功和引以为豪的东西替代的时候,这是一种什么恐惧。我想以后各位可能多多少少会经历一点,包括腾讯开始改BUG了,我们可能有这种压力。在这个比赛前,很多互联网的代表人物,甚至有技术代表的人都认为人会赢,机器赢不了,包括我们公司十几个人,我们一一去问,百分之八九十的人给我的答复是未来机器会赢,但是这次人会赢。

  他们认为下围棋会有区别,认为以后机器没有问题,但是现在时机不成熟,很不幸,最后机器确实战胜了人。我们当时记小黑板说不够情怀,即便做科技的人也没有想到这个这么突然,这是这个事情给大家的感受。但是我想我们不要有恐惧或者有浪漫性的关怀,我们了解它到底能做什么、不能做什么,这对我们生活态度和工作有帮助。不是说这个东西到底怎么赚钱,很多朋友说到底是不是商业机会,我们究竟怎么理解这件事情,包括人自身的提升,我们对机器的了解可能会更加长远。

  不知道大家有没有听过“深度学习”这个词。大部分都听过,因为这个词像Alpha Go一样,讲到了一个特别神秘的概念,就是机器的深度学习或者智能。深度学习讲的是两个概念:第一个概念是,机器学里面用神经语言模拟人脑的语言模型做训练,或者机器的识别,就是把你的输入变成向量,中间经过迭代做到结果;第二是迭代的网络结果很深,不是一层可以做到,需要多层。后来研究人员不断提升这样的模型。这个概念很早就提出来了,1985年这个理论就已经趋于成熟。它是反向传播,机器怎么进行训练这个已经有了。有了这个机器之后有一个问题,计算量太大,做不到。当时十几个结点的时候,机器已经不够用了,但是现在最大的不是理论体系变化,而是计算力的提升。这也告诉大家,从人工智能到理论深度学习的做法,包括之前的这些机器的理解能力已经慢慢成熟。今天我们用的方法没有超过当年理论的框架和计算模式。这不是一个新东西。

  发生了什么变化呢?其实变化在两件事情,一件事情是计算力的极大提升。Alpha Go的机器计算力是深蓝的2。5万倍。第二个是我们采集了大量的数据,数据采集比较困难,现在有大数据之后,数据有多大?其实下围棋没有多大,用了30万台曾经下过围棋的用来做训练。没有互联网不敢想。有了互联网之后,国外下围棋的网站上已经有对应的数据,30万台,每一台大概100步的样子,所以一共3000万步棋做了训练。我们怎么把这个理论用来下围棋,这是Google的创新。第一件事情cnn网络(音),用点看图的方法来下棋,以前说棋子是逻辑分析,而不是网络。现在就像看照片一样看棋盘,因此机器有了棋感。最近五年有一个最大的提升是人脸识别,之前是完全不知道怎么样的事情,识别眉毛吗?识别眼睛吗?在座可能有写程序的,你想一下用什么规则去描述人的脸,但是今天我们用CNN图像的感觉做到了。所以Google的第一个创新是用CNN网络对机器进行描述,使得机器有了体感。第二个是把跟深蓝相关的搜索作为理性的方式,跟CNN的感性进行结合,这是第二件创新。

  第三件事情是用的强大的学习,让机器跟自己下,当机器变得聪明之后自己可以跟自己下,因此在这里面提升。这里面并没有带来理论界的突破,但是在创新应用里面做了很大的贡献。所以Alpha Go的胜利背后融合了工程师的重新能力在。这件事情真正重要的在于什么地方?不是在于技术本身,而是所有人在关心我们自己的定位。我把这一周的活动比拟成原来几十年文艺复兴的结果。这样一个星期过去,我恍如隔世。大家知道一个星期机器是什么理解和态度,一个星期之后有了很大的变化。我们人和人的关系,包括我们看《圣经》,人和人平等了,距离拉近了。

  现在我们怎么看这台机器?比赛之前大家认为机器比较笨,什么干不了,比赛之后有两个重要变化:第一个是我们对机器的能力有了更高的评价,机器可以战胜人了。之前说我们看病的时候,你拍一个片子,机器告诉你做诊断没有什么病,我们难以接受,很不相信。现在机器告诉你一个什么结果,我们可能觉得比人还要准。但是能想到这个变化吗?我们机器因为这一个事件之后,对能力有一个巨大的认可。这使得我们更多的工程师、更多的创业公司、更多的资本会投向人工智能。我开玩笑讲A股人工智能概念可能延续了好几个涨停板,我们看到了人工智能的信仰。但是很巧的是Alpha Go不是五局都胜利的,输了一局,但是大家还是转不过劲儿来。它代表了整个围棋界的共同的胜利,就是机器变成另外的门派,我们还是有自己的尊严。

  想到二十年前的电影《独立日》,当时人类飞行员面临太空船的时候,把飞船开进去把太空船破坏掉,所以面对机器我们还有尊严。更多人,我们很多年轻人开始乘Alpha Go叫狗狗。我们想到年轻人90后或者00后会觉得机器人成为朋友,还有人叫阿老师的。其实机器并没有到不可战胜的时候,第一是要相信它,第二要接受它。拒绝它很难,我们要接受它。这是我们整理人机大战的关键,到底我们怎么用、怎么跟它交朋友,后面会提到,所以这场启蒙运动很重要。

  技术的进步有三个层次,不管是从软件硬件。这三个层次是什么呢?传统最早的是智能,其实是把规则交给机器。举个例子,我们做一个电饭锅、智能冰箱,它来干嘛呢?我们程序员要写程序,当温度到103度的时候我就跳闸。实际上我们可以把足够复杂的东西交给机器,把人类的智慧交给机器。很不幸的时候,老师讲学生如果把规则给他,他的能力会下降,所以这时候机器比人落后,智力少于人。还有一种情况,我们自己都不知道规则是什么,我们是用感觉。就像刚才讲的人脸识别,这是一个非常经典的问题。每个人都觉得很简单,可能脸盲吃力一点,但是大部分没有问题,不像大家学外语这么难,只是可能记忆力不好,识别没有问题。

  当把这个问题给机器的时候,我们遇到了障碍,几十年里面在图像识别方面我们举步维艰,国外就有做过把这种数据分大类,每年进展非常缓慢,搞图像的人基本上找不到工作,因为不实用。很长时间里面人工智能跟理论是脱节的。我们前几年跟清华做人工智能的院士聊,说人工智能但凡跟实践结合就拉低水平,因为连接不上,但是现在不是,现在连接到一块了,为什么呢?因为我们到了第二个阶段,我们开始不用跟机器讲规则。深度学习的美妙之处是我们把问题和答案对应的交给机器,告诉他这是张三的脸,那个脸是李四的,不用告诉机器为什么他是张三或者李四。机器通过大量的数据训练就能够学会。就像我们教小孩一样,通过这些方法一步一步的展开,而在这里我们一并给到机器,图像和声音领域已经非常好了。

  去年开始图像人脸识别机器超过了人,准确率超过了人一倍。我们可以告诉机器答案,机器可以自己学习。这还不够,甚至有一些问题我们连答案还不够。我们说学围棋有3000万步答案,机器就学会了下棋的基本规则,把6段到9段的方法告诉它,它达到了6段水平。后来Google让两个机器随机下,下完之后不告诉你赢了还是输了,机器通过自己优化算法找到更好的答案。第二件事情是把答案给机器,第三个是告诉你机器给你一个答案,我评价答案是好或者不好。这是三个层次的进度。特别是第三件事情,像Google团队或者微软顶级的人里面,甚至可能有宗教色彩,当我们给机器一个目标,机器是否自己学会找规则和答案。我只给他目标,而不是告诉他怎么做,这是演进中很重要的一步。

  我看到一个文献,他们想重新训练一台Alpha Go的机器,一开始不是让它学习人怎么下的,一开始是两张白纸的Alpha Go,自己跟自己下,只告诉它目标是赢棋、输棋,看能不能训练出新的棋手。我觉得这件事情很有意义。一个人在中原学会了所有武功,把它融汇贯通,然后再进行提高。另外一个人从来没有来过地球和中原,来学武功,你说它的武功跟人一样吗?这是人类好奇的,看重新会长出什么智慧来。这是三个层次做的事情。基于刚才三个层次,我们来想,什么样的职业、什么样的人本身的工作更容易被取代?我们可以看作是机会,也可以看作对自身的挑战。

  容易取代的有两点,第一是你的工作和环境封闭。意味着做决策的时候,决策来源的信息是封闭的、有限的甚至是结构化的。比如说下围棋这件事情决策很封闭,只需要知道期盼上的规定就可以下决定。医生会难很多,医生会知道病人的病史和病人当前的状态;但是作为一个老师可能会面临更复杂的环境,做决策的时候信息来源可能足够开放,你的答案越标准越容易被机器取代。第二件事情定的是目标,第一件事情是你处理的信息的开放性或者封闭性。从这一点我们知道,有的决策信息需要少的机器就容易做,信息需要的做机器也能做。我们做好一个翻译或者一个作家,需要很多生活阅历,作家就是读万卷书、行万里路的做法。如此开放的环境对机器就是很大的挑战。反过来,如果这个开放答案跟你有关,机器就容易做到。这就是机器是否能做好、人是否会取代的一个标准。回到人是否会被取代的问题。

  人是什么概念?人的目标是为了自己的生存或者繁衍。机器更简单,我做诊断,下一个棋,或者做一个语言识别。人已经到了很大的扩展空间,我们的机器只是在局限的空间去工作,主要看机器的训练空间多大。如果算法再好也不能脱离目标和机器适应的范围。所以今天的技术还远不到这一步。第二是我们不会去造一台机器给它设定一个目标怎么生存,也不会说适应环境有特别大的空间。我们即便有能力,也没有动力去制造一个能取代人的机器,我们不认为机器自己会演化出一种生存能力来。反过来,如果有野心勃勃的科学家要做一件事情,说要创造一个智能机器,这个机器有生存的概念,可以面对整个地球环境。其实我们不是在做人工智能,我们其实是在创造一种生命。

  所以这个概念大家想清楚,如果你朝着创造生命的态度去做,机器可能有一种生命意识,知道自己的存在。反过来,今天我们的做法大可以放心,我们做这些事情目标足够的简单,比如说Alpha Go机器,把棋盘从19×19变成20×20,人类可以理解和学习,但是环境变了,Alpha Go变得什么都不会了。另外一个问题是想象力,区别于人和动物的。有一本书叫《人类简史》,这种历史发展是相关的,这也是一个路径,这是我认为人不会被取代的核心的两个判断标准。人工智能和人是怎样的关系呢?有技术我们可能变得更强大了,但是也有可能技术让我们变得更弱了。在座很多人戴眼镜,眼镜是一种技术,当用了眼镜之后我们视力变得更好、更强大,但是离开眼镜我们更弱。我们要抛离技术之后看自己孤立的行不行,放下手机、pad、汽车交通工具是不是变强了?我们发现是变弱了。

  我们由于机器变得弱化,我们掌握了能源之后体力被取代了,今天的种植也被机器取代了。以后目标清晰之后,环境相对封闭,机器能做的时候我们可以交给它,我们可以利用Google做搜索引擎,通过手机变成千里眼、顺风耳,这是一个趋势。未来穿戴设备可能会变成植入,像Google眼镜,很多人眼睛不近视也会有很多人尝试,包括还有年轻的女孩子会整容,这些东西会带来新的植入。从这一点我认为人工智能与人融合会带来新的物种,你不用害怕,你问一个猴子你会变成人吗?通过我们对人工智能的理解和对技术的理解,技术可以带来与人的融合,可以把人的能力提升了,也可能把人的能力降低了,这是我们未来的进化。

  今天给大家分享到这里,谢谢!

个人简介
王小川,搜狗公司首席执行官,搜狐首席技术官,全面负责搜狗公司的战略规划和运营管理。还在清华大学就读期间,王小川就加入了当时中国最大的校园交友网站ChinaRen,并领衔开发了国内首家基于搜索引擎技术的开放式目录推广平台…
每日关注 更多
王小川 的日志归档
[查看更多]
赞助商广告