web 3.0

Web 3.0

贡献者   雷士军

Web 3.0一词包含多层含义,用来概括互联网发展过程中可能出现的各种不同的方向和特征,包括将互联网本身转化为一个泛型数据库;跨浏览器、超浏览器的内容投递和请求机制;人工智能技术的运用;语义网;地理映射网;运用3D技术搭建的网站甚至虚拟世界或网络公国等。

 

Web 3.0的定义

Web 3.0是针对Web 2.0提出的,较有名的首次提及是在2006年初Jeffrey Zeldman的博客中一篇批评Web 2.0的文章中。

(图)Web 3.0Web 3.0

2006年5月,蒂姆·伯纳斯-李曾说:

“ 人们不停地质问Web 3.0到底是什么。我认为当可缩放矢量图形在Web 2.0的基础上大面积使用——所有东西都起波纹、被折叠并且看起来没有棱角——以及一整张语义网涵盖著大量的数据,你就可以访问这难以置信的数据资源。 ”
—Tim Berners-Lee, A 'more revolutionary' Web

2006年11月的Technet峰会上,Yahoo创办人兼首席执行官杨致远作出阐述[3]:

“ 目前对Web 2.0的归档和讨论很多。借助网路级别所能达到的效能,网络的力量已经到达了一个临界点。我们同时也看到最近4年出现了更富级的设备以及更富级的与网路互动的方法,不仅仅体现在游戏机和移动设备这样的硬件,同时也体现在软件层面。你不一定得是电脑科学家才能创作出一个程序。这种现象在Web 2.0里初现端倪,而3.0将更加深化,是一个真正的公共载体……专业,半专业和消费者的界限越来越模糊,创造出一种商业和应用程序的网络效应。 ”
—杨致远

在这个峰会上,Netflix创始人Reed Hastings阐述了定义Web术语的简单公式:

“ Web 1.0是拨号上网,50K平均带宽,Web 2.0是1M平均带宽那Web 3.0就该是10M带宽,全视频的网络,这才感觉像Web 3.0。 ”
—Reed Hastings

2007年8月7日,谷歌首席执行官Eric Schmidt出席首尔数字论坛时被与会者问及Web 3.0的定义, Eric Schmidt首先开玩笑的地说“Web 2.0只是一个行销术语,而你刚才正好发明了Web 3.0这个行销术语。”随后他谈及了自己的具体看法[4]:

“ ……(Web 3.0)创建应用程序的方法将不同。到目前为止Web 2.0一词的出现主要是回应某种叫做“AJAX”的概念……而对Web 3.0我的预测将是拼凑在一起的应用程序,带有一些主要特征:应用程序相对较小、数据处于Cloud中、应用程序可以在任何设备上运行(PC或者移动电话)、应用程序的速度非常快并能进行很多自定义、此外应用程序像病毒一样地扩散(社交网络,电子邮件等)。 ”

(图)Web 3.0Web 3.0


—Eric Schmidt
自2006年底以来,Web 3.0一词正受到越来越多的关注,也是越来越多争论的焦点,这个现象正持续到2007。

谷歌CEO埃里克·施密特的定义是:Web 3.0是一系列组合的应用(Applications that are pieced together)。

通常的定义是:网站内的信息可以直接和其他网站相关信息进行交互,能通过第三方信息平台同时对多家网站的信息进行整合使用;用户在互联网上拥有自己的数据,并能在不同网站上使用;完全基于web,用浏览器即可实现复杂系统程序才能实现的系统功能。

中国互联网协会新媒体专家郭涛的定义是:WEB 3.0是基于用户需求的职能过滤器和多元化需求满足平台。 

网络资源从Web 1.0的集中到Web 2.0分散,未来的Web 3.0又回到更加精准的集中。过去Web 1.0解决了信息孤岛的联结问题,Web 2.0解决了网络发言权的解放问题,Web 3.0的目的就是解决海量信息在细化后的定向搜索与获利机制问题。
Web 1.0 是精英文化,开创了聚众时代;2.0是草根文化,开创了分众时代;而3.0是个性文化,开创一个全新的个性时代。

还有的定义是:Web 3.0是以主动性、最大程度的数字化、多维化等为特征、以服务为内容的第三代互联网系统。

还有的观点有:Web 3.0将借助开放的API使Web成为一个操作系统。

关于Web 3.0的争论

关于如何定义Web 3.0,及其所代表的含义的争论非常激烈,观点也琳琅满目。

将网际网路转化为数据库
迈向Web 3.0的第一步是“网际网路”这一概念的体现,结构化数据集以可重复利用、可远程查询的格式公布于网路上,比如XML,RDF和微格式。最近SPARQL的发展为网络上以RDF方式配发的数据库提供了一套标准化的查询语言和应用程序接口。数据网络让数据契合和应用程序互用性更上新台阶,使数据像网页一样容易访问和链接。在数据网络时代,重点主要是如何以RDF的方式提供结构化的数据。全语义网时期会拓宽语义范围,这样结构化,半结构化甚至零散的数据内容(比如传统的网页、文档等)都能以RDF和OWL语义格式的形式普遍存在。[5]

向人工智能进化的道路
Web 3.0也被用来描述一条最终通向人工智能的网络进化的道路,这个人工智能最终能以类似人类的方式思辩网络。一些人对此表示悲观,认为这是不可企及的设想。然而,像IBM和Google这样的大公司已经在使用一些正提供惊人的信息的新技术,例如通过挖取学校音乐网站的数据来预测未来的热门单曲。同时也有人提出是否智能系统将是Web 3.0背后的推动力,抑或智能会以人的形式出现,即某体系的人们(例如del.icio.us这样的协同过滤服务,Flickr和Digg这样人工抽取网络资源)以及他们之间如何互动。[5]

语义网和SOA的实现
和人工智能的方向有关联,Web 3.0可以是语义网概念的实现和扩充。各学院正在研究开发一种基于描述逻辑和智能代理的推理软件,这样的软件通过运用表述网络上概念和数据之间的关系的规则来进行逻辑推理操作。[6]

Sramana Mitra对语义网成为次世代互联网基本要素的看法不同,并提出了一道封装Web 3.0的公式[7]

Web 3.0也被认为和服务导向结构及语义网的具体体现有关。[8]

(图)Web 3.0Web 3.0

向3D进化
另一条可能的道路是Web3D联盟拥护的3D化构想,包括将整个网络转化为一系列3D空间,采用第二人生启发的概念。[9]同时也提供新的方式在3D共享空间连接和协同。[10]

所建议的一些延伸性定义
Nova Spivack建议将Web 3.0的定义延伸至当前各大技术潮流迈向新的成熟阶段的具体体现,包括:

无处不联网,宽带网普及和发展,移动通信设备的互联网介入。
网络计算,“软件就是服务”的商业模型,Web服务互用性,分布式计算,网格计算和效用计算(又“云雾计算”)。
开放技术,开放API和协议,开放数据格式,开源软件平台和开放数据(如创作共用,开放数据许可)。
开放身份,OpenID,开放名声,跨域身份和个人数据。
智能网络,语义网技术比如资源描述框架,网络本体语言,SWRL,SPARQL,语义应用程序平台和基于声明的数据储备。
分布式数据库,万维数据库(“World Wide Database”,由语义网的技术实现)。
智能应用程序,普通语言的处理。[11],机器学习,机器推理,自主代理。[12]

针对Web 2.0的扩展和革新
Web 2.0以AJAX概念为契机,提供了高仿桌面应用程序的网络应用程序,激励用户生成内容和搭建具有向心力的社区,并以高耦合的技术形成轻快有效的商业模型。在此基础上,Web 3.0被认为肩负著发扬2.0的精神,并冲破目前Web 2.0所面临的障碍。因此通过对目前Web 2.0所面临的瓶颈和具体实例进行分析,可以对Web 3.0作一些展望。

带宽
用户所在区域的网络的带宽均值,将直接影响到网站内容的投放和索取,是制约丰富互联网应用程序发展的一大瓶颈。

应用程序的速度
虽然许多网站使用异步JavaScript和XML/JSON以及各种UI Widgets来实现仿桌面应用程序的网络应用程序,但这些前台程序的速度都无法与传统桌面程序媲美,为了实现桌面程序界面的一些常见功能(如拖拽、排序、缩放等),必须使用复杂的JavaScript,这样容易造成许多用户的浏览器响应延时甚至假死,进一步降低用户体验。

应用程序开发的草根化,社区协同化
目前网络应用程序的开发门槛仍然较高,并且较为封闭,这样虽然可以满足开发一般的以用户生成内容(“User-generated content”)为主导的应用程序,却制约了用户生成程序(“User-generated application”)的发展空间。在向用户生成程序过度的期间,值得注意的应用程序、技术和概念有:

Mash-up,更人性化的Mash up如Microsoft Popfly
项目协同,Basecamp,Bugzilla,Project.net,维基
API,Google Earth,facebook API

2009年有点特别,是Web3.0吗?

这周我在新西兰当地的活动Webstock Mini上做了一个简短的发言,在台上的展示中,我对今年的网络技术趋势比较关注。演示幻灯片已经嵌在下面了。我对“Web3.0"这个名词作了一点小小的讽刺。不过我演讲的主题还是我们在2009年看到产品与之前在”Web2.0"大行其道的时候(05年到08年)看到的产品的确有所不同。

在2009年,我们看到越来越多的产品是基于开放,结构化的数据,比如Wolfram Alpha知识搜索引擎。我们也看到应用更加实时化,像Twitter, OneRiot。而且我也看到过滤机制越来越完善,像FriendFeed和Facebook(不过,我认为Facebook在创意上是抄袭FriendFeed的)

下面求是对我们在2009年看到的趋势的一个简要概括

开放数据
结构化的数据->更加智能
过滤内容
实时化
个性化
手机(基于地理位置信息,你也可说这是对数据一种智能化的使用)
真实网络(以现实世界为对象的网络)
我指出,谷歌上周宣布的搜索百宝箱(Search Option)和富摘要(Rich Snippets)就是反应了上面这些趋势的一个最新例子。

因为演讲相对较短,我们没有对2009年的趋势做更深入的讨论。因此我们非常欢迎读者加入讨论。你可以在下面留言中些下你对这些趋势的看法——以及你对此有什么要补充的。你也可以告诉我们今年你看到有哪些产品很新,而且风格不那么“Web2.0”。

这周晚些时候我会发布一个更新贴,希望在读者的帮助下对目前的趋势有一个更加全面的看法。

如果想要了解上面这些趋势的更多信息,你可以看看读写网最近发布的这些文章

网络新时代:Web3.0、关联数据和语义网(中文link)
怒放的关联数据:你为什么应该关注?(中文link )
即时网络入门(中文link)
实时网络的三个价值模型(link)
Gmail之父称实时对话才代表FriendFeed未来的方向(中文link)

上周我们讨论了2009年网络趋势《2009年有点特别,是Web3.0吗?》,我们谈到了开放数据、结构化数据、内容过滤应用、即时产品、个性化、移动产品(尤其是基于位置的产品),联网物品(Internet of Things)。本文将对上次的读者反馈进行总结。

还有什么?
除了我们列举的趋势,读者还发现了哪些新趋势呢?

Babak Samii指出2009年越来越多的“真实、明确的业务模式开始带来收入”。MacStories表示同意,并称我们将看到更多盈利模式。

Aaron Fulkerson(来自 Mindtouch )评论说面向网络的结构(Web Oriented Architectures)正在重新定义公司的投资回报率(ROI)和总体拥有成本(TCO)。他说的没错,越来越多公司开始重视互联网的商业应用了。Google企业应用套件的流行就是一个很好的例子。

Willi评论说当前互联网呈现一种“新型轻量化趋势” 。他认为“出现了一种新的粒度、原子性和化学物”。他指出人们可以在Twitter上在用户、hashtag、即时对话之间进行切换。他还列举了 Evernote和Mir:ror,这些产品看上去有些琐碎,但是可以衍生出新的用法,给用户带来新的价值。

开放数据……只是无法输出
有人不同意我们之前列举的趋势。读写网读者William认为‘开发数据’是个噱头,因为用户无法从Facebook、Twitter、MySpace等网站中导出自己的数据。但在未来这样的事情可能性很大。

‘开放数据’的另一个含义是对开发人员开放,在其基础之上开发新产品。Twitter就是一个很好的例子。Jason Barone称这是一种“通过API的形式,流向他们的封闭系统的单向信息流。”这和以前比是一种进步。所以总的来说,API,甚至关联数据会催生更多关联网络产品。这会带来一个更加丰富多彩的网络产品生态系统和社交网络,这是一件好事。

尽管William和Jason说得不错,但现在的用户有一半脑子里有‘开放数据’的概念就不错了。只有我们拥有数据便携性时,数据才会真正开放。

现实生活中的即时网络
目前为止,人们对即时网络的关注大多集中在Twitter和Friendfeed,但是Andria Krewson指出即时网络的影响范围将不仅仅是早期用户。

即时网络很伟大。很多公司都是建立在定时数据转存(data dumps)上的,时机会对工作流程和现金流产生影响。但是网不离身一代将迫使公司提供及时在线信息。”

但是速度更快并不意味着比Twitter或Friendfeed更好。时间将验证一切。

结论
我们的结论是没有结论,因为互联网在不断演变。我们希望开放数据越来越流行;我们很高兴看到即时网络在今年带来的影响;移动网和联网物品也让我们激动不已。

如果您发现更多趋势,请在评论中列出。

这是最原始的五分钟幻灯片视频:

Web 3.0: How’s That Panning Out Then…(编译:pestwave)

Web 2.0 到 web 4.0 :未来的语义网络和网络操作系统(WebOS)

Radar Networks 公司的 Nova Spivack 绘制了一份未来 25 年的网络进化图。 Nova 没有明确指出 Web 4.0 具体的来临日期和所需技术,但每个阶段的发展以 10 年为期限是真实而可信的。同时,我们也不必拘泥于命名的规则 – 1.0、2.0 等等。互联网下一次显著进化将使其成为一个包含语义网络的平台,这一理念是合情合理的。

Nova 的公司正在秘密进行一项研究,他将其描述为“基于 Java 的框架,可提供与 Ruby on Rails 类似的语义网络应用程序和服务,同时包含一些其他技术,如用于语义数据列表的高速及可扩展的存储层,强大的语义查询功能,以及用于分析数据和为用户提供智能服务的一系列算法。”Radar Networks 公司在今年年末提供的服务“将推动和丰富更为智能的在线互动、社团、内容、合作以及商务活动,”他在最近的一篇博客中指出。此外,另一个秘密成立的 MetaWeb 公司也在进行有关语义网络的研究工作。

正如在 Web 1.0 的早期,很少人能够预测 Web 2.0 如何来临,同样 Web 3.0 的概念也是模糊不清的,甚至Nova 进化图中的 WebOS 仍未定义。网络操作系统(WebOS)意味着机器智能到达某个程度,其中互联网成为一个全球计算机,一个具有高度智能互动的大型网络。

Ray Kurzweil 预测到 2029 年,WebOS 将与人类的大脑相匹敌: 
到 2029 年,将有足够的运算能力,能够模拟人脑,预测其运算速度为每秒钟 1016(一亿亿)次运算,其成本大约为 1 美元。那时,智能机器能够将人类所擅长的微妙而灵巧的技能(主要指人类所具有的模式识别能力)与机器出众的运行方式相结合,如正确存储上万亿的数据,快速搜索大型数据库,以及下载技能和知识。
   
但这并不是智能机器人的外星入侵,而是人类文明的展现,正如使用科学技术扩展我们的身体和智力极限。通过毛细血管将智能纳米机器人(血细胞大小的电子机器人)发送至人类大脑中,并与生物神经元进行密切互动,从而可以使人类吸收溶合这种技能。如果您认为这种场面充满了科幻色彩,那我可以告诉你人类已经使用血细胞大小的设备对动物进行高级诊断治疗,如治疗 I 型糖尿病以及识别并消灭癌细胞。

我无法预知 Kurzweil 有关未来网络的观点是否正确,但网络/互联网正逐渐变得更加智能,更加接近于人类的大脑以及孕育它的协作智能。

译者注:

1. Nova Spivack 是一位企业家、语义网络的倡导者、科技预言家,还有管理达人彼得 德鲁克(Peter Drucker)是他爷爷啊。Nova 这名字莫非是传说中的网络 ID?!

2. Ray Kurzweil 是发明家和未来主义者(futurist),还是光学字符识别(OCR)技术、文本语音合成和语音识别方面的先驱。因发明供盲人使用 Kurzweil 阅读器和歌手 Stevie Wonder 成为好友。另外,此人对长生不老的科学技术比较狂热。(翻译:tsaizb )

时下的Web 3.0无聊的博客风暴

Tim O'Reilly
10.04.07

如果说Web 2.0火爆异常那么Web 3.0又如何?对于那些有抱负有想法的工程师们这已经变成一个周期性的主题了,他们总是希望把自己的创业当做下一次大潮。Nova Spivack开始把不为所知的Radar Networks 描述成Web 3.0, 但是现在 Jason Calacanis又提出自己的定义,并作了巧妙的修改以此来对应他自己的mahalo.com。结果大量的嘲讽如期而至。

现在,反而是我本人很犹豫是断言:“Web 3.0是个愚蠢的想法。”因为Web2.0过去遭受过同样的批评。然而我还是看到两个重要的不同:

Web2.0起源于一个会议的名字。而且这个名字有很明确的目的:指明Web大潮继dot com泡沫破裂之后又滚滚而来!2.0并不是指技术,而是指业界针对Web的兴趣的复苏。2003年当我们提出这个想法的时候很多程序员没有工作,大家对Web应用普遍缺乏兴趣。当时我们看到了春潮涌动,并设计了会议来告诉大家这一次和以前不同了。
那个时候我着实花了一些时间尝试分辨出这些公司的特点,包括从网络泡沫破裂中存活下来的公司,最突出的新公司以及我能看到的新涌现出来的网站。那篇文章—— What is Web 2.0?——是一篇回顾性的描述,建立在非常广泛的对成功公司分析的基础之上,而不是仅仅瞄准一个还没做出什么的公司或项目所作的量体裁衣似的命题作文。
所以对于创业者,我想说如果想赋予Web3.0真正一些意义我们需要看到一些针对上一代技术真正的超越。他们可能又是泡沫、复苏或者类似的什么,但应该有一些本质的不同的东西。我喜欢Stowe Boyd对这一问题的思考:

“就我个人来讲的确感受到某些超越Web2.0的东西,它们是真正的进步。想象一下没有浏览器的Web,打破文档的概念,或者真正的应用和信息的混合。那才是Web3.0应该是的样子,但我打赌我们该称它其他什么。”

我同意Stowe的观点。绝对有一些新事物在蓄势待发,但我敢打赌应该称它们其他什么而不是Web3.0。而且很有可能它会比Web更广阔、更普遍深入,因为激光技术、传感器、语音识别和很多其他新技术把计算机技术变得比今天更深入我们的生活。

但是任何变迁中下一个要把握的潮流都是建立在广泛基础上的,有很多经过考验的点,每一点都展现了飞跃的一方面。任何说他创业的公司就代表了下一次革命的人都是过早的。

我发现我最恼火的是那些用web 2.0的定义来定义Web3.0的做法(像一些集体智慧应用的新形式),他们通过坚持Web2.0就是一些Ajax、Mashup等一些客户端技术来标榜自己已经做到一些突破。比如,看一下Nova Spivack今天回应Jason的文章:

“Web3.0我认为在Web的第三个十年(2010-2020)时才能给出最好的定义,这期间几个关键的技术会得到广泛的应用。他们中最主要的会是RDF和正出现的语义Web技术。尽管Web3.0不是语义Web的同义词(那期间会有几次其他重要的技术更迭),他仍然会被语义学极大地影响。

在我们把重点放在前端(Web2.0主要是像Ajax、标签等一些前端用户体验的更新。)的十年之后,Web3.0应该是一个我们更新Web后端的时代。”

我有些同情Nova为了尝试挽救他的Web3.0概念把它绑在一个时间表上而不是某个特定的技术(Win95什么的),但是我发现说Web2.0是一个关于前端技术的说法是如此可笑以至于让整个想法蒙羞。Google是一个杰出的Web2.0成功例子,它是后端的。每一个主流Web2.0厂商都是后端的。他们都是在构建能驾驭网络效应以此来增强人们的体验的应用工具——而且你只能通过强大的后端做到这一点。Nova说语义Web会在一些网站中越来越多这是对的,但我不认为这一点是一定的。(翻译:sniffer)

Web 3.0: 当web网站成为web服务

       今天的web蕴藏着大量的对人类有用的信息,但却隐藏在计算机之后。矛盾在于信息是以一种神秘的机器难以处理的格式隐藏在HTML页面中. 所谓的”web3.0”就是指Web网站正向Web服务发展, 它们将有效地把信息暴露给世界.
       这种转变将以两种方式进行,一些站点学习amazon, del.icio.us 和Flickr, 通过REST API的方式提供他们的信息. 另一些网站将试图保持信息的私有性, 但这些信息会通过汇聚(mashups)的方式公开, 汇聚可以通过Dapper, Teqlo和Yahoo!Pipes等生成. 非结构化信息将给结构化信息让路, 使得智能计算的道路更加平坦. 本文将讲述这些重要的转变是怎样发生的以及它们怎样改变互联网.

亚马逊电子商务API-打开访问亚马逊商品目录的大门

       我们已经在这里 写了亚马逊的WebOS战略,这个西雅图的Web巨人通过一套强大的API把自身的网站构架暴露于众。首先开放的服务是电子商务服务,该服务开放了亚马逊产品目录主要产品的访问,该API相当强大,允许处理用户,收藏列表和购物车,当然最关键的是可以查看亚马逊的产品。

       亚马逊为什么以完全免费的方式提供这项服务呢?因为几乎所有购建在这项服务之上的应用都为亚马逊带来了流量(该服务返回给应用程序的产品中含有亚马逊的链接)。换句话说,通过提供电子商务服务,亚马逊使别人能够访问亚马逊的库存。结果是很多公司想出了利用亚马逊信息的好方法。你可以在这里看到这些成功的案例.

       API文化升温

       Del.icio.us也是最早开放其API 的Web2.0网站,很多Web服务紧随其后,使得API文化逐渐升温,John Musser在ProgrammableWeb上不辞辛劳地将这些API和汇聚分类整理,这个页面分门别类地给出了将近400个API。这些对理解本文很有帮助。

       当前的Del.icio.us API 与亚马逊的不同,因为它没有开放del.icio.us的数据库,它做的只是允许授权的汇聚应用去加工存储在del.icio.us的信息。比如,应用程序可以通过编程添加一个帖子,或更新一个tag,但你不能通过API去知道你这个帖子发到了哪个链接,或者整个数据库中哪些内容被打上了这个tag,这些问题通过网站很容易回答,但却不能通过当前的API来得到答案。

 标准化的URL-没有API的API

尽管没有直接的API(深入数据库), 很多公司还是可以利用存储在del.icio.us中的信息。这里有一些例子。

Delexa是一个有趣而且有用的汇聚站点, 它可以用del.icio.us去对Alexa站点进行归类,例如,这里是以book标签的著名站点。

另一个站点叫similicio.us, 使用del.icio.us去推荐类似站点,例如这里是它认为和Read/WriteWeb相似的站点。

怎样在没有API的情况下实现这些服务呢?答案就是它们可以利用标准URL和一种叫做Web抓取(Web scraping)的技术.  让我们来看看它是怎么工作的. 比如, 所有被标签为book的链接可以在链接http://del.icio.us/tag/book 下找到, 而标签为movie的则在http://del.icio.us/tag/movie 下, 等等, 链接的结构总是一样的: http://del.icio.us/tag[TAG] . 因此, 给定任意标签, 程序都可以获得被该标签标记的站点列表, 然后通过页面抓取技术抓取需要的信息.

页面抓取程序怎样工作

页面抓取本质上是HTML页面的反向工程,也可以看成页面解释器,网页以HTML编码,HTML以树型结构表示信息,实际数据与布局代码以及效果信息混杂在一起,不能被计算机直接利用。抓取器程序“知道”怎样从给定HTML页面中抓取数据。它们通过分析网页特定的标注方式找到实际数据,例如,下图给出了抓取器怎么抓取del.icio.us的页面的示意图。我们可以找到被任意标签标记的链接。

Dapper, Teqlo, Yahoo! Pipes---即将来临的的抓取技术

       我们最近谈到Yahoo!Pipes, 一个专注于RSS融合的应用,另一个相似的技术是,刚刚上线的Teqlo, 它可以让人们从Web服务和RSS中创建汇聚。在它们之前,Dapper提供了一个通用的抓取器,可以抓取任意网站。Dapper是一项有趣的技术,它通过可视界面为抓取网页提供便捷。

       它是这样工作的,让开发者定义一些示例页面,然后帮助她用标记表示相似信息。这看起来很简单,但现象的背后是Dapper使用一种不平常的树匹配的算法去完成该任务。一旦用户在页面上定义了相似信息,Dapper允许用户将其转为一个字段,对页面其他信息重复该过程,开发这就可以有效的定义一个查询语句将一个非结构化的页面转为一些结构化的记录。

 作用—Web网站变Web服务

       这里图示了一些网络应用像Dapper和Teqlo的作用。

     
       结合开放API(如亚马逊的电子商务服务)和抓取/汇聚技术,我们可以将任何网站看作一个开放了信息的web服务。信息,更准确地说数据,变得开放。接踵而来的是,软件可以借此获取大量数据。有了它,互联网才真正称得上是一个可以查询和重新组合的数据库。

 这听起来很不错,但是否合法呢?

       抓取技术事实上备受争议。某种意义上来说,它们可以被认为是偷取了属于其它网站的信息。整个问题很复杂,因为你不清楚拷贝/粘贴什么时候结束,抓取什么时候开始。人们拷贝保存网页信息是没有问题的,但用软件来做这个可能不是合法的。但抓取网页然后提供利用网页信息的服务,并且没有说明出处,可能就是非法的了。

       但抓取似乎并不会停止,就像Napster的法律纠纷没有让人们停止写点对点共享软件,更近的YouTube法律纠纷不会使人们停止上传版权视频,看似免费的信息也会被人们理所当然的当成免费的。

       互联网如果变成数据库,巨大机遇将让人们兴奋不已,如果这一转变真地会实现呢,我们是否应该反思一下怎样去顺应这一趋势呢?

为什么网站应该提供Web服务

       这里有几个好的理由(特别对在线零售商),最重要的理由是控制,有了API,抓取器就变得没必要了,它还可以跟踪谁在使用数据以及怎样和为什么使用,像亚马逊,网站通过这样做去培育会员和增加流量。

       陈旧的观点认为封闭的数据是竞争优势,新的观点则认为开放数据才是竞争优势。可行的解决方案是不必提心吊胆的去保护信息,而是提供API,然后收取一定费用。对每次API调用收取少量费用(想想亚马逊)是可以接受的,因为该费用对每个使用者都不会很高。但却有机会在总体上盈利。这就是亚马逊在web服务战略上下的赌,这也许是个不错的赌。

结论

       随着越来越多的网站可别其他网站混合利用,整个系统变成平台兼数据库。当然,这种转变并不顺利,可扩展性是一个大问题,法律问题也不那么简单。

       但问题不在于网站是否会变成Web服务,而在于什么时候和怎样转变.API是一个更容易控制,干净的被大家接受的方式。尽管如此,当没有API或者API不够强大时,抓取是一种解决问题的方式。像往常一样,时间是最好的裁判;同时,我们希望从你的反馈和故事中知道你是怎么面对web3.0的。(翻译:zhoucheng )

Web 3.0悬念

  Facebook和Twitter们还没有找到赢利模式,但阵地已经稳固。你需要关注互联网的下一步了

  《环球企业家》 罗燕

  除却那些可爱的机器人们,你一定还记得2008年大热的动画片《Wall-E》为人类勾画的未来—其实它在科幻小说中常常出现:电脑完全智能化,它能识别你的语音,理解你的行动,所有活动都在电脑的操纵之下,而人类无所事事。

  自从计算机诞生之后,这样的梦幻场景便屡屡出现。与其说是害怕机器操控时代的来临,不如说人们更多是怀着对未来的憧憬和期待,在梦想的照射下一点一滴地改善着身边这个还远非强大的网络。

  但不得不承认,从诞生到现在,互联网的变化的确可以用日新月异来形容。1969年还只能将分处各地的四台主要计算机连接起来的网络,如今已经覆盖了全世界超过14亿人口。同时,日益加快的运行速度以及内容、辐射能力的广阔性都一再改写着摩尔定律的翻新规律。

  也许正像去年9月Google创立10年之际,其首席互联网顾问,也是互联网开创者之一的维特·瑟夫所描绘的10年后的美妙场景一样:彼时,约70%的人口将通过固定及移动网络上网,速度将达到吉兆/秒。移动设备将成为主要的上网工具,很多东西都要与网络相连。比如我们可通过网络跟踪和管理电力需求,远程操控具有网络功能的家电。

  其实,你若细心便能发现近来Google的一个变化:如果在搜索栏中键入“比尔·克林顿的老婆是谁”,第一个条目的标题便是:希拉里·克林顿。但点击它,你会发现网页上并没有现成的答案。这就意味着,虽然我们尚未进入可自动解读问题的语义网理想阶段,但这些网络时代的领军者们却正在酝酿着重大变革—尽管目前它可能只是一种对非结构化的数据进行分析的新方法。

  所以梦想并不像看上去那样遥不可及,即使是在这个金融危机的寒冬中。技术博客Techcrunch的创始人迈克尔·阿灵顿就笃定,创意并不会由此戛然而止,仅仅代表着“容易钱(easy money)”即将终结。是的,2000年的互联网泡沫孕育了web 2.0的疯狂发展,眼下严峻的经济形势却能修正这股充溢着泡沫的热潮—而2008年,这种趋势已经显现。

  Web2.0阵地

  在今年召开的国际消费电子展(CES)上,这个被公认为行业风向标的盛会首次利用Facebook进行自我宣传,并在YouTube上开辟了专门的视频频道。的确,这些热门网站因所拥有的强大而忠实的受众群,而日益进入主流,如今,谁都无法忽视其业已形成的稳固阵地。所以,不可免俗的,我们还是先要从web 2.0谈起,因为正是它让互联网实现了前所未有的跨越:从此之后,网络与人之间的互动才算真正开始。

  Web 2.0的概念诞生于2004年O'Reilly公司和MediaLive国际公司的一次头脑风暴会议中。那时,互联网行业刚从4年前那轮泡沫带来的低迷环境中渐渐复苏。之后,该词发明者—O'Reilly公司的总裁提姆·奥莱理逐步廓清了它的定义。简单来说,其特指让用户分享和自主创造内容的一系列网络创新。

  当然,这种全民参与的革命性背后则是多个因素相互作用的结果:带宽的飞速发展、电脑硬件价格日益低廉、数码技术和互联网技术的成熟,以及网民自我意识的觉醒等等。但无论这些新兴网站采用何种形式、何种内容—无论是YouTube、MySpace还是Facebook,它们都依然指向了一个继互联网诞生以来的唯一终极目的:让数据更加丰富、更加易得。

  就像Google一贯的宣言一样:“整合全球的信息,使其为所有人所用。”这也是其这些年来网络各种产品的一个主线,比如视频网站YouTube、博客网站Blogger、百科网站Knol,以及医疗信息数据系统Google Health,甚至其所投资的基因测序网站23andme。

  而RSS和Friendfeed则因更进一步地整合动态的、碎片化的关系网信息广受关注。前者能订阅你每天要看的网站和博客,而后者则能跟踪你的朋友在Facebook上的活动、在Twitter上的发言、在RSS中的分享。

  可以看出,一个聚集你的行为、你阅读的文章、你的健康状况,以及你的社交活动等等个性化信息的web 2.0世界已初具雏形。不过无法忽视的事实是,虽然给人们的生活带来了巨大变化,但这些web 2.0网站却均未盈利。

  比如在2008年流量取得752%惊人增长的Twitter,虽已有高达400万的独立访问者,但仍然没有一个可行的商业模式。为此,有人向这个能洞悉网民细微动向的网站建议开放API、引入更多的第三方,从而开发更贴近用户的广告程序。

  换句话说,在海量化和个性化之后,如何达到这些信息的最优化利用则成为一个亟待解决的问题。

  被“遗落”的下一代

  或许,这个工作要留给下一代互联网了,即我们已经听到过的web 3.0。至少维珍创始人理查德·布兰森就表示:“我已经不想什么web 2.0了,那已成为了过去!”

  其实,当这个“过去”让整个世界为之震惊的时候,以万维网之父蒂姆·伯纳斯·李为首的万维网联盟人员却陷入了空前的愤怒。这种发展和他们的终极理想—实现智能化网络,即语义网(semantic web)大相径庭。

  有趣的是,早在第一代门户网站大兴其盛时,伯纳斯·李就开始酝酿自己的“Web 2.0”概念。2001年,他在《科学美国人》上发表了一篇文章,大力提倡发展语义网,并期盼着这种能准确洞察人们心意的第二代万维网的到来。

  所以可以想象,奥莱理提出的全新Web 2.0概念以及引起的强烈反响,打乱了伯纳斯·李对于未来的希冀。因为语义网和当前互联网的结构完全不同。目前网络使用HTML语言来表现数据,电脑无法对内容进行识别。而语义网则需要推行一套新的网页标准:使用XML(可扩展置标语言)以及RDF(资源描述框架)来表达数据。这套新的规范能通过对内容的标识和属性让机器理解词语和概念,以及它们之间的逻辑关系。如此一来,搜索就能获得更精准的结果,网站的推荐就更加准确,广告就能够推送到更匹配的人群中—而利润来源就此有了保证。

  “当初Web 2.0的提出实际上对语义网运动是一个突然而至的闷棍。”研究语义网的上海数字图书所所长刘炜对《环球企业家》说,“由此,万维网联盟的人不得不在慌忙中聚焦到了下一波互联网大潮—Web 3.0中。”

  是的,这个人们不停质问到底是什么的Web 3.0概念,其实早在所谓的web 2.0出现之时就曾与我们失之交臂。但是即使如此,涵盖大量的数据,并能够让我们随意访问这些不可思议的数据资源的语义网技术,成为现实的可能性在当下还是虚无缥缈。除了技术上的难关,标准的推广也是很大的问题:过去的网页要重新编写,新的网页要遵循新的规则。总之,它已不是第二代的简单升级,而是对其的彻底颠覆,这也因此让它成为一项“不可能完成的任务”。

  但关于下一代互联网的探讨并未止步。比如Google CEO埃里克·施密特就认为,Web 3.0也可以理解为拼凑在一起的应用程序。它们虽单体相对较小,但运行速度非常快并能进行很多自定义,可以在任何设备上运行(PC或者移动电话),而且由于数据处于“云”中,它可以像病毒一样地扩散(如社交网络,电子邮件等)。而奥莱理则认为Web3.0应是超越经验以外的,“很有可能它会比万维网更广阔、更普遍地深入到我们的生活中。就像激光技术、传感器、语音识别和很多其它新技术已经把计算机向前推进了一大步一样。”

  新标准

  好在,我们并不需要自我局限在某个标签之中,无论web 3.0的内涵最终被如何定义,我们已能从种种迹象中窥见出互联网的未来轮廓:数据开放、无处不联网。一句话,云计算为互联网带来了膨胀力量!

  这就不得不提它的倡导者、如今毋庸置疑的互联网领袖Google,以及它所带来的改变。

  事实上,web 2.0代表形式—社区的出现,曾让Google这样的搜索引擎颇感尴尬。由于标准和设置不同,社区对于搜索引擎来说就是一个信息黑洞。随着社区的成长,这个黑洞会越来越大。

  于是,Google推出了倡导标准统一和数据开放的OpenSocial平台,使得第三方软件开发商更容易将同一应用程序嫁接在多个网站之上。在Facebook的垄断趋势日益加强的情况下,各家竞争对手更有驱动力去支持OpenSocial。这也意味着,一个小公司在未来将能以最低成本利用每个社区积累的用户群。

  而对于用户而言,个性化网络则可能成为现实。当OpenSocial和API开放成为业界标准后,同一个ID就能贯穿整个互联网:浏览器将成为个人网页的入口,只需要在浏览器上用ID进行登录,便能进入你的个性社区和个性化内容。

  而随后在去年推出的Chrome,则占据了浏览器这个连入未来的必由之地。其更大意义在于,由于支持一种名为V8的JavaScript引擎,与IE相比,它的运行的速度可提升数倍。

  在互联网的发展中,脚本语言JavaScript可谓功不可没。它将原来的静态网页,转变成为接近桌面体验的丰富应用。但当网页使用过于复杂的JavaScript时,浏览器很有可能无法响应。这就是Google推出Chrome的关键原因:让浏览器技术水平赶上Web应用程序的步伐。日后,越来越多复杂的程序将能在浏览器上快速运行。

  而由此,依赖云计算的发展,创业公司们就能用低成本的方式进行庞大的数据挖掘和数据分析,只需要租赁Google或者任何一个公司的“云”。所以说,如果以前强大的计算能力是网站的一个门槛,那它现在已经被彻底打破。网站们已不用再投资购买昂贵的硬件设备、负担频繁的保养与升级,却依旧能获得对海量数据的处理能力。这也使那个让Twitter采用第三方软件进行广告与用户智能化匹配的提议具有了现实基础。

  从中,我们不难看到Google的野心—它要缔造一个开放的互联网,并逐渐深入到其底层。而其中所贯彻的新标准,建立过程则全然不像语义网那样遥不可及。

 延伸的互联网

  当然,2008年最值得庆贺的事情,莫过于互联网的平台终于开始跨越PC这一单一访问媒介了。当乔布斯把 iPhone(手机上网)叫做“你口袋里的生活”时,他也将互联网放入了每个人的口袋中。

  比起电脑,手机无疑是最适合完成个性化的设备。然而这几年来,虽然意识到移动行业存在着巨大的金矿,但大的飞跃却未实现。这其中存在着几个障碍:手机上网并不便利;手机开发的封闭式环境,将更多有创造力的开发者隔绝在外。

  显然,改变已经开始。

  去年不啻为手机行业的开源元年。Google Android的努力使得开源平台成为手机业的新发展方向。智能手机成本大大降低,软件和服务替代硬件成为了手机业的核心竞争力。

  另一大跃进是手机上网体验的极大改进。iPhone和Android都带WiFi(无线宽带)功能。而它多年来一直被手机行业拒之门外,其真正原因恐怕是为了让消费者将时间耗在运营商自己的网络上。但运营商垄断网络的梦想现在无疑被打破,手机的定位也随之发生了巨变:成为个人随时联网的行动装置。

  这些都能释放手机互联网的创意潜能。比如,在Android的运用程序中就有很多基于移动特点的有趣服务。Locale可以根据用户所处位置调整手机设置,在剧院或电影院时自动关闭手机铃声;日程管理软件GeoLife在你路过超市时提醒你别忘了买纸巾;Ecorio则能通过GPS获知你每天的行程,计算你每天的碳排放并给出减少碳排放的小窍门。最近,甚至有人将Android连入上网本—这又是一个有着无尽想象力的平台。

  让我们暂时回到手机。除了位置服务之外,手机这个媒介还能为互联网带来哪些价值呢?

  很直观的一点是,当触摸屏成为智能手机的流行趋势后,SearchMe那样的可视化网页将备受青睐。这个搜索引擎与Google的不同点在于,它将搜索结果用网页图片展示,如同iPhone的照片显示,风格非常酷。

  不过,真正的未来到底如何,我们仍然难以清晰描述。但可以确定的一点是,文章开头所提到的那个无限渗透的智能网络,正一步步向我们走近。

Web 3.0还有多远

  我们在今天描述Web 3.0,就如同当年在互联网诞生之前的世界里想象Web 1.0一样。

  本刊记者 樊兰

  上个世纪末,歌手朴树在《NewBoy》里唱道:“快来吧,奔腾电脑,就让它们代替我来思考。”他关于电脑会“思考”的愿望至今也未能实现,但却预言了Web 3.0的情形。

  在Web 3.0时代,你不再为了预定一张机票,去好几个网站搜索航班和价格,进行反反复复的比较。你只需给你的软件代理设置一个任务,它就会想你所想,自动搜索并以最合适的价格订到你满意的航班。你还能查看你乘坐的所有航班的纪录:飞行了多少里程,目的地是哪里,行李发生过哪些问题等等。

  这一切,并不是因为电脑变了,而是互联网变了。

  语义网与在线操作系统的结合体

  还记得过去的保龄球—保龄球1.0吗?你得在一张纸上写下所有人的名字,然后用铅笔在每个人的名字下写下他们的得分。后来我们进入保龄球2.0:往一个电脑屏幕里输入每个人的得分,电脑运算之后给出结果。今天的保龄球馆则更加聪明:自动换瓶机告诉电脑哪些木瓶还留在原地,计分软件就自动算出分数。这是不是有点Web 3.0的感觉?而真正的保龄球3.0是这样的:当你出现在保龄球馆,软件就能够认出你,并在你打球的时候自动计分,然后把当天的分数加到你的个人在线数据库—那里存有你所有的保龄球分数。你甚至能在同一天与不同城市的上万名打保龄球的人进行PK。

  6年前,蒂姆·伯纳斯·李写道:“我盼望着网络能够分析所有的数据:内容、链接、人与电脑之间的交易。正在出现的语义网会让这些变成现实,当这些实现的时候,我们的日常生活会由机器之间的对话来处理。人们盼望多年的智能代理程序,最终成为现实。”

  互联网之父这番颇让人费解的畅想,化成具体的场景就会是这样:

  你在网上预订一个酒店房间,进去后你会发现,里面的床已经按照你喜欢的软硬程度设置好;洗澡水不冷也不烫,正是你喜欢的温度;电视屏幕上一边是你最爱看的电视节目表,另一边是你可能感兴趣的餐厅的名单;即使你已经昏迷不醒,也能在世界上任何一家医院得到治疗,因为他们都能立即进入你的医疗纪录。你能看到你驾车行驶的每一公里的记录、你拍摄的每张照片、你签署的每份协议……所有的这一切都在语义网上。

  在2007年的今天,我们仍然把数据从一个应用程序搬到另一个应用程序。虽然你和同事的电脑上都有Word程序,但如果你要看同事的文档,他必须先发给你,然后你再用自己电脑上的Word来看这份文档。假如你的同事把文档做了修改之后又发给你,后来又做一些改动再发给你,相信你收到的文档版本已经全被弄乱了。怎么办?Google Docs和微软的Live文档以及Office 2007提供了Web 2.0的解决方法:你不需把文档发给任何人,只需给阅读和写作这些文档的人发送邀请,所有的编辑工作就会同时出现在你和对方的电脑屏幕上。

  Web 3.0则更进一步—每个文件只有一个来源。你填过的所有表格:杂志订阅单、学校档案、驾照、合同、购物单、支票、银行表格等,都在你的在线数据保险箱里。如果你在个人ID里变更了自己的住址或者手机号,所有的在线文档都会自动更新为你的新住址和新手机号,你不需要向每个人都发一封邮件告诉他们你的住址变了、手机号换了。所有的东西都是相互链接的,没有复制的文件。这就是Web 3.0的伟大之处。

  今天,笔记本电脑还因为便携性大受欢迎,几年之后,你将不再需要笔记本电脑。在Web 3.0时代,只用手握任何一个接入互联网的屏幕、登陆,你的个人桌面就会出现在你面前。你能通过手机的耳麦与你的在线桌面互动:听取你的留言、发送留言、听歌等,并且你的耳机能跟任何与它相通的设备无线连通。如果你的手机丢了,只需拿起别人的手机登陆自己的桌面。那时的手机没有任何内存,所有东西都从你的在线数据保险箱里获取。

  乐高积木

  如果你想买一辆山地自行车,你该去哪里?如果用Google搜索自行车,你会发现搜索结果里一大半是自行车协会、自行车爱好者的网站。想通过搜索关键词找到理想的自行车?几乎不可能。搜索为什么不能变得聪明点?

  因为现在互联网上成千上万的产品信息都是用不同的语言和标准写的,有的是Excel文件,有的是Word文件、还有的PDF, 这些产品描述大概占到整个互联网(除去MySpace)内容的20%,彼此却并不认识,即使它们是相互重复的。因此,戴尔、亚马逊、eBay等网站便不得不建立自己的分类系统。不幸的是,这些分类系统之间并不互通。

  要实现Web 3.0,核心是标准化的数据描述符,它们就如同我们小时候玩的乐高积木,可以相互拼接、任意组合,这样搜索就能聪明起来了。你只要输入对自行车的要求:车架、变速功能、轮胎、价格等等,然后就能在一张地图上看到所有符合要求的山地车,按照价格、车况或者任何你希望的方式排列。说不定你会发现邻居就有一辆自行车想出售,出门几分钟之内你就能搞定这件事。不管你是一个发动机厂的老板,还是一个拥有一套连环画的小孩,只要你把你的库存清单放在网上,搜索引擎就会自动把你和你的买家连接起来。

  那么,这些乐高积木是如何搭建起Web 3.0的呢?在Web 3.0金字塔的最底层有一个“标准化产品描述符的数据库”。比如,你想买一辆汽车,在这个数据库里你就会看到来自制造商、杂志、保险公司等方方面面关于这款车的信息,这些数据都是标准格式的,因此你能按照任何标准对汽车进行比较:汽油消耗定额、维修记录、颜色、茶杯座的大小、撞击试验的等级等等,不一而足。底层还有另一个数据库,里面有每辆车的“数字出生证明”包含每辆车的所有相关信息。

  金字塔的中间是“个人数据保险柜”,里面有你的个人ID和你拥有的一切东西的详细记录。比方说,财产指示器会链接到你的汽车的数字出生证明,以及你身为车主的纪录。

  金字塔的顶端则是Ajax(异步的JavaScript和XML处理)产品推荐器,它能让其他人在车主的许可下看到这辆车。比如,你可以把车放在eBay上,然后链接到你的个人数据保险箱里关于这辆车的文件夹,人们就能看到所有你愿意让他们看到的信息。如果你把车卖掉,这些信息就会转移到新的车主那里。

  Web 3.0和现实的距离

  其实,Web 3.0的元素在医疗领域目前已有应用。据调查,美国进行的所有医学测试中,有40%是因为不知道病人以前的测试结果而进行的。庆幸的是,在电子病历领域,现在出现了一个名叫“World Vista”的开源标准。这个由VA开发的基于Vista的标准向所有人开放,能够形成一个全球性的可互换医疗信息的系统。Thomas Goetz在《连线》杂志上发出赞叹:“由于使用‘Vista’,美国退役军人医疗系统的人均成本比十年前降低了32%。而同期的医疗消费价格指数增长了50%。”

  今年5月,在美国圣何塞举办的2007年语义技术大会上,除了NASA(美国国家航空航天管理局)、美国国防部、美国空军、斯坦福大学等大型科研机构之外,微软、IBM、Oracle、Sun、Google、雅虎等巨头几乎倾巢出动,甚至波音、福特、沃尔玛这样的非IT企业也兴致盎然地前来参会,足见各界对Web 3.0的重视。微软MSN的高级副总裁布雷克·何文说:“Windows Live和Office Live是Web 3.0时代的领航产品,用户将可以定制自己的互联网内容世界。”Google也开始了对Web 3.0的精心布局,目前已经完成了从信息创作、信息组织、信息存贮、信息检索、信息发布、到信息翻译、再到信息服务、以及无线服务Google SMS 的一整条Web 3.0产业链的构建。

  除了大公司的战略布局之外,Web 3.0在技术层面也有了新的发展。要实现语义网,其核心是要建造乐高积木—标准化的数据描述符。自1998年被W3C(万维网联盟)制定为标准以来,XML(可扩展标识语言)已成为互联网通用的数据描述语言标准,尤其是商业用户交换企业信息的通用方式,相比以前的HTML,XML具有清晰的结构以及强大、灵活的标签定义和数据描述机制,。但XML的缺点是只能描述数据的语法,而不能表达机器可理解的语义,无法满足语义网的要求。

  因此,2004年W3C推出了一个基于XML的更为简单有效的数据描述框架—RDF(资源描述框架),在这个通用的框架下,所有的数据都能得到充分有效的描述,机器可以理解其表达的语义信息。RDF目前已被IBM、Adobe等公司应用到自己的产品系统中、波音的数据集成系统也采用RDF作为数据交互的中间语言,而中国的中医药科学数据中心也是基于RDF数据模型的,并在语义浏览方面领先国际。

  但目前RDF数据并不普及,现有的Google和雅虎等搜索引擎会产生大量冗余或无意义的搜索结果,于是有人开始进行语义搜索方面的尝试,希望为用户提供相关度更高的搜索结果,StumbleUpon是其中的先行者。这个由三名加拿大软件工程师在2001年创办的搜索引擎结合了搜索算法和用户推荐,如果用户搜索“汽车”,网站将会综合考虑用户的收入、年龄、性别和家庭所在地等信息,提供一个网页列表以及其它有相似兴趣和背景的用户推荐的网站。该网站于今年5月被eBay以7500万美元的高价买走。

  Phil Cogito是Cognition Search的CEO,他在这个还是测试版的搜索引擎首页上宣称他要“展示一种基于含义的搜索技术,让你进行前所未有的深度搜索”。该搜索引擎采用了一种独特的语言学和数学的混合算法,计算机“学会”了几乎所有的常用英语单词和短语,能理解词语在上下文中的含义。Phil 称,Cognition Search还具有“自然语言查询”的能力,不管用户输入怎样的问题,搜索引擎都能找到你需要的资料。美中不足的是,目前其搜索的范围仅限于案例研究、政府、医疗、政治博客等几个特定的领域。

  不仅是文本,音乐也有了搜索引擎—Pandora.com,这家位于加州奥克兰的公司正通过一个名叫“音乐基因工程”的项目对音乐的音调、节奏和歌词等细节进行分析,用户输入歌曲或歌手名字,就可以听到这首歌曲。

  在线操作系统(Web OS)也已经浮出水面。Ajax是打造友善、易于操作的用户界面最核心的技术,由于Web 2.0的助推,Ajax已经被发扬光大,Orkut、Gmail、Google Group、Google Suggest、Google Maps、Flickr、A9.com的界面都使用了Ajax。以Ajax为基础,国外已经有了Desktop On Demand、Ajax Windows、Eye OS等几家知名的Web OS,而在中国也诞生了自己的Web OS—TOMOS。登陆这家网站,你的眼前就出现了一个类似于Windows界面的在线操作系统,你能享受到“我的文档”、办公软件、多媒体服务、信息平台、IM聊天、娱乐游戏、邮件服务等多种服务。另外一家很有特色的网站YnnnY.com,是一个免费的个人在线记账平台,目前已有近两万人在这里记录下自己每天的生活开支。

  很多关于Web 3.0的尝试已经出现,但这些尝试要聚合起来还需要一个漫长的过程,现在的Web 3.0就像一堆碎石,等待着被整理成一条畅通的公路。回想20年前,还没有Google,一套开放的标准和带宽让今天这个新世界成为可能。我们在今天描述Web 3.0,就如同当年在互联网诞生之前的世界里想象Web 1.0一样。

Web3.0展望

嘿,您打算看场电影,然后再吃点什么吗?喜剧片和超辣的四川火锅怎么样?好的,那我们就启动电脑,打开网络浏览器,来Google一下吧!先让我们看看附近的电影院正在上映什么片子,再仔细浏览下每部电影的介绍,然后选一部想看的片子。电影选好了,接下来该挑选餐厅了。看看电影院附近有哪些火锅店,然后查看顾客对这些餐厅的评价——这些都是必须做的功课。总而言之,在您出门之前,至少得浏览好几个网站来收集必要的信息。

图中这个小巧的头戴式显示屏是不是能为我们展示未来的网络远景呢?
Yoshikazu Tsuno拍摄/AFP/Getty Images 供图
图中这个小巧的头戴式显示屏是不是能为我们展示未来的网络远景呢?

有的互联网专家认为下一代网络——Web3.0——将让您的搜索工作变得更快捷、更轻松。不用再进行繁琐的多种搜索,您只需在Web3.0浏览器中输入一两句问题,网络就会帮您完成剩下的工作。在刚才我们所举的例子中,您可以输入“我想看一部有趣的电影,然后在一家不错的火锅店用餐。我有哪些选择?”Web3.0浏览器就会马上分析您的问题,然后在互联网搜索可能的答案,最后将搜索结果整理好提交给您。

这还只是Web3.0浏览器的功能之一。许多专家认为,Web3.0浏览器还可以充当计算机用户的私人助理。当您在网络上进行搜索时,浏览器将了解到您有哪些兴趣。您越是经常使用网络,您的浏览器就会对您越了解,您在搜索时提出的问题也就可以越简单。到了最后,您也许只要问 “我应该去哪里吃午餐?”这样的开放式问题,您的浏览器就可以查阅您的喜好记录,结合您所在的位置,给您列出一个可选餐厅的目录。

要想了解网络未来的发展,我们必须先快速回顾一下它的发展历程。下一节,我们将为您简单介绍一下网络的发展历程。

在公众熟知的所有互联网热门词汇和专业术语中,Web2.0恐怕是人们听得最多的一个。然而,尽管很多人都听过这个词,但很少有人真正知道什么是Web2.0。有人称这个词只不过是种市场营销策略,目的是为了获得风险投资人上百万美元的投资。事实上,当O‘Reilly媒体公司的副总裁戴尔•多尔蒂(Dale Dougherty)在第一次提出这个术语时,也没有给它一个清晰的定义。甚至连有没有Web1.0这个概念都没有定论。

YouTube就是个典型的Web2.0网站
YouTube就是个典型的Web2.0网站

不过,也有人坚持认为Web2.0确实存在。简单地说,Web2.0具有下列特征:

  • 访问者可以对网页进行修改:亚马逊网站(Amazon)的用户可以在该网站发布产品评价。用户只要填写一个在线表单,就可以在亚马逊的网页上添加其他访问者可以看到的信息。
     
  • 通过页面将用户联系起来:像Facebook和Myspace这样的社区网络之所以大受欢迎,原因之一是它们可以让用户更方便地找到对方并保持联系。
     
  • 高效地分享内容:在这方面,YouTube做得很不错。YouTube用户可以将他们制作的视频上传到网站上,用不了一个小时,就会有其他访问者看到这些视频。
     
  • 获取信息的新途径:互联网用户可以订阅某网页的RSS(RSS,Really Simple Syndication,聚合内容),而且只要他们上网,就能收到该网站的更新通知。
  • 除计算机外,还能利用其他设备上网:人们可以通过手机或视频游戏机等设备登陆互联网;专家预计,用不了多久,用户将可以通过电视机和其他设备登陆互联网。

Web1.0就好像是个图书馆,它可以为人们提供信息,但是人们却无法添加或更改信息;而Web2.0则更像是个朋友圈或社交圈,它也可以为人们提供信息,但同时人们也可以通过它进行交流,并获得更丰富的体验。

虽然现在还有很多人刚开始学习如何使用Web2.0,但已经有人在构想下一代网络模式了。Web3.0将会是什么样的?它与现在的网络有多大差别?它会是一场巨大的变革还是难以察觉的微小变化?

互联网专家们眼中的新一代互联网会是什么样的呢?我们将在下一节告诉您答案。

互联网专家认为有了Web3.0,用户就好像多了一个私人助理——事实上,它对您的所有个人信息都了如指掌,并能在互联网上搜集所有相关信息来回答您提出的任何问题。很多人把Web3.0比作一个大型数据库。Web2.0利用互联网实现了人与人之间的交流,而Web3.0将利用互联网在信息与信息之间建起一座桥梁。有专家认为Web3.0将最终取代现在的网络,也有人认为Web3.0将与现在的网络同时并存。

打算到热带度假吗?Web3.0可以帮您制定旅行计划。
©iStockphoto/dstephens
打算到热带度假吗?Web3.0可以帮您制定旅行计划。

让我们举个例子,解释一下什么是Web3.0。比如,您打算找个气候宜人的地方度假,而此行的预算是5000元。在预算内,你希望找到一家舒适且价格合理的旅馆,而且还希望买到便宜机票。

如果利用现在的网络技术,您并须先在网上做大量调查,才能制定出最佳的度假方案,整个过程可能需要好几个小时,而其中大部分时间都浪费在浏览搜索引擎给出的结果页面上——您需要研究所有可选的目的地,在其中挑选最合适的;您需要登陆两三个旅行打折网,比较机票和旅馆的价格。

您的网上生活

如果您的Web3.0浏览器可以根据您个人的喜好为您检索信息,那么这些检索结果会不会被别人看到,从而暴露您不愿让人知道的个人信息呢?如果有人在互联网上搜索有关您的信息,又会发生什么情况呢?您在互联网上的活动会不会成为公开信息呢?现在我们还无法预知这些问题的答案,但有人担心等到我们找到答案时,要想亡羊补牢,恐怕为时已晚


有的互联网专家认为有了Web3.0,您将可以安稳地坐在电脑前,让互联网帮您完成所有工作。搜索服务会帮您缩小搜索参数范围,浏览器程序会对信息进行收集、分析,然后提交分析结果。而您只要轻松对比结果,就可以在瞬间做出选择。Web3.0之所以可以做到这一切,是因为它能够理解互联网上的信息。

您现在使用的网络搜索引擎还不能真正理解您的搜索需求,它只能根据您输入的关键词,搜索那些包含该关键词的网页。换句话说,现在的搜索引擎只能判断该网页是否包含关键词,但却无法判断该网页内容是否真的与您的搜索需求相关。比如,如果您搜索的关键词是“火星”,您得到的搜索结果中可能会包括有关行星的网页和很多没有意义的废帖。

Web3.0的搜索引擎不仅可以检索到您输入的关键词,还能理解您为什么会有这样的搜索需求。它所找到的都是与您的需求相关联的结果,而且还能提供其他相关的搜索建议。比如在刚才的例子中,如果您输入“费用在5000元以下的南方度假地”,Web3.0浏览器就会为您提供所有与搜索需求相关的信息,其中包括各种有趣的活动或者不错的餐馆。Web3.0浏览器会把网络当成一个可以满足任何查询需求的大型信息库。

Web3.0的功能为什么会如此强大呢?

没有人能预知未来技术会怎样发展,但大部分互联网专家对于Web3.0的基本特征都持有相同看法。他们认为Web3.0可以为用户提供内容更丰富、相关度更高的用户体验。还有人认为在Web3.0时代,每个用户都会拥有一个基于个人浏览历史记录的网络档案,Web3.0将根据这个档案为每个用户量身定制一套浏览体验。也就是说,如果两个兴趣爱好完全不同的人通过同一项搜索服务输入相同的关键词,他们得到的搜索结果也会截然不同,因为他们拥有完全不同的网络档案。

Web3.0很可能对您的个人兴趣和浏览习惯了如指掌。
©iStockphoto/ktsimage 供图
Web3.0很可能对您的个人兴趣和浏览习惯了如指掌。

目前,这种应用所需的技术和软件还不成熟。像TiVO和Pandora这样的服务虽然可以根据用户输入的信息提供个性化内容,但是它们都只是基于试错法,而试错法的效率要远低于专家们所说的Web3.0方案。而且,TiVO和Pandora都有一定的局限性(前者只适用于电视节目,而后者只适用于音乐),而Web3.0则能处理整个互联网上的所有信息。

有些专家认为Web3.0的基础应该是应用程序接口( application programming interfaces,APIs)。API是一种编程介面,通过这个介面,程序员可以开发出调用特定资源的各种应用程序。许多Web2.0的网站都有类似的应用程序接口,程序员可以通过它们使用网站的数据和功能。例如,利用Facebook的应用程序接口,程序员可以设计一些以Facebook为平台的程序,比如游戏、问答、产品评价等等。

Mashup(网络聚合应用)是Web2.0新出现的网络现象,这种功能也有助于Web3.0的开发。Mushup就是将两种以上的应用结合起来,形成一个聚合应用。例如,程序员可以将Google的电子地图和一个允许用户对餐厅做出评价的程序整合在一起。这一新的Mashup不仅可以显示用户对每个餐厅的评价,而且还可以将每个餐厅标注在电子地图上,以便用户能很快找到餐厅的位置。有的互联网专家相信在Web3.0上创建Mashup将会是所有人都能完成的简单任务。

Widgets应用小插件

Widget是一种小型应用程序,人们可以用拷贝或在网页代码中嵌入代码行的方式将它们插入到网页中。这些应用程序包括游戏、新闻定制(News Feeds)、视频播放器等等。有的互联网人士预测,在Web3.0时代,用户可以把各种应用小插件整合到一起——只要点击鼠标,然后将几个图标拖到网页上的一个小框里就可以创建聚合应用。如果想要网络显示新闻故事发生的地点,您只要将新闻定制图标和Google电子地图图标拖到一个小框里,剩下的事情Web3.0可以帮您完成。但它到底会如何完成呢?目前,还没有人知道答案


还有些专家认为Web3.0将是一种全新的网络,它的基础编码语言将与Web2.0所使用的HTML截然不同。这些专家们认为建立一个全新网络模式要比对现有网络模式进行修改容易得多。然而,Web3.0还仅限于理论阶段,现在就对它的工作原理妄下结论似乎为时过早。

万维网的创建者对于将来的网络发展有着独到的理论,他给它起了个名字——“语义网(Semantic Web)”,而其他互联网专家在提到Web3.0时也会借用他的理论。那么究竟什么是语义网呢?

1989年蒂姆•伯纳斯-李(Tim Berners-Lee)创建了万维网,它是互联网的界面,也是信息分享的渠道。伯纳斯-李对于“Web2.0”是否真的存在也表示怀疑,他认为“Web2.0”只不过是个毫无意义的词[资料来源:Register] 。伯纳斯-李一直认为他设计万维网的目的就是让它处理Web2.0所能处理的所有工作。

万维网的创建者蒂姆•伯纳斯-李
Catrina Genovese摄影/Getty Images 供图
万维网的创建者蒂姆•伯纳斯-李

伯纳斯-李对于未来网络的构想与Web3.0的概念十分相似——这就是语义网。目前来看,互联网的结构是为人类量身定做的。我们可以轻松登陆网页,并了解该网页的所有内容。计算机无法做到这一点。搜索引擎也许可以搜索关键词,但是它也无法理解这些关键词为何会出现在具体网页中。

有了语义网,计算机就可以利用代理人软件(software agents)扫描并解释网页上的信息。代理人软件就是一些可以查询相关信息的网络检索程序。它们之所以具有这种功能,是因为语义网拥有许多信息库,也叫做“知识本体(ontologies)”。在互联网中,一个知识本体就是一个文档,该文档定义了一组词汇之间的相互关系。比如,词汇“堂兄弟”,指父母不同但祖父母相同的两个男性之间的关系。一个语义网的知识本体可能会对每个家庭成员做出如下定义:

  • 祖父母:父亲的上一代直系血亲
  • 父母:上一代直系血亲兄弟
  • 姐妹:拥有相同父母的人
  • 侄子或侄女:兄弟的孩子
  • 叔父或伯父:父亲的兄弟
  • 堂兄弟:叔父或伯父的儿子

知识本体的内容必须详细全面,才能提高语义网的效率。在伯纳斯-李的概念里,知识本体以元数据(Metadata)的形式存在。元数据是包含在网页代码中的信息,我们无法看到,但计算机可以识别。

构建知识本体是一项极为艰巨的任务。事实上,这也是语义网面临的主要难题之一。人们是否愿意投入足够的精力来为他们的网站构建全面的知识本体呢?人们是否愿意根据网站的变化不断修改维护知识本体呢?持反对意见者认为创建和维护如此复杂的文档对于大多数人来说是一项浩大的工程。

另一方面,有些人十分喜欢给网络对象和网络信息做标记,网络标签可以给这些做了标记的网络信息进行分类。不少博客都有标签选项,它可以帮助您轻松地按照主题给日志条目分类。在图片共享网站Flickr上,用户可以给图片做标记。Google甚至还把这种功能做成了一个游戏——Google图像贴标比赛,参与者必须给一系列图片贴上相关标签,贴标数量最多的一方获胜。有的专家认为,Web3.0可以搜索标签,并将最相关的结果返回给用户。也许,Web3.0能够将伯纳斯-李的语义网概念和Web2.0的标签文化结合在一起。

尽管Web3.0还处于理论阶段,但这并没有阻止人们去猜测在它之后网络将会变成什么样子。在下一节中,我们将继续展望网络的遥远未来。

不管下一代网络叫什么名字,我们都很想知道在它之后的新一代网络又会是什么样的。现在,有关Web3.0之后的网络理论不乏保守的预测和大胆的猜想,但无论哪一种,听上去都有点像科幻片里的情节。

在2008年国际消费类电子产品展览会上(2008 International Consumer Electronics Show),因特尔的总裁兼CEO保罗•欧德宁(Paul Otellini)先生指出移动设备在网络应用中的地位将越来越重要。
David Paul Morris摄影/Getty Images供图
在2008年国际消费类电子产品展览会上(2008 International Consumer Electronics Show),因特尔的总裁兼CEO保罗•欧德宁(Paul Otellini)先生指出移动设备在网络应用中的地位将越来越重要。

以下是其中的一些猜测:

  • 技术专家兼企业家诺瓦•斯皮瓦克(Nova Spivack)认为,网络的发展将以10年为一周期。在网络发展的第一个十年,发展的重点是网络的后端,或者叫网络的基本架构,程序员在此期间创造出了我们今天用来制作网页的网络协议和代码语言。在第二个十年,发展的重心由后端转移到了前端,我们由此进入了Web2.0时代。现在,人们利用网页作为平台来获取其他网络应用。同时,他们也在网络上创建Mashup(聚合应用)并尝试用多种方法,来增强网络体验的互动性。而今,Web2.0时代即将谢幕,Web3.0时代将粉墨登场。在这新一轮的周期中,网络发展的重心将再次转移到后端。程序员将进一步完善互联网的基本架构,使其能够支持Web3.0浏览器的高级功能。到这个周期结束之时,我们还将迎来Web4.0时代。到了那时,发展的重点又将回到前端,同时会有成千上万的基于Web3.0的新程序被开发出来[资料来源:诺瓦•斯皮瓦克] 。
  • 网络将发展成一个三维环境,我们将看到的不是什么“Web3.0”而是“Web3D”。Web3D可以把虚拟现实元素和大型多人在线角色扮演游戏(MMORPGs)中的网络世界结合起来,变成一个极其真实的三维数字空间。您可以以第一人称的视角或者隐藏在虚拟化身之下在网络中畅游。
  • 未来网络的建立将基于分布式计算的发展,并最终实现真正的人工智能。分布式计算就是由几台计算机同时处理一个大型项目,每台计算机分别负责该项目的一小部分。有人认为这样的网络具有思考能力,可以给上千台计算机分配工作并查询内容更广博的知识本体。实际上,整个网络就是一个巨大的“脑”,它能分析数据并根据现有信息做出推断。
  • 未来网络的载体将不再局限于计算机和手机;从手表、电视机到服装,几乎所有东西都可以与网络连接。用户可以与网络保持稳定连接,反之亦然。软件代理商将通过电子产品观察更多地了解每个用户。到那时,如何在个人隐私和个性化网络浏览体验中取得平衡将可能成为人们争论的焦点。
  • 未来的网络将与其他形式的娱乐融合,直至各种媒体形式之间的界限完全消除。广播节目、电视节目和电影都将以网络作为传播系统。

目前,我们还无法判断上面这些猜想和假设哪些会成为现实,也许真正的未来网络将大大超出我们的预期。但愿到了那时,不论网络变成什么样子,我们能最终给它确定一个名称。 (博闻网:作者:Jonathan Strickland)

编辑/发表时间:2010-02-05 10:45
编辑词条如何编辑词条?)                          历史版本

贡献者:
高黎雷士军