搜索引擎的新鲜血液在哪

王鲲 原创 | 2009-12-18 11:01 | 收藏 | 投票

 

    1993年,麻省理工学院学生Mattew Gray开发了世界上第一个爬虫(crawler)程序。这是搜索引擎的开始。到现在,已经过去了16年。从应用创新的角度,搜索引擎已经进入了它的成熟期。

    

   但是,我们可以观察到一个状况:无论是国外的Google、Yahoo,还是国内的百度,从基于关键词的搜索应用的最开始,一直到今天,搜索结果的形态,几乎一成不变。换句话说,对于普通网民,搜索引擎极少改头换脸。

 

   换一种思路对待搜索应用的未来

 

    诚然,搜索引擎的本质是整合、梳理信息,将最有价值的结果呈现给用户。围绕这一点,在过去的很多年,搜索引擎一直在努力提高它前3条结果的满意度,也就是搜索结果的相关性。但我们似乎对此过于执着,乃至有些偏执,而忽视了搜索引擎未来的另外可能。

 

    举个简单的例子,当我们搜索“麻省理工”时,搜索引擎总是尽可能优化其自然语言处理、分词、语义分析流程,并优化排序算法,让最具匹配度的网页链接成为检索结果的第一条链接。但是,且慢,我们重视的是搜索前端的分析、中端的排序,但却忽略了最后一步——结果的展现形式。

 

    这让我们陷入了一个无限循环中,算法的优化总是无止境的,每更新一次算法,下一次更新的难度就以几何倍数的提升。如此下去,自然造成搜索结果相关性的瓶颈越来越窄。

      

    为什么我们不能换一种思路呢,将目光投向结果的展现形式上呢?我认为,这是搜索引擎能够快速取得突破的法门。

 

    百度“阿拉丁”带来的启示

 

    以百度为例,从今年开始,它全面铺开的“阿拉丁”项目,就是在搜索结果的展现形式上做文章。

      

    当我们在百度中搜索“孔子”,第三个结果可以看到《孔子》这部即将上映的电影资料,包括导演、演员、剧情、预告片、海报等等。这显然要比来一条“电影《孔子》的介绍”链接要更有价值。

      

   “阿拉丁”实际上是将之前以网页为信息检索单位,更进一步升级到了以数据模块为检索单位,为用户省去了手动浏览分析的一步,大大提高了信息获取的效率。

      

    如果按照传统的做法,我们需要点击一次搜索链接,再到目标页面中去用肉眼搜寻相关信息,这是一个巨大的操作浪费。假设每一天有10万人通过搜索“孔子”来了解这部电影,每一个人节约10秒钟,“阿拉丁”的上线,至少可以累计节省100万秒。推而广之,这简直就是信息组织的一次革命。

      

   “阿拉丁”给搜索引擎带来的启示就是:搜索应该是解决人们的需求,而不是“寻找最匹配的网页”。这就跟面对一个饥饿的人,你只需要给他一块面包,而不是告诉他一大堆烤制面包的方法。

      

    搜索引擎的新鲜血液

      

    百度在2008年的创新技术大会上提出了“框计算”的概念,这个概念要比“阿拉丁”更宏伟,“阿拉丁”是“框计算”的子集。

      

   我认为,“框计算”的提出,让“阿拉丁”的前景应用开阔了很多,尤其是当各种应用程序接口嵌入到搜索结果时,搜索就变得立体起来——它不再仅仅是资料获取,也可能是服务获取。

      

   比如假设将搜索引擎与在线杀毒应用结合,当网民在搜索框中输入“杀毒”,结果中出现了一个“在线杀毒”按钮,点击一下即可帮助用户扫描电脑,清除病毒。

      

   这绝非天方夜谭。实际上“阿拉丁”已经实现了一些类似的应用,比如火车票查询。

      

   搜索应该以人为本,具有人情味。“阿拉丁”带来的应用实际上最大限度体现了这一点。当在百度输入“yeah.net”时,百度返回的不是yeah.net这条链接,而是一个邮箱登录框,当你看到这样的处理,就会明白搜索引擎的未来究竟在哪。

个人简介
知名IT评论人,科幻星系创建人,多家知名媒体及企业特邀顾问专家
每日关注 更多
王鲲 的日志归档
[查看更多]
赞助商广告