搜索引擎的新鲜血液在哪

王鲲原创 | 2009-12-18 11:01 | 收藏 | 投票

1993年，麻省理工学院学生Mattew Gray开发了世界上第一个爬虫（crawler）程序。这是搜索引擎的开始。到现在，已经过去了16年。从应用创新的角度，搜索引擎已经进入了它的成熟期。

但是，我们可以观察到一个状况：无论是国外的Google、Yahoo，还是国内的百度，从基于关键词的搜索应用的最开始，一直到今天，搜索结果的形态，几乎一成不变。换句话说，对于普通网民，搜索引擎极少改头换脸。

换一种思路对待搜索应用的未来

诚然，搜索引擎的本质是整合、梳理信息，将最有价值的结果呈现给用户。围绕这一点，在过去的很多年，搜索引擎一直在努力提高它前3条结果的满意度，也就是搜索结果的相关性。但我们似乎对此过于执着，乃至有些偏执，而忽视了搜索引擎未来的另外可能。

举个简单的例子，当我们搜索“麻省理工”时，搜索引擎总是尽可能优化其自然语言处理、分词、语义分析流程，并优化排序算法，让最具匹配度的网页链接成为检索结果的第一条链接。但是，且慢，我们重视的是搜索前端的分析、中端的排序，但却忽略了最后一步——结果的展现形式。

这让我们陷入了一个无限循环中，算法的优化总是无止境的，每更新一次算法，下一次更新的难度就以几何倍数的提升。如此下去，自然造成搜索结果相关性的瓶颈越来越窄。

为什么我们不能换一种思路呢，将目光投向结果的展现形式上呢？我认为，这是搜索引擎能够快速取得突破的法门。

百度“阿拉丁”带来的启示

以百度为例，从今年开始，它全面铺开的“阿拉丁”项目，就是在搜索结果的展现形式上做文章。

当我们在百度中搜索“孔子”，第三个结果可以看到《孔子》这部即将上映的电影资料，包括导演、演员、剧情、预告片、海报等等。这显然要比来一条“电影《孔子》的介绍”链接要更有价值。

“阿拉丁”实际上是将之前以网页为信息检索单位，更进一步升级到了以数据模块为检索单位，为用户省去了手动浏览分析的一步，大大提高了信息获取的效率。

如果按照传统的做法，我们需要点击一次搜索链接，再到目标页面中去用肉眼搜寻相关信息，这是一个巨大的操作浪费。假设每一天有10万人通过搜索“孔子”来了解这部电影，每一个人节约10秒钟，“阿拉丁”的上线，至少可以累计节省100万秒。推而广之，这简直就是信息组织的一次革命。

“阿拉丁”给搜索引擎带来的启示就是：搜索应该是解决人们的需求，而不是“寻找最匹配的网页”。这就跟面对一个饥饿的人，你只需要给他一块面包，而不是告诉他一大堆烤制面包的方法。

搜索引擎的新鲜血液

百度在2008年的创新技术大会上提出了“框计算”的概念，这个概念要比“阿拉丁”更宏伟，“阿拉丁”是“框计算”的子集。

我认为，“框计算”的提出，让“阿拉丁”的前景应用开阔了很多，尤其是当各种应用程序接口嵌入到搜索结果时，搜索就变得立体起来——它不再仅仅是资料获取，也可能是服务获取。

比如假设将搜索引擎与在线杀毒应用结合，当网民在搜索框中输入“杀毒”，结果中出现了一个“在线杀毒”按钮，点击一下即可帮助用户扫描电脑，清除病毒。

这绝非天方夜谭。实际上“阿拉丁”已经实现了一些类似的应用，比如火车票查询。

搜索应该以人为本，具有人情味。“阿拉丁”带来的应用实际上最大限度体现了这一点。当在百度输入“yeah.net”时，百度返回的不是yeah.net这条链接，而是一个邮箱登录框，当你看到这样的处理，就会明白搜索引擎的未来究竟在哪。