IT技术博客大学习 共学习 共进步
全部 移动开发 后端 数据库 AI 算法 安全 DevOps 前端 设计 开发者

整合搜索,阿拉丁,云计算,以及框计算

在地铁站 2009-11-04 09:23:54 累计浏览 4,896 次
本机暂存

    纯属民间解释,如能给感兴趣的兄弟解解惑,就达到目的了。

    整合搜索(或者叫通用搜索吧),是这样一种思路:用户没必要记住每一个具有独特价值的搜索入口(实际上能记住的也极有限),而且切换成本也太高,搜索引擎应该自然而然的把合适的数据资源整合到一个入口中,当用户需要的时候,它就自动的跳出来。例如:

    百度搜“racer翻译”,第一个结果是:

    racer翻译―百度词典
racer 【音标】:['reisə] 【词典解释】:名词 n. 1. 赛跑者 2. 比赛用的汽车(或游艇、马、自行车、飞机等);
dict.baidu.com/s?wd=racer 2009-08-25

    百度搜“racer”,这个结果也有,但是跑到第六位去了。为什么呢?因为用户搜索这个词,主要的需求不是看简单的翻译。

    如果要安个帽子,那么这个就是“整合搜索”。只是百度并不满足于仅仅实现这个效果,所以找了个新名字,叫“阿拉丁”,显出有更大的野心。那么阿拉丁和整合搜索的差别在哪里呢?差别就在于,阿拉丁是开放式的,而无论是通用搜索也好,整合搜索也好,都是不开放的。比如”人民币汇率“。它是资源拥有方自己插进去的结果。

    很多兄弟说,开放有啥稀奇啊,这年头开放平台多了去了,firefox有开放插件,iphone有开放商店,facebook有开放应用。这是表象。但本质上是有区别的。这些开放平台,更多意义上,是一种众人拾柴式的”存储“。我只要按照标准接口形式开发完了,往平台上一搁,就等着其他用户来挑选应用了。平台方需要做的事情,最主要是存储,然后可能提供一些找到这些应用的简单检索服务。而搜索引擎的开放,大致有四个难点:

    1,资源质量的验证和监控
2,和既有搜索系统的整合
3,和需求契合的排序位置
4,和需求契合的展现形态

    所以,搜索开放平台也有一点“存储”的意味,但很小。和其他平台最主要的技术差别,在于上述四点。这四个问题解决起来很容易么?对搜索引擎架构略有了解的兄弟,应该知道其困难处。

    接下来说云计算。云计算按我的说法,可能叫“晕计算”更合适,因为很多喜欢把它挂在嘴上的兄弟,对于什么是云计算,并不见得很清楚。

    按流行的说法,云计算大概有两个含义:

    含义一:大规模分布式集群计算。从这个意义上来说,云计算只是一个换了个新瓶子的老概念。其实任何一个搜索引擎公司,这点是最起码的技术。否则几百亿网页的超链提取和计算,怎么玩呢?丢进去一个关键词,在如此庞大的索引中快速找出合适的,这种大规模计算也是基础中的基础。

    含义二:为外界提供大规模分布式集群计算服务。我想多数人比较兴奋的应该是这一点吧。这被认为是一种具有革命性的技术服务形态。于是各种各样的网络应用,都被套上了“云计算”的帽子。我知道有很多原先的客户端应用,被弄成web apps后,也宣称“云计算”了。如果是这样的话,那么126的电子邮局,早就是云计算应用了。首先,它要处理海量数据吧?其次,它对外提供服务吧?我这么一说,是不是扫很多人的兴呢?

    其实按我所理解的“云计算”服务,我来举个例子。以搜索引擎而言,搜索日志是一个巨大无比的,但价值极高的东西。但是,并不是谁都可以开发一个脚本,就到数万G的数据中挖出想要的东西的,即使他写的代码效率足够高,也没有运算资源供他使用。于是,如果有人将这些数据归拢起来,建立索引,标准化的查询接口,以及足够的硬件运算支撑,使得其他人通过提交简单的脚本,就能快速run出他想要的数据,这就是典型的“云计算”了。我估计主流的搜索引擎公司都会有这个“云”服务,只是面向的不是公众,而只是公司内部的需求。

    面向社会公众的类似“云”服务?我还没看到过很典型的。如果有谁知道,也可以知会一下。只是不用跟我提web apps了,比如 web photo editor,web office 等等。如果你愿意跟风叫他“云计算”,我也不反对。只是这样的话,对“云计算”这个简洁而高级的新名词,就多少有点委屈意味了。

    那么,什么是框计算呢?

    其实百度提出的框计算,也不是从石头缝里蹦出来的。一切都是水到渠成的。水是什么呢?阿拉丁。阿拉丁关注的东西,仍是搜索引擎领域的“资源整合”;而框计算关注的东西,把搜索引擎也给“框”进去了,除了搜索引擎之外,还有其他的各类应用。这就是框计算和阿拉丁的关联和区别的地方。

    既然框后面有无数应用都ready了,那么“框”的工作重点,主要就是两个了:

    1,搞明白用户到底想要啥
2,提供开放机制,供各类应用和框进行低成本的对接

    这东东听上去很“简单”啊,为什么不是其他公司做,而是由搜索引擎公司来做?很简单,搜索引擎作为信息获取的入口点,汇天下网民之需求,是最有资质干这事儿的。

    所以,云计算和框计算其实谈不上啥啥PK,根本是两种不同角度的思考方式。前者聚焦于“计算”,将自己的计算能力share出来,为他人服务;后者聚焦于“需求”,利用自己的优势,计算出用户真正之所需,并为用户提供恰当的解决方案。

同分类推荐文章

  1. 等了十年的 Go 链式管道,终于来了:seq 让你像写 Scala 一样写 Go (2026-06-25 18:38:18)
  2. Go 实验特性详解 (2026-06-21 10:05:27)
  3. amd64 微架构级别对 Go 程序性能提升多少? (2026-06-21 09:38:49)

查看更多 后端 文章 →

建议继续学习

  1. 如何成为OpenStack工程师 (累计阅读 15,958)
  2. MacBook Air与工作效率 (累计阅读 10,663)
  3. 马化腾李彦宏马云首次对话:一小时掌声不断 (累计阅读 5,799)
  4. 浅析PageRank算法 (累计阅读 5,375)
  5. 15年运维经验老兵对公有云的深度剖析 (累计阅读 4,695)
  6. 阿里巴巴集团去IOE运动的思考与总结 (累计阅读 4,591)
  7. 做云这三年 (累计阅读 4,560)
  8. 七年工作,几个故事 (累计阅读 4,358)
  9. 一个开发眼中的运维 (累计阅读 4,332)
  10. 关于音乐搜索 (累计阅读 3,853)