技术头条 - 一个快速在微博传播文章的方式     搜索本站
您现在的位置首页 --> 互联网 --> 整合搜索,阿拉丁,云计算,以及框计算

整合搜索,阿拉丁,云计算,以及框计算

浏览:3058次  出处信息

    纯属民间解释,如能给感兴趣的兄弟解解惑,就达到目的了。

    整合搜索(或者叫通用搜索吧),是这样一种思路:用户没必要记住每一个具有独特价值的搜索入口(实际上能记住的也极有限),而且切换成本也太高,搜索引擎应该自然而然的把合适的数据资源整合到一个入口中,当用户需要的时候,它就自动的跳出来。例如:

    百度搜“racer翻译”,第一个结果是:

    racer翻译―百度词典
racer 【音标】:['reisə] 【词典解释】:名词 n. 1. 赛跑者 2. 比赛用的汽车(或游艇、马、自行车、飞机等);
dict.baidu.com/s?wd=racer 2009-08-25

    百度搜“racer”,这个结果也有,但是跑到第六位去了。为什么呢?因为用户搜索这个词,主要的需求不是看简单的翻译。

    如果要安个帽子,那么这个就是“整合搜索”。只是百度并不满足于仅仅实现这个效果,所以找了个新名字,叫“阿拉丁”,显出有更大的野心。那么阿拉丁和整合搜索的差别在哪里呢?差别就在于,阿拉丁是开放式的,而无论是通用搜索也好,整合搜索也好,都是不开放的。比如”人民币汇率“。它是资源拥有方自己插进去的结果。

    很多兄弟说,开放有啥稀奇啊,这年头开放平台多了去了,firefox有开放插件,iphone有开放商店,facebook有开放应用。这是表象。但本质上是有区别的。这些开放平台,更多意义上,是一种众人拾柴式的”存储“。我只要按照标准接口形式开发完了,往平台上一搁,就等着其他用户来挑选应用了。平台方需要做的事情,最主要是存储,然后可能提供一些找到这些应用的简单检索服务。而搜索引擎的开放,大致有四个难点:

    1,资源质量的验证和监控
2,和既有搜索系统的整合
3,和需求契合的排序位置
4,和需求契合的展现形态

    所以,搜索开放平台也有一点“存储”的意味,但很小。和其他平台最主要的技术差别,在于上述四点。这四个问题解决起来很容易么?对搜索引擎架构略有了解的兄弟,应该知道其困难处。

    接下来说云计算。云计算按我的说法,可能叫“晕计算”更合适,因为很多喜欢把它挂在嘴上的兄弟,对于什么是云计算,并不见得很清楚。

    按流行的说法,云计算大概有两个含义:

    含义一:大规模分布式集群计算。从这个意义上来说,云计算只是一个换了个新瓶子的老概念。其实任何一个搜索引擎公司,这点是最起码的技术。否则几百亿网页的超链提取和计算,怎么玩呢?丢进去一个关键词,在如此庞大的索引中快速找出合适的,这种大规模计算也是基础中的基础。

    含义二:为外界提供大规模分布式集群计算服务。我想多数人比较兴奋的应该是这一点吧。这被认为是一种具有革命性的技术服务形态。于是各种各样的网络应用,都被套上了“云计算”的帽子。我知道有很多原先的客户端应用,被弄成web apps后,也宣称“云计算”了。如果是这样的话,那么126的电子邮局,早就是云计算应用了。首先,它要处理海量数据吧?其次,它对外提供服务吧?我这么一说,是不是扫很多人的兴呢?

    其实按我所理解的“云计算”服务,我来举个例子。以搜索引擎而言,搜索日志是一个巨大无比的,但价值极高的东西。但是,并不是谁都可以开发一个脚本,就到数万G的数据中挖出想要的东西的,即使他写的代码效率足够高,也没有运算资源供他使用。于是,如果有人将这些数据归拢起来,建立索引,标准化的查询接口,以及足够的硬件运算支撑,使得其他人通过提交简单的脚本,就能快速run出他想要的数据,这就是典型的“云计算”了。我估计主流的搜索引擎公司都会有这个“云”服务,只是面向的不是公众,而只是公司内部的需求。

    面向社会公众的类似“云”服务?我还没看到过很典型的。如果有谁知道,也可以知会一下。只是不用跟我提web apps了,比如 web photo editor,web office 等等。如果你愿意跟风叫他“云计算”,我也不反对。只是这样的话,对“云计算”这个简洁而高级的新名词,就多少有点委屈意味了。

    那么,什么是框计算呢?

    其实百度提出的框计算,也不是从石头缝里蹦出来的。一切都是水到渠成的。水是什么呢?阿拉丁。阿拉丁关注的东西,仍是搜索引擎领域的“资源整合”;而框计算关注的东西,把搜索引擎也给“框”进去了,除了搜索引擎之外,还有其他的各类应用。这就是框计算和阿拉丁的关联和区别的地方。

    既然框后面有无数应用都ready了,那么“框”的工作重点,主要就是两个了:

    1,搞明白用户到底想要啥
2,提供开放机制,供各类应用和框进行低成本的对接

    这东东听上去很“简单”啊,为什么不是其他公司做,而是由搜索引擎公司来做?很简单,搜索引擎作为信息获取的入口点,汇天下网民之需求,是最有资质干这事儿的。

    所以,云计算和框计算其实谈不上啥啥PK,根本是两种不同角度的思考方式。前者聚焦于“计算”,将自己的计算能力share出来,为他人服务;后者聚焦于“需求”,利用自己的优势,计算出用户真正之所需,并为用户提供恰当的解决方案。

建议继续学习:

  1. 怎样用好Google进行搜索    (阅读:14397)
  2. 读书笔记-壹百度:百度十年千倍的29条法则    (阅读:8717)
  3. 淘宝搜索:定向抓取网页技术漫谈    (阅读:8033)
  4. 百度日本-四面楚歌    (阅读:6172)
  5. 手机产品设计方向    (阅读:5906)
  6. 简析搜索引擎中网络爬虫的搜索策略    (阅读:5659)
  7. 在百度的第一年    (阅读:5157)
  8. 几种常见的基于Lucene的开源搜索解决方案对比    (阅读:4487)
  9. 马化腾李彦宏马云首次对话:一小时掌声不断    (阅读:4393)
  10. 用Sphinx快速搭建站内搜索功能    (阅读:4253)
QQ技术交流群:445447336,欢迎加入!
扫一扫订阅我的微信号:IT技术博客大学习
后一篇:联网的剪切板 >>
© 2009 - 2024 by blogread.cn 微博:@IT技术博客大学习

京ICP备15002552号-1