整合搜索,阿拉丁,云计算,以及框计算
纯属民间解释,如能给感兴趣的兄弟解解惑,就达到目的了。
整合搜索(或者叫通用搜索吧),是这样一种思路:用户没必要记住每一个具有独特价值的搜索入口(实际上能记住的也极有限),而且切换成本也太高,搜索引擎应该自然而然的把合适的数据资源整合到一个入口中,当用户需要的时候,它就自动的跳出来。例如:
百度搜“racer翻译”,第一个结果是:
racer翻译―百度词典
racer 【音标】:['reisə] 【词典解释】:名词 n. 1. 赛跑者 2. 比赛用的汽车(或游艇、马、自行车、飞机等);
dict.baidu.com/s?wd=racer 2009-08-25
百度搜“racer”,这个结果也有,但是跑到第六位去了。为什么呢?因为用户搜索这个词,主要的需求不是看简单的翻译。
如果要安个帽子,那么这个就是“整合搜索”。只是百度并不满足于仅仅实现这个效果,所以找了个新名字,叫“阿拉丁”,显出有更大的野心。那么阿拉丁和整合搜索的差别在哪里呢?差别就在于,阿拉丁是开放式的,而无论是通用搜索也好,整合搜索也好,都是不开放的。比如”人民币汇率“。它是资源拥有方自己插进去的结果。
很多兄弟说,开放有啥稀奇啊,这年头开放平台多了去了,firefox有开放插件,iphone有开放商店,facebook有开放应用。这是表象。但本质上是有区别的。这些开放平台,更多意义上,是一种众人拾柴式的”存储“。我只要按照标准接口形式开发完了,往平台上一搁,就等着其他用户来挑选应用了。平台方需要做的事情,最主要是存储,然后可能提供一些找到这些应用的简单检索服务。而搜索引擎的开放,大致有四个难点:
1,资源质量的验证和监控
2,和既有搜索系统的整合
3,和需求契合的排序位置
4,和需求契合的展现形态
所以,搜索开放平台也有一点“存储”的意味,但很小。和其他平台最主要的技术差别,在于上述四点。这四个问题解决起来很容易么?对搜索引擎架构略有了解的兄弟,应该知道其困难处。
接下来说云计算。云计算按我的说法,可能叫“晕计算”更合适,因为很多喜欢把它挂在嘴上的兄弟,对于什么是云计算,并不见得很清楚。
按流行的说法,云计算大概有两个含义:
含义一:大规模分布式集群计算。从这个意义上来说,云计算只是一个换了个新瓶子的老概念。其实任何一个搜索引擎公司,这点是最起码的技术。否则几百亿网页的超链提取和计算,怎么玩呢?丢进去一个关键词,在如此庞大的索引中快速找出合适的,这种大规模计算也是基础中的基础。
含义二:为外界提供大规模分布式集群计算服务。我想多数人比较兴奋的应该是这一点吧。这被认为是一种具有革命性的技术服务形态。于是各种各样的网络应用,都被套上了“云计算”的帽子。我知道有很多原先的客户端应用,被弄成web apps后,也宣称“云计算”了。如果是这样的话,那么126的电子邮局,早就是云计算应用了。首先,它要处理海量数据吧?其次,它对外提供服务吧?我这么一说,是不是扫很多人的兴呢?
其实按我所理解的“云计算”服务,我来举个例子。以搜索引擎而言,搜索日志是一个巨大无比的,但价值极高的东西。但是,并不是谁都可以开发一个脚本,就到数万G的数据中挖出想要的东西的,即使他写的代码效率足够高,也没有运算资源供他使用。于是,如果有人将这些数据归拢起来,建立索引,标准化的查询接口,以及足够的硬件运算支撑,使得其他人通过提交简单的脚本,就能快速run出他想要的数据,这就是典型的“云计算”了。我估计主流的搜索引擎公司都会有这个“云”服务,只是面向的不是公众,而只是公司内部的需求。
面向社会公众的类似“云”服务?我还没看到过很典型的。如果有谁知道,也可以知会一下。只是不用跟我提web apps了,比如 web photo editor,web office 等等。如果你愿意跟风叫他“云计算”,我也不反对。只是这样的话,对“云计算”这个简洁而高级的新名词,就多少有点委屈意味了。
那么,什么是框计算呢?
其实百度提出的框计算,也不是从石头缝里蹦出来的。一切都是水到渠成的。水是什么呢?阿拉丁。阿拉丁关注的东西,仍是搜索引擎领域的“资源整合”;而框计算关注的东西,把搜索引擎也给“框”进去了,除了搜索引擎之外,还有其他的各类应用。这就是框计算和阿拉丁的关联和区别的地方。
既然框后面有无数应用都ready了,那么“框”的工作重点,主要就是两个了:
1,搞明白用户到底想要啥
2,提供开放机制,供各类应用和框进行低成本的对接
这东东听上去很“简单”啊,为什么不是其他公司做,而是由搜索引擎公司来做?很简单,搜索引擎作为信息获取的入口点,汇天下网民之需求,是最有资质干这事儿的。
所以,云计算和框计算其实谈不上啥啥PK,根本是两种不同角度的思考方式。前者聚焦于“计算”,将自己的计算能力share出来,为他人服务;后者聚焦于“需求”,利用自己的优势,计算出用户真正之所需,并为用户提供恰当的解决方案。
建议继续学习:
- 怎样用好Google进行搜索 (阅读:14631)
- 读书笔记-壹百度:百度十年千倍的29条法则 (阅读:11504)
- 淘宝搜索:定向抓取网页技术漫谈 (阅读:8190)
- 百度日本-四面楚歌 (阅读:6435)
- 手机产品设计方向 (阅读:6340)
- 简析搜索引擎中网络爬虫的搜索策略 (阅读:5966)
- 在百度的第一年 (阅读:5337)
- 几种常见的基于Lucene的开源搜索解决方案对比 (阅读:4623)
- 马化腾李彦宏马云首次对话:一小时掌声不断 (阅读:4441)
- 用Sphinx快速搭建站内搜索功能 (阅读:4401)
扫一扫订阅我的微信号:IT技术博客大学习
- 作者:solaryf 来源: 在地铁站
- 标签: 云计算 搜索 框计算 百度 阿拉丁
- 发布时间:2009-11-04 09:23:54
- [67] Oracle MTS模式下 进程地址与会话信
- [65] 如何拿下简短的域名
- [65] Go Reflect 性能
- [59] 图书馆的世界纪录
- [59] 【社会化设计】自我(self)部分――欢迎区
- [59] android 开发入门
- [58] IOS安全–浅谈关于IOS加固的几种方法
- [53] 视觉调整-设计师 vs. 逻辑
- [47] 读书笔记-壹百度:百度十年千倍的29条法则
- [47] 界面设计速成