IT技术博客大学习 共学习 共进步

百度解构第一季 - 理解用户搜索行为

caoz的和谐blog 2012-01-03 23:35:01 浏览 3,061 次

    前言:

     为防止断章取义,曲解个人本意,谢绝一切转载,如果您觉得此文值得分享,请把本文url分享,多谢。

    缘起:

     2011年8月18日凌晨,我在新浪微博放了第一炮

     搜索引擎有三面,百度人看到的;架构,逻辑。站长和营销人员看到的,流量和转化率;普通网民看到的,体验和目标;百度人自认为能看到第三面,但很遗憾,太多毕业后只在百度工作的小盆友,他们和社会是脱节的,并不真的理解普通网民的搜索体验。能把三面看透并说清楚的,视野所及只我一人。

    简单解读:

     其实搜索达人,在任何视角和领域达到登峰造极的地步,都可以取得十分卓越的成就,而在单一领域内比caoz精深者,俯拾皆是,这点自知之明还是有的,但是我敢夸下海口,基于两点。

     第一:因缘际会,我先后跟 搜索9238,zwang,黑苹果 这三位在各自领域内对搜索引擎的认识登峰造极的人物 学到了不少东西,外加夏天天,jeffwu等朋友们的不断指点, 乃至汪华老师及相当多各自领域内专家的培训讲座,从深度说尚有不足,从广度说确实敢讲自己已经独一无二。

     第二:曾经至少有两年时间,我所掌握的关于搜索的数据(用户行为的和商业相关的)是国内最全的,最完整的,没有之一,而且我知道怎么去分析和处理这些数据。

     放炮的目的是什么,因为我觉得,百度的一些小盆友们需要敲打,他们也许在单一领域内研究的比较深入了,但是换个视角,他们往往是一无所知的菜鸟;很可惜,他们中的很多人,从来没换过视角,却自以为很全面。百度员工视野狭窄的问题,我和solaryf私下沟通过,solaryf 也承认了(这是目前百度最懂搜索的人,如果你是百度员工,别说你不知道),他认为,处于某个level之上,是能够清醒的认识自己不足的,但是目前,处于这个level之上的百度员工,貌似不多。 

     说这些都是虚的,怎么听都像忽悠,所以下面来点实在的,证明一下。

    挑战:

     8月18日中午,我发了第二个微博,来验证百度小盆友们的搜索认知能力,这一炸,还真炸出来不少好玩的。挑战如下: 2011年8月17日百度指数最高的词是哪一个? 为什么? 如果你碰巧去看了百度风云榜,那么风云榜热门搜索第一“优酷”的实际指数排名应该是第几?

     这个微博的评论很值得看,有些不错的回复还是很用心的 http://weibo.com/1495169251/xk1dN1M2k 。当然,你也能看到一些这样的人,他们不敢直面问题,却要跳出来喊别人不懂,我知道其中一些人是谁,更证明了这次挑战的必要性,百度确乎存在这样的小盆友,狭隘而又自以为是。也确乎如solaryf所言,在某个level之上的百度员工,其实还是能客观的面对问题,给出相对专业的分析解读。

    答案:

     8月19日,我放出了第一波答案 排第一的,是4399小游戏 ,此外QQ空间,淘宝网,7k7k小游戏,新浪微博 都在优酷的前面。可能还有疏漏。...都是目标寻址搜索。 然后,我给出了提示,用户搜淘宝而不是购物,搜4399而不是小游戏,搜优酷而不是视频,这意味着什么。

     好吧,我承认这里有个邪恶的目的,就是我所在职的 4399小游戏,是实质上百度网民搜索最多的词,刺激一下大众,别小看这玩意。

     我不知道百度的小盆友们思考了没有,下面,是真正的答案。

     蔡文胜说,品牌很重要,那么品牌是什么?是用户的信任与依赖。而互联网品牌,用户的信任与依赖从何而来?专业的服务与运营。

    听上去是废话,下面实例说话

    实例1:

     http://index.baidu.com/main/word.php?word=%D0%A1%D3%CE%CF%B7%2C4399%2B4399%D0%A1%D3%CE%CF%B7

    时间轴拉长,

    2007年,小游戏的指数是11万,比4399+4399小游戏的指数高1倍

    2008年,小游戏的指数增长到20万,但是4399+4399小游戏的指数达到了同样的高度。

    2009年,小游戏指数摸高后下滑,4399+4399小游戏的指数 超过小游戏指数一倍。

    2010年,小游戏指数略有上升,4399+4399小游戏的指数超过小游戏指数接近2倍。

    2011年,到现在 ,这个差距达到了4倍。

    07年到现在,4399+4399小游戏 指数涨了30倍。而小游戏指数只涨了2-3倍

    为什么2009年我义无反顾的投奔4399,并不是因为挖角或者其他多么好的待遇条件,而是因为我看到了这样的趋势,2009年,你看到了什么?

    同理,“购物” 的百度指数 从2007年到现在,是每况愈下的,而淘宝+淘宝网的百度指数,却屡创新高。4年时间涨了10倍。

    同理,“视频” 的百度指数 从2007年到现在,是下降的,而优酷的指数,涨了5倍以上

    同理, “招聘+招聘网”,对比“智联招聘+智联招聘网”

    同理,“旅游”,对比“携程+携程网”

    你明白了吗?你真的明白了吗? 从07年到现在,用户搜索习惯发生了怎样深刻的改变,对百度产生了怎样深刻的影响。按照我上面的思路全部对比一遍,对于竞价排名,这意味着什么;对于品牌专区这意味着什么,对于凤巢这意味着什么;对于阿拉丁又意味着什么!

    寻址搜索一向是搜索用户的主要搜索方式,这没错,但是这一趋势是怎样的,baiduer你们真的跟踪和关注了吗?当年我做了分析,跟踪这样的数据跟踪了最少两年,不知道现在百度还有没有人看。

    实例2:

    爆个大料

    2008年奥运会,新浪乐翻天,腾讯乐翻天,搜狐乐翻天,连网易都很哈皮的看到了流量和广告收入的增长;百度也趁此机会推出了奥运频道,但是很可惜的是,很可惜很可惜的是,奥运期间,百度整体流量是下降的;百度奥运频道让信心满满的广告主极度失望,百度财报还要解释因奥运对流量和收入的不良影响;这说明了什么?

    专业性!你做搜索再专业,你做媒体不专业。

    实例3:

    连衣裙这个词的指数,还不错,07年到现在,还是有增长的;但是同期,在淘宝的搜索量变化如何?目前,在淘宝上一天搜索这个词的人比百度多多少倍?

    百度做有啊的时候,是有数据做基础的,我们有多少搜索词是购物相关,有多少用户通过这些搜索词进入了淘宝,有多少用户通过百度为入口进行网络购物,这数据都没错,但是淘宝和百度闹翻后,结果发生了什么?用户都去搜淘宝了。

    百度有啊的最大失败,并不是一个产品的失败,而是百度丧失了用户将其作为购物搜索入口的信任感。这个损失,百度反省过吗?

    实例4:

    回到小游戏上,上次百度大会,李彦宏用“坦克大战”来作为阿拉丁计划的典范,我就说了百度不专业,这个搜索词,从相关词分析,从自然结果序,我们都能得到明确的结论,这是一个典型的两分搜索,一部分人是玩小游戏坦克大战,一部分人是玩联机游戏坦克大战;所以正确的自然结果,应该兼顾两部分用户的搜索需求,但是为了体现阿拉丁的优越性,他们用小游戏填满了第一屏,这是对用户体验的尊重吗?这是理解搜索体验的表现吗?

    当百度以这样的思路强推他们自以为优化用户体验的搜索结果,用户用鼠标给予了更加明确的回应,用数据说话就是,寻址搜索的比例越来越高,越来越高。所以当百度用小游戏这个热门搜索词再次去强调他们阿拉丁平台的优越性的时候,他们似乎没注意到,更多更多的用户去搜索4399小游戏了。

    实例5:

    感谢新浪用户 ck201010 的提示,增补一个实例,就是淘宝和百度的用户搜索习惯对比。

    我相信大家都有这样的习惯, 在淘宝,你想买鞋,你会搜 男鞋,女鞋,运动鞋,也许你还会搜耐克,匹克,但你很少会去搜名鞋库这样的词,尽管他们的生意最大,做的最好;这在淘宝的热榜上是很清楚的;但是在百度,看一下乐淘,好乐买的指数变化。用户不会直接搜索鞋品,而是会搜索经销商。

    再比如,一个优秀的品牌,比如iphone,在淘宝是个热门词,但是用户并不会去搜,是谁在卖iphone。可是在百度,我们拿出一个范例,弹弹堂,一个优秀的游戏,有很多平台在运营,类似于很多商家卖iphone, 但是用户越来越多的搜索,4399弹弹堂。比较一下这两个词的指数变化趋势,再比较一下这两个词的自然搜索结果。4399弹弹堂是不是最符合用户搜索“弹弹堂”目标呢?从百度自然搜索结果中你能看出来。占据了自然搜索结果的第一名和第二名;百度完全知道这个事实,但是你再看这个搜索结果页的表现,就能明白用户所遇到的挣扎,和为什么更多的去搜索4399弹弹堂。

    实例6:

    感谢这份评论 http://hi.baidu.com/stonewang/blog/item/9b039245a3022825879473c1.html 

    虽然他的观点是 谷歌同样存在寻址搜索加剧的现象,但是数据对比还是很值得看一下,我个人认为,仍然可以作为我的论点的佐证。

    谷歌所存在的这一现象,无论是横向比较(当前谷歌搜索品牌词和行业词的差距,与百度的对比);还是纵向比较(谷歌这些年来相关趋势的发展速度,与百度的对比),都更加证明了,百度用户在加剧转向寻址化搜索,也就是我下文所提到的,百度用户所面临的挣扎。

    具体数据对比,请猛击上面的链接。

    实例7:

    8月23日,加一个有意思的搜索行为特征,百度用户搜索一个词的时候,习惯加上“官网”的后缀,而谷歌用户,这个习惯并不强烈。

    典型范例有“cf”,“dnf”,“小米手机”,“神仙道” 等等,俯拾皆是。

    用户为什么要搜“官网”,虽说有搜索词sugest的作用,但是不是也是面对搜索结果的一种无奈表达呢?

    solaryf 说过一句很经典的话,我也会一直强调,理解用户的挣扎。怎么理解?

    你去看指数,当百度越发按照自己的意图去打造全球最牛x的站内搜索的时候,用户越发通过寻址搜索的方式挣扎着跑出去,你看到了吗?你真的看到了吗?你还在麻痹自己吗?

    你真认为调整了算法和增加了展现形式,就比专业运营平台更懂用户了?拜托,做自己最擅长的事情,更专注于搜索本身,希望李彦宏能反思一下。

建议继续学习

  1. 怎样用好Google进行搜索 (阅读 15,661)
  2. 淘宝搜索:定向抓取网页技术漫谈 (阅读 9,360)
  3. 简析搜索引擎中网络爬虫的搜索策略 (阅读 7,280)
  4. 几种常见的基于Lucene的开源搜索解决方案对比 (阅读 5,980)
  5. 基于用户行为分析的搜索引擎自动性能评价 (阅读 5,600)
  6. 百度搜索URL参数解析 (阅读 5,581)
  7. 用Sphinx快速搭建站内搜索功能 (阅读 5,562)
  8. Xapian搜索体系结构 (阅读 5,160)
  9. 附近地点搜索初探 (阅读 5,140)
  10. 互联网网站的反爬虫策略浅析 (阅读 5,040)