IT技术博客大学习 共学习 共进步
全部 移动开发 后端 数据库 AI 算法 安全 DevOps 前端 设计 开发者

用户的地图需求分析

搜索研发部官方博客 2011-06-21 13:44:50 累计浏览 3,675 次
本机暂存

     什么是地图需求

     用户通常会在搜索引擎中搜索很多与地图产品相关的词,如:北京地图,百度大厦怎么走,北京333路公交车等等,这些具有地域特征,并且适合用地图来满足的词都可以算用户地图需求。这类需求在大搜索结果中给予展现,相对传统的文字方式更能直观地满足用户的需求。

    目前百度的地图需求主要可以大致归结成以下四大类:

    1. 精确需求

    包括:精确POI点、精确寻址需求、道路、门址。

    这类需求地点明确唯一,结果如下:

原图已失效

    2. 泛需求

这类需求地点不唯一,通常一个城市内有多个地点,如:
原图已失效

    3. 行政区

    主要是一些省、地级市、县等的区域查询需求,如:

原图已失效

    4. 交通路线

    交通路线包括二类:公交路线和出行方案。如下:

原图已失效
原图已失效
原图已失效

    二 百度框计算如何来满足地图类需求

     框计算的需求满足是一整套流程,包括需求识别、需求分发、后端海量数据检索、结果展现等流程,这里主要介绍地图需求识别的过程。

    1. 地图需求识别数据的来源

    1) 用户平时的检索行为:日常用户在搜索一些和地图需求相关的词时,如果没有在普通的大搜索结果中得到满足,通常会转向地图频道,或者更改查询词进一步搜索,或者点击一些地图网站进一步进行检索,这种用户行为的统计数据非常有用,大量的数据能够排除一些噪音干扰,使得结果十分准确。

    2) 地图频道的用户搜索日志:在普通网页中搜索的日志通常包含各种需求,但是在地图频道中的日志则相对更加纯净,因为用户的目的更加明确,所输入的查询串也更加精确。

    3) 专业生活类网站的定向挖掘:这类网站通常是人工整理好的,与人们日常生活息息相关的类别,这些数据更能反映出人们日常的需求,通过抓取、分析、提取出有用字段,也是地图数据的来源。

    4) 百度知道问题:用户会在百度知道中问一下,比如:北京海淀区哪里有桌游店。通过一些数据挖掘的手段,我们也能从人们日常的提问中挖掘出桌游店相关的信息来。

    2. 数据的挖掘与学习

    有了以上这些数据,我们通过各种方法进行统计、分析、抽取、去除掉杂质,保留地图相关的特征,形成词典。如:肯德基、公交查询等等特征词,作为后续识别的依据。我们还进行用户表述方式的挖掘,通常来说,用户在搜索中使用的模式十分有限,很容易穷举出热门、常见的模式来。我们根据日志挖掘、总结出相应的模式。

    另外,我们使用了目前比较热门的基于序列化特征的条件随机场模型(CRF)进行自学习,从用户行为中学习出用户的表述方式及特征来,这种基于统计的模型对结构化明显的数据来说被证明具有很好地泛化能力,能够很好地预测一些新的表述方式。

    3. 自动需求识别

    百度每天要接受亿级别的请求,这些请求不可能通过人工的方式来处理,在已有挖掘出来数据的基础上,进行自动化识别,把地图需求相关的查询词找出来,分发到相关的应用来处理,从而更好地满足用户。

    地图需求目前主要结合用户表述方式和词典来进行自动化识别,对于一些不可穷举的情况,如机构名识别,则使用基于序列化的统计需求识别模型―-CRF模型来识别,线下自动训练模型,学习用户数据,线上进行实时识别,能够很好地预见一些未登入数据,从而提高需求识别的召回率。

    通过基于规则与统计相结合的方法,目前百度的地图需求识别已经能够在保证很高的准确率的情况下,满足大部分用户需求,而且这个过程都是在完全自动化的方法下进行,完全没有人工参与的成分。

     百度地图需求识别的未来

    随着生活类搜索的流行,人们越来越多地关注身边的一些日常生活信息,如:租房、餐饮、4s店等等。将来的地图产品将越来越接近人们的生活,更加实时地反应出人们周围的变化,以更好地满足人们的日常需求。

同分类推荐文章

  1. 如何写好设计文档? (2026-06-23 08:00:00)
  2. Designing With Uncertainty: How AI Supercharges Probabilistic Thinking (2026-06-16 23:00:00)
  3. The Benefits Of Cognitive Inclusion In UX Research (2026-06-10 18:00:00)

查看更多 设计 文章 →

建议继续学习

  1. 120个优秀的水平导航设计 (累计阅读 75,624)
  2. 流程管理与用户研究 (累计阅读 17,052)
  3. 我的 Sublime Text 2 笔记 (累计阅读 16,728)
  4. 越简单越丰富――极简网页设计视觉呈现技巧 (累计阅读 11,597)
  5. 看看各个网站的404错误处理 (累计阅读 10,208)
  6. 为什么现在那么多人应聘产品经理岗位? (累计阅读 8,349)
  7. 视觉设计前瞻实用性研究(PNVD) 第五期 (累计阅读 7,197)
  8. 视觉注意力―解剖设计的根源 (累计阅读 6,969)
  9. 给想转行做产品经理的同学 (累计阅读 6,927)
  10. 可用性测试好助手——Morae软件的应用 (累计阅读 6,779)