用户的地图需求分析
用户通常会在搜索引擎中搜索很多与地图产品相关的词,如:北京地图,百度大厦怎么走,北京333路公交车等等,这些具有地域特征,并且适合用地图来满足的词都可以算用户地图需求。这类需求在大搜索结果中给予展现,相对传统的文字方式更能直观地满足用户的需求。
目前百度的地图需求主要可以大致归结成以下四大类:
1. 精确需求
包括:精确POI点、精确寻址需求、道路、门址。
这类需求地点明确唯一,结果如下:
2. 泛需求
4. 交通路线
交通路线包括二类:公交路线和出行方案。如下:
二 百度框计算如何来满足地图类需求
框计算的需求满足是一整套流程,包括需求识别、需求分发、后端海量数据检索、结果展现等流程,这里主要介绍地图需求识别的过程。
1. 地图需求识别数据的来源
1) 用户平时的检索行为:日常用户在搜索一些和地图需求相关的词时,如果没有在普通的大搜索结果中得到满足,通常会转向地图频道,或者更改查询词进一步搜索,或者点击一些地图网站进一步进行检索,这种用户行为的统计数据非常有用,大量的数据能够排除一些噪音干扰,使得结果十分准确。
2) 地图频道的用户搜索日志:在普通网页中搜索的日志通常包含各种需求,但是在地图频道中的日志则相对更加纯净,因为用户的目的更加明确,所输入的查询串也更加精确。
3) 专业生活类网站的定向挖掘:这类网站通常是人工整理好的,与人们日常生活息息相关的类别,这些数据更能反映出人们日常的需求,通过抓取、分析、提取出有用字段,也是地图数据的来源。
4) 百度知道问题:用户会在百度知道中问一下,比如:北京海淀区哪里有桌游店。通过一些数据挖掘的手段,我们也能从人们日常的提问中挖掘出桌游店相关的信息来。
2. 数据的挖掘与学习
有了以上这些数据,我们通过各种方法进行统计、分析、抽取、去除掉杂质,保留地图相关的特征,形成词典。如:肯德基、公交查询等等特征词,作为后续识别的依据。我们还进行用户表述方式的挖掘,通常来说,用户在搜索中使用的模式十分有限,很容易穷举出热门、常见的模式来。我们根据日志挖掘、总结出相应的模式。
另外,我们使用了目前比较热门的基于序列化特征的条件随机场模型(CRF)进行自学习,从用户行为中学习出用户的表述方式及特征来,这种基于统计的模型对结构化明显的数据来说被证明具有很好地泛化能力,能够很好地预测一些新的表述方式。
3. 自动需求识别
百度每天要接受亿级别的请求,这些请求不可能通过人工的方式来处理,在已有挖掘出来数据的基础上,进行自动化识别,把地图需求相关的查询词找出来,分发到相关的应用来处理,从而更好地满足用户。
地图需求目前主要结合用户表述方式和词典来进行自动化识别,对于一些不可穷举的情况,如机构名识别,则使用基于序列化的统计需求识别模型―-CRF模型来识别,线下自动训练模型,学习用户数据,线上进行实时识别,能够很好地预见一些未登入数据,从而提高需求识别的召回率。
通过基于规则与统计相结合的方法,目前百度的地图需求识别已经能够在保证很高的准确率的情况下,满足大部分用户需求,而且这个过程都是在完全自动化的方法下进行,完全没有人工参与的成分。
三 百度地图需求识别的未来
随着生活类搜索的流行,人们越来越多地关注身边的一些日常生活信息,如:租房、餐饮、4s店等等。将来的地图产品将越来越接近人们的生活,更加实时地反应出人们周围的变化,以更好地满足人们的日常需求。
建议继续学习:
- 不懂技术的人不要对懂技术的人说这很容易实现 (阅读:4413)
- 关于架构的一句话,还有一个实例 (阅读:3578)
- 用Unix的设计思想来应对多变的需求 (阅读:3583)
- 需求评审与讨论问题的基本方式 (阅读:2940)
- 百度PM万维雅:需求把握和正确决策 (阅读:2695)
- 如何准确看清用户需求? (阅读:2557)
- 如何媒体正确的看待:产品需求文档和产品需求 (阅读:2245)
- 姐要的视频广告 (阅读:2242)
- 分析用户需求:在场景中寻找“痛点” (阅读:2051)
- 需求变化与IoC (阅读:2004)
扫一扫订阅我的微信号:IT技术博客大学习
- 作者:editor 来源: 搜索研发部官方博客
- 标签: 需求
- 发布时间:2011-06-21 13:44:50
- [66] Oracle MTS模式下 进程地址与会话信
- [66] Go Reflect 性能
- [65] 如何拿下简短的域名
- [59] android 开发入门
- [59] 图书馆的世界纪录
- [59] IOS安全–浅谈关于IOS加固的几种方法
- [58] 【社会化设计】自我(self)部分――欢迎区
- [53] 视觉调整-设计师 vs. 逻辑
- [47] 界面设计速成
- [46] 读书笔记-壹百度:百度十年千倍的29条法则