框计算垂直搜索之统计篇
在信息高速增长的时代,生活变得越来越简单。随便百度一下,都会有很多的结果。现在让我们困惑的不再是没有选择,而是在浩瀚的信息世界里茫然不知所措。如何能更准确更迅速的找到想要的答案,已经变得非常的重要和急迫。这个时候,如果有一个好的分类和统计信息摆在面前,相信很多人都会笑的乐开怀。
下面介绍一个简单的分类系统,希望能抛砖引玉,大家畅所欲言吧
1 合理的分类体系
要想有一个理想和有效的统计结果,就必须有一个完善合理的分类体系。这个体系不能太大,太大就失去了分类的意义,也不能过于精简,否则就让我们得不到想要的信息。别拿豆包不当干粮,村长也是干部,如何把握和拿捏,需要实践和用户的检验。
2 对数据加以分类
有了一个好的分类,并不是万能的。如何把每个产品放到合适的分类里也是一门学问。一般一个鸡蛋放到一个篮子里我们都习以为常,但有的偏偏同时属于多个分类,就像一个人既是男人,又是父亲一样,我们也要坦然面对。
3 对结果进行统计
既然每个数据都有了自己的归属,那我们就要开始对海量的信息进行归类和统计了。既然每个数据都要参与,那么我们就要一次把活干完,就像人口普查一样,一次把信息都统计到位,否则隔几天查一下籍贯,又隔几天查一下年龄,又隔几天查一下配偶,于己于人,都不是什么好事。
4 统计信息的封装
有了统计结果,如何更快的传递给别人,如何以更简洁易懂的语言表达,变成了一个摆在面前的任务。如果只有一个分类,大家都可以轻松应对,如果多个分类,每个分类又有子分类,可能略加思考,也能想出结果。但如果每个子分类里又有子分类,子分类里还有子分类,我们又当如何?所以这个时候不能图一时简单,不看将来,做就做得彻底一点,兵来将挡,水来土掩,万事都要未雨绸缪,方才能临危不变,笑傲明天。
5 展示结果
万事俱备,只欠东风。货都备好了,如果不能友好的展现出来,也是竹篮子打水一场空。不是每一颗人参都能光宗耀祖,也有的还像萝卜一样流浪凡间。如何包装自己,如何让人更舒适的得到信息,变得尤为重要。
以上只是对于统计和分类的一个十分简单的理解,要想做好,还有很多的细节要去思考,有很多技术要去攻关,不管多难多险,勇于尝试,勇于进取,才是生存之道。
建议继续学习:
- 获取指定(访客)IP的所有信息,地址、邮政编码、国家、经纬度等的API (阅读:5408)
- 整合搜索,阿拉丁,云计算,以及框计算 (阅读:3489)
- 统计指标和术语汇总 (阅读:2730)
- 如何确定抽样统计的最小样本量 (阅读:2468)
- 统计数据背后的真相 ― 读《How to lie with statistics》 (阅读:2243)
- 我们需要什么样的网站数据 (阅读:2257)
- 框计算垂直搜索之索引篇 (阅读:2140)
- 关于绘制统计曲线算法的一些思考 (阅读:1865)
- 框计算精确搜索之架构篇 (阅读:1850)
- “破网”利器一箩筐——移动互联网分析工具推荐 (阅读:1784)
扫一扫订阅我的微信号:IT技术博客大学习
- 作者:editor 来源: 搜索研发部官方博客
- 标签: 框计算 统计
- 发布时间:2011-06-21 13:39:11
- [68] Twitter/微博客的学习摘要
- [67] IOS安全–浅谈关于IOS加固的几种方法
- [65] 如何拿下简短的域名
- [65] android 开发入门
- [63] find命令的一点注意事项
- [61] Go Reflect 性能
- [60] 流程管理与用户研究
- [59] Oracle MTS模式下 进程地址与会话信
- [58] 图书馆的世界纪录
- [57] 读书笔记-壹百度:百度十年千倍的29条法则