技术头条 - 一个快速在微博传播文章的方式     搜索本站
您现在的位置首页 --> 算法 --> 框计算垂直搜索之统计篇

框计算垂直搜索之统计篇

浏览:1507次  出处信息

    在信息高速增长的时代,生活变得越来越简单。随便百度一下,都会有很多的结果。现在让我们困惑的不再是没有选择,而是在浩瀚的信息世界里茫然不知所措。如何能更准确更迅速的找到想要的答案,已经变得非常的重要和急迫。这个时候,如果有一个好的分类和统计信息摆在面前,相信很多人都会笑的乐开怀。

    下面介绍一个简单的分类系统,希望能抛砖引玉,大家畅所欲言吧

    1 合理的分类体系

    要想有一个理想和有效的统计结果,就必须有一个完善合理的分类体系。这个体系不能太大,太大就失去了分类的意义,也不能过于精简,否则就让我们得不到想要的信息。别拿豆包不当干粮,村长也是干部,如何把握和拿捏,需要实践和用户的检验。

    2 对数据加以分类

    有了一个好的分类,并不是万能的。如何把每个产品放到合适的分类里也是一门学问。一般一个鸡蛋放到一个篮子里我们都习以为常,但有的偏偏同时属于多个分类,就像一个人既是男人,又是父亲一样,我们也要坦然面对。

    3 对结果进行统计

    既然每个数据都有了自己的归属,那我们就要开始对海量的信息进行归类和统计了。既然每个数据都要参与,那么我们就要一次把活干完,就像人口普查一样,一次把信息都统计到位,否则隔几天查一下籍贯,又隔几天查一下年龄,又隔几天查一下配偶,于己于人,都不是什么好事。

    4 统计信息的封装

    有了统计结果,如何更快的传递给别人,如何以更简洁易懂的语言表达,变成了一个摆在面前的任务。如果只有一个分类,大家都可以轻松应对,如果多个分类,每个分类又有子分类,可能略加思考,也能想出结果。但如果每个子分类里又有子分类,子分类里还有子分类,我们又当如何?所以这个时候不能图一时简单,不看将来,做就做得彻底一点,兵来将挡,水来土掩,万事都要未雨绸缪,方才能临危不变,笑傲明天。

    5 展示结果

    万事俱备,只欠东风。货都备好了,如果不能友好的展现出来,也是竹篮子打水一场空。不是每一颗人参都能光宗耀祖,也有的还像萝卜一样流浪凡间。如何包装自己,如何让人更舒适的得到信息,变得尤为重要。

    以上只是对于统计和分类的一个十分简单的理解,要想做好,还有很多的细节要去思考,有很多技术要去攻关,不管多难多险,勇于尝试,勇于进取,才是生存之道。

建议继续学习:

  1. 获取指定(访客)IP的所有信息,地址、邮政编码、国家、经纬度等的API    (阅读:5227)
  2. 整合搜索,阿拉丁,云计算,以及框计算    (阅读:3062)
  3. 统计指标和术语汇总    (阅读:2653)
  4. 如何确定抽样统计的最小样本量    (阅读:2415)
  5. 统计数据背后的真相 ― 读《How to lie with statistics》    (阅读:2176)
  6. 框计算垂直搜索之索引篇    (阅读:2072)
  7. 我们需要什么样的网站数据    (阅读:1983)
  8. 关于绘制统计曲线算法的一些思考    (阅读:1808)
  9. 框计算精确搜索之架构篇    (阅读:1786)
  10. 百度框计算数据引入方式    (阅读:1550)
QQ技术交流群:445447336,欢迎加入!
扫一扫订阅我的微信号:IT技术博客大学习
© 2009 - 2024 by blogread.cn 微博:@IT技术博客大学习

京ICP备15002552号-1