技术头条 - 一个快速在微博传播文章的方式     搜索本站
您现在的位置首页 --> 系统运维 --> MapR初体验

MapR初体验

浏览:2381次  出处信息

作者:钟龙伟

    一、MapR是什么?

    MapR是MapR Technologies, Inc的一个产品,号称下一代Hadoop,使Hadoop变为一个速度更快、可靠性更高、更易于管理、使用更加方便的分布式计算服务和存储平台,同时性能也不断提高。它将极大的扩大了Hadoop的使用范围和方式。它包含了开源社区的许多流行的工具和功能,例如Hbase、Hive。它还100%和Apache Hadoop的API兼容。它能够为客户节约一半的硬件资源消耗,使更多的组织能够利用海量数据分析的力量提高竞争优势。目前有两个版本,M3和M5,其中M3是免费的,M5为收费版,有试用期。具体功能差别见:http://www.mapr.com/products/mapr-editions.html

    1、MapR的整体结构:

    Mapr架构图

    二、为什么要MapR

    MapR比之其他Hadoop发行版具有三大优越性:EASY、DEPENDABLE、FAST。

    Easy

  • 有强大的管理工具:MapR Control System,方便的查看集群的状态,作业执行情况,各项配置等;
  • Mount Hadoop with Direct Access NFSTM . This allows users to mount the entire Hadoop cluster as an NFS volume . Users can simply browse files, automatically open associated applications with a mouse click, or drag-and-drop files and directories into and out of the cluster. Additionally, standard command-line tools and UNIX applications and utilities (such as Grep, Tar, Sort, or Tail) can be used directly on data in the cluster. With other Hadoop distributions, the user must copy the data out of the cluster in order to use standard tools . 不同于HDFS的一次写入,MapR允许修改、重写文件,可并发读写任一文件。
  • 安装配置简单,完整发布版包括:HBase, Pig, Hive, Mahout, HBase, Cascading, ZooKeeper等。(但其实M3没有默认安装HBase, Pig, Hive, Mahout,需要自己另行安装)
  • 和Hadoop - MapReduce, HDFS ,HBase 100% API兼容。
  •     Dependable:

  • 分布式的NameNode,避免单点失败;(M5才有)
  • 镜像,MapR的镜像让你可以根据你的Recovery Time objectives设定策略,自动镜像你集群内、集群间或者站点间的数据,(M5才有)
  • 快照,采用redirect-on-write技术,速度快,可以设定快照计划或者随机使用快照,操作简单。(M5才有)
  • 使多个作业安全地共享集群资源,MapR可以给用户设定资源配额,跟踪容量的使用情况。
  •     Fast

  • 比其他的发行版快,而且节约一半的硬件资源;
  • Higher MapReduce and HBase throughput (2X
  • 建议继续学习:

    1. 分布式缓存系统 Memcached 入门    (阅读:14788)
    2. Zookeeper工作原理    (阅读:10513)
    3. GFS, HDFS, Blob File System架构对比    (阅读:9444)
    4. Zookeeper研究和应用    (阅读:8576)
    5. 分布式日志系统scribe使用手记    (阅读:8097)
    6. 一致性哈希算法及其在分布式系统中的应用    (阅读:7994)
    7. 分布式哈希和一致性哈希    (阅读:7729)
    8. HBase技术介绍    (阅读:6824)
    9. 分布式系统的事务处理    (阅读:6101)
    10. Memcache分布式部署方案    (阅读:5507)
    QQ技术交流群:445447336,欢迎加入!
    扫一扫订阅我的微信号:IT技术博客大学习
    © 2009 - 2024 by blogread.cn 微博:@IT技术博客大学习

    京ICP备15002552号-1