4.梳理HBase的结构与运行流程,以用图与自己的话进行简要描述,图中包括以下内容:


  • Master主服务器的功能
    • 主服务器Master主要负责表和Region的管理工作:
      – 管理用户对表的增加、删除、修改、查询等操作
      – 实现不同Region服务器之间的负载均衡
      – 在Region分裂或合并后,负责重新调整Region的分布
      – 对发生故障失效的Region服务器上的Region进行迁移
  • Region服务器的功能
    • Region服务器是HBase中最核心的模块,负责维护分配给自己的Region,并响应用户的读写请求
  • Zookeeper协同的功能
    • Zookeeper可以帮助选举出一个Master作为集群的总管,并保证在任何时刻总有唯一一个Master在运行,这就避免了Master的“单点失效”问题
  • Client客户端的请求流程
  • 四者之间的相系关系

    1、Hbase集群有两种服务器:一个Master服务器和多个RegionServer服务器;

    2、Master服务负责维护表结构信息和各种协调工作,比如建表、删表、移动region、合并等操作;

    3、客户端获取数据是由客户端直连RegionServer的,所以Master服务挂掉之后依然可以查询、存储、删除数据,就是不能建新表了;

    4、RegionServer非常依赖Zookeeper服务,Zookeeper管理Hbase所有的RegionServer信息,包括具体的数据段存放在那个RegionServer上;

    5、客户端每次与Hbase连接,其实都是先于Zookeeper通信,查询出哪个RegionServer需要连接,然后再连接RegionServer;客户端从Zookeeper获取了RegionServer的地址后,会直接从RegionServer获取数据;

  • 与HDFS的关联
    RegionServer保存的数据直接存储在Hadoop的HDFS上;

相关