大数据组件之HBASE-快速入门

HBase

Posted by TBKK on December 19, 2018

什么是HBase

  1. 分布式、多版本、面向列的开源KV数据库
  2. 支持PB级、百万列的数据存储
  3. 强一致性、高扩展、高可用。

HBase核心概念

  • RowKey:表中每条记录的主键
  • Column Family:列族,将表进行横向切割,后面简称CF
  • Column:属于某一个列族,可动态添加列;
  • Version Number:类型为Long,默认值是系统时间戳,可由用户自定义
  • Value:真实的数据 image

  • Region:一段数据的集合
  • RegionServer:用于存放Region的服务。 image

HBase VS Mysql

image

HBase 数据逻辑视图

从过往记忆大神的PPT里拷贝出来了一张图,觉得很实用,就不重复画了 image

HBase 存储模型

image

HBase 数据特性

  • 支持数据多版本特性。
  • 默认以时间戳作为版本号
  • 默认每条数据3个版本,可以配置
  • 默认返回最新版本,可以通过版本号指定旧数据

总结

本文主要是针对快速入门,HBase并非只有大数据场景才能使用,比如全链路监控pinpoint,他的底层存储就是HBase。