什么是HBase
- 分布式、多版本、面向列的开源KV数据库
- 支持PB级、百万列的数据存储
- 强一致性、高扩展、高可用。
HBase核心概念
- RowKey:表中每条记录的主键
- Column Family:列族,将表进行横向切割,后面简称CF
- Column:属于某一个列族,可动态添加列;
- Version Number:类型为Long,默认值是系统时间戳,可由用户自定义
-
Value:真实的数据

- Region:一段数据的集合
- RegionServer:用于存放Region的服务。

HBase VS Mysql

HBase 数据逻辑视图
从过往记忆大神的PPT里拷贝出来了一张图,觉得很实用,就不重复画了

HBase 存储模型

HBase 数据特性
- 支持数据多版本特性。
- 默认以时间戳作为版本号
- 默认每条数据3个版本,可以配置
- 默认返回最新版本,可以通过版本号指定旧数据
总结
本文主要是针对快速入门,HBase并非只有大数据场景才能使用,比如全链路监控pinpoint,他的底层存储就是HBase。