HBase表、行与列族
HBase表
HBase 中表是在 schema 定义时被预先声明的。
可以使用以下的命令来创建一个表,在这里必须指定表名和列族名。在 HBase shell 中创建表的语法如下所示:
create ‘<table name>’,’<column family>’
HBase行
HBase中的行是逻辑上的行,物理上模型上行是按列族(colomn family)分别存取的。
行键是未解释的字节,行是按字母顺序排序的,最低顺序首先出现在表中。空字节数组用于表示表命名空间的开始和结束。
HBase列族
Apache HBase 中的列分为列族和列的限定符。列的限定符是列族中数据的索引。例如给定了一个列族 content,那么限定符可能是 content:html,也可以是 content:pdf。列族在创建表格时是确定的了,但是列的限定符是动态地并且行与行之间的差别也可能是非常大的。
Hbase表中的每个列都归属于某个列族,列族必须作为标模式(schema)定义的一部分预先给出。如 create'test',''course'。
列名以列族做为前缀,每个“列族”都可以有多个成员(colunm):如 course:math,course:english,新的列族成员(列)可以随后按需、动态加入
权限控制、存储以及调优都是在列族层面进行的。
HBase Cell
由行和列的坐标交叉决定;
单元格是有版本的;
单元格的内容是未解析的字节数组;
单元格是由行、列族、列限定符、值和代表值版本的时间戳组成的({row key,column( =<family>+<qualifier>),version})唯一确定单元格。cell中的数据是没有类型
的,全部是字节码形式存储。