1.基本原理介绍
HBase的存储是通过行键建立索引进行存储的,而且HBase只支持一级索引,因此只要通过行键才能很快的找到需要的数据。
HBase是一个分布式的系统,HBase通过行键的分片,把不同的数据存储在不同的主机上。
1).顺序分片
依据固定列值作为键,顺序的存入HBase数据库,一般以时间列为键值,这样有利于迅速读出同一台机器上相近时间的值
2).Hash分片
以一个或者多个列的值进行Hash计算,作为行键,可以把数据接近平均的写入各个主机,提高写性能
2.实际中的运用
在一次系统改造中,使用了hash分片的技术,将数据传输到不同的处理机上进行处理。