博主历时三年精心创作的《大数据平台架构与原型实现:数据中台建设实战》一书现已由知名IT图书品牌电子工业出版社博文视点出版发行,点击《重磅推荐:建大数据平台太难了!给我发个工程原型吧!》了解图书详情,京东购书链接:https://item.jd.com/12677623.html,扫描左侧二维码进入京东手机购书页面。 |
1. 背景介绍
本文介绍的演练操作源于某真实案例,用户有一个接近 100 TB 的 HBase 数据库,其中有一张超大表,数据量约为数十TB,在一次迁移任务中,用户需要将该 HBase 数据库迁移到 Amazon EMR 上。 本文将讨论并演示:将一个数十TB HBase 单表不停机迁移数据到一个 HBase on S3 集群上。
2. 知识储备
介绍详细的迁移操作前,有必要介绍一些与 HBase 相关的背景知识,这些知识对于理解迁移过程中的操作步骤至关重要,同