hbase建表时设置预分区

一.hbase rowkey设计的原则
遵循唯一性,散列,不应过长等原则

二.rowkey常用的设计
1.reverse反转
2.salt加盐
3.hash散列

三.hbase建表预分区,指定3个rowkey,分成4个region
在Hbase中,预分区是一种优化手段,用于在创建表时提前规划好Region的分布,以提高数据写入的效率和查询性能,同时避免数据分布不均导致的热点问题
为什么要预分区?
1.减少split操作:随着数据的增长,单个Region超过一定大小会触发split操作,会消耗资源并影响性能
2.平衡数据分布:通过预知数据的分布特性,更均匀地分配Region,避免数据倾斜和热点问题
3.提升写入性能:预分区能够使得数据初始写入时直接分散到多个Region,提高并行写入的能力

示例:

create 'phoenix2','cf1',SPLITS => ['key1','key5','key8']describe 'phoenix2'
{NAME => 'cf1', BLOOMFILTER => 'ROW', VERSIONS => '1', IN_MEMORY => 'false', KEEP_DELETED_CELLS => 'FALSE', DATA_BLOCK_ENCODING => 'NONE', TTL => 'FOREVER', COMPRESSION => 'NONE', MIN_VERSIONS => '0', BLOCK
CACHE => 'true', BLOCKSIZE => '65536', REPLICATION_SCOPE => '0'}
1 row(s) in 0.0170 secondsput 'phoenix2','key0','cf1:name','key0'
put 'phoenix2','key1','cf1:name','key1'
put 'phoenix2','key2','cf1:name','key2'
put 'phoenix2','key3','cf1:name','key3'
put 'phoenix2','key4','cf1:name','key4'
put 'phoenix2','key5','cf1:name','key5'
put 'phoenix2','key6','cf1:name','key6'
put 'phoenix2','key7','cf1:name','key7'
put 'phoenix2','key8','cf1:name','key8'
put 'phoenix2','key9','cf1:name','key9'

查看Hbase的web界面,可以看到生成了4个Region
Table Regions
Name Region Server Start Key End Key Locality Requests
phoenix2,1713767154009.1e1a7e1962249ebb0419c0be83e884f0. whtpiodscshd01t,21302,1710927618816 key1 0.0 1
phoenix2,key1,1713767154009.bee445cc4e6c81de2a31f5b8cdf61aca. whtpiodscshd02t,21302,1710927704067 key1 key5 0.0 4
phoenix2,key5,1713767154009.c92a61e074907b5bdab9e6619615ac27. whtpiodscshd02t,21302,1710927704067 key5 key8 0.0 3
phoenix2,key8,1713767154009.0029739e798ac34f4f34b5a70d31a19c. whtpiodscshd03t,21302,1710927771892 key8 0.0 2

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/828091.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【ARMv9 DSU-120 系列 -- CHI Interface】

文章目录 DSU-120 CHI BUSAddress Target Groups配置步骤映射和管理Hashing for CHI transaction distribution散列过程和地址目标组识别散列函数定义两个地址目标组的散列四个地址目标组的散列八个地址目标组的散列DSU-120 CHI BUS DSU-120(DynamIQ™共享单元-120)在构建时…

文件操作(1)

为什么使⽤⽂件? 如果没有⽂件,我们写的程序的数据是存储在电脑的内存中,如果程序退出,内存回收,数据就丢失了,等再次运⾏程序,是看不到上次程序的数据的,如果要将数据进⾏持久化的…

各平台奇怪问题备忘录

微信小程序 小程序报错Page 页面路径 has not been register yet 描述:uniapp做微信小程序开发时,新增某页面后,小程序跳转该页面报错Page 页面路径 has not been register yet 已知:page.json已添加该页面,小程序a…

实验二:Huggingface数据集页面遍历爬取

准备: 获取所有的标签和链接,并存储在json文件中 main.py from bs4 import BeautifulSoup import requests import extract import Into_Tag import read import json def get_info(filepath):try:with open(filepath,r,encodingutf-8)as file:conten…

B端设计实战:基于角色属性的权限设计

编辑导读:“权限控制”是中后台的基础能力,用于管控操作人员在平台内可做的事项内容。即通过权限控制,可以决定哪些人在平台内可以做哪些事。本文作者围绕角色&属性的权限设计展开分析,希望对你有帮助。 Hello,我是一名交互设计师。 随着3月暖春的即将到来,苏州的疫…

Java设计模式中策略模式

策略模式是一种行为型设计模式,它允许在运行时选择算法的行为。这种模式定义了一系列算法,并使这些算法可以相互替换,使得算法的变化独立于使用算法的客户。 以下是策略模式的一般结构: Context(上下文)&a…

bugku-杂项-社工进阶收集

下载附件 得到图片 利用百度地图查找 这里得到地点名称大雁塔音乐喷泉 陕西省西安市,大雁塔北广场 打开高德地图 来到大雁塔北广场 因为在北广场,所以地铁站为大雁塔站 开始分析 坐七站到大雁塔站,即始发站为韦曲南站 因为始发站离她家800米&…

高频前端面试题汇总之HTML篇

1. src和href的区别 src和href都是用来引用外部的资源,它们的区别如下: src: 表示对资源的引用,它指向的内容会嵌入到当前标签所在的位置。src会将其指向的资源下载并应⽤到⽂档内,如请求js脚本。当浏览器解析到该元素…

34. BI - 美国大学生足球队的 GCN 案例

本文为 「茶桁的 AI 秘籍 - BI 篇 第 34 篇」 文章目录 美国大学生足球队 Embedding(GCN) Hi,你好。我是茶桁。 在上一节课中,因为需要,我们先是回顾了一下 Graph Embedding,然后跟大家讲解了 GCN 以及其算…

linux驱动-CCF-0基础

1. 时钟设备 晶振:提供基础时钟源的(可分为有源晶振、无源晶振两种); PLL: 用于倍频的锁相环; mux: 用于多路时钟源选择; Divider: 用于分频的; gate: 用于时钟使能的与门电路等 2. CCF…

Python读写文本URL蓝牙WIFI自动连接电子名片位置坐标智能海报等NDEF标签

本示例使用的发卡器:https://item.taobao.com/item.htm?id615391857885&spma1z10.5-c.w4002-21818769070.11.60ad789erlonvk 近场通信(Near Field Communication,简称NFC),是一种新兴的技术&…

Python常见运算符

赋值运算符 赋值运算符主要用来对变量进行赋值,包括如下这些: 运算符 描述 赋值加等于 - 减等于 * 乘等于 / 除等于 // 整除等于 % 模等于 ** 幂等于实例如下: a 10 a 5 # 等价于 a a5 a *2 # 等价于 a a*2比较运算符 比较运算符主要用来比较两个数据的大小,包括如下这…

技术速递|Java on Azure Tooling 3月更新 - Java on Azure 开发工具未来六个月路线图发布

作者:Jialuo Gan - Program Manager, Developer Division At Microsoft 排版:Alan Wang 大家好,欢迎阅读 Java on Azure 工具的三月更新。在本次更新中,我们将分享未来几个月对 Java on Azure 开发工具的投资。此外,我…

ubuntu系统解决安装datahub时报错failed to register layer: error creating overlay mount

查了很多说禁用selinx和不使用overlay 以及删除overlay2文件夹的方法都没用 再次拉取的时候还是会报这个错误 编辑 Docker 配置文件: 打开 Docker 的配置文件,通常位于 /etc/docker/daemon.json。如果文件不存在,则可以创建一个新文件。…

Redis入门到通关之数据结构解析-Dict

文章目录 概述构成Dict的扩容Dict的rehash总结 欢迎来到 请回答1024 的博客 🍓🍓🍓欢迎来到 请回答1024的博客 关于博主: 我是 请回答1024,一个追求数学与计算的边界、时间与空间的平衡,0与1的延伸的后端开…

SpringBoot引入第三方jar包或本地jar包

idea2018创建spring boot项目 New Project窗口选择Spring Initializr Type选择Maven(Generate…),有两个Maven选择这一个。 勾选Spring Web。 pom.xml中version改成2.5.10。 在resources中新建jar目录,将第三方jar包fastjson2-2.0.47.jar放入其中。&#xff08…

国产FTP文件传输服务器需要具备哪些关键特性?

国产FTP文件传输服务器是指根据中国国内信息技术创新(信创)的要求和标准,自主研发的文件传输服务器软件。这类软件旨在替代传统的FTP服务器,以更好地适应国产化和信息安全的需要。国产FTP文件传输服务器通常需要具备以下要求&…

【ensp】网关冗余vrrp实验

基础文字知识复习时,添加,下文仅拓扑以及核心配置以及结果分析 冗余路由器 核心代码: int g0/0/0 [R1-GigabitEthernet0/0/0]vrrp vrid 1 virtual-ip 192.168.10.1 ###设置虚拟ip [R1-GigabitEthernet0/0/0]vrrp vrid 1 priority 120 …

零碳家庭 “光”的力量

有行业专家乐观预测,在供给充足、基础设施建设与时俱进的情况下,2025年,我国新能源汽车市场的占有率将会达到50%,2030年更有望突破90%的大关。为了方便新能源汽车的出行,在家中安装一个智能充电桩是越来越多驾驶者的选…

常见的加密方式都有哪些

加密方式有多种类型,包括对称加密、非对称加密和哈希函数。以下是它们的主要类型: 对称加密: 对称加密使用相同的密钥进行加密和解密。常见的对称加密算法包括:DES、3DES、AES、RC4 等。 非对称加密: 非对称加密使用一…