.net hbase client--终于浮出水面的轮子

一、开篇

1.背景

在大数据时代,HBase 数据库是个绕不开的热门话题。由于其使用 Java 作为主要开发语言,并且依赖大量的 Java 组件(如 Hadoop、zooKeep),使得其他技术栈想要有一个对应的 hbase 客户端变得有一定难度。在 .net 的世界中,一直缺乏能够直接访问 hbase 的客户端。

2.历程

Apache Thrift 作为社区内比较有名的支持多语言的 Api 服务,可以解决跨语言访问 HBase 数据库的痛点。在以往的文章中业也介绍过 C#如何使用 thrift 访问 hbase,但在真正的生产环境中,该方式的访问效率和原生 Java 客户端比起来真着实让人心灰意冷。此外,thrift 也要求服务端和客户端版本一致。

Protocol Buffers HBase 提供基于 Protocol 的数据访问,这以一种相对高效紧凑的数据交换规则。基于此,我们能够造出属于 .net 的 hbase 客户端。

这是一个造轮子的过程,中间虽有着许多难点就不再赘述。下面直接介绍该项目的使用。

二、HBaseNet 使用

1.HBase 数据库准备

作为项目使用演示,我们就不讨论如何搭建 HBase 集群了,一切以简单便捷为前提,直接使用别人构建好的 docker 镜像就可以轻松获取 HBase 数据库的使用。

在 dockerhub 中搜索 hbase 或者命令行:docker search hbase。结果中找到dajobe/hbase,将其 pull 到本地就行。可以按照作者教程进行部署。其核心操作也就几个简单命令,现作一简单摘抄:

docker pull dajobe/hbase # 拉取镜像到本地
mkdir data # 创建名为data的目录
id=$(docker run --name=hbase-docker -h hbase-docker -d -v $PWD/data:/data dajobe/hbase) #将hbase-docker设置为主机名运行,并将docker容器id赋值给id

命令行docker inspect hbase-docker|grep IPAddress查看 hbase 主机地址:

"SecondaryIPAddresses": null,
"IPAddress": "172.17.0.2","IPAddress": "172.17.0.2",

可以看到我的在 172.17.0.2 上,我们可以直接浏览器访问http://172.17.0.2:16010/,看到habse的主页说明部署成功。此外,最好将本地物理机的hosts修改以作映射,文件中添加一行172.17.0.2 hbase-docker即可。

2.HBaseNet 简单演示

演示项目创建

首先创建控制台项目dotnet new console -o HBaseNetTest,然后添加 HBaseNet 客户端 nuget dotnet add package HBaseNet --version 0.1.0-rc2-final

使用 AdminClient 创建 HBase 表

直接在主函数中写下如下代码:

static async Task Main(string[] args)
{// 注意在hosts中添加地址映射var ZkQuorum = "hbase-docker";var admin = await new AdminClient(ZkQuorum).Build();if (admin == null) return;var table = "products";var cols = new[] { new ColumnFamily("info") };//名为info的列簇var create = new CreateTableCall(table, cols){SplitKeys = new[] { "8" }// 预分区};//简单判断表是否存在var tables = await admin.ListTableNames(new ListTableNamesCall { Regex = table });if (true != tables?.Any()){//使用高级客户端创建products表var createResult = await admin.CreateTable(create);Console.WriteLine($"创建表{table}的结果:{createResult}.");}else{Console.WriteLine($"表{table}已经存在");}
}

运行后控制台输出创建表products的结果:True.。我们再查看主页http://hbase-docker:16010/,找到Tables,可以看到 products 表已经被创建:

default	products	ENABLED	2	0	0	0	0	0	0	0	'products', {NAME => 'info', VERSIONS => '3', DATA_BLOCK_ENCODING => 'FAST_DIFF', BLOCKCACHE => 'False', METADATA => {'TTl' => '2147483647'}}

使用 StandardClient 进行数据的写入和查询

var client = await new StandardClient(ZkQuorum).Build();
if (client == null) return;
var rowKey = "123";
var values = new Dictionary<string, IDictionary<string, byte[]>>
{{"info", new Dictionary<string, byte[]>{{"key", "value".ToUtf8Bytes()}}}
};
//放入一条数据
var rs = await client.Put(new MutateCall(table, rowKey, values));
Console.WriteLine($"放入数据key:{rowKey},结果:{rs.HasProcessed}");
// 根据rowkey获取一条数据
var getResult = await client.Get(new GetCall(table, rowKey));
Console.WriteLine($"获取数据结果key:{rowKey}");
// 使用scanner进行数据扫描
var sc = new ScanCall(table, "1", "")
{NumberOfRows = 1000
};
using var scanner = client.Scan(sc);
var scanResults = new List<Result>();
while (scanner.CanContinueNext)
{var per = await scanner.Next();if (true != per?.Any()) continue;scanResults.AddRange(per);
}
Console.WriteLine($"扫描数据共返回结果:{scanResults.Count}行");

控制台输出:

放入数据key:123,结果:True
获取数据结果key:123
扫描数据共返回结果:1行

日志配置

为了方便友好,建议还是开启日志进行使用。这里就以使用Serilog为例,添加以下 nuget 包:

dotnet add package Serilog --version 2.10.0-dev-01226
dotnet add package Serilog.Sinks.Console --version 4.0.0-dev-00839
dotnet add package Microsoft.Extensions.DependencyInjection --version 5.0.0-preview.7.20364.11

在主函数最上面添加:

Log.Logger = new LoggerConfiguration().Enrich.FromLogContext().MinimumLevel.Debug().WriteTo.Console(outputTemplate: "[{Timestamp:yyyy-MM-dd HH:mm:ss} {Level:u3}] {Message:lj}{NewLine}{Exception}").CreateLogger();
HBaseConfig.Instance.ServiceProvider = new ServiceCollection().AddLogging(cfg => cfg.AddSerilog(Log.Logger)).BuildServiceProvider();

更多细节可以参考项目里的示例代码HBaseNet.Console。

三、最后

在 .neter 中使用 hbase 的人极少,多数人还是在抱怨生态不好。但想一想自己能够做什么,付诸行动总是比无谓的抱怨要好很多的。HBaseNet是一个刚开始的项目,捂了(肝了)几个月还是把它做出来了。如果对它感兴趣,欢迎加入我们或者提出宝贵的修改意见。当然,我最终的愿望是希望它对您有用。开源不易,非常欢迎到项目主页进行 star 鼓励。

感谢。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/308481.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

x12arima季节调整方法_《时间序列X-12-ARIMA季节调整:原理与方法》

对时间序列进行季节调整是经济分析的基础性工作。人民银行组织力量对季节调整基本方法进行了研究&#xff0c;结合调整中国特有的移动假日——春节的需要&#xff0c;提出了不同的处理模型&#xff0c;对各国较为通用的季节调整软件X-12-ARIMA进行了改造&#xff0c;开发出PBC版…

C++中getline()和cin()同时使用时的注意事项

一&#xff1a;问题 当用cin输入完后 然后再用getline()的话就会直接结束没办法在输入了 问题分析&#xff1a; cin只是在缓存区中&#xff0c;把字符读走&#xff0c;会剩余/n在缓存区中&#xff0c;但是getline对/n极度敏感&#xff0c;导致getline刚开始读入便遇到/n于是…

api接口返回动态的json格式?我太难了,尝试一下 linq to json

一&#xff1a;背景1. 讲故事前段时间和一家公司联调api接口的时候&#xff0c;发现一个奇葩的问题&#xff0c;它的api返回的json会动态改变&#xff0c;简化如下&#xff1a;{"Code":101,"Items":[{"OrderTitle":"订单1"}]}{"C…

mysql id 字段类型转换_mysql 数据类型转换

一、问题有一张如下图所示的表&#xff0c;需要我们查出 result 值大于 reference_high值的数据然后我们写了下面的SQL查询语句SELECT i.result,i.reference_high FROM report_item iLEFT JOIN report r ON r.idi.report_idWHERE r.org_id54 AND r.report_status1AND r.add_dat…

7-22 堆栈模拟队列 (25 分)(详解夹思路)

一&#xff1a;题目 设已知有两个堆栈S1和S2&#xff0c;请用这两个堆栈模拟出一个队列Q。 所谓用堆栈模拟队列&#xff0c;实际上就是通过调用堆栈的下列操作函数: int IsFull(Stack S)&#xff1a;判断堆栈S是否已满&#xff0c;返回1或0&#xff1b; int IsEmpty (Stack …

What is 测试金字塔?

【答疑解惑】| 作者 / Edison Zhou这是恰童鞋骚年的第271篇原创内容我的女朋友是一名测试工程师&#xff0c;但她之前却不知道测试金字塔的概念&#xff0c;为此我曾经在家里的白板上画了一个图一层一层给她讲解过。我和同事在给团队面试测试和开发岗位时&#xff0c;也会必问到…

Mysql编码教程_mysql编码设置教程 mysql编码要怎么设置呢

mysql的默认编码是拉丁&#xff0c;每次JSP制作网页用insert语句插入数据库时汉字都会显示成问号&#xff0c;安装mysql后&#xff0c;启动服务并登陆&#xff0c;使用show variables命令可查看mysql数据库的默认编码:由上图可见database和server的字符集使用了latin1编码方式&…

Java当中 报错 没有有任何类型 的外层实例可访问

一&#xff1a;报错分析 如果你想定义一个外部类 但 定义成 内部类 了&#xff0c;但是你还是按照 外部类来实例化对象 就会报这个错误。 二&#xff1a;代码分析 报错码 package cn.wyj.one;public class Demo1_泛型 {/*** param args*/public static void main(String[] …

技术脱钩后软硬件磨合优化不失为一条出路

从宏观上看&#xff0c;这一论的制裁只是一连串组合拳的一次攻击&#xff0c;将来&#xff0c;东亚大国和西方技术脱钩是大趋势。在这种背景下&#xff0c;宜建立红色产业链。指导方针是不过度追求局部指标的先进性&#xff0c;而是追求技术自主性&#xff0c;并把握整体性能达…

7-23 还原二叉树 (25 分)(分析加详解)

一&#xff1a;题目&#xff1a; 给定一棵二叉树的先序遍历序列和中序遍历序列&#xff0c;要求计算该二叉树的高度。 输入格式: 输入首先给出正整数N&#xff08;≤50&#xff09;&#xff0c;为树中结点总数。下面两行先后给出先序和中序遍历序列&#xff0c;均是长度为N的…

java多线程原子操作_Java 多线程 - 原子操作CAS

什么是原子操作?如何实现原子操作?假定有两个操作 A 和 B&#xff0c;如果从执行 A 的线程来看&#xff0c;当另一个线程执行 B 时&#xff0c; 要么将 B 全部执行完&#xff0c;要么完全不执行 B&#xff0c;那么 A 和 B 对彼此来说是原子的。实现原子操作可以使用锁&#x…

dotNET:怎样处理程序中的异常(实战篇)?

在上篇 《dotNET&#xff1a;怎样处理程序中的异常&#xff08;理论篇&#xff09;》 中讲了一些程序中出现异常怎样处理的理论知识&#xff0c;本文将以代码的方式来进行实践。环境dotNET Core&#xff1a;3.1工具&#xff1a;Rider 2019.3.2系统&#xff1a;macOS 10.15.4创建…

JAVA 手撕底层arrayList代码(arrayList的简单实现)

一&#xff1a;引言&#xff1a; 这些方法根本不用写&#xff0c;list类当中都有这些方法&#xff0c;可以直接调用&#xff0c;但为了解list类的底层 所以手写了一便 只是实现了简单方法 二&#xff1a;上码&#xff1a; package cn.wyj.two;import javax.management.Runti…

java数组键_Java基础之数组

数组数组就是用于存储相同数据类型数据的一个容器。可以通过有规律的索引来访问没有规律的元素。一维数组定义格式&#xff1a;元素的数据类型[ ] 数组名称  new 元素的数据类型 [ 数组容器大小 ]&#xff1b;数组定义格式解释&#xff1a;元素&#xff1a;数组中的数据&am…

结构型设计模式总结

结构型设计模式总结Intro前面几篇文章已经介绍完了所有的结构型设计模式&#xff0c;来做一个总结结构型设计模式主要总结了一些类或对象组合在一起的经典结构&#xff0c;这些经典的结构可以解决一些特定应用场景的问题。结构型模式包括&#xff1a;代理模式、桥接模式、装饰器…

Java手撕Linkedlist(双向链表)基本用法的实现

一&#xff1a;引言 实现的方法 LinkList类都有 自带的 可以直接调用 &#xff0c;这是为了熟悉底层代码 敲了一下基本用法 &#xff0c;主要以高琪老师讲的来写 二&#xff1a;上码 package cn.wyj.two;import java.awt.image.RasterFormatException;/**自定义一个链表* pa…

在 MySQL 中使用码农很忙 IP 地址数据库

在下载到码农很忙 IP 地址数据库后&#xff0c;我们可以将其存储在 MySQL 数据库中&#xff0c;并在需要查询某个 IP 对应的位置数据时&#xff0c;通过 SQL 语句获取正确的结果。这是一种很便捷的使用方式&#xff0c;并且在增加了恰当的索引后&#xff0c;可以取得不错的搜索…

java numberformat异常_Java NumberFormat格式化float类型的bug

首先&#xff0c;这个NumberFormat这个类&#xff0c;可以格式化各种数字。你只要稍微设置一下&#xff0c;结果还是很理性的。但是&#xff0c;他有那么一丢丢的bug&#xff0c;不知道你知道不&#xff1f;/*** 2.3F经过格式化&#xff0c;竟然变成2.99啦。what the fuck .* f…

7-24 树种统计 (25 分)(详解)map做法 map真香啊!

一&#xff1a;题目 7-24 树种统计 (25 分)随着卫星成像技术的应用&#xff0c;自然资源研究机构可以识别每一棵树的种类。请编写程序帮助研究人员统计每种树的数量&#xff0c;计算每种树占总数的百分比。 输入格式: 输入首先给出正整数N&#xff08;≤10 ​5 ​​ &#xf…

死磕 Redis,我有这么几招

如果你是一位后端工程师&#xff0c;面试时八成会被问到 Redis&#xff0c;特别是那些大型互联网公司&#xff0c;不仅要求面试者能简单使用 Redis&#xff0c;还要深入理解其底层实现原理&#xff0c;具备解决常见问题的能力。可以说&#xff0c;熟练使用 Redis 就是后端工程师…