选择阿里云数据库HBase版十大理由

根据Gartner的预计,全球非关系型数据库(NoSQL)在2020~2022预计保持在30%左右高速增长,远高于数据库整体市场。

阿里云数据库HBase版也是踏着技术发展的节奏,伴随着NoSQL和大数据技术的兴起和发展,从2010年开始研究和发展。时光荏苒,日月如梭,转眼九年时间,在阿里云上直接开放提供服务也有1年多时间,并在去年的12月份全新发布X-Pack,将单一的HBase演进到一个完整的数据处理平台的能力。我们注意到还有很多同学和客户不清楚HBase X-Pack是什么,什么场景下合适选择HBase X-Pack。

首先我们先来看下HBase X-Pack的定位:

  • HBase X-Pack是基于HBase及HBase生态构建的 低成本一站式数据处理平台。
  • HBase X-Pack支持:HBase API(包括RestServerThriftServer)、关系Phoenix SQL、时序OpenTSDB、全文Solr、时空GeoMesa、图HGraph、分析Spark on HBase,是阿里云首个支持多模式的分布式数据库,且协议100%兼容开源协议。
  • HBase X-Pack实现数据从处理、存储到分析全流程闭环,让客户用最低成本实现一站式数据处理。

接下来一起来梳理一下阿里云HBase X-Pack关键能力,一起看看选择阿里云HBase X-Pack的十个理由。

理由一:一体化数据处理平台,提供一站式能力

企业数字化转型时代,业务越来越复杂,需要一个平台可以提供一站式处理能力。传统大数据各个组件非常多,各个组件分层发展,给扩展性带来非常大的便利,但同时也引入了非常高的技术门槛,云HBase X-Pack通过集成Spark,Solr,HBase,时序,时空,图等组件,打通各个组件之间的数据同步,通过数据工作台提供统一一体化交互式的操作体验,实现计算、存储、分析、检索、机器学习五位一体的一站式能力,极大的降低了使用门槛,轻松上手,同时提供全托管的服务,避免各种复杂的运维和技术坑。

云HBase X-Pack详细的能力可以访问云HBase的帮助,里面有各个能力详细的介绍:

理由二:深厚的技术积累

企业决策选择云服务,最核心的一个因素就是降低TCO,最看重的核心因素就是背后的技术力量,服务能力。
阿里云HBase X-Pack经过9年的发展,积累强大的专家团队,目前拥有国际认证7个committer,4个PMC,拥有国内独一无二的技术实力。
我们拥有集团超过万台的服务经验,对各种异常场景,数据可靠性,可用性,性能,数据迁移各个方面有全套的服务和工具。

理由三:独家企业版本,以及最新2.0版本

阿里云HBase提供的版本是经过、千锤百炼的企业版本,在稳定性和性能上远胜于开源的版本,并且全球首家提供最新2.0版本。关于阿里云HBase发展历程,可以看这里详细介绍:https://yq.aliyun.com/articles/601531。阿里云HBase和开源版本的关键区别,可以查看:
https://help.aliyun.com/document_detail/49502.html。

理由四:开发效率最高的数据库

Gartner在2017年数据库厂商推荐报告中就明确指出多模是发展趋势阿里云新发布X-Pack更是将多模推上新高度,KV的基础上,同时支持时序、时空、图、文档等多种数据模型。
我们知道,大数据时代,业务多样性是大数据的本质之一,强制使用单一模型只会降低生产效率,HBase X-Pack提供KV、SQL、时序、时空、图丰富的多模多模能力,帮助客户可以根据不同的业务选择不同的数据处理模型,支持业务灵活选择,从而实现最高效率的开发和生产。

理由五:做成本最低的数据库

HBase诞生于Google的bigtable论文,天然是为了存储海量互联网数据而诞生,低成本能力是其天然的属性。云HBase X-Pack在继承HBase自身能力的同时,为了给客户节省成本做了很多努力。体现在内核,整体方案各个方面,主要有:

  • 云HBase版本的内核是经过优化的,性能平均高出自建版本30%~300%:
    如果对性能有要求的场景,就可以节省更少的CPU资源,获取更大的效果,具体可以参考https://yq.aliyun.com/articles/198654。
  • 齐全的产品形态,满足各种业务场景,提供最高性价比:
    HBase X-Pack支持单节点,集群版本,跨可用区/跨地域双集群版本,满足用户从测试,生产环境,高可用各种使用环境,平衡能力和成本,提供高性价比的选择,具体可以参考https://help.aliyun.com/document_detail/71538.html。
  • 提供数据全生命周期管理功能,数据冷热分离,存储成本下降3.5倍:
    很多场景里面,数据有冷热的需求,我们提供不同的存储介质,包括OSS,本地盘,云盘,高性能云盘,帮助客户实现最佳的存储成本,详细的可以看下https://yq.aliyun.com/articles/646983。
  • 客户基于ECS自建,存储选择云盘,hdfs副本数天然是3副本:
    HBase服务通过和云盘深度集成2副本就可以同样的性能和可靠性。在存储上天然节省1/3,详细的可以访问https://yq.aliyun.com/articles/646983。
  • 全托管服务,提供代维,99.9%的SLA:
    运维在日常数据库工作中占了很大的比重,而且数据库的稳定性关系到整个系统,牵一发和动全身,云HBase X-Pack提供全托管的服务,给客户节省运维费用,以及极大的避免故障带来的损失。
  • 提供一体化的方案节省成本:
    云HBase X-Pack通过把各个组件深度集成和融合,通过组合各个产品之间的能力,给很多场景带来增效,解决了性能瓶颈的同时,带来成本的下降。这里举2个典型的例子:
  1. 很多人工智能,多媒体场景,在线教育里面,大量图片、小视频文件。传统的使用方法都是存在OSS里面,OSS天然并发和时延处理能力有限,同时读写都是要收费的,读写次数越多,费用越高,使用HBase X-Pack没有这部分的费用,可以解决性能的瓶颈的同时,带来综合成本的降低。

  2. 碰到非结构化数据查询的诉求时,大家一般会想起ES。ES适合文本查询,入库会比较差(一般就几百条/S),查询函数也有限。HBase X-Pack通过支持Solr完全补齐了文本查询的能力。同时Phoneix+solr组合结合了HBase和搜索的两者的优势,在吞吐和并发上有优势。对SQL的易用性也有优势。尤其是在新零售等场景,一张表中混杂结构化字段和非结构化字段,可以根据需求,自动创建索引,融合两者的优势。倒排膨胀率很高,入库会极速下降。大部分客户只是部分字段有模糊查询的需求,ES强制所有的用单一技术。Phoneix非常适合并发高的查询,条件不多。搜索技术补充了索引技术,适合各种条件。通过结合phoneix+solr成功平滑查询和存储性能,提高性能的同时,存储成本也下降几倍,非常适合结构化+非结构化混合的场景。

理由六:力争做最好用的数据处理平台

HBase主要提供在线查询能力,沉淀下来的数据需要使用Spark来做复杂分析,HBase X-Pack中的Spark为了让用户更便捷的做数据处理,产品上面提供了以下能力:

1)数据工作台:支持交互式、作业管理、工作流、资源管理、元数据管理,从测试、开发、上线一站式开发体验
2)spark内置connector:一键关联hbase、mongo、redis、rds等集群,免去调试的烦恼,更加便捷的分析其他数据库的数据
3)支持多语言:可以选择习惯的语言进行编程
4)可维护性:支持小版本升级、监控、报警,免去Spark集群维护
5)离线数仓能力:一键归档在线库rds、polardb、mongo、hbase、cassandra数据到Spark数仓
6)成本:集群默认存储为集群版本HDFS,同时支持数据存储在oss降成本

使用HBase X-Pack Spark能够构建业界成熟的一体化数据处理平台,支撑推荐、风控、离线数仓、实时处理及计算、大数据运营、日志分析、去oracle复杂分析等业务场景:

理由七:数据可靠性作为重中之重

对大多数公司来说数据的安全性以及可靠性是非常重要的,如何保障数据的安全以及数据的可靠是大多数数据库必须考虑的。2016 IDC的报告表示数据的备份(data-protection)和数据恢复(retention)是NoSQL的最基础的需求之一,阿里云NoSQL数据库也一直把怎么保障客户的数据安全放在首位。
以云HBase为例,传统数据库备份恢复的能力都是TB级别,在交易等场景下面是足够的,但面向大数据场景就捉襟见肘了。云HBase通过垂直整合高压缩、内核级优化等能力,将备份恢复的量级成功推高百倍以上,做到 百TB级别甚至更高 ,让客户在大数据量场景下也无后顾之忧。
云HBase支持全量(备份集)备份、全量(备份集)恢复、增量(实时)备份、增量(时间点)恢复完整备份恢复能力。

理由八:单集群3个9高可用,双集群4个9高可用

HBase通过内核加固,一系列自动运维修复工具,单集群可以提供3个9的可用性,为了满足很多场景下面更高可用性的要求,云HBase支持跨可用区或者跨地域双集群主备同步,可以让多个HBase集群保持同步关系。在一个集群出现故障的时候,迅速地将业务切换至另外一个集群从而避免故障。HBase主备之间数据的同步基于异步链路实现,遵循最终一致性协议,典型的主备同步延迟在200ms左右。

理由九:大量场景验证,久经考验

阿里云HBase从10年上线以来,在阿里集团内部久经考验,超过12000台服务器,单集群超过2000台的规模应用。
云HBase自发布以来,通过丰富的能力,优秀的全托管能力,全面超越同类产品的技术能力得到金融、社交、多媒体、新零售、车联网网、制作业、政企等等多个行业,多上千个客户的信赖,积累了大量的使用经验。欢迎我们的新老客户访问首页获取更多的信息:

理由十:提供不停机迁移服务,让自建迁移无忧

客户已经使用ECS自建服务,想使用云HBase服务,最担心的应该还是迁移过程中对业务的影响,技术团队充分考虑这一点,提供免费的不停机迁移服务,对在线业务0影响,数据迁移一行不丢。当前业界有能力提供不提供不停机迁移HBase服务的仅此一家。

本文简单梳理了阿里云HBase X-Pack十大理由,希望能对大家理解云HBase有一个帮助,另外也给您选型做一个充分的参考。当能我们还有很多改进的空间,我们还在成长的路上持续努力,也欢迎大家联系我们提出宝贵的意见。


原文链接
本文为云栖社区原创内容,未经允许不得转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/519142.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

酷睿i7cpu适合的linux,CPU性能篇 - Core i7-4770K Linux之旅:有喜有忧_Linux新闻_Linux公社-Linux系统门户网站...

CPU性能篇——Rodinia是学术界经常使用的科学测试工具。OpenMP LavaMD负载中,4770K相比3770K快了12%,8350表现也可以。OpenMP Leukocyte负载里,4770K对比3770K的优势依然有10%,但是8350大亮了,竟…

GitOps:Kubernetes多集群环境下的高效CICD实践

为了解决传统应用升级缓慢、架构臃肿、不能快速迭代、故障不能快速定位、问题无法快速解决等问题,云原生这一概念横空出世。云原生可以改进应用开发的效率,改变企业的组织结构,甚至会在文化层面上直接影响一个公司的决策,可以说&a…

远程办公是一阵“过渡风”还是会“继续燃烧”?

受中国新型冠状病毒肺炎感疫情的影响,2月伊始,「远程办公」成为所有人关心与讨论的热门话题之一。在现实驱动之下,企业如何协同与高效办公成为重点问题中的焦点。在中国企业与「远程办公」正面相遇满月之际,2月29日,CS…

SpringBoot+Shiro+ehcache实现登录失败超次数锁定帐号

文章目录二、Controller层接收登录请求三、自定义的Realm四、密码验证器增加登录次数校验功能五、ShiroConfig的配置类六、EhCache 的配置七、全局异常的配置####### 一、 Shiro的执行流程1、核心介绍1)Application Code用户编写代码2)Subject就是shiro管…

linux putty 字体,putty修改字体配色

先看效果步骤:1. 打开Windows注册表编辑器开始 -> regedit2. 找到putty默认session所在位置HKEY_CURRENT_USER\Software\SimonTatham\PuTTY\Sessions\Default%20Settings3. 右键导出修改# 字体(monaco字体不错,如效果图)"Font""Consol…

90后ACE成长记——从偏居一隅小城里走出的核心技术人

《ACE成长记》栏目说明 名词解释: 阿里云工程师,简称 ACE (Alibaba Cloud Engineer),代表云计算的爱好者,是最“王牌”(ACE)的一群开发者,也是未来的MVP。 ACE 是遍布在…

阿里开发者招聘节 | 面试题01:如何实现一个高效的单向链表逆序输出?

面试,如同玩一场饥饿游戏:既要对环境了然于胸,又要对自身心知肚明。发现一个好工作不容易,但成功应聘又会面临一系列的挑战。 为帮助开发者们提升面试技能、有机会入职阿里,云栖社区特别制作了这个专辑——阿里巴巴资…

从Kubernetes安全地访问AWS服务,告诉你多云场景下如何管理云凭据!

作者| Alexey Ledenev翻译 | 天道酬勤,责编 | Carol出品 | CSDN云计算(ID:CSDNcloud)随着企业与各种云提供商合作,多云场景已经变得十分常见。在谷歌Kubernetes引擎(GKE)上运行的应用程序需要访…

MSSQL-最佳实践-Always Encrypted

摘要 在SQL Server安全系列专题月报分享中,往期我们已经陆续分享了:如何使用对称密钥实现SQL Server列加密技术、使用非对称密钥实现SQL Server列加密、使用混合密钥实现SQL Server列加密技术、列加密技术带来的查询性能问题以及相应解决方案、行级别安…

java实现对文件加解密操作

源文件: 加密后的文件: 解密后的文件: package com.gblfy.test;import java.io.*;/*** java 实现对文件加解密的方法** author gblfy* date 2020-12-08*/ public class IOSercet {//获取系统类型private static String OS System.getPro…

如何在工作中快速成长?致工程师的10个简单技巧

阿里妹导读:阿里有句非常经典的土话,“今天的最好表现,是明天的最低要求。”如何挖掘潜能、发现更好的自己?今天,阿里巴巴高级无线开发专家江建明将认知升级的方法总结出来,帮助你获得快速成长的秘诀&#…

1 手写第一个Win32窗口程序

1 基础概念 什么是窗口? 答:窗口就是屏幕上的一片区域,接受用户的输入,显示程序的输出。可以包含标题栏、菜单栏、工具栏以及控件等。什么是句柄? 答: 作为一种管理和操作系统资源的机制,提供了…

解析云原生与云计算本质区别,别再傻傻分不清楚了!

来源| comparethecloud翻译 | 天道酬勤,责编 | Carol出品 | CSDN云计算(ID:CSDNcloud)云应用程序是热门话题。很多时候,我们会遇到像云原生应用程序和云计算应用程序这样的术语。首先,很少有人同时使用这两…

阿里开发者招聘节 | 面试题02-04:给定一个二叉搜索树(BST),找到树中第K小的节点

为帮助开发者们提升面试技能、有机会入职阿里,云栖社区特别制作了这个专辑——阿里巴巴资深技术专家们结合多年的工作、面试经验总结提炼而成的面试真题这一次将陆续放出(面试题官方参考答案将在专辑结束后统一汇总分享,点此进入答题并围观他…

确认!别再相信Python了! 程序员:就你敢说...

程序员你有没有感觉到,Python最近已经刷屏到爆炸了?细分析Python之所以刷屏,主要是因为人红是非多,在编程界它是一种特殊的存在,有人认为,只有用Python才能优雅写代码,提高代码效率;…

云原生的新思考,为什么容器已经无处不在了

4月24日,中国信息通信研究院主办的首届云原生产业大会在北京举行,在《云原生数字引领未来》的主题演讲中,阿里云容器服务总监易立表示:“云原生不但可以很好的支持互联网应用,也在深刻影响着新的计算架构、新的智能数据…

走近科学,探究阿里闲鱼团队通过数据提升Flutter体验的真相

背景 闲鱼客户端的flutter页面已经服务上亿级用户,这个时候Flutter页面的用户体验尤其重要,完善Flutter性能稳定性监控体系,可以及早发现线上性能问题,也可以作为用户体验提升的衡量标准。那么Flutter的性能到底如何?…

阿里3篇技术论文入选国际顶级会议FAST2020,全球第一!

2月26日,存储行业顶级国际会议FAST2020(18th USENIX Conference on File and Storage Technologies)在美国圣克拉拉举行,大会公开论文名单显示,阿里巴巴3篇第一作者论文入选,是全球入选数最多的企业。 FAS…

oracle11g linux 日期格式设置

下面的过程把oracle 的日期格式设置成 yyyy-mm-dd hh24:mi:ss(1) 使用 oracle 用户登录(2) 在.bash_profile里增加以下两条环境变量export NLS_LANGamerican_america.ZHS16GBK export NLS_DATE_FORMAT"YYYY-MM-DD HH24:MI:SS" (3) 执行一下"source .bash_profil…

一份还热乎的蚂蚁金服面经(已拿Offer)!附答案!!

本文来自我的知识星球的球友投稿,他在最近的校招中拿到了蚂蚁金服的实习生Offer,整体思路和面试题目由作者——泽林提供,部分答案由Hollis整理自知识星球《Hollis和他的朋友们》中「直面Java」板块。 经历了漫长一个月的等待,终于…