告别传统人肉运维,实现360°可观测!奇点云数据存算引擎DataKun R2.0发布

近日,奇点云的数据云全系产品发布新一季更新。本文着重分享数据存算引擎DataKun、数据安全引擎DataBlack、指标工厂SimbaMetric、标签工厂SimbaTag的最新进展。

摘要:

· 数据存算引擎DataKun R2.0发布,在安全稳定、智能运维、自主可控等层面均有优化,实现360°可观测。

· 数据安全引擎DataBlack R2.0发布,成为独立版本,支持全域数据安全,内置开箱即用的行业模板,更有“冠军算法”加持。

· SimbaMetric(指标工厂)、SimbaTag(标签工厂)成为独立版本,可搭载于企业现有数据平台之上,为标签管理、指标管理提效。

DataKun R2.0

智能运维,自主可控

数据存算引擎DataKun,提供企业级的大数据集群智能运维能力。延续“安全稳定”、“智能运维”、“云原生”、“自主可控”四大特性,DataKun R2.0持续优化进阶:

  • 360°可观测,告别传统人肉运维

围绕大数据运维全生命周期,DataKun从系统层、服务层、业务层实现360°可观测,并通过智能运维模型,自动化监测、分析和优化系统行为,改变了传统“人肉运维”的方式。

R2.0相关升级主要体现在以下三个方面:

1、“健康检查”

DataKun“健康检查”功能,通过一系列检查及验证,帮助运维工程师及时发现常见的配置问题,更新系统参数,减少由于错误配置引起的潜在故障和性能问题。

本次更新完善了检查与更新NTP的设置,以确保时间同步;完善了检查与优化磁盘的设置,以确保存储性能更优。

2、“Service Advisor”

“Service Advisor”(服务顾问)功能,旨在通过分析集群组件的配置和状态,检查可能存在的问题,并提供优化建议。例如,按照集群规模,动态推荐各组件的CPU和内存值,帮助用户改善集群的性能和资源利用率,解决Container并发度不足导致任务运行排队严重、效率太低等问题。

本次更新中,Service Advisor基于过往服务客户的最佳实践,优化了HDFS、Ranger、HBase、ClickHouse等组件的配置推荐算法。

3、“集群监控”

“集群监控”功能相当于大数据集群的“天眼”。DataKun R2.0迭代了基础监控数据指标体系,建设了完善的监控看板与易用的诊断工具,覆盖系统、服务、业务三个层面,帮助及时发现硬件故障、资源瓶颈、任务执行异常等问题。

  • 全量压测,安全稳定

作为数据存算引擎,DataKun需确保长期运行过程中,始终具备高可用、高性能,且满足安全、稳定、合规的要求。

1、核心组件全量压测,充分保障稳定

本轮更新,DataKun的核心组件完成全量压测,包括YARN、HDFS、Hive、Spark等在内的所有核心组件稳定性及性能均得到了充分验证。

结合压测结果数据,我们进一步对组件进行配置调优,提升了集群的整体吞吐能力。

2、持续关注开源组件安全,第一时间修复相关漏洞

DataKun持续关注开源社区动态,及时更新并进行专业的兼容性验证测试,以规避因开源组件漏洞而造成的拒绝服务攻击、远程代码执行及安全绕过等问题。

本轮迭代,截至2023年6月Hadoop和Hive中发现的高危漏洞,均已在DataKun R2.0修复完毕。

  • 自主可控,增加国内研发软硬件环境适配

DataKun持续适配国内研发软硬件环境,R2.0现已支持兼容KunPeng(ARM架构)Kylin V10、X86 Kylin V10。

此外,DataKun R2.0提供更成熟、标准化的配套迁移服务,支持从CDH及云上EMR迁移至DataKun,进一步保障企业客户自主可控。

DataBlack R2.0

独立版本,支持全域数据安全

数据安全引擎DataBlack以数据为中心,具备敏感数据自动化发现、数据脱敏和加密、权限管理、风险识别和监控、数据审计等五大核心功能,助力客户完成企业级的数据全生命周期安全管控及保护。

DataBlack R2.0带来以下关键更新:

  • 独立版本,支持全域全场景数据安全

自R2.0起,DataBlack正式作为独立产品单独售卖(而不再只作为数据云平台DataSimba的增购项)。

“自立门户”的DataBlack不仅能保障数据云平台DataSimba、数据存算引擎DataKun内的数据资产安全,也支持对接分析云(例如CDP、UBA)等多类数据应用产品,提供一站式的数据安全管理能力,帮助企业高效满足《个人信息保护法》《数据安全法》《网络安全法》等安全合规要求。

DataBlack R2.0产品架构升级,独立支持全域数据安全

以增长分析(UBA)为例,利用DataBlack完成敏感数据识别后,企业用户可以对UBA内Event、User、Item三张表中存在安全风险的敏感信息进行统一管理,也可以下载风险明细,满足审计要求。

面对数据应用日益多样而安全合规缺失的现状,企业的数据安全管理部门可以借助DataBlack,对全域数据采取一致的数据安全策略与流程应用,给用户授予对应应用的安全角色、配置安全能力,从而真正提高数据安全管控效率。

  • 内置行业模板,开箱即用

根据各行业规范要求和业务特性,DataBlack R2.0内置了数据安全分类分级行业模版,开箱即用,帮助企业高效管理敏感数据,自动生成分级分类全景图

目前,内置模板包括以下三类:

  1. 分类分级标准模板:基于《个人信息保护法》等国家安全法律法规,内置37类敏感数据类别及对应的敏感级别,帮助企业快速完成敏感数据分类、查询状态。
  2. 金融数据安全分类分级模板:依据《金融数据安全 数据安全分级指南》(JR/T 0197—2020),侧重个人金融信息保护和金融重要数据保护。
  3. 智联网汽车数据分类分级模板:依据“数据安全推进计划”出台的《智能网联汽车数据分类分级指南》,侧重智能网联汽车的个人敏感信息和汽车重要数据保护。

  • “冠军算法”加持智能安全

曾斩获全国数据安全赛事冠军的“异常攻击事件检测模型”现已融入DataBlack R2.0

“异常攻击事件检测模型”是一种兼顾“攻击事件分类识别”和“基线行为预测”的多任务深度学习模型,不仅能检测攻击事件发生的时间段、攻击事件类型,还能解析攻击事件的独特表现。

通过该模型所属的“风险智能识别”功能,企业可以监控对应平台内用户的操作行为,自动化检测异常操作,识别离职员工账号违规使用、员工下载敏感数据导致泄露、低权限账号访问敏感重要数据等安全风险问题。

SimbaMetric R2.0

指标管理与开发的效率工具

SimbaMetric(指标工厂)是针对指标统一管理与开发的效率工具,为企业提供一套完整的指标管理与开发体系。

具体而言,SimbaMetric能全面满足指标的业务需求、技术需求以及管理需求提供指标从“提出”、“定义”、“设计”、“开发”、“使用”、“修改”到“下线”等全生命周期的管理功能,为经营分析、风险管理、领导决策等提供管理规范、指标统一、数据易用的产品功能保障。

作为Simba Toolkits(数据服务工具箱)中的一员,SimbaMetric现已进阶为独立版本,不仅支持搭配数据云平台DataSimba增购,也支持单独购买,满足更多客户所需。

 

SimbaMetric R2.0的能力包括:

  • 严谨的分层分域设计,更清晰。在指标开发的过程中,SimbaMetric支持用户严格遵循数仓分层分域的架构设计,让数据结构清晰化、条理化,减少指标的重复开发。
  • 指标建模的方式让指标业务更“落地”。SimbaMetric以“统计粒度+派生指标”形成逻辑表的业务维度和度量字段,使得维度建模的过程与业务紧密结合。例如,渠道维度的订单分析数据,应围绕“渠道”的统计粒度和“订单”相关的派生指标进行开发。
  • 管理数据标准,更强调应用数据标准。在数据治理的场景中,SimbaMetric基于数据标准场景实现了对数据规范的管理,如标准的定义、标准值的定义和条件约束,并通过这套规范执行、检测、维护数据的标准化。
  • 丰富的行业模板库,一键引用。我们将众多行业的实践经验沉淀至高级版模板库功能中,可以在项目中一键引用行业模板并创建,包括但不限于泛零售行业的词根、数据标准、主题域、业务过程等等多个模板。

SimbaTag R2.0

标签开发与管理分析的效率工具

与SimbaMetric同期“独立”的,还有SimbaTag(标签工厂)。

SimbaTag是面向业务标签开发、管理、分析的生产力工具型应用。

聚焦大数据治理环节中高频的标签开发场景,SimbaTag提炼OEET方法论(Object对象-Entity实体-Event事件-Tag标签),可完成标签体系从业务定义到数据模型构建、标签开发的落地全过程,并针对形成的标签资产进行统一的资产管理,提供数据服务API及数据订阅服务。

下游业务系统(例如CDP,客户数据平台)可通过调用SimbaTag提供的Open API接口,灵活调整标签开发模板,迭代衍生标签,沉淀出新的标签资产,形成“标签生产-管理-服务-回流”的标签运营生态。

 与此前的版本相比,SimbaTag R2.0有以下产品优势:

  • 操作配置可视化:可拖拽式构建对象宽表模型,并将字段批量配置为对象属性;
  • 输出表结构稳定:标签输出表采用高表结构,便于下游系统查询及调用;
  • 标签管理接口开放:支持下游系统调用Open API接口进行标签克隆,快速生成衍生标签。

写在最后:为什么选择让它们“自立门户”?

继数据存算引擎DataKun后,数据安全引擎DataBlack、指标工厂SimbaMetric、标签工厂SimbaTag陆续升级为独立版本。

也就是说,上述产品可以单独售卖,而不再只作为数据云平台DataSimba的增购项。已有数仓/数据平台的企业可以根据自身的技术栈规划,按需选购。

相较搭配购买,单独购买独立版本往往更为“轻量”,组合更为灵活。而实践过后,有许多企业会发现各类数据产品工具自成一套,组装时不得不重复建设,架构变得冗杂。

因此,与市面上产品不同的是,上述产品的独立版本均内置了Simba OS(数据云操作系统内核),负责对DataBlack、SimbaMetric、SimbaTag等产品提供数据的存算、权限体系等标准能力。

Simba OS采用对象体系的设计,因此上述产品的独立版本均可继承对象的属性和行为,例如继承“支持60多种数据源”、“具备完善的监控告警运维能力”等。在保持轻量、灵活等优势的同时,无需为多引擎、多依赖、多云、海量多源异构数据等带来的复杂性以及多产品体系打通等问题操心。

期待成为您的理想选择!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/28891.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

深入理解Jdk5引入的Java泛型:类型安全与灵活性并存

深入理解Jdk5引入的Java泛型:类型安全与灵活性并存 ​ 在Java的中,有一个强大的工具,它可以让你在编写代码时既保持类型安全,又享受灵活性。**这个工具就是——泛型(Generics)。**本文将引导你深入了解Java…

袋鼠云数栈 DataOps 数据生产力实践,实现数据流程的自动化和规范化

袋鼠云产品团队在帮助企业进行数字化转型实践的过程中,发现很多企业在数据生产链路上都有着相同的问题。包括数据团队聚焦于业务需求短期内的快速交付,内部缺少自顶向下的数据生产管理制度,在数据标准、数据生产流程到研发规范的各个层面均存…

【网络】数据链路层

目录 一、以太网 二、以太网帧格式 三、 MTU 1、MTU概念 2、 MTU对IP协议的影响 3、MTU对UDP协议的影响 4、 MTU对于TCP协议的影响 四、MAC地址 五、 ARP协议 1、ARP协议的作用 2、ARP协议的工作流程 3、ARP数据报的格式 4、中间人 数据链路层解决的,是…

分享windwosServer2012R--ISO镜像下载地址(含激活教程)

windowsServer2012R----急速网盘下载地址:点击下载 提取码:888999 激活下载:点击下载 提取码:888999

【Linux】网络层、数据链路层、DNS、ICMP协议、NAT技术

​🌠 作者:阿亮joy. 🎆专栏:《学会Linux》 🎇 座右铭:每个优秀的人都有一段沉默的时光,那段时光是付出了很多努力却得不到结果的日子,我们把它叫做扎根 目录 👉网络层&a…

【香瓜说职场】如何高效地提问(2018.05.06)

一、什么是低效地提问? 香瓜先举3个非常非常常见的低效提问实例: 1、“为什么我的XXX不成功?” 这个问题就像“为什么我会摔倒”,可能原因有“腿残疾”、“路上有坑”、“眼神不好”等无数种原因……“不摔倒”的我是回答不了的、…

Django入门 - 路由Route的基本使用

文章目录 1. 直接访问视图函数,没有使用子路由2. 使用子路由 urls.py 我们一般叫它根路由 1. 直接访问视图函数,没有使用子路由 MyDjangoPro2\views.py 代码 from django.shortcuts import renderfrom django.http import HttpResponse# 视图函数Views …

消息队列 (9)-消费者核心类的实现

目录 前言消费者类设计思路核心API总体代码 前言 我们上一篇博客,写了虚拟主机的实现, 在虚拟主机中需要用到俩个未实现的类,分别是验证绑定关键字和消费者类,接下来我们实现消费者类的核心代码 消费者类设计思路 在这个类中,首先我们要持有virtualHost对象来操作数据, 然后…

postman----传参格式(json格式、表单格式)

本文主要讲解postman使用post请求方法的2中传参方式:json格式、表单格式 首先了解下,postman进行接口测试,必须条件是: ♥请求地址 ♥请求协议 ♥请求方式 ♥请求头 ♥参数 json格式 先看一下接口文档,根据接口文档&…

深度学习环境安装依赖时常见错误解决

1.pydantic 安装pydantic时报以下错误: ImportError: cannot import name Annotated from pydantic.typing (C:\Users\duole\anaconda3\envs\vrh\lib\site-packages\pydantic\typing.py) 这个是版本错误,删除装好的版本,重新指定版本安装就…

web-xss

一、简介 XSS 又称CSS(Cross Site Scripting)或跨站脚本攻击,攻击者在网页中插入由JavaScript编写的恶意代码,当用户浏览被嵌入恶意代码的网页时,恶意代码将会在用户的浏览器上执行。 二、xss的攻击方式 Dom:这是一种将任意 Jav…

zookeeper入门学习

zookeeper入门学习 zookeeper应用场景 分布式协调组件 客户端第一次请求发给服务器2,将flag值修改为false,第二次请求被负载均衡到服务器1,访问到的flag也会是false 一旦有节点发生改变,就会通知所有监听方改变自己的值&#…

一键开启ChatGPT“危险发言”

‍ ‍ 大数据文摘授权转载自学术头条 作者:Hazel Yan 编辑:佩奇 随着大模型技术的普及,AI 聊天机器人已成为社交娱乐、客户服务和教育辅助的常见工具之一。 然而,不安全的 AI 聊天机器人可能会被部分人用于传播虚假信息、操纵舆…

SSH 免密登录

SSH SSH(Secure Shell)是一种安全通道协议,主要用来实现字符界面的远程登录、远程复制等功能 SSH 协议对通信双方的数据传输进行了加密处理,其中包括用户登录时输入的用户口令 SSH 为建立在应用层和传输层基础上的安全协议。对数…

使用go获取链上数据之主动拉取-搭建环境(一)

使用go获取链上数据之主动拉取-搭建环境(一) 1、配置文件1.1、新建配置文件1.2、新建setting.go文件1.3、新建config.go文件 2、全局变量配置2.1、新建global.go2.2、初始化配置2.3、验证配置 在我们实际开发项目中,很多时候都需要从链上获取…

PyTorch 微调终极指南:第 1 部分 — 预训练模型及其配置

一、说明 如今,在训练深度学习模型时,通过在自己的数据上微调预训练模型来迁移学习已成为首选方法。通过微调这些模型,我们可以利用他们的专业知识并使其适应我们的特定任务,从而节省宝贵的时间和计算资源。本文分为四个部分&…

数据结构:插入排序

直接插入排序 插入排序算法是所有排序方法中最简单的一种算法,其主要的实现思想是将数据按照一定的顺序一个一个的插入到有序的表中,最终得到的序列就是已经排序好的数据。 直接插入排序是插入排序算法中的一种,采用的方法是:在…

解析隧道代理被封的几个主要原因

Hey,各位爬虫高手,你是不是经常遇到爬虫代理HTTP被封的问题?不要慌,今天我来分享一些信息,帮你解析这个问题!告别封禁,让你的爬虫工作更顺利,赶快跟随我一起了解吧! 在爬…

opencv基础45-图像金字塔01-高斯金字塔cv2.pyrDown()

什么是图像金字塔? 图像金字塔(Image> Pyramid)是一种用于多尺度图像处理和分析的技术,它通过构建一系列不同分辨率的图像,从而使得图像可以在不同尺度下进行处理和分析。图像金字塔在计算机视觉、图像处理和计算机…

APT80DQ60BG-ASEMI快恢复二极管APT80DQ60BG

编辑:ll APT80DQ60BG-ASEMI快恢复二极管APT80DQ60BG 型号:APT80DQ60BG 品牌:ASEMI 芯片个数:双芯片 封装:TO-3P 恢复时间:≤80ns 工作温度:-55C~150C 浪涌电流:600A 正向电…