【星环社区版TDH2024年度大事件】全新版本?全新组件?性能提升10倍?

TDH社区版家族迎来新成员

不知不觉社区版已经陪伴大家将近两年的时间了,在这两年里收获到了很多认可,同时也收获到了一些建议与意见,比如资源成本的问题。在去年我们发布了TDH社区开发版,仅需单台服务器即可一键安装部署Inceptor关系型分析引擎以及Hyperbase NoSQL宽表数据库,降低资源成本的同时充分提升了开发效率。

发布后获得了很多用户的关注与喜欢。为了进一步满足用户在多样化数据检索以及使用图模型探索复杂的关联关系等方面的需求,此次社区开发版正式推出Scope搜索引擎以及StellarDB图数据库。

image.png

社区开发版让众多开发爱好者可以0成本、低门槛快速的构建数据开发环境,无论您是想快速地体验企业级产品功能,亦或是想要学习了解相关技术,社区开发版都能很好地满足您的需求。

  • 开箱即用:Scope社区开发版及StellarDB社区开发版同样采用了all-in-one全内置设计的产品包形式,将各类核心服务深度整合于一体,开箱即可用。免去了平台安装的步骤,只需三步即可一键启动。用户无需花费大量时间和精力来进行环境配置、安装部署,平台预先设置了最佳的默认参数配置,确保了用户在部署时能享受到前所未有的简便快捷;
  • 低成本:社区开发版充分降低了用户的使用门槛以及资源成本,单台服务器即可一键部署。自研的统一SQL引擎更是进一步降低了用户的整体学习成本和应用开发门槛;
  • 企业级管理套件:社区开发版同样配备了企业级管理套件,比如对所有组件与服务进行统一管理的平台Manager、全方位监控系统负载与任务运行状况的平台监控软件Aquila Insight、提供身份认证与精细化权限安全管理软件Guardian。通过完备的管理组件,用户得以全面而精确地把握产品环境整体的运行情况,真正做到运维无忧。

以下为相关资源链接:

  • 产品下载地址: 下载官网
  • 产品安装教程: 安装手册(内含视频教程)
  • 产品升级教程: 升级手册(内含视频教程)
  • Scope使用手册: 手册
  • StellarDB使用手册: 手册
  • 【0-1系列】快速了解搜索引擎Scope
  • 使用图数据库进行人物关系探索Demo示例及教程
  • 使用图数据库进行反洗钱之银行转账流水数据分析

版本全线更新,全面解决小文件、数据倾斜等问题

TDH社区开发版以及社区版让众多的开发爱好者可以“0成本”“低门槛”,快速的构建数据开发环境。无论用户是想快速体验企业级产品功能还是想要学习了解相关技术,都能够很好的满足用户的需求。

此次社区版家族还针对版本做了更新。

新版本特性可查看: ReleaseNotes

image.png

image.png

更新点1. 小文件问题救星来了

大数据场景下会产生海量文件,随着每日增量数据的插入以及可能的数据重复插入,HDFS上的文件数与日俱增,达到千万甚至上亿的级别。当小文件过多时,将会导致长GC、OOM、集群不稳定,增加计算资源的开支等一系列问题。因此小文件治理是必要的也是迫切的。

星环产品针对不同表格式均有对应的Compact机制,譬如针对Holodesk表用户可以使用Compact Service(小文件合并专用服务)进行小文件合并任务,该服务在组件级别做了隔离,开启后不会影响到Quark的查询计算性能,合并效果更好。

但是在Inceptor跑批场景下会涉及ORC等非事务表,其不像事务表有文件合并的逻辑。而且,开源产品的方案通常是在任务运行结束后再去起一个Job执行合并任务,但是在这个阶段,表无法对外提供服务,只能读不能写,相关业务会受到影响。

所以星环采用了全新的技术,针对这个场景做了设计了新的算法,在任务运行过程中动态的执行小文件合并操作,能够确保在合并过程中Quark端的业务,包括表的读,写,删除等操作能够不被长时间阻塞,并成功执行不报错。

社区版今年将企业版针对非事务表小文件治理方面的功能Galactus做了引入,社区版用户也可以高效治理自己集群内的小文件,无需担心因为处理不及时或有疏漏影响到业务系统。更多原理解析及使用教程可查看: Text/ORC非事务表合并最佳方式

除了非事务表小文件更新的能力之外,社区版此次也引入了归档分区功能,针对一些较少访问及更改的历史数据及分区信息,用户可以选择跨分区进行合并,从而进一步的去减少存储开销、元数据管理的开销以及处理时的任务调度开销。 归档分区介绍及使用方法

更新点2. 数据倾斜治理好帮手

数据倾斜指的是说在并行处理海量数据的时候,单个task上需要处理大量的数据。一些处理节点会比其他节点需要更长的时间运行才能完成数据计算,这样既限制了并行处理的效率,也造成了空闲处理节点的资源浪费,系统将无法充分利用节点进行并行处理,十分影响性能和效率。

当在计算过程中出现数据倾斜的问题时,通常可以通过采用针对倾斜的key单独处理或MapJoin等方式进行处理。但是比如像MapJoin主要适用于大小表关联的情况。

社区版此次针对大表与大表之间进行关联发布了新的SkewJoin功能,可以在一定程度缓解大表关联场景下的数据倾斜问题。

更多原理解析及使用教程可查看:SkewJoin原理解析及使用介绍

更新点3. 全新Manager

Manager是保障集群稳定运行最高效的方式,它为底层每个核心组件都提供了强大的统一管理及运维能力。所以这次Manager针对UI,监控服务的集成也做了全新的优化升级,解锁新增了各项创新功能之外,也做了系统范围内的性能提升。

比如说开源产品在管理大集群方面一直以来都存在一些挑战,社区版在管理集群的能力上跟企业版保持了一致,所以这次也针对大集群下的集群安装,节点上下线的管理,以及服务的配置,启动等方面做了全方位的性能提升,操作速度更快也更稳定了。即使是数百上千个节点,在生产上也不用担心。

更多Manager新版本特性可查看: ReleaseNotes

TDH社区订阅版迎来最强辅助,TDS开发套件强势来袭

企业在信息化过程中积累了大量的业务系统和数据,TDH社区订阅版的发布,为企业在整合已有的海量多维度、多样化数据、数据统一化等方面的业务需求提供了有力支持。那么在构建数据仓库或数据湖的过程中,除了需要构建统一的计算和存储平台,进行统一的元数据管理之外,利用数据开发套件支持数据汇聚和开发也是企业数据平台建设过程的关键。

星环科技大数据开发工具 Transwarp Data Studio (TDS)为企业提供了一个一站式统一的数据开发平台,各个套件可以支持多个场景的使用需求,如数据开发场景、数据治理场景或者综合性的数据中台场景。针对更加细化的细分场景如任务流调度、血缘分析或数据资产门户等,TDS可以支持任意组件组合的形式,提供产品能力服务。

此次社区订阅版上架的TDS数据开发套件(SQLBook/Workflow/Transporter)提供了数据集成、SQL开发和任务调度的能力,帮助企业将数据归集到数据仓库和数据湖,可以更高效地完成数据统一化。

开发套件能力演示视频

image.png

image.png

有关更多详细的产品能力介绍,感兴趣的读者可访问 TDS平台各功能能力一览 进一步查看。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/856899.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

创新实训2024.05.01日志:document-loaders

在建立易学知识库的过程中,仅仅有向量数据库以及词嵌入模型、分词器是不够的,因为我们有大量的非结构化文本(如doc,pdf)或者是图片需要上传(例如pdf里面有图片),此时词嵌入无法直接向向量数据库…

Uniapp获取具体地理位置

使用uniapp自带uni.getLocation获取当前定位经纬度 再调用高德逆地理编码API,查到具体位置信息 https://restapi.amap.com/v3/geocode/regeo?location${longitude},${latitude}&key${key}&extensionsall 但是个人申请的key,有配额限制 最多每…

LabVIEW程序闪退问题

LabVIEW程序出现闪退问题可能源于多个方面,包括软件兼容性、内存管理、代码质量、硬件兼容性和环境因素。本文将从这些角度进行详细分析,探讨可能的原因和解决方案,并提供预防措施,以帮助用户避免和解决LabVIEW程序闪退的问题。 1…

qmt量化交易策略小白学习笔记第44期【qmt编程之期货行情数据】

qmt编程之获取期货行情数据 qmt更加详细的教程方法,会持续慢慢梳理。 也可找寻博主的历史文章,搜索关键词查看解决方案 ! 获取行情数据 提示 使用该接口时,需要先订阅实时行情(subscribe_quote)或下载过历史行情(download_hi…

k8s中 docker和containerd 镜像相互导入导出

containerd镜像导出并导入docker 1 查看containerd 本地镜像列表 crictl images 2 containerd 导出本地镜像到当前目录下(注意: 导出导入需要指定镜像平台类型 --platform) ctr -n k8s.io images export nacos-server-24-06-30-13-02-…

openGauss开发者大会、华为云HDC大会举行; PostgreSQL中国技术大会7月杭州开启

重要更新 1. openGauss Developer Day本周五于北京举行,大会聚集了相关行业专家、用户、伙伴和开发者,分享给予openGauss的联合创新成果和实践案例。([2] ) ;华为云 HDC 2024本周五于东莞松山湖举行,主题演讲主要覆盖鸿蒙、AI ([3…

Vue3 + Ant-Design 中 a-date-picke 实现选择切换年份 没有鼠标光标,输入框内自带‘年’

效果图&#xff1a; 效果图 <a-date-picker ref"datePicker" v-model:value"year" picker"year" value-format"YYYY年" format"YYYY年" :bordered"false" :allowClear"false" inputReadOnly change&…

【前端项目笔记】3 用户管理

用户管理相关功能实现 涉及表单、对话框、Ajax数据请求 基本页面 用户列表开发 在router.js中导入Users.vue 解决用户列表小问题 选中&#xff08;激活&#xff09;子菜单后刷新不显示高亮 给二级菜单绑定单击事件&#xff0c;点击链接时把对应的地址保存到sessionSto…

vlan技术--交换机实现局域网分割(Access模式trunk模式)

自作笔记... 目录 vlan技术--交换机连接pc实现局域网分割(Access模式) PC SW1 结果 vlan技术--交换机连接pc实现局域网分割(trunk模式) vlan技术--交换机连接pc实现局域网分割(Access模式) 交换机先创建vlan. 交换机分别进入接口 (配置好连接模式, 连接的vlan) PC SW1 …

Set集合系列——Set、HashSet、LinkedHashset、TreeSet

Set系列的公共特点&#xff1a;无重复、无索引&#xff0c;不可用普通for循环&#xff0c;API和Collection重复 HashSet&#xff1a;采取哈希表存取数据 哈希表组成&#xff1f; JDk8之前&#xff1a;数组链表&#xff0c; JDK8以后&#xff1a;数组链表红黑树 哈希值&#…

简单高效的盈利策略,昂首资本推荐价格行为交易

有没有这样一种简单高效的盈利策略&#xff0c;不仅易于新手掌握&#xff0c;也是专业人士的常用利器?当然有了&#xff0c;就是Anzo Capital昂首资本今天推荐的价格行为交易。价格行为交易以其透明清晰的市场视角受到交易员的青睐&#xff0c;它如实反映了市场的真实动态&…

Ubuntu下安装docker

一、docker安装说明 解决官方源无法下载的问题 二、使用步骤 1.更新软件包索引 sudo apt-get update2.安装必要的软件包&#xff0c;以允许apt通过HTTPS使用仓库 sudo apt-get install apt-transport-https ca-certificates curl software-properties-common3.添加Docker的…

功能测试 之 单模块测试----购物车模块

1.需求分析 &#xff08;1&#xff09;购物车显示 1.若未登录&#xff0c;提示登录&#xff0c;提示文案“购物车内暂时没有商品&#xff0c;登录后将显示您之前加入的商品” 2.若已登录&#xff0c;购物车没有商品&#xff0c;提示去购物。 未登录状态 已登录状态 3.购物车有…

CVPR2024|UniPAD:一种自动驾驶的统一的预训练范式

本文章仅用于学术分享 论文标题丨 UniPAD: A Universal Pre-training Paradigm for Autonomous Driving 论文地址丨 https://arxiv.org/abs/2310.08370 代码地址 | https://github.com/Nightmare-n/UniPAD 关注「AI前沿速递」公众号&#xff0c;获取更多前沿资讯 01总览 这…

Spring Clude 是什么?

目录 认识微服务 单体架构 集群和分布式架构 集群和分布式 集群和分布式区别和联系 微服务架构 分布式架构&微服务架构 微服务的优势和带来的挑战 微服务解决方案- Spring Cloud 什么是 Spring Cloud Spring Cloud 版本 Spring Cloud 和 SpringBoot 的关系 Sp…

「51媒体」食品展览展会活动,媒体邀约资源有哪些?

传媒如春雨&#xff0c;润物细无声&#xff0c;大家好&#xff0c;我是51媒体网胡老师。 食品展览展会活动在媒体邀约方面拥有丰富的资源&#xff0c;可以吸引各类媒体的关注和报道。以下是一些常见的媒体邀约资源&#xff1a; 1. 行业媒体&#xff1a; 专业食品杂志&#xff…

可编程非线性RCD负载原理与应用

可编程非线性RCD负载&#xff08;Resistor-Capacitor-Diode&#xff09;是一种电子元件&#xff0c;其电阻、电容和二极管的特性可以通过编程进行控制和调整。这种负载广泛应用于电力系统、通信设备、电子设备等领域&#xff0c;具有很高的实用价值。 RCD负载的基本原理是利用电…

超声波清洗机的优势到底有哪些?四款精良爆品总结安利,质量放心

眼镜是现代人生活中的必备物品&#xff0c;但是很多人可能对于如何正确清洗眼镜感到困惑。传统的清洗方法可能会在清洗过程中对眼镜造成损坏&#xff0c;例如使用普通肥皂或清水清洗时容易划伤镜片。为了解决这个问题&#xff0c;家用眼镜超声波清洗机应运而生。超声波清洗机利…

[华为北向网管NCE开发教程(6)消息订阅

1.作用 之前介绍的都是我们向网管NCE发起请求获取数据&#xff0c;消息订阅则反过来&#xff0c;是网管NCE系统给我们推送信息。其原理和MQ&#xff0c;JMS这些差不多&#xff0c;这里不过多累述。 2.场景 所支持订阅的场景有如下&#xff0c;以告警通知为例&#xff0c;当我…

Talk|北京大学张嘉曌:NaVid - 视觉语言导航大模型

本期为TechBeat人工智能社区第602期线上Talk。 北京时间6月20日(周四)20:00&#xff0c;北京大学博士生—张嘉曌的Talk已经准时在TechBeat人工智能社区开播&#xff01; 他与大家分享的主题是: “NaVid - 视觉语言导航大模型”&#xff0c;NaVid是首个专为视觉语言导航&#xf…