致敬图灵!HashData拥抱数据智能新时代!

图片

图1:2023ACM中国图灵大会现场

生于1912年的艾伦·图灵被称为“计算机科学之父”、“人工智能之父”。1966年,国际计算机协会(ACM)为了纪念这位卓越的科学家,设立了以其名字命名的ACM图灵奖,以表彰在计算机领域做出重大贡献的科学家。

时至今日,图灵专注创新、持续探索的精神激励着一代又一代的科学家投身计算机科学的研究,由此带动的IT技术变革也深刻影响了社会和经济的发展。

今天,新一轮人工智能科技革命和产业变革已然到来。自去年年底以来,国内众多科技企业陆续推出大模型产品,并积极推进大模型的行业落地应用。

在AI大模型火热的当下,以“通用智能,人机共生”为主题的2023ACM中国图灵大会于7月28日至30日在武汉召开。酷克数据作为国内云原生数据仓库领军企业,受邀参与本次大会。在会上,酷克数据展示了基于HashData云数仓自主研发的下一代高级分析和数据科学工具HashML,助力 AI 模型生产应用和规模化落地。

三层解耦 降低数据分析成本

AI模型训练需要依托海量的文本、图像和视频数据。如何低成本、高效率地管理与利用数据,是企业在人工智能时代面临的重要挑战。HashData云数仓通过创新的三层解耦架构设计,在保证了数据的一致性的同时,节省了更低的存储和调用资源。

图片

图2:HashData产品架构

HashData的湖仓一体特性帮助企业一站式管理多模态训练数据。产品架构完美适应混合云,最大限度帮助用户实现公域训练数据和私有训练数据的安全、合规、统一管理和调度。云架构带来的充分弹性和并发性,支持几乎无限的横向扩展,满足用户长时间、高密度的数据提取与计算的峰值需求。此外,HashData支持亿级向量存储,为大模型训练提供根本的底层支持。

同时,HashData云数仓能够充分发挥云平台的弹性和扩展能力,并且将数据持久化到底层对象存储,大幅度降低企业进行数据分析的成本。

HashData数据仓库可无缝对接多种公有云和混合云,以统一的平台提供包括数据仓库、数据湖、数据科学、数据工程和数据共享等能力,可以支持千万级的数据库对象、100+PB数据量、数千个并发应用。

此外,通过支持对象存储,HashData能够提供完全兼容多个公有云与混合云的数据管理能力,为企业多云战略的实施提供了灵活易用的解决方案。

两大引擎 高效管理海量数据

在数据智能产业链上,基础设施建设和模型生产应用是AI大模型发展的必由之路,而机器学习是Al成长的重要“抓手”。

传统MPP架构的数据库,在机器学习解决方案存在支持算法种类有限、缺乏数据并行训练、新算法开发难度大等诸多问题,难以满足数据管理和模型开发的需求。

与之相比,HashData拥有两种计算引擎:针对SQL查询分析任务的MPP计算引擎,以及针对机器学习和深度学习任务的ML/DL计算引擎。

基于存算分离的架构,HashData不仅能够通过SQL计算引擎对传统的数仓业务提供很好的支持,还能够借助ML/DL计算引擎实现对机器学习和深度学习的高效支持,其中包括在库内环境对大语言模型进行微调和推理。HashML就是酷克数据利用HashData强大的计算引擎打造的下一代In-Database高级分析和数据科学工具。

 图3:基于HashData双计算引擎架构构建HashML

同时,HashData还实现了对大规模向量数据的高效存储和检索,使得基于知识增强的LLM智能应用搭建变得更加简单。

一步到位 助力大模型规模化应用

AI 模型开发完成后需要在实际生产环境中落地部署,才能最终实现价值。

国际调研机构Gartner的研究表明,只有53%的项目能够从 AI 原型转化为生产。AI生产转化率低的主要原因在于模型全链路生命周期管理存在问题,包括跨团队协作难度大、过程和资产管理欠缺、生产和交付周期长等。

为了解决这些问题,HashML提供了从数据查询处理、高级分析到ML/DL模型的训练、推理和服务部署的全套工具,实现对大语言模型微调和推理的全链路支持。例如,借助HashML,最少用3行代码就可以对LLaMA2模型进行参数高效的微调:

图片

图4:用HashML对LLaMA2模型进行微调

HashML与HashData云数仓共享统一的存储和计算资源,随数仓的部署提供开箱即用、一站式交付的AI能力,大幅降低了系统部署的成本和复杂度,为开发者提供了统一的数据查询、分析、建模环境。

图片

图5:HashML主要功能概览

作为一款算法先进、性能卓越的数据科学工具,HashML能够帮助用户高效、简易地构建、训练和部署模型,极大地降低建模使用门槛,让用户能够在短时间内尝试多种模型架构和参数组合,从而更好地满足多元应用场景的需求。

目前,HashML各项功能正在紧锣密鼓地完善中,预计将于八月发布第一个正式版本。届时,我们将邀请各方合作伙伴共同参与验证测试,推动产品快速迭代升级,加速 AI 落地,让AI惠及各行各业。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/13110.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

入门redis你一定需要知道的命令

1、各种数据类型的特点 字符串(string):普通字符串,Redis中最简单的数据类型 哈希(hash):也叫散列,类似于Java中的HashMap结构 列表(list):按照插入顺序排序,可以有重复元素,类似于Java中的Li…

nginx如何配置两个服务器的连接

nginx 中通过server_name listen的方式配置多个服务器 nginx配置两个站点的windows操作方法,双域名双站点

JavaWeb_LeadNews_Day4-阿里云内容安全, 雪花算法, app文章保存, 自媒体文章审核

JavaWeb_LeadNews_Day4-阿里云内容安全, 雪花算法, app文章保存, 自媒体文章审核 阿里云内容安全分布式主键策略-雪花算法app文章保存具体实现总结 自媒体文章审核提取内容和图片审核内容和图片保存app端文章Feign远程调用降级发布文章异步调用自管理敏感词图片文字识别入门集成…

【【51单片机11.0592晶振红外遥控】】

51单片机11.0592晶振红外遥控 红外遥控,51单片机完结 这是初步实现的架构 怎么实现内部的详细逻辑 我们用状态机的方法 0状态时一个空闲状态 当它接收到下降沿开始计时然后转为1状态 1状态下 寻找start 或者repeat的信号 再来下降沿读出定时器的值 如果是start 那…

UE4/5C++多线程插件制作(十八、Graph线程封装,以及宏的设置)

目录​​​​​​​ 什么是Graph线程? MTPThreadGraphManage.h MTPThreadInterface.h MTPThreadGraphManage.h MTPManage.cpp void FMTPThreadGraphManage::Wait(const FGraphEventRef& EventRef)</

QT 常用数据结构整理

目录 QString篇 QString篇 //初始化bool bOk false;QString str "sd";QString strTemp(str);str QString("%1,%2").arg("11").arg("-gg");qDebug()<<str;str.sprintf("%s %d","ni",1);qDebug()<<…

网安笔记2

一、实例对象 1.对象是单个实物的抽象&#xff0c;是一个容器&#xff0c;封装了属性和方法 2.构造函数&#xff0c;构造函数就是一个普通的函数&#xff0c;但具有自己的特征和用法。 var Vehicle function () { this.price 1000; }; 上面代码中&#xff0c;Ve…

前端(Electron Nodejs)如何读取本地配置文件

使用electron封装了前端界面之后&#xff0c;最终打包为一个客户端&#xff08;exe&#xff09;。但是&#xff0c;最近项目组内做CS&#xff08;c开发&#xff09;的&#xff0c;想把所有的配置都放进安装目录的配置文件中&#xff08;比如config.json&#xff09;。这做法&am…

M 芯片的 macos 系统安装虚拟机 centos7 网络配置

centos 安装之前把网络配置配好或者是把网线插好 第一步找到这个 第二步打开网络适配器 选择图中所指位置 设置好之后 开机启动 centos 第三步 开机以后 编写网卡文件保存 重启网卡就可以了&#xff0c;如果重启网卡不管用&#xff0c;则重启虚拟机即可 “ ifcfg-ens160 ” 这…

黑苹果如何在macOS Sonoma中驱动博通网卡

准备资源&#xff08;百度&#xff1a;黑果魏叔 下载&#xff09; 资源包中包含&#xff1a;AirportBrcmFixup.kext/IOSkywalkFamily.kext/IO80211FamilyLegacy.kext/OpenCore-Patcher 使用方法&#xff1a; 1.将 csr-active-config 设置为 03080000 全选代码 复制 2.在 …

c++数据锁链

题目描述&#xff1a; 创建一个结构体为Node&#xff0c;具有value , next 两个属性&#xff1b; value为整型&#xff0c;用来储存结构体数值&#xff1b; next为Node类型指针&#xff0c;用来指向下一组数据地址&#xff1b; 第1组数据value 5&#xff1b; 第2组数据value …

php查询数据(日期查询)和fastadmin的日期查询

当前月查询 要在 PHP 中查询数据库中当前月份的数据&#xff0c;需要使用 SQL 查询语句来筛选出符合条件的数据。首先&#xff0c;确保数据库中有一个日期或时间类型的字段用于存储记录的日期信息。 假设你的数据库表名为 my_table&#xff0c;其中有一个名为 date_column 的…

MATLAB RANSAC平面拟合 (29)

MATLAB RANSAC平面拟合 (29) 一、算法简介二、函数介绍三、算法实现四、效果展示一、算法简介 将一个平面与一个从内点到平面的最大允许距离的点云相匹配。该函数返回描述平面的几何模型。该函数采用 M- 估计量样本一致性(MSAC)算法求解平面。MSAC 算法是随机样本一致性(RAN…

【C++】STL——list的介绍和使用、list增删查改函数的介绍和使用、push_back、pop_back

文章目录 1.list的使用2.list的增删查改函数&#xff08;1&#xff09;push_front 在list首元素前插入值为val的元素&#xff08;2&#xff09;pop_front 删除list中第一个元素&#xff08;3&#xff09;push_back 在list尾部插入值为val的元素&#xff08;4&#xff09;pop_ba…

常用的一些蓝图(持续更新)

文章目录 ADEIPS A Apply Damage: 对指定的actor应用伤害。 Add Mapping Context: 添加控制映射上下文。 D Do Once: 仅在第一次命中节点时触发&#xff0c;但可以重置。 Delay: 延迟执行。 Destroy Actor: 销毁指定的actor。 E Enhanced Input Local Player Subsystem: 从玩家…

Elasticsearch 分片策略

文章目录 分片索引设置分片获取索引分片信息示例 分片分配集群级分片分配索引级分片分配索引级分片筛选每个节点的分片总数索引恢复优先级节点掉线时延时分配 分片 和数据库中的表空间类似&#xff0c;不过分片是为每个索引设置&#xff0c;一个索引可以有多个分片&#xff0c…

TCP三次握手/四次挥手

三次握手 三次握手过程 TCP服务器进程先创建传输控制块TCB&#xff0c;时刻准备接受客户进程的连接请求&#xff0c;此时服务器就进入了LISTEN&#xff08;监听&#xff09;状态&#xff1b;TCP客户进程也是先创建传输控制块TCB&#xff0c;然后向服务器发出连接请求报文&…

【QT 网络云盘客户端】——登录界面功能的实现

目录 1.注册账号 2.服务器ip地址和端口号设置 3. 登录功能 4.读取配置文件 5.显示主界面 1.注册账号 1.点击注册页面&#xff0c;将数据 输入 到 用户名&#xff0c;昵称&#xff0c;密码&#xff0c;确认密码&#xff0c;手机&#xff0c;邮箱 的输入框中&#xff0c; 点…

【C语言学习——————动态内存管理】

文章目录 一、什么是动态内存管理二、动态内存函数的介绍 1.malloc函数的介绍2.calloc函数的介绍3.realloc函数的介绍三、free函数的介绍 一.什么是动态内存管理 我们知道数据都是在内存中进行储存的&#xff0c;但是如果我们需要调用内存&#xff0c;我们可以通过定义一个变量…

HTML <p> 标签

实例 以下代码标记了一个段落&#xff1a; <p>This is some text in a very short paragraph</p> &#xff08;在页面下部&#xff0c;您可以找到更多实例。&#xff09; 浏览器支持 元素ChromeIEFirefoxSafariOpera<p>YesYesYesYesYes 所有主流浏览器都…