Answer.AI开启家用70亿参数模型训练新篇章

Answer.AI开启家用70亿参数模型训练新篇章

摘要

2024年3月6日,Answer.AI推出首个项目:一套开源系统,首次实现在家用台式机上,仅需两块标准游戏GPU(RTX 3090或4090),高效训练70亿大型语言模型。此系统结合了FSDP和QLoRA技术,由Answer.AI、Tim Dettmers(华盛顿大学)和Hugging Face的Titus von Koeller及Sourab Mangrulkar合作开发。此系统旨在帮助开源社区发布更优秀的模型。

背景

在深度学习模型训练领域,通常使用的有数据中心级硬件(如H100s和A100s),其成本达数十万美元;与之相对的是,装有游戏GPU的桌面计算机(如双4090),成本不足1万美元。数据中心GPU与游戏GPU性能相似,但前者价格昂贵且功耗巨大。Answer.AI旨在寻找利用游戏GPU训练大型语言模型的方法,以降低训练成本,提高可访问性。

QLoRA && FSDP: 大模型训练的新进展

QLoRA是一种将权重量化与低秩适应结合的技术,有效减少模型大小,使得更大的模型能够适应GPU内存限制。另一方面,FSDP(Fully Sharded Data Parallel)技术允许将大型模型分片到多个GPU上并行训练,进一步拓宽训练大型模型的可能区间。

首次尝试的成功

Answer.AI团队通过结合QLoRA与FSDP技术,首次在两块24GB内存的3090 GPU上成功训练了70亿参数的模型,展示了在个人电脑上训练大型模型的可行性。此成就标志着使用家用硬件进行高效模型训练的新时代开端。

未来展望

Answer.AI与开源社区合作,通过进一步的技术优化和共享,致力于降低AI模型训练成本,使AI技术更广泛地被社会各界所使用。我们期待未来有更多创新的方法出现,共同推动AI技术的发展与普及。

使用与测试

为了使广大用户能够体验到该技术,Answer.AI提供了详尽的安装和使用说明。对有兴趣尝试的用户,可以通过我们的开源项目页面获取相关信息进行操作尝试。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/754141.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[leetcode ~dp ]279. 完全平方数

给你一个整数 n ,返回 和为 n 的完全平方数的最少数量 。 完全平方数 是一个整数,其值等于另一个整数的平方;换句话说,其值等于一个整数自乘的积。例如,1、4、9 和 16 都是完全平方数,而 3 和 11 不是。 …

2023年度VSCode主题推荐(个人常用主题存档)

前言 早在2018年的时候发了一篇关于VSCode主题风格推荐——VS Code 主题风格设置,时过境迁,如今常用的主题皮肤早已更替。 今天下午在整理VSCode插件的时候,不小心把常用的那款(亮色)主题插件给删除了,无…

202444读书笔记|《作家榜名著:菜根谭》——大聪明的人,小事必朦胧,大懵懂的人,小事必伺察

202444读书笔记|《作家榜名著:菜根谭》——大聪明的人,小事必朦胧,大懵懂的人,小事必伺察 修省篇(三八则)应酬篇(五一则)评议篇(四八则)闲适篇(四…

添可、希亦、追觅洗地机好不好用?实物终极PK测评分享!

随着人们对家庭生活品质的追求不断地提高,对智能清洁家电的需求也不断地上涨。作为在智能清洁家电领域的资深研究员,结合我八年的使用经验以及专业的眼光,今天就给大家一起来聊聊希亦、追觅、添可洗地机好不好用,以及三款洗地机产…

科技成果鉴定测试如何进行?第三方检测机构进行鉴定测试的好处

科技成果鉴定测试,作为科技领域中一项重要的质量检验手段,具有广泛的应用范围。旨在为科技成果的研发者和使用者提供客观、科学、权威的鉴定结果,从而评估科技成果的技术水平和市场竞争力。   科技成果鉴定测试是对科技成果进行系统、全面的…

Java项目:62 基于ssm的校园驿站管理系统+jsp

作者主页:源码空间codegym 简介:Java领域优质创作者、Java项目、学习资料、技术互助 文中获取源码 项目介绍 管理员管理快递仓库信息,管理待发货信息,管理已收快递,管理物流以及留言信息,管理员工和用户资…

2.7 ROC曲线相比P-R曲线有什么特点?

2.7 ROC曲线相比P-R曲线有什么特点? 前情提要: P-R曲线详见:2.2 什么是精确率(Precision)与召回率(Recall)?二者如何权衡?) 2.4 ROC曲线是什么? 2…

小鹏MONA将至:10 - 15万级,用性价比打新势力,用智驾打比亚迪

‍ 作者 |老缅 编辑 |德新 小鹏的全新品牌即将发布,10-15万级也能有高等级智能驾驶。 3月16日在中国电动汽车百人会论坛2024上,小鹏汽车董事长、CEO何小鹏提出:“下一个十年将是智能化的十年。未来18个月内高阶智驾的拐点将到来”。 所谓…

Excel之数据透视表

数据透视:逻辑理解与制作步骤 一、创建数据透视表 1、创建数据透视表:每列必须有表头 (1)选择要创建数据透视表的数据------插入----选择数据透视表 (2)选择现有工作表然后点击目标表选择合适的位置插入…

第1关:在字符串相邻字符间再插入一个字符

任务描述 本关任务:编写一个能在字符串相邻字符间再插入一个字符的小程序。 编程要求 用户输入一个字符a,再输入一个字符串s,在字符串s相邻的每两个字符之间插入一个字符a输出 根据提示,在右侧编辑器补充代码。 测试说明 平台…

面向对象深度解析---webpack 项目搭建

安装依赖 "devDependencies": {"babel-core": "^6.26.3","babel-loader": "^8.0.6","babel-preset-env": "^1.7.0","html-webpack-plugin": "^3.2.0","webpack": "…

局域网的拓扑结构

局域网的拓扑结构是指局域网中传输介质将各种设备互联的物理布局。以下是几种常见的局域网拓扑结构: 星形结构:在这种结构中,各工作站以星形方式连接起来,每个节点设备都以中心节点为中心,通过连接线与中心节点相连。…

test测试类-变量学习

test测试类 作用:标记到类上成为测试类,标记到方法上成为测试方法 变量:测试类的变量,在测试类括号中应用 1、invocationCount变量 意思是这个方法应该被调用的次数。 在测试框架中,特别是当使用参数化测试或数据驱动…

力扣思路题:最长特殊序列1

int findLUSlength(char * a, char * b){int alenstrlen(a),blenstrlen(b);if (strcmp(a,b)0)return -1;return alen>blen?alen:blen; }

本地知识库的底层逻辑是什么?为什么企业需要它?

如果我们将企业比作一座繁华的城市,那么信息就像是城市的建筑,知识库则是城市的地图。知识库不仅可以帮我们存储整理和搜寻信息,而且还可以为我们提供信息的结构以便我们能够更好地理解和利用这些信息。今天,我们要探讨的就是这个…

数组中的flat方法如何实现

数组的成员有时还是数组,Array.prototype.flat()用于将嵌套的数组“拉平”,变成一维的数组。该方法返回一个新数组,对原数据没有影响。 [1, 2, [3, 4]].flat() // [1, 2, 3, 4]那flat怎么来实现呢? 1、使用while循环 实现的代码…

Centos7 安装postgresql14后无法连接数据库

1、数据库服务器允许外部访问5432端口。 2、postgresql.conf 3、pg_hba.conf a、制定某个IP(192.168.0.107)访问 b、指定ip段访问 允许10.1.1.0~10.1.1.255网段登录数据库 host all all 10.1.1.0/24 trust c、指定全网访问 host a…

高可用篇_A Docker容器化技术_V 基于DockerCompose实现容器编排

原创作者:田超凡(程序员田宝宝) 版权所有,引用请注明原作者,严禁复制转载 Docker Compose Sit pre prd环境 为什么需要使用Docker Compose Docker Compose 容器编排技术 容器编排技术 1.现在我们有一个springbo…

【Godot4.2】任意多边形或折线围绕任意点旋转

概述 在很多绘图软件中,都会有对于任意图形围绕给定的旋转中心旋转的基本操作。本节就基于Godot实现任意多边形(Polygon)或折线(Polyline)绕任意旋转中心(在图形内或外都可以)进行旋转。 基本…

linux 16进制写入

1.简单用法[推荐] echo 001122334455 | xxd -r -ps > test // 6 个字节xxd // xxd 命令用于用二进制或十六进制显示文件的内容 -r // 把xxd的十六进制输出内容转换回原文件的二进制内容 -ps // 以 postscript的连续十六进制转储输出,这也叫做纯十六进…