Llama 3下月正式发布，继续开源！

Llama 3下月正式发布，继续开源！

news/2025/4/21 12:36:15/文章来源:https://blog.csdn.net/weixin_57291105/article/details/137591552

4月10日，Techcrunch消息，Meta在本周伦敦举办的一场活动中确定，下个月将正式发布Llama 3并且继续开源。

Meta全球事务总裁Nick Clegg表示，我们希望在下个月，甚至更短的时间内，正式推出新一代基础模型Llama 3。它将有很多个版本，而且功能也各不相同。

根据Meta的AI副总裁Joelle Pineau透露，Llama 3的参数大约只有1400亿左右，将继续保持高性能，低参数的风格。这对于中小企业和个人开发者来说帮助巨大，可以节省很多成本。

Llama系列模型时类ChatGPT开源模型的鼻祖，早在去年2月，ChatGPT火爆出圈时，全球多个国家、地区皆在尝试开发类似的产品。虽然已经有一些开源产品，但在功能、能耗等方面与其相差甚远。

同月，Meta重磅开源了类ChatGPT开源模型LLaMA。随后，国内外不少科研机构、个人开发者在LLaMA基础之上，开发了众多知名开源项目。但LLaMA有一个致命缺点，无法商业化只能用于研究。

LLaMA与ChatGPT同样是基于Transformers架构演变而来，共有70亿、130亿、330亿和650亿参数四种类型，接受了20种不同语言文本的训练。

数据训练方面，LLaMA使用公开可用的数据集进行训练，其中包括开放数据平台Common Crawl、英文文档数据集C4、代码平台GitHub、维基百科、论文平台ArXiv等，总体标记数据总量大约在1.4万亿个Tokens左右。

2023年7月，Meta在LLaMA基础之上训练、开源了LLaMA 2，拥有70亿、130亿、340亿和700亿四种参数。并且这一代终于允许商业化。

Llama 2 预训练模型接受了2万亿个标记的训练，上下文长度是Llama 1的两倍。其微调模型已经接受了超过100 万个人类注释的训练，整体性能非常强悍。

目前，Llama 2也是整个生成式AI开源界应用最多的大模型之一。

本文素材来源Techcrunch，如有侵权请联系删除

END

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/815111.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

云服务器宝塔ssh:tabby 部署SpringBoot项目

云服务器宝塔ssh:tabby 部署SpringBoot项目

阿里云服务器 ----》 linux 云服务器 ， ip , root 密码 tabby -----> ssh 连接工具 ，用这个连接云服务器去操作云服务器宝塔 -------》可视化工具，快速部署云服务器的安装环境 ，部署项目。 tabby :Tabby Terminal 下载…

阅读更多...

【华为OD机试】比赛的冠亚季军（深度优先搜索—JavaPythonC++JS实现）

【华为OD机试】比赛的冠亚季军（深度优先搜索—JavaPythonC++JS实现）

本文收录于专栏：算法之翼本专栏所有题目均包含优质解题思路，高质量解题代码(Java&Python&C++&JS分别实现)，详细代码讲解，助你深入学习，深度掌握！文章目录一. 题目二.解题思路三.题解代码Python题解代码JAVA题解代码C/C++题解代码JS题解代码四.代码讲解(Ja…

阅读更多...

ubuntu netplan 设置dns

ubuntu netplan 设置dns

ubuntu netplan 设置dns 要配置netplan，请/etc/netplan/使用.yaml扩展名（例如/etc/netplan/config.yaml）保存配置文件，然后运行sudo netplan apply。此命令解析配置并将其应用于系统。配置文件格式参照这里. eth0:dhcp4: noa…

阅读更多...

机器学习和深度学习--李宏毅（笔记与个人理解）Day9

机器学习和深度学习--李宏毅（笔记与个人理解）Day9

Day9 Logistic Regression（内涵，熵和交叉熵的详解） 中间打了一天的gta5，图书馆闭馆正好npy 不舒服那天天气不好，哈哈哈哈哈总之各种理由吧，导致昨天没弄起来，今天补更！ 这里重点注意…

阅读更多...

git修改某个远端服务器的地址的方式以及4种remote（git remote set-url origin xxx、git remote -v）

git修改某个远端服务器的地址的方式以及4种remote（git remote set-url origin xxx、git remote -v）

假设本地有1个远端仓库，默认一般叫origin，原来对应的git url是：gitxxx.git # 查看方式： git remote -v# 修改方式： git地址url指定远程仓库：（常用） git remote set-url origin gitn…

阅读更多...

面试官：实战中用过CountDownLatch吗？详细说一说，我：啊这...

面试官：实战中用过CountDownLatch吗？详细说一说，我：啊这...

写在开头在很多的面经中都看到过提问 CountDownLatch 的问题，正好我们最近也在梳理学习AQS（抽象队列同步器），而CountDownLatch又是其中典型的代表，我们今天就继续来学一下这个同步工具类！ CountDownLatc…

阅读更多...

机器学习第34周周报VBAED

机器学习第34周周报VBAED

文章目录 week34 VBAED摘要Abstract一、文献阅读1. 题目2. abstract3. 网络架构3.1 序列问题阐述3.2 变分模态分解3.3 具有 BiLSTM 和双向输入注意力的编码器3.4 具有 BiLSTM 和双向时间注意力的解码器 4. 文献解读4.1 Introduction4.2 创新点4.3 实验过程4.3.1 数据集数据预处…

阅读更多...

Redis为什么会变慢

Redis为什么会变慢

链接: https://pan.baidu.com/s/1PNzhDMqkFBdKUu9_FxA5zw 提取码: euvk

阅读更多...

软考中级网络工程师-计算机基础理论与安全-第三节存储技术基础

软考中级网络工程师-计算机基础理论与安全-第三节存储技术基础

关于进程与线程的描述中，正确的是：( ) A 进程与线程是相同的概念 B 进程需要存储空间 C 一个线程可包含多个进程 D 线程不需要分时器切换试题答案正确答案： B 答案解析一个运行的程序对应一个进程，需要相应的存储空间。在实际中…

阅读更多...

若依 ruoyi-vue 维护Ancestors字段树转换成List

若依 ruoyi-vue 维护Ancestors字段树转换成List

迁移部门表，没有ancestors字段，若依部门权限没办法做，写了一段代码维护ancestors字段。调用的若依框架组成树的方法，拼接ancestors public AjaxResult tree() {List<SysDept> depts deptService.selectDeptTree();for (Sy…

阅读更多...

以太网数据量大小字符串生成方法（可变单位）

以太网数据量大小字符串生成方法（可变单位）

0 前言当我们想显示以太网数据量大小时，往往有个头疼的单位需要处理，单位取小了不一目了然，单位取大了精度太低。本例设计一个函数，将根据以太网数据量大小自动生成单位可变的字符串（KB、MB、GB、TB、PB）…

阅读更多...

雷军 30 年前的病毒论文，结语最后一句是亮点

雷军 30 年前的病毒论文，结语最后一句是亮点

在 2023 雷军年度「成长」主题演讲中，他分享了自己在武汉大学设立的三个目标： 两年修完大学所有学分成为优秀的程序员在学报上发论文对于彼时的在校生来说，在一级学报上发表论文是十分困难的事情，但雷军并没有因困难而畏惧、放…

阅读更多...

【植物大战僵尸融合机器学习】+源码

【植物大战僵尸融合机器学习】+源码

上期回顾： 今天给大家推荐一个Gtihub开源项目：PythonPlantsVsZombies，翻译成中就是植物大战僵尸。《植物大战僵尸》是一款极富策略性的小游戏。可怕的僵尸即将入侵，每种僵尸都有不同的特点，例如铁桶僵尸拥有极强的抗…

阅读更多...

VRRP虚拟路由实验（华为）

VRRP虚拟路由实验（华为）

思科设备参考：VRRP虚拟路由实验（思科） 一，技术简介 VRRP（Virtual Router Redundancy Protocol）是一种网络协议，用于实现路由器冗余，提高网络可靠性和容错能力。VRRP允许多台路由器…

阅读更多...

APP开发_开发一个入门的 H5 APP

APP开发_开发一个入门的 H5 APP

1 开发环境的搭建与准备 1.1 安装 Android Studio 下载：首先，从谷歌的安卓开发者网站（https://developer.android.google.cn/studio/releases?hlzh-cn）下载Android Studio的安装包。在下载页面中，可以根据自己的操作…

阅读更多...

前端传参 json 后端处理反序列化器 boolean转数字空字符串转null

前端传参 json 后端处理反序列化器 boolean转数字空字符串转null

接口报错-JSON parse error: Cannot deserialize value of type java.lang.Integer from Boolean value 入参是Boolean，接收是Integer，导致报错。自定义反序列化器，将boolean转integer。 import com.fasterxml.jackson.core.JsonParser;…

阅读更多...

llamafactory:unified efficient fine-tuning of 100+ lanuage models

llamafactory:unified efficient fine-tuning of 100+ lanuage models

1.introduction llamafactory由三个主要模块组成，Model Loader，Data Worker，Trainer。 2.Efficient fine-tuning techniques 2.1 Efficient Optimization 冻结微调：冻结大部分参数，同时只在一小部分解码器层中微调剩…

阅读更多...

【MATLAB源码-第36期】matlab基于BD,SVD,ZF,MMSE,MF,SLNR预编码的MIMO系统误码率分析。

【MATLAB源码-第36期】matlab基于BD,SVD,ZF,MMSE,MF,SLNR预编码的MIMO系统误码率分析。

操作环境： MATLAB 2022a 1、算法描述 1. MIMO (多输入多输出)：这是一个无线通信系统中使用的技术，其中有多个发送和接收天线。通过同时发送和接收多个数据流，MIMO可以增加数据速率和系统容量，同时提高信号的可靠性。…

阅读更多...

建造者模式：构造复杂对象的艺术

建造者模式：构造复杂对象的艺术

在面向对象的设计中，建造者模式是一种重要的创建型设计模式，专门用来构建复杂的对象。它主要目的是将对象的构造代码与其表示代码分离，使同样的构建过程可以创建不同的表示。本文将详细介绍建造者模式的定义、实现、应用场景以及优缺点&#…

阅读更多...

数字乡村创新实践探索农业现代化与乡村振兴新路径：科技赋能农村全面振兴与农民幸福新篇章

数字乡村创新实践探索农业现代化与乡村振兴新路径：科技赋能农村全面振兴与农民幸福新篇章

随着信息技术的飞速发展，数字乡村成为推动农业现代化与乡村振兴的重要战略举措。科技赋能下的数字乡村创新实践，不仅提升了农业生产的智能化水平，也为乡村治理和农民生活带来了翻天覆地的变化。本文旨在探讨数字乡村创新实践在农业现代化与乡…

阅读更多...

最新文章