Llama 3.1:Meta的最新AI模型发布

Meta的最新AI模型发布

      • 性能特点
      • 基准测试
      • 教学模型
      • 模型结构
      • 开源和可用性

2024年7月23日,Meta正式发布了其开源大型语言模型Llama的最新版本——Llama 3.1。这个版本拥有4050亿参数,是迄今为止Meta发布的最大版本。Llama 3.1是对今年4月发布的Llama 3的更新,之前的版本仅有80亿和70亿参数。

性能特点

Llama 3.1被设计为性能卓越的开源模型,能够与许多行业领先的闭源模型竞争。该模型支持多语言,包括英语、葡萄牙语、西班牙语、意大利语、德语、法语、印地语和泰语。Llama 3.1的上下文窗口扩展到了128,000个令牌,这意味着用户可以输入相当于近400页小说长度的文本。

基准测试

Meta在150多个基准数据集上对Llama 3.1进行了测试,并在现实世界场景中进行了人工引导的评估。结果显示,这个拥有4050亿参数的模型在多项任务上与领先的基准模型,如GPT-4、GPT-4o和Claude 3.5 Sonnet等具有竞争力。

教学模型

Meta还更新了其所有模型的许可证,允许进行模型蒸馏和创建合成数据。这种模型蒸馏,或称为知识蒸馏,使得用户可以将大型AI模型的知识或训练转移到较小的模型上。4050亿参数的版本被称为“教学模型”,能够将其知识传递给8亿和70亿参数的模型。

模型结构

为了使更大的模型更具可扩展性,Meta研究人员决定使用标准的仅变压器模型,而不是近期流行的混合专家架构。公司还使用了一种“迭代后训练程序”来进行监督式微调,并创建了“最高质量”的合成数据来提高其性能。

开源和可用性

与之前的Llama模型一样,Llama 3.1也将开源。用户可以通过AWS、Nvidia、Groq、Dell、Databricks、Microsoft Azure、Google Cloud和其他模型库来访问它。
Llama 3.1 405B版本也将通过WhatsApp和Meta AI提供。这个强大的新模型无疑将在AI领域产生重大影响,为开发者和研究人员提供新的工具和可能性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/49461.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Jdk11与Jdk17区别

JDK 11与JDK 17之间存在一些显著的不同点,以下是具体的差异归纳: 模块化与安全性 JDK 11引入了模块化系统(Jigsaw项目),使得开发者可以将代码组织成模块,提高了大型项目的可维护性和可扩展性。 JDK 17作为长期支持(LTS)版本,增强了模块系统的安全性和可靠性,通过封…

在windows上使用Docker部署一个简易的web程序

使用Docker部署一个python的web服务🚀 由于是从事算法相关工作,之前在项目中,需要将写完的代码服务,部署在docker上,以此是开始接触了Docker这个工具,由于之前也没系统学习过,之后应该可能还会用…

视频压缩大小怎么压缩?几种简单视频压缩方法教给你

现如今,视频已成为我们生活和工作中不可或缺的一部分。然而,高清视频往往伴随着庞大的文件体积,这给存储和传输带来了不小的挑战。这时候我们就需要对视频进行压缩处理,方便储存和发送,那么怎么有效压缩视频呢&#xf…

java之回合制游戏以及如何优化

public class Role {private String name;private int blood;//空参public Role() {}//包含全部参数的构造public Role(String name, int blood) {this.name name;this.blood blood;}public String getName() {return name;}public void setName(String name) {this.name na…

提交高通量测序原始数据到 SRA --- 操作流程

❝ 写在前面 由于最近在提交课题数据到 NCBI 数据库,整理了相关笔记。本着自己学习、分享他人的态度,分享学习笔记,希望能对大家有所帮助。推荐先按顺序阅读往期内容: 1. 提交高通量测序数据到 GEO --- 说明书 目录 1 注册 NCBI 账…

HTML中a标签跳转后路径不正确?

场景&#xff1a;页面中动态设置了一个tag跳转的a标签&#xff0c;由于页面路径都是同级的一直没发现问题&#xff0c;后来新增页签想通过模块目录分类&#xff0c;就出现了跳转后地址路径重复404问题&#xff0c;地址上面总会多出路径拼接 页签举例&#xff1a; <ul id&q…

【C++】关联容器探秘:Map与Multimap详解

目录 1.映射类 map 0. 引入 pair&#xff1a; 1.定义 2.插入 3. 遍历 4.❗operator[]的实现 5. 插入 运用 2.Multimap 类 0. 引入&#xff1a;不去重的 Multi 1. Multimap 不支持 Operator[] 2. Multimap 的删除 1.映射类 map 0. 引入 pair&#xff1a; 在C中&…

1 go语言环境的搭建

本专栏将从基础开始&#xff0c;循序渐进&#xff0c;由浅入深讲解Go语言&#xff0c;希望大家都能够从中有所收获&#xff0c;也请大家多多支持。 查看相关资料与知识库 专栏地址:Go专栏 如果文章知识点有错误的地方&#xff0c;请指正&#xff01;大家一起学习&#xff0c;…

软件测试---测试需求分析

课程目标 什么是软件测试需求 软件测试需求的必要性 如何对软件测试需求进行分析&#xff08;重点&#xff09; 课程补充 灰度测试&#xff08;基于功能&#xff09;&#xff1a;先发布部分功能&#xff0c;然后看用户的反馈&#xff0c;再去发布另外一部分的功能更新。 A/B测…

运筹学笔记

计算的时间问题&#xff01;计算机解决了计算量的问题&#xff01; 计算机的发展对运筹学研究起到了极大的促进作用。 运筹学的一个特征之一是它常常会考虑寻求问题模型的最佳解决方案&#xff08;称为最优解&#xff09;。 没有人能成为运筹学所有方面的专家。 分析学越来越流…

Pytorch 8

这节课是讲mini_batch数据下载的 from torch.utils.data import Dataset from torch.utils.data import DataLoader第一个类是抽象类&#xff0c;只能继承 第二个可以直接用 class DiabetesDataset(Dataset):def __init__(self, filepath):xy np.loadtxt(filepath, delimit…

redis的分片集群(仅供自己参考)

前言&#xff1a;为什么使用分片集群&#xff1a;因为redis的主从和哨兵机制主要是用来解决redis的高并发读的问题&#xff0c;还有redis的高并发的写的问题没有解决。使用分片集群就可以很好的解决redis写的问题&#xff0c;有多个master就可以实现并发的写。同时&#xff0c;…

C++学习笔记04-补充知识点(问题-解答自查版)

前言 以下问题以Q&A形式记录&#xff0c;基本上都是笔者在初学一轮后&#xff0c;掌握不牢或者频繁忘记的点 Q&A的形式有助于学习过程中时刻关注自己的输入与输出关系&#xff0c;也适合做查漏补缺和复盘。 本文对读者可以用作自查&#xff0c;答案在后面&#xff0…

Mysql-高级实战案例

文章目录 千万级用户场景下的运营系统SQL调优1. 索引优化2. 查询优化3. 分析查询执行计划4. 存储引擎配置5. 数据库架构优化6. 监控与报警7. 定期维护8. 软件升级 亿级数据量商品系统的SQL调优实战1. 索引优化2. 查询重构3. 分区策略4. 优化查询计划5. 缓存策略6. 数据库架构调…

国内微短剧系统平台抖音微信付费小程序app开发源代码交付

微短剧作为当下热门的内容&#xff0c;结合抖音平台的广泛用户基础&#xff0c;开发微短剧付费小程序APP具有显著的市场潜力&#xff0c;用户对于短剧内容的需求旺盛&#xff0c;特别是在言情、总裁、赘婿等热门题材方面&#xff0c;接下来给大家普及一下微短剧小程序系统。 顺…

rce漏洞-ctfshow(50-70)

Web51 if(!preg_match("/\;|cat|flag| |[0-9]|\\$|\*|more|less|head|sort|tail|sed|cut|tac|awk|strings|od|curl|\|\%|\x09|\x26/i", $c)){ system($c." >/dev/null 2>&1"); } Nl&#xff0c;绕过tac&#xff0c;cat&#xff0c;绕…

Pytest进阶之fixture的使用(超详细)

目录 Fixture定义 Fixture使用方式 作为参数使用 Fixture间相互调用(作为参数调用) 作为conftest.py文件传入 Fixture作用范围Scope function class module session Fixture中params和ids Fixture中autouse Fixture中Name 总结 pytest fixture 是一种用来管理测试…

回溯算法(相关解题):

求子集序列&#xff1a; 解题思路&#xff1a; 已知原集合的数据位数为N&#xff0c;则可以通过二进制比对原来集合&#xff0c;二进制位为1则输出集合上的该位数据&#xff0c;为0则空&#xff0c;二进制的01排序规律与子集的输出一致由集合的位数可以判断出二进制的范围 0 ~…

Direct3D 9的介绍以及Demo演示

文章目录 1、d3d9的介绍1. 概述2. 核心概念3. 初始化和渲染流程4. 常见用法5. 先进特性6. 总结 2、d3d9demo详解1.头文件和全局变量2.IGW 相关全局变量3.函数&#xff1a;CloseIGW4.函数&#xff1a;OpenIGW5.UI 控件和日志处理6.登录和登出相关函数7.登录回调函数8.DXUT 相关回…

P3-AI产品经理-九五小庞

AI产品的数据流向 美团外卖&#xff0c;实时只能调度 美团28分钟送达需求的分析 AI产品常用的算法 常用算法 常见的AI算法解析 自然语言生成NLG语音识别&#xff1a;科大讯飞&#xff0c;通义千问 虚拟现实机器学习平台 决策管理系统生物特征识别技术 RPA(机器人流程自动…