[250411] Meta 发布 Llama 4 系列 AI 模型 | Rust 1.86 引入重大语言特性

目录

    • Llama 4 家族登场:开启原生多模态 AI 创新新纪元
    • Rust 1.86.0 版本发布亮点
      • 主要新特性与改进
      • 其他重要信息

Llama 4 家族登场:开启原生多模态 AI 创新新纪元

Meta AI 近日发布了其最新、最先进的 Llama 4 系列人工智能模型,标志着 AI 技术进入了一个原生支持多种信息类型(文本、图像、视频)的新时代。这些模型旨在推动更加个性化、智能化的 AI 体验。

请添加图片描述

核心亮点:

  • 原生多模态能力: Llama 4 模型从一开始就设计为能够同时理解和处理文本、图像及视频信息,实现更自然的交互。
  • 开放可用: Llama 4 系列中的 Scout 和 Maverick 模型已开放权重,供全球开发者和研究人员下载使用,共同构建 AI 的未来。
  • 卓越性能与效率: 采用了创新的“混合专家”(MoE)架构,模型在保持强大能力的同时,训练和运行更高效。

Llama 4 模型家族介绍:

  1. Llama 4 Scout:

    • 定位: 高效、强大的入门级模型。
    • 特点: 拥有 170 亿活跃参数和 16 位专家,性能超越所有前代 Llama 模型及同级别的 Gemma 3、Gemini 2.0 Flash-Lite 等。
    • 突破: 提供业界领先的 1000 万 token 超长上下文窗口,能处理极长的文档或对话历史。
    • 部署: 经过优化,可在单块 NVIDIA H100 GPU 上运行。
  2. Llama 4 Maverick:

    • 定位: 性能领先的旗舰级模型。
    • 特点: 拥有 170 亿活跃参数和 128 位专家,在多项基准测试中击败了 GPT-4o 和 Gemini 2.0 Flash,并在推理和编码方面媲美 DeepSeek v3,但活跃参数更少。
    • 优势: 实现了顶尖的性能与成本效益比,特别擅长精确的图像理解和创意写作。
    • 部署: 可在单个 H100 主机上运行。
  3. Llama 4 Behemoth (预览):

    • 定位: 超大规模的“教师”模型,目前仍在训练中。
    • 特点: 拥有 2880 亿活跃参数和近 2 万亿总参数,是 Meta AI 迄今最强大的模型之一,在多个科学、技术、工程和数学 (STEM) 基准测试中超越了 GPT-4.5、Claude Sonnet 3.7 等顶尖模型。
    • 作用: 其强大的能力被用于“教导”Scout 和 Maverick 模型,显著提升了它们的质量。

关键技术进步(非技术解读):

  • 更懂世界: 通过“早期融合”技术,模型能更好地结合文本和视觉信息进行理解。
  • 更广知识: 使用了超过 30 万亿 token(包括文本、图像、视频)的数据进行训练,涵盖 200 种语言,多语言能力大幅提升。
  • 更强能力: 经过专门的“中段训练”和优化的“后训练”流程,模型在推理、编码、数学和对话能力上得到显著增强。
  • 更长记忆: Scout 模型的超长上下文处理能力(1000 万 token)得益于创新的 iRoPE 架构和注意力机制优化。

安全与责任:

  • Llama 4 的开发过程集成了多层安全措施,从数据过滤到模型训练,再到提供给开发者的可调安全工具(如 Llama Guard、Prompt Guard),旨在防范有害内容和滥用。
  • 通过自动化和人工的对抗性测试(红队测试,包括新的 GOAT 方法)来发现并修复潜在风险。
  • 致力于减少模型偏见,特别是在有争议的社会政治话题上,Llama 4 在保持中立、理解多方观点方面相比 Llama 3 有显著改进,拒绝回答敏感问题的比例降低,观点平衡性更好。

如何体验与获取:

  • 立即试用: 用户可以通过 Meta AI 助手(在 WhatsApp, Messenger, Instagram Direct 及 Meta.AI 网站)体验由 Llama 4 驱动的最新功能。
  • 开发者获取: Llama 4 Scout 和 Maverick 模型可在 Llama 官网 (llama.com) 和 Hugging Face 平台下载。未来几天也将通过各大云平台和合作伙伴提供。

Llama 4 的发布为 AI 应用开辟了新的可能性,有望带来更智能、更个性化、更安全的 AI 体验。

来源:

https://ai.meta.com/blog/llama-4-multimodal-intelligence/

Rust 1.86.0 版本发布亮点

Rust 团队荣幸地宣布 Rust 1.86.0 正式发布!Rust 是一种致力于让每个人都能构建可靠、高效软件的编程语言。此版本带来了多项备受期待的功能和改进。

可以通过 rustup update stable 命令更新到最新版本。

主要新特性与改进

  • Trait 向上转型 (Trait Upcasting) 稳定化

    • 这是一项期待已久的功能,现在可以将一个 Trait 对象(如 &dyn Trait)安全地向上转换为其父 Trait 的对象(如 &dyn Supertrait)。
    • 这简化了之前需要变通方法(如添加 as_supertrait 方法)的代码,尤其在与 dyn Any 配合进行类型向下转换时非常有用。
  • HashMap 与切片支持同时获取多个可变元素

    • 新增了 get_disjoint_mut 方法,允许从 HashMap 或切片中安全地同时获取多个不相交元素的可变引用,解决了之前借用检查器对此类操作的限制。
    • 示例:v.get_disjoint_mut([0, 2]) 可以同时获取索引 0 和 2 处元素的可变引用。
  • 允许为安全函数添加 #[target_feature] 属性

    • 现在可以在 safe fn 上使用 #[target_feature] 属性,用于编写依赖特定 CPU 特性(如 AVX2)但本身逻辑安全的代码。
    • 这些函数只能在同样标记了该属性的函数中安全调用,或在确认 CPU 支持该特性后的 unsafe 块中调用。
  • 调试模式下增加指针非空断言

    • 在启用调试断言(debug assertions)的构建中,编译器会插入运行时检查,确保在对指针进行解引用或再借用为引用时,指针值不为 null。
    • 这有助于在开发阶段更早地发现潜在的空指针错误,但不应依赖此特性保证发布版本的健全性。
  • missing_abi Lint 默认级别提升为警告

    • extern 块或 extern fn 中省略 ABI(如 extern {})现在会产生警告。
    • 推荐显式指定 ABI,例如 extern "C" {}extern "C" fn

其他重要信息

  • 目标平台弃用预告:计划在 Rust 1.87.0 版本中移除对 i586-pc-windows-msvc 目标的支持。建议使用此目标的用户迁移到 i686-pc-windows-msvc

  • API 稳定化:本次更新稳定了多项 API,包括:

    • 浮点数的 next_down / next_up 方法。
    • 切片和 HashMapget_disjoint_mut 系列方法。
    • Vec::pop_if
    • sync::Once::wait / wait_forcesync::OnceLock::wait
    • 多个 API(如 hint::black_box, str::split_at 等)现在可以在 const 上下文中使用。
  • 更多详情:可以查阅 Rust、Cargo 和 Clippy 的详细更新日志,了解所有变更。

Rust 1.86.0 的发布离不开众多贡献者的努力。感谢所有参与其中的人!

来源:

https://blog.rust-lang.org/2025/04/03/Rust-1.86.0.html

更多内容请查阅 : blog-250411

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/76883.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ArrayList 和 数组 的区别

定义与本质 数组:是 Java 语言内置的数据结构,是存储相同类型元素的连续内存空间。它是一个基本的语言特性,在内存中是一块连续的区域。ArrayList:是 Java 集合框架中的一个类,属于动态数组。它是基于数组实现的&#…

​‌FireCrawl‌爬虫工具​, Craw4ai

‌FireCrawl‌是一款开源的AI爬虫工具,专门用于Web数据提取,并将其转换为Markdown格式或其他结构化数据。FireCrawl特别适合处理使用JavaScript动态生成的网站,能够自动抓取网站及其所有可访问的子页面内容,并将其转换为适合大语言…

通信原理-非线性调制

今天给大家带来的是关于通信原理中非线性调制的内容,一起来看看吧!!! 1.角度调制 2.FM与PM的区别 3.单音调制FM 4.窄带调频 5.宽带调频 5.1FM信号的频谱 5.2FM信号的带宽 5.3FM信号的功率分配 6.FM信号的产生与解调 6.1FM信号的产生 6.2FM…

文心一言开发指南03——千帆大模型平台产品优势

版权声明 本文原创作者:谷哥的小弟作者博客地址:http://blog.csdn.net/lfdfhl 千帆大模型平台作为百度智能云推出的企业级大模型一站式平台,具有显著的产品优势。千帆大模型平台以其基础强大、流程完善、运行稳定和安全可靠的产品优势成为企…

mysql DQL

一.基本查询 1.查询多个字段 2.查看所有字段 3.设置别名 4.去除重复记录 二.条件查询 1.大于小于等于 2.查询 身份证为空的 没有所以没有记录 3.在15到20这个区间范围内 4.or/in 或者 4.like 匹配 (_匹配单个字符 %匹配多个字符) 查询员工信…

关于 软件开发模型 的分类、核心特点及详细对比分析,涵盖传统模型、迭代模型、敏捷模型等主流类型

以下是关于 软件开发模型 的分类、核心特点及详细对比分析,涵盖传统模型、迭代模型、敏捷模型等主流类型: 一、软件开发模型分类及核心特点 1. 瀑布模型(Waterfall Model) 核心特点: 线性阶段划分:需求分…

2025年第十六届蓝桥杯省赛C++ A组真题

2025年第十六届蓝桥杯省赛C A组真题 1.说明2.题目A:寻找质数(5分)3.题目B:黑白棋(5分)4. 题目C:抽奖(10分)5. 题目D:红黑树(10分)6. 题…

JVM初探——走进类加载机制|三大特性 | 打破双亲委派SPI机制详解

目录 JVM是什么? 类加载机制 Class装载到JVM的过程 装载(load)——查找和导入class文件 链接(link)——验证、准备、解析 验证(verify)——保证加载类的正确性 准备(Prepare&…

分布式微服务系统架构第106集:jt808,补充类加载器

加群联系作者vx:xiaoda0423 仓库地址:https://webvueblog.github.io/JavaPlusDoc/ https://1024bat.cn/ 类加载器 类与类加载器 判断类是否“相等” 任意一个类,都由加载它的类加载器和这个类本身一同确立其在 Java 虚拟机中的唯一性&#xf…

利用 pyecharts 实现地图的数据可视化——第七次人口普查数据的2d、3d展示(关键词:2d 、3d 、map、 geo、涟漪点)

参考文档:链接: link_pyecharts 官方文档 1、map() 传入省份全称,date_pair 是列表套列表 [ [ ],[ ] … ] 2、geo() 传入省份简称,date_pair 是列表套元组 [ ( ),( ) … ] 1、准备数据 population_data:简称经纬度 population_da…

Enovia许可释放

随着企业规模的扩大和业务的不断增长,Enovia许可证的管理变得至关重要。在许多情况下,企业可能面临许可证资源浪费或不足的问题。为了解决这一问题,Enovia提供了许可释放功能,帮助企业更加灵活地管理和使用许可证资源。本文将介绍…

每日一道leetcode(回来了!!!)

236. 二叉树的最近公共祖先 - 力扣(LeetCode) 题目 给定一个二叉树, 找到该树中两个指定节点的最近公共祖先。 百度百科中最近公共祖先的定义为:“对于有根树 T 的两个节点 p、q,最近公共祖先表示为一个节点 x,满足…

【Redis】布隆过滤器应对缓存穿透的go调用实现

布隆过滤器 https://pkg.go.dev/github.com/bits-and-blooms/bloom/v3 作用: 判断一个元素是不是在集合中 工作原理: 一个位数组(bit array),初始全为0。多个哈希函数,运算输入,从而映射到位数…

【ROS2】行为树 BehaviorTree(四):组合使用子树

1、大树调用子树 如下图,左边为大树主干: 1)如果门没有关,直接通过; 2)如果门关闭了,执行开门动作,然后通过 右边为子树,主要任务是开门 1)尝试直接开门; 2)尝试开锁开门,最多尝试5次; 3)最后尝试砸门! XML如何描述大树主干调佣子树:使用关键字 SubTree 来…

【口腔粘膜鳞状细胞癌】文献阅读

写在前面 看看文章,看看有没有思路 文献 The regulatory role of cancer stem cell marker gene CXCR4 in the growth and metastasis of gastric cancer IF:6.8 中科院分区:1区 医学WOS分区: Q1 目的:通过 scRNA-seq 结合大量 RNA-seq 揭示癌症干细胞…

【ComfyUI】蓝耘元生代 | ComfyUI深度解析:高性能AI绘画工作流实践

【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈人工智能与大模型应用 ⌋ ⌋ ⌋ 人工智能(AI)通过算法模拟人类智能,利用机器学习、深度学习等技术驱动医疗、金融等领域的智能化。大模型是千亿参数的深度神经网络(如ChatGPT&…

深入理解Java中的队列:核心操作、实现与应用

队列(Queue)是计算机科学中最基础且重要的数据结构之一,遵循 先进先出(FIFO) 的规则。Java通过java.util.Queue接口及其丰富的实现类为开发者提供了强大的队列工具。本文将详细解析Java队列的核心操作、常见实现类及其…

idea里面不能运行 node 命令 cmd 里面可以运行咋回事啊

idea里面不能运行 node 命令 cmd 里面可以运行咋回事啊 在 IntelliJ IDEA(或其他 JetBrains 系列 IDE)中无法运行某些命令,但在系统的命令提示符(CMD)中可以正常运行,这种情况通常是由于以下原因之一导致的…

Express学习笔记(六)——前后端的身份认证

目录 1. Web 开发模式 1.1 服务端渲染的 Web 开发模式 1.2 服务端渲染的优缺点 1.3 前后端分离的 Web 开发模式 1.4 前后端分离的优缺点 1.5 如何选择 Web 开发模式 2. 身份认证 2.1 什么是身份认证 2.2 为什么需要身份认证 2.3 不同开发模式下的身份认证 3. Sessio…