谷歌开源单个 GPU 可运行的Gemma 3 模型,27B 超越 671B 参数的 DeepSeek

自从 DeepSeek 把训练成本打下来之后,各个模型厂家现在不再堆参数进行模型的能力对比。而是转向了训练成本优化方面,且还要保证模型能力不减反增的效果。包括使用较少的模型参数,降低 GPU 使用数量,降低模型内存占用等等技术手段。这里可以查看 DeepSeek 开源周发布的优化策略。

谷歌正式发布了全新一代 AI 模型 Gemma 3!这可不是简单的升级,而是用了 Gemini 2.0 同款技术打造的 最先进、最便携、最负责任的开放模型!啥意思?简单说,就是性能更强、体积更小、更安全!更重要的是,它能在各种设备上 飞速运行,从你的手机、笔记本到专业工作站,都能轻松驾驭!Gemma 3 有多种尺寸(1B、4B、12B 和 27B),可以根据特定的硬件和性能需求选择最佳模型。

Gemma 3 是多模态的!40 亿、120 亿和 270 亿个参数模型可以处理图像和文本,而 1B 版本只能处理文本。对于 1B 版本,输入上下文窗口长度已从 Gemma 2 的 8k 增加到32k ,对于其他所有版本,则增加到 128k。与其他 VLM(视觉语言模型)一样,Gemma 3 会根据用户输入生成文本,这些文本可能由文本组成,也可能由图像组成。

与 Gemma2 相比,虽然模型参数没有增加,但是上下文长度增加到了 128K,而且还是一个多模态的模型,不仅识别文本,还支持图片与视频内容的交互。更是支持了 140 种语言能力,简直不要太强大。

Gemma 3 性能特点?

  1. 性能怪兽,单卡 GPU 就能起飞! Gemma 3 在 LMArena 排行榜上直接超越了 Llama3、DeepSeek 等一众大佬!这意味着在单个 GPU 或 TPU 上,就能创建丝滑流畅的 AI 体验!
  2. 140 种语言精通,走遍全球都不怕! 别再担心语言障碍!Gemma 3 开箱即用支持超过 35 种语言,预训练更是覆盖 140 多种语言!
  3. 文能识图写诗,武能函数调用! 轻松搞定图片、文本、短视频分析,开启交互式智能新纪元!函数调用也安排上了,自动执行任务、构建智能 Agent,不在话下!
  4. 海量信息轻松应对! 128k Token 上下文窗口,再复杂的任务,再多的信息,都能 hold 住!
  5. 官方量化版本,性能加速! 体积更小,计算更快,精度还不变!简直是为移动端量身定制!

一张图告诉你 Gemma 3 有多强:

看到了吗?Gemma 3 (27B) 在众多 AI 模型中脱颖而出!而且只需要一个 GPU,而其他模型可能需要多达 32 个!不仅如此,27B 参数的模型竟然超过了 671B 参数的 DeepSeek V3 模型,简直不要太好用。这么小参数量的模型,完全可以跑在自己电脑上面了。普通电脑配置也能跑大模型了。

Gemma3 性能在最优点

安全第一,谷歌这次玩真的!

谷歌深知开放模型需要谨慎的风控!Gemma 3 经历了严格的安全评估,包括数据管理、安全微调和基准评估。即使是增强的 STEM 性能也经过了特定评估,以确保滥用风险较低。

ShieldGemma 2:为图像应用保驾护航!

除了 Gemma 3,谷歌还推出了 ShieldGemma 2!这是一个基于 Gemma 3 构建的强大图像安全检查器,能够识别“危险内容、色情和暴力”!而且它是开源的,开发者可以根据需求进行定制!

Gemma 3 评估

在 LMSys Chatbot Arena 上,Gemma 3 27B IT 的 Elo 分数为1339,跻身前 10 个最佳模型之列,包括领先的封闭模型。Elo 与 o1-preview 相当,并且高于其他非思考开放模型。与表中的其他 LLM 一样,Gemma 3 仅处理文本输入即可获得此分数。

Gemma 3 已通过 MMLU-Pro(27B:67.5)、LiveCodeBench(27B:29.7)和 Bird-SQL(27B:54.4)等基准测试进行评估,与封闭式 Gemini 模型相比,其性能更具竞争力。GPQA Diamond(27B:42.4)和 MATH(27B:69.0)等测试凸显了其推理和数学技能,而 FACTS Grounding(27B:74.9)和 MMMU(27B:64.9)则展示了强大的事实准确性和多模态能力。然而,它在 SimpleQA(27B:10.0)的基本事实方面落后。与 Gemini 1.5 模型相比,Gemma 3 通常很接近,有时甚至更好,证明了其作为可访问、高性能选项的价值。

无缝集成,即刻上手!

Gemma 3 和 ShieldGemma 2 可以轻松集成到你现有的工作流程中!支持 Hugging Face Transformers、Ollama、JAX、Keras、PyTorch 等等!

#使用管道进行推理
import torch
from transformers import pipeline
pipe = pipeline("image-text-to-text",model="google/gemma-3-4b-it", # "google/gemma-3-12b-it", "google/gemma-3-27b-it" device="cuda",torch_dtype=torch.bfloat16)
messages = [{ "role": "user","content": [{"type": "image", "url": "candy.JPG"},{"type": "text", "text": "What animal is on the candy?"}]}]
output = pipe(text=messages, max_new_tokens=200)
print(output[0]["generated_text"][-1]["content"])

糖果上是什么动物?
让我们分析一下图片中的糖果吧!糖果上的动物是一只乌龟。
你可以清楚地看到龟壳和乌龟的头和腿印在表面上。

使用 Transformer 进行推理

Transformer集成有两个新的模型类:


Gemma3ForConditionalGeneration:适用于4B、12B和27B视觉语言模型。

Gemma3ForCausalLM:对于 1B 纯文本模型

import torch
from transformers import AutoProcessor, Gemma3ForConditionalGeneration
ckpt = "google/gemma-3-4b-it"
model = Gemma3ForConditionalGeneration.from_pretrained(ckpt, device_map="auto", torch_dtype=torch.bfloat16,)
processor = AutoProcessor.from_pretrained(ckpt)
messages = [{"role": "user","content": [{"type": "image", "url": "password.jpg"},{"type": "text", "text": "What is the password?"}]}]
inputs = processor.apply_chat_template(messages, add_generation_prompt=True, tokenize=True,return_dict=True, return_tensors="pt"
).to(model.device)
input_len = inputs["input_ids"].shape[-1]
generation = model.generate(**inputs, max_new_tokens=100, do_sample=False)
generation = generation[0][input_len:]
decoded = processor.decode(generation, skip_special_tokens=True)
print(decoded)

密码是什么?
根据图片,密码是aaeu

在线体验

Gemma 3 不仅可以使用代码进行执行,或者使用 ollama进行本地部署,若不想占用本地资源,也可以在线使用。可以直接在 hugging face 上面使用,当然也可以使用 Google studio 上面使用。

Gemmaverse 生态,无限可能!

谷歌还鼓励社区基于 Gemma 构建各种应用和工具,形成一个庞大的 Gemmaverse 生态! AI Singapore 的 SEA-LION v3 打破语言障碍,促进了东南亚地区的交流;INSAIT 的 BgGPT 是首个保加利亚语大型语言模型;Nexa AI 的 OmniAudio 展示了设备内置 AI 的潜力!

Gemma 3 的发布,标志着 AI 技术民主化的又一里程碑!它将强大的 AI 能力带到了每个人的指尖,让开发者能够创造出更多创新应用,改变我们的生活!不仅参数少,模型小,还可以在单个 GPU 上面运行,普通电脑也可以直接跑大模型了,而 DeepSeek 系列的模型需要 32 个 GPU,不是普通玩家玩的模型。

huggingface.co/blog/gemma3
blog.google/technology/developers/gemma-3/头条号:人工智能研究所
v号:启示AI科技

 动画详解transformer  在线教程 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/75672.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

回归预测 | Matlab实现NRBO-Transformer-LSTM多输入单输出回归预测

回归预测 | Matlab实现NRBO-Transformer-LSTM多输入单输出回归预测 目录 回归预测 | Matlab实现NRBO-Transformer-LSTM多输入单输出回归预测预测效果基本介绍程序设计参考资料 预测效果 基本介绍 1.【JCR一区级】Matlab实现NRBO-Transformer-LSTM多输入单输出回归预测&#xf…

Photoshop 2025 Mac中文Ps图像编辑

Photoshop 2025 Mac中文Ps图像编辑 文章目录 Photoshop 2025 Mac中文Ps图像编辑一、介绍二、效果三、下载 一、介绍 Adobe Photoshop 2025 Mac版集成了多种强大的图像编辑、处理和创作功能。①强化了Adobe Sensei AI的应用,通过智能抠图、自动修复、图像生成等功能…

7. 记忆(Memory)机制:让AI拥有“短期记忆”与“长期记忆”

引言:当AI学会"记住你" 2025年某银行智能客服因无法记住用户身份,每次对话都要求重复验证,引发大量投诉。引入LangChain 记忆系统后,客户满意度提升62%。本文将基于MemorySaver与FAISS本地存储,教你构建符合…

【Python使用】嘿马云课堂web完整实战项目第3篇:增加数据,修改数据【附代码文档】

教程总体简介:项目概述 项目背景 项目的功能构架 项目的技术架构 CMS 什么是CMS CMS需求分析与工程搭建 静态门户工程搭建 SSI服务端包含技术 页面预览开发 4 添加“页面预览”链接 页面发布 需求分析 技术方案 测试 环境搭建 数据字典 服务端 前端 数据模型 页面原…

论文笔记(七十五)Auto-Encoding Variational Bayes

Auto-Encoding Variational Bayes 文章概括摘要1 引言2 方法2.1 问题场景2.2 变分下界2.3 SGVB估计器与AEVB算法2.4 重参数化技巧 3 示例:变分自编码器(Variational Auto-Encoder)4 相关工作5 实验6 结论7 未来工作 文章概括 引用&#xff1…

Python3 学习笔记

Python3 简介 | 菜鸟教程 一 Python3 简介 Python 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。 Python 的设计具有很强的可读性,相比其他语言经常使用英文关键字,其他语言的一些标点符号,它具有比其他语言更有特色…

Java实现N皇后问题的双路径探索:递归回溯与迭代回溯算法详解

N皇后问题要求在NN的棋盘上放置N个皇后,使得她们无法互相攻击。本文提供递归和循环迭代两种解法,并通过图示解释核心逻辑。 一、算法核心思想 使用回溯法逐行放置皇后,通过冲突检测保证每行、每列、对角线上只有一个皇后。发现无效路径时回退…

前端判断值相等的方法和区别

1. (宽松相等) 在比较之前会进行类型转换 可能导致一些意外的结果 0 // true 0 0 // true false 0 // true null undefined // true [1,2,3]1,2,3 // true2. (严格相等) 不进行类型转换 类型和值都必须相同 0 // false 0 0 // false false 0 /…

Socket编程UDP

Socket编程UDP 1、V1版本——EchoServer2、网络命令2.1、ping2.2、netstat2.3、pidof 3、验证UDP——Windows作为client访问Linux4、V2版本——DictServer5、V3版本——简单聊天室 1、V1版本——EchoServer 首先给出EchoServer目录结构:服务器的类我们实现在UdpServ…

辅助查询是根据查询到的文档片段再去生成新的查询问题

💡 辅助查询是怎么来的? 它是基于你当前查询(query)检索到的某个文档片段(chunk_result),再去“反推”出新的相关问题(utility queries),这些问题的作用是&a…

2025 年 4 月补丁星期二预测:微软将推出更多 AI 安全功能

微软正在继续构建其 AI 网络安全战略,并于本月宣布在 Microsoft Security Copilot 中引入新代理。 他们引入了用于网络钓鱼分类的代理、用于数据丢失预防和内部风险管理的警报分类、条件访问优化、漏洞修复和威胁情报简报。 这些代理的目标是不断从这些不同学科中…

【LLM系列】1.大模型简介

1. 基础 1.1 如何权衡模型的复杂度和性能? ├── a. 模型架构选择 │ ├── 简化架构 │ │ └── 选择较小的网络层数和宽度,降低复杂度; │ │ 可使用高性能基础模型如 Transformers 作为起点,根据需求缩放模型。 │ └──…

【leetcode】记录与查找:哈希表的题型分析

前言 🌟🌟本期讲解关于力扣的几篇题解的详细介绍~~~ 🌈感兴趣的小伙伴看一看小编主页:GGBondlctrl-CSDN博客 🔥 你的点赞就是小编不断更新的最大动力 🎆那么废话不…

优选算法的妙思之流:分治——快排专题

专栏:算法的魔法世界 个人主页:手握风云 目录 一、快速排序 二、例题讲解 2.1. 颜色分类 2.2. 排序数组 2.3. 数组中的第K个最大元素 2.4. 库存管理 III 一、快速排序 分治,简单理解为“分而治之”,将一个大问题划分为若干个…

二叉树的ACM板子(自用)

package 二叉树的中序遍历;import java.util.*;// 定义二叉树节点 class TreeNode {int val; // 节点值TreeNode left; // 左子节点TreeNode right; // 右子节点// 构造函数TreeNode(int x) {val x;} }public class DMain {// 构建二叉树(层序遍历方式&…

Linux常用命令详解:从基础到进阶

目录 一、引言 二、文件处理相关命令 (一)grep指令 (二)zip/unzip指令 ​编辑 (三)tar指令 (四)find指令 三、系统管理相关命令 (一)shutdown指…

Qt多线程从基础到性能优化

一、为什么需要多线程开发 现代应用程序的性能需求 CPU多核架构的有效利用 复杂任务的解耦与响应式界面保持 二、Qt线程创建四大方式 1. 继承QThread重写run() class WorkerThread : public QThread {void run() override {// 耗时操作qDebug() << "Thread ID…

【java】在 Java 中,获取一个类的`Class`对象有多种方式

在 Java 中&#xff0c;获取一个类的Class对象有多种方式。Class对象代表了 Java 中的一个类或接口的运行时类信息&#xff0c;可以用于反射操作。以下是获取Class对象的几种常见方法&#xff1a; 1.使用.class属性 每个类都有一个.class属性&#xff0c;可以直接获取该类的Cl…

什么是RPC通信

RPC&#xff08;Remote Procedure Call&#xff0c;远程过程调用&#xff09;通信是一种允许程序像调用本地函数一样调用远程服务器上函数的通信技术。它简化了分布式系统中的网络交互&#xff0c;隐藏了底层网络通信的复杂性&#xff0c;使开发者能够专注于业务逻辑。 一、RPC…

还是主题混合程序设计

以下是针对您现有代码的完整主题化改造方案&#xff0c;实现跨QML/Qt Widgets的阴影主题系统&#xff1a; 一、主题管理系统核心 // thememanager.h #pragma once #include <QObject> #include <QColor> #include <QMap> #include <QQmlEngine>class…