Google重磅开源！Gemma 2B/7B小模型登场，6万亿Tokens喂饱，聊天编程两不误，LLaMA也黯然失色？

Google重磅开源！Gemma 2B/7B小模型登场，6万亿Tokens喂饱，聊天编程两不误，LLaMA也黯然失色？

news/2025/4/27 2:43:14/文章来源:https://blog.csdn.net/qq_19968255/article/details/136233477

在这里插入图片描述
Google又有大动作！

近日，他们发布了Gemma 2B和7B两个开源AI模型，与大型封闭模型不同，它们更适合小型任务，如聊天和文本摘要。

这两个模型在训练过程中使用了6万亿个Tokens的数据，包括网页文档、代码和数学文本，确保模型能应对广泛的文本和编程问题。

相比之下，其他知名模型如LLaMA 2的训练集都要小得多，大约只用了2万亿Tokens。

现在，你可以通过Kaggle、Hugging Face、Nvidia的NeMo以及Google的Vertex AI来获取这些模型。

Gemma模型的特点是什么？如何使用？

内容迁移微信公众号：李孟聊AI
在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/696181.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

收单外包机构备案2023年回顾和2024年展望

收单外包机构备案2023年回顾和2024年展望

孟凡富本文原标题为聚合支付深度复盘与展望，首发于《支付百科》公众号！ 收单外包服务机构在我国支付收单市场中占据着举足轻重的地位，其规模在政策引导和市场需求驱动下不断扩大。同时，随着行业自律管理体系的持续发展和完善&a…

阅读更多...

文献速递：GAN医学影像合成--用生成对抗网络生成 3D TOF-MRA 体积和分割标签

文献速递：GAN医学影像合成--用生成对抗网络生成 3D TOF-MRA 体积和分割标签

文献速递：GAN医学影像合成–用生成对抗网络生成 3D TOF-MRA 体积和分割标签 01 文献速递介绍深度学习算法在自然图像分析中的成功近年来已被应用于医学成像领域。深度学习方法已被用于自动化各种耗时的手动任务，如医学图像的分割和分类（G…

阅读更多...

顶刊中很出彩的二元变量图

顶刊中很出彩的二元变量图

导师希望你发顶刊，但你的图纸差点意思，那么，你不妨试试这个，二元变量图，在顶刊中都很出彩哦！本次，我们来以“降水量”和“NDVI”两个数据为例，绘制二元变量分析图，表达“降水量”和“NDVI”之间的关系。什么是二元变量图首先还是先解释下“二元变量图”。顾…

阅读更多...

OpenCV中saturate_cast模板函数

OpenCV中saturate_cast模板函数

在OpenCV中，saturate_cast是一个模板函数，用于正确地将一个数值从一种类型转换到另一种类型，同时确保结果在目标类型的有效范围内。这在图像处理中特别有用，比如当像素值在经过计算后可能超出其数据类型允许的范围时。saturate_ca…

阅读更多...

-bash: /root/.ssh/authorized_keys: Read-only file system

-bash: /root/.ssh/authorized_keys: Read-only file system

问题背景由于跳板机不支持 ssh-copy-id 命令，为了配置免密登录，考虑在服务器上手动使用 cat 命令写入跳板机公钥 cat <<EOL >> ~/.ssh/authorized_keys [Your public key] EOL但却出现了以下错误 -bash: /root/.ssh/authorized_keys: Re…

阅读更多...

编程笔记 Golang基础 013 格式化输入输出

编程笔记 Golang基础 013 格式化输入输出

编程笔记 Golang基础 013 格式化输入输出一、格式化输出1. fmt.Print系列函数2. Printf格式说明3. 格式化布尔类型二、格式化输入1. fmt.Scan系列函数注意事项三、练习小结 Go语言中的格式化输入和输出主要通过标准库 fmt 包来实现。主要是输出需要格式化。一、格式化输出 …

阅读更多...

扫盲贴：Svg动画和Canvas动画有什么区别

扫盲贴：Svg动画和Canvas动画有什么区别

hello，我是贝格前端工场，网页中动画的实现有N种方式，比如css动画，js动画，svg动画，canvas动画等等，每一种动画都有对应的场景，本问重点介绍一下svg和canvas动画的异同点，欢…

阅读更多...

大工程从0到1 数据治理数仓篇（sample database classicmodels _No.7）

大工程从0到1 数据治理数仓篇（sample database classicmodels _No.7）

大工程从0到1 数据治理之数仓篇我这里还是sample database classicmodels为案列，可以下载，我看网上还没有类似的案列，那就从 0-1开始吧！ 提示：写完文章后，目录可以自动生成，如何生成可参…

阅读更多...

TRS 2024 论文阅读 | 基于点云处理和点Transformer网络的人体活动连续识别

TRS 2024 论文阅读 | 基于点云处理和点Transformer网络的人体活动连续识别

无线感知/雷达成像部分最新工作<持续更新>：链接地址注1:本文系“无线感知论文速递”系列之一,致力于简洁清晰完整地介绍、解读无线感知领域最新的顶会/顶刊论文(包括但不限于 Nature/Science及其子刊; MobiCom, Sigcom, MobiSys, NSDI, SenSys, Ubicomp; JSAC, 雷达学…

阅读更多...

提高代码质量的 10 条编码原则

提高代码质量的 10 条编码原则

提高代码质量的 10 条编码原则本文转自公众号 ByteByteGo，如有侵权，请联系，立即删除今天来聊聊提高代码质量的 10 条编码原则。软件开发需要良好的系统设计和编码标准。我们在下图中列出了 10 条良好的编码原则。 01 遵循代码规范我们…

阅读更多...

Studio One破解版和正版的区别 Studio One购买是永久的吗

Studio One破解版和正版的区别 Studio One购买是永久的吗

在过去的很长一段时间里，很多小伙伴想要使用一款软件时，可能第一时间就去网上寻找破解版的资源， 白嫖的资源固然很香，但随着法制的健全和人们版权意识的增强，现在破解版的资源是越来越少了。同时破解版的资源也会伴随着…

阅读更多...

大数据计算技术秘史（上篇）

大数据计算技术秘史（上篇）

在之前的文章《2024 年，一个大数据从业者决定……》《存储技术背后的那些事儿》中，我们粗略地回顾了大数据领域的存储技术。在解决了「数据怎么存」之后，下一步就是解决「数据怎么用」的问题。其实在大数据技术兴起之前，对于用户…

阅读更多...

react实现拖拽的插件

react实现拖拽的插件

插件一：dnd-kit 插件官网链接https://docs.dndkit.com/introduction/installation 插件二：react-beautiful-dnd https://github.com/atlassian/react-beautiful-dnd/tree/master 两个插件的区别： 插件一可以做到从区域A拖住到区域B 插件二…

阅读更多...

平台组成-门户服务

平台组成-门户服务

整体是从用户视角，从外往内介绍。前面讲了平台的几个模块（就是前端部署包）。今天开始介绍后台服务（微服务，SpringCloud，通过-jar 参数启动的jar包）。门户服务完成登录、注册、界面配置、功能链…

阅读更多...

java面试JVM虚拟机篇

java面试JVM虚拟机篇

1 JVM组成 1.1 JVM由那些部分组成，运行流程是什么？ 难易程度：☆☆☆ 出现频率：☆☆☆☆ JVM是什么 Java Virtual Machine Java程序的运行环境（java二进制字节码的运行环境） 好处： 一次编写&a…

阅读更多...

Go 原子操作有哪些？

Go 原子操作有哪些？

Go atomic包是最轻量级的锁（也称无锁结构），可以在不形成临界区和创建互斥量的情况下完成并发安全的值替换操作，不过这个包只支持int32/int64/uint32/uint64/uintptr这几种数据类型的一些基础操作（增减、交换、载入、存…

阅读更多...

Excel之index、MATCH面试题、VLOOKUP函数，

Excel之index、MATCH面试题、VLOOKUP函数，

VLOOKUP() 在表格的首列查找指定的数值，并返回表格当前行中指定列处的数值。结构：VLOOKUP(查找值,查找区域,列序数,匹配条件) 解释：VLOOKUP(找谁,在哪里找,第几列,0或1) 1.目的：根据【产品】查找【销量】公式：V…

阅读更多...

pikachu靶场-XSS

pikachu靶场-XSS

XSS： XSS（跨站脚本）概述 Cross-Site Scripting 简称为“CSS”，为避免与前端叠成样式表的缩写"CSS"冲突，故又称XSS。一般XSS可以分为如下几种常见类型： 1.反射性XSS; 2.存储型XSS; 3.DOM型XSS; …

阅读更多...

QT的UI入门

QT的UI入门

二、UI入门 QWidget类（熟悉） QWidget类是所有组件和窗口的基类，内部包含了一些基础的界面特性。常用属性： 修改坐标 x : const int 横坐标，每个图形的左上角为定位点，横轴的零点在屏幕的最左边&#xff0c…

阅读更多...

js实现复制功能

js实现复制功能

一、具体场景前端有时需要实现点击按钮复制的功能，这个时候就不能让用户去手动选择内容右键复制了。二、实现方式 1. document.execCommand （1）具体实现复制时，先选中文本，然后调用document.execCommand(‘copy’)…

阅读更多...

最新文章