Google炸场,推出开“放”可商用的大语言模型Gemma!超级轻量,个人电脑即可运行

与OpenAI的封闭式大型模型不同,谷歌、Meta等科技巨头正致力于开发开源模型,以期实现技术上的快速追赶。

介绍

2月21日,谷歌发布了其最新一代的开源AI模型——Gemma(https://ai.google.dev/gemma),这是一个与Meta的Llama 2模型相媲美的轻量级模型。

单从名字上判断,新推出的Gemma与谷歌早前的Gemini模型容易让人混淆。对此,谷歌在其官方公告中阐释说,Gemma的设计灵感正是源自于Gemini,而Gemma在拉丁语中意味着“宝石”。两者的主要区别在于:

  • Gemma可以被看作是Gemini的一个更小型、更轻量级的变体。

  • Gemma旨在使开发者和研究人员能够更便捷地获取和使用,而Gemini则旨在处理更为复杂的任务。

  • 这两个模型都可以免费使用,但是Gemma提供的免费选项更加有限。

最关键的是,Gemma模型能够在个人台式电脑或笔记本上本地执行运行。

Gemma是什么?

总体而言,Gemma是由Google DeepMind联合Google AI的其他团队共同研发的成果,它基于与Gemini模型相似的研究和技术,构建于序列模型、变换器(Transformer)、基于神经网络的深度学习技术以及分布式系统的大规模训练之上。该模型的训练上下文长度能够处理高达8192个token。

这个最新推出的模型提供了两个版本,分别是Gemma 2B(含有20亿参数)和Gemma 7B(含有70亿参数)。这两个版本都提供了预训练版本和经过指令调整的变体。

Gemma模型将通过商业许可授权的形式发布,同时,Google还将推出一个新的负责任的生成式人工智能工具包,旨在指导开发者和研究人员负责任地利用Gemma模型。

在人工智能领域,参数是决定AI模型行为的神经网络中的数值,而权重则是这些参数中存储于文件的一部分。

自从2022年OpenAI推出ChatGPT以来,Gemma的推出标志着Google发布的首个开放式大型语言模型(LLM),但这并非Google在开放式AI研究领域的首次贡献。Google AI团队在官方博客中表示,他们过去已经推出了Transformers、TensorFlow、BERT、T5、JAX、AlphaFold和AlphaCode等关键的AI架构和工具集。

因此,这一次,Google还为所有主流框架提供了推理和监督微调(SFT)工具链,包括JAX、PyTorch和TensorFlow(通过本地Keras 3.0)。

此外,还提供了随时可用的Colab和Kaggle笔记本,以及与Hugging Face、MaxText、NVIDIA NeMo和TensorRT-LLM等流行工具的集成,使得开发者更加容易地开始使用Gemma。

经过预训练和指令调整的Gemma模型可以在笔记本电脑、工作站或Google Cloud上运行,并且可以在Vertex AI和Google Kubernetes Engine上进行部署。

除此之外,英伟达今天宣布与Google合作,在包括本地RTX AI PC在内的所有英伟达AI平台上推出优化措施,以加速Gemma的性能。

Gemma 技术报告评测结果

从学术性能的基准测试来看,Gemma 7B模型在数学、Python代码生成、常识及常识推理等任务的多个基准测试中,表现优于Meta的Llama 2 7B和13B模型。

具体而言,在MMLU(多模态学习理解)基准测试中,Gemma 7B不仅超越了所有同等规模或更小规模的开源模型,甚至还超过了一些规模更大的模型,包括Llama 2的13B版本。

开放模型并不是指开源

Google在强调“开源”与“开放”模型之间的区别时,明确指出了两者的不同优势。Google指出,开源代码的一个显著优点是,一旦发布,许可证便授予用户完全的创作自由,这为开发人员和最终用户获得技术提供了强有力的保障。另一个优势是,开源技术可以自由地被修改,以满足最终用户的特定需求。

然而,Gemma模型遵循的是“开放模型”而非开源原则。开放模型的特征在于,尽管模型权重可以免费获得,但使用、再分发以及变体的所有权条款则根据模型的具体使用条款而异,这些条款可能并非基于开源许可证。

根据Gemma模型的使用条款,个人开发者、研究人员以及商业用户都可以自由地访问和重新分配这些模型。用户还被允许自由地创建和发布模型的变体。在使用Gemma模型时,开发者需同意避免任何有害的使用方式,这反映了Google对于负责任地开发人工智能技术的承诺,并进一步加强了对该技术使用的监管。

Google之所以不将“开源”一词用于描述Gemma的属性,是因为它认为现有的开源概念并不总是能够直接适用于AI系统。这引发了关于如何在人工智能领域应用开源许可证的问题。Google所面临的挑战在于,需要明确开源AI的定义,并解决衍生作品和作者归属等问题。

Gemma 与 Gemini 什么区别?

Gemma是一系列轻量级的最先进开源模型,它们是基于创建Gemini模型的相同研究和技术构建的。由Google DeepMind和Google的其他团队开发,Gemma的灵感来自于Gemini,其名称反映了拉丁语中“宝石”的意思。除了模型权重,谷歌还发布了一些工具来支持开发者的创新,促进合作,并指导Gemma模型的负责任使用。

​官方技术报告 pdf 

需要源文件的,可留言免费领取

关于 Gemma 的权威参考资料:

  • Google Gemma 官方博客:https://blog.google/technology/developers/gemma-open-models/

  • 官方地址:https://ai.google.dev/gemma?hl=zh-cn

  • Google炸场,推出开“放”可商用的大语言模型Gemma!超级轻量,个人电脑即可运行

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/704000.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2024.2.29 模拟实现 RabbitMQ —— 项目展示

目录 项目介绍 核心功能 核心技术 演示直接交换机 演示扇出交换机 演示主题交换机 项目介绍 此处我们模拟 RabbitMQ 实现了一个消息队列服务器 核心功能 提供了 虚拟主机、交换机、队列、绑定、消息 概念的管理九大核心 API 创建队列、销毁队列、创建交换机、销毁交换机、…

基于JSP的毕业设计选题系统的设计与实现

基于JSP的毕业设计选题系统的设计与实现 (源代码论文) A. 项目简介 毕业设计选题系统就是能够使学生通过互联网完成毕业设计课题的选定,它采用Web方式,同时适用于局域网和Internet,它要实现审核,权限管理,邮件通知…

Python中的atexit模块:优雅地处理程序退出

前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站AI学习网站。 目录 前言 atexit模块概述 atexit模块的基本用法 示例代码:文件操作时的应用场景 典型应用场景 1 资源释放…

云里物里轻薄系列电子价签,如何革新零售?

云里物里的DS轻薄系列电子价签,凭借轻巧外观和强劲性能,为零售行业提供了更便捷的商品改价方案。这不仅是对纸质价标的替代,更以其安全性和可持续发展性,实现对零售行业的效率升级,让商家们轻松迎接数字化时代的挑战&a…

【Vue3】学习watch监视:深入了解Vue3响应式系统的核心功能(下)

💗💗💗欢迎来到我的博客,你将找到有关如何使用技术解决问题的文章,也会找到某个技术的学习路线。无论你是何种职业,我都希望我的博客对你有所帮助。最后不要忘记订阅我的博客以获取最新文章,也欢…

OD(9)之Mermaid序列图(Sequence diagrams)使用详解

OD(8)之Mermaid序列图(Sequence diagrams)使用详解 Author: Once Day Date: 2024年2月21日 漫漫长路才刚刚开始… 全系列文章可参考专栏: Mermiad使用指南_Once_day的博客-CSDN博客 参考文章: 关于 Mermaid | Mermaid 中文网 (nodejs.cn)Mermaid | Diagramming and charti…

4.4 MySQL存储

目录 1、使用前提 2、使用连接数据库最初步骤 2.1 最初步骤 2.2 connect()方法中参数简单传递 3、创建数据库(创建架构)和创建表 3.1 创建数据库(创建架构) 3.2 创建表 3.2.1 基本创建 3.2.2 创建自增主键 4、Pycharm 可视化连接 MySQL 图形界面 5、插入、更新、查询…

【蓝桥杯】青蛙跳杯子(BFS)

一.题目描述 二.输入描述 输入为 2 行,2 个串,表示初始局面和目标局面。我们约定,输入的串的长度不超过 15。 三.输出描述 输出要求为一个整数,表示至少需要多少步的青蛙跳。 四.问题分析 注意:空杯子只有一个 …

3种SQL语句优化方法,测试人必知必会!

关于SQL语句的优化,本质上就是尽量降低SQL语句的执行时间,对于如何降低SQL语句的执行时间,可以从以下几个方面入手。 一、降低SQL语句执行时的资源消耗 这是我们在数据库性能调优中常用的方法,该方法以分析SQL语句的执行计划为切…

Python实用技巧:处理JSON文件写入换行问题

Python实用技巧:处理JSON文件写入换行问题 🌈 个人主页:高斯小哥 🔥 高质量专栏:Matplotlib之旅:零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程 👈 希望得到您的订阅…

linux中将普通用户添加sudo权限

1.登录root权限账号,编辑/etc/sudoers文件 2.找到"root ALL(ALL) ALL",并在下面添加普通用户 格式:username ALL(ALL) ALL vim /etc/sudoers ## Next comes the main part: which users can run what software …

CMake和VsCode调试的使用

目录 CMake使用 CMake下载 创建系统文件目录 MakeList编写规范 VsCode启动调试 添加配置文件 添加断点,启动调试 CMake使用 CMake下载 输入指令 sudo apt install cmake 安装cmake,使用 cmake -version可查看cmake的版本信息 创建系统文件目…

土耳其商务团一行莅临优积科技考察交流

7月31日土耳其商务代表Emre Arif Parlak等一行三人莅临优积科技考察交流,公司CEO刘其东携团队成员热情接待并深入交流。 商务团首先参观了我司产品生产基地,详细了解了钢结构模块的生产加工工艺流程和质量控制体系。随后参观了我司模块化学校样板房、模块…

Git+py+ipynb Usage

0.default config ssh-keygen -t rsa #之后一路回车,当前目录.ssh/下产生公私钥 cat ~/.ssh/id_rsa.pub #复制公钥到账号 git config --global user.email account_email git config --global user.name account_namebug of ipynb TqdmWarning: IProgress not found. Please …

一文1400字使用Jmeter进行http接口测试【建议收藏】

前言: 本文主要针对http接口进行测试,使用Jmeter工具实现。Jmter工具设计之初是用于做性能测试的,它在实现对各种接口的调用方面已经做的比较成熟,因此,本次直接使用Jmeter工具来完成对Http接口的测试。 一、开发接口…

【JavaSE】集合框架

目录 程序场景分析 Java集合框架包含的内容List接口ArrayListLinkedListList接口的常用方法ArrayList案例背景分析代码示例扩展以下功能代码示例 LinkedList案例背景分析代码示例LinkedList的特殊方法 ArrayList与LinkedList对比 Set接口HashSet 集合的特点常用方法案例背景分析…

[c 语言] 大端,小端;网络序,主机序

在网络编程中,特别是底层网卡驱动开发时,常常遇到字节序问题。字节序指的是多字节数据类型在内存中存放的顺序,高位保存在低地址还是高地址,以此来划分大端还是小端。 1 大端和小端 大端和小端指的是 cpu 的属性,常见…

Vulhub 靶场训练 DC-9解析

一、搭建环境 kali的IP地址是:192.168.200.14 DC-9的IP地址暂时未知 二、信息收集 1、探索同网段下存活的主机 arp-scan -l #2、探索开放的端口 开启端口有:80和22端口 3、目录扫描 访问80 端口显示的主页面 分别点击其他几个页面 可以看到是用户…

SpringBoot源码解读与原理分析(三十四)SpringBoot整合JDBC(三)声明式事务的传播行为控制

文章目录 前言10.5 声明式事务的传播行为控制10.5.1 修改测试代码(1)新建一个Service类,并引用UserService(2)修改主启动类 10.5.2 PROPAGATION_REQUIRED10.5.2.1 tm.getTransaction(1)获取事务…

用于自监督视觉预训练的屏蔽特征预测

Masked Feature Prediction for Self-Supervised Visual Pre-Training 一、摘要 提出了用于视频模型自监督预训练的掩模特征预测(MaskFeat)。首先随机屏蔽输入序列的一部分,然后预测屏蔽区域的特征。研究了五种不同类型的特征,发…