Google炸场，推出开“放”可商用的大语言模型Gemma！超级轻量，个人电脑即可运行

与OpenAI的封闭式大型模型不同，谷歌、Meta等科技巨头正致力于开发开源模型，以期实现技术上的快速追赶。

介绍

2月21日，谷歌发布了其最新一代的开源AI模型——Gemma（https://ai.google.dev/gemma），这是一个与Meta的Llama 2模型相媲美的轻量级模型。

单从名字上判断，新推出的Gemma与谷歌早前的Gemini模型容易让人混淆。对此，谷歌在其官方公告中阐释说，Gemma的设计灵感正是源自于Gemini，而Gemma在拉丁语中意味着“宝石”。两者的主要区别在于：

Gemma可以被看作是Gemini的一个更小型、更轻量级的变体。
Gemma旨在使开发者和研究人员能够更便捷地获取和使用，而Gemini则旨在处理更为复杂的任务。
这两个模型都可以免费使用，但是Gemma提供的免费选项更加有限。

最关键的是，Gemma模型能够在个人台式电脑或笔记本上本地执行运行。

Gemma是什么？

总体而言，Gemma是由Google DeepMind联合Google AI的其他团队共同研发的成果，它基于与Gemini模型相似的研究和技术，构建于序列模型、变换器（Transformer）、基于神经网络的深度学习技术以及分布式系统的大规模训练之上。该模型的训练上下文长度能够处理高达8192个token。

这个最新推出的模型提供了两个版本，分别是Gemma 2B（含有20亿参数）和Gemma 7B（含有70亿参数）。这两个版本都提供了预训练版本和经过指令调整的变体。

Gemma模型将通过商业许可授权的形式发布，同时，Google还将推出一个新的负责任的生成式人工智能工具包，旨在指导开发者和研究人员负责任地利用Gemma模型。

在人工智能领域，参数是决定AI模型行为的神经网络中的数值，而权重则是这些参数中存储于文件的一部分。

自从2022年OpenAI推出ChatGPT以来，Gemma的推出标志着Google发布的首个开放式大型语言模型（LLM），但这并非Google在开放式AI研究领域的首次贡献。Google AI团队在官方博客中表示，他们过去已经推出了Transformers、TensorFlow、BERT、T5、JAX、AlphaFold和AlphaCode等关键的AI架构和工具集。

因此，这一次，Google还为所有主流框架提供了推理和监督微调（SFT）工具链，包括JAX、PyTorch和TensorFlow（通过本地Keras 3.0）。

此外，还提供了随时可用的Colab和Kaggle笔记本，以及与Hugging Face、MaxText、NVIDIA NeMo和TensorRT-LLM等流行工具的集成，使得开发者更加容易地开始使用Gemma。

经过预训练和指令调整的Gemma模型可以在笔记本电脑、工作站或Google Cloud上运行，并且可以在Vertex AI和Google Kubernetes Engine上进行部署。

除此之外，英伟达今天宣布与Google合作，在包括本地RTX AI PC在内的所有英伟达AI平台上推出优化措施，以加速Gemma的性能。

Gemma 技术报告评测结果

从学术性能的基准测试来看，Gemma 7B模型在数学、Python代码生成、常识及常识推理等任务的多个基准测试中，表现优于Meta的Llama 2 7B和13B模型。

具体而言，在MMLU（多模态学习理解）基准测试中，Gemma 7B不仅超越了所有同等规模或更小规模的开源模型，甚至还超过了一些规模更大的模型，包括Llama 2的13B版本。

开放模型并不是指开源

Google在强调“开源”与“开放”模型之间的区别时，明确指出了两者的不同优势。Google指出，开源代码的一个显著优点是，一旦发布，许可证便授予用户完全的创作自由，这为开发人员和最终用户获得技术提供了强有力的保障。另一个优势是，开源技术可以自由地被修改，以满足最终用户的特定需求。

然而，Gemma模型遵循的是“开放模型”而非开源原则。开放模型的特征在于，尽管模型权重可以免费获得，但使用、再分发以及变体的所有权条款则根据模型的具体使用条款而异，这些条款可能并非基于开源许可证。

根据Gemma模型的使用条款，个人开发者、研究人员以及商业用户都可以自由地访问和重新分配这些模型。用户还被允许自由地创建和发布模型的变体。在使用Gemma模型时，开发者需同意避免任何有害的使用方式，这反映了Google对于负责任地开发人工智能技术的承诺，并进一步加强了对该技术使用的监管。

Google之所以不将“开源”一词用于描述Gemma的属性，是因为它认为现有的开源概念并不总是能够直接适用于AI系统。这引发了关于如何在人工智能领域应用开源许可证的问题。Google所面临的挑战在于，需要明确开源AI的定义，并解决衍生作品和作者归属等问题。

Gemma 与 Gemini 什么区别？

Gemma是一系列轻量级的最先进开源模型，它们是基于创建Gemini模型的相同研究和技术构建的。由Google DeepMind和Google的其他团队开发，Gemma的灵感来自于Gemini，其名称反映了拉丁语中“宝石”的意思。除了模型权重，谷歌还发布了一些工具来支持开发者的创新，促进合作，并指导Gemma模型的负责任使用。