与OpenAI的封闭式大型模型不同,谷歌、Meta等科技巨头正致力于开发开源模型,以期实现技术上的快速追赶。
介绍
2月21日,谷歌发布了其最新一代的开源AI模型——Gemma(https://ai.google.dev/gemma),这是一个与Meta的Llama 2模型相媲美的轻量级模型。
单从名字上判断,新推出的Gemma与谷歌早前的Gemini模型容易让人混淆。对此,谷歌在其官方公告中阐释说,Gemma的设计灵感正是源自于Gemini,而Gemma在拉丁语中意味着“宝石”。两者的主要区别在于:
-
Gemma可以被看作是Gemini的一个更小型、更轻量级的变体。
-
Gemma旨在使开发者和研究人员能够更便捷地获取和使用,而Gemini则旨在处理更为复杂的任务。
-
这两个模型都可以免费使用,但是Gemma提供的免费选项更加有限。
最关键的是,Gemma模型能够在个人台式电脑或笔记本上本地执行运行。
Gemma是什么?
总体而言,Gemma是由Google DeepMind联合Google AI的其他团队共同研发的成果,它基于与Gemini模型相似的研究和技术,构建于序列模型、变换器(Transformer)、基于神经网络的深度学习技术以及分布式系统的大规模训练之上。该模型的训练上下文长度能够处理高达8192个token。
这个最新推出的模型提供了两个版本,分别是Gemma 2B(含有20亿参数)和Gemma 7B(含有70亿参数)。这两个版本都提供了预训练版本和经过指令调整的变体。
Gemma模型将通过商业许可授权的形式发布,同时,Google还将推出一个新的负责任的生成式人工智能工具包,旨在指导开发者和研究人员负责任地利用Gemma模型。
在人工智能领域,参数是决定AI模型行为的神经网络中的数值,而权重则是这些参数中存储于文件的一部分。
自从2022年OpenAI推出ChatGPT以来,Gemma的推出标志着Google发布的首个开放式大型语言模型(LLM),但这并非Google在开放式AI研究领域的首次贡献。Google AI团队在官方博客中表示,他们过去已经推出了Transformers、TensorFlow、BERT、T5、JAX、AlphaFold和AlphaCode等关键的AI架构和工具集。
因此,这一次,Google还为所有主流框架提供了推理和监督微调(SFT)工具链,包括JAX、PyTorch和TensorFlow(通过本地Keras 3.0)。
此外,还提供了随时可用的Colab和Kaggle笔记本,以及与Hugging Face、MaxText、NVIDIA NeMo和TensorRT-LLM等流行工具的集成,使得开发者更加容易地开始使用Gemma。
经过预训练和指令调整的Gemma模型可以在笔记本电脑、工作站或Google Cloud上运行,并且可以在Vertex AI和Google Kubernetes Engine上进行部署。
除此之外,英伟达今天宣布与Google合作,在包括本地RTX AI PC在内的所有英伟达AI平台上推出优化措施,以加速Gemma的性能。
Gemma 技术报告评测结果
从学术性能的基准测试来看,Gemma 7B模型在数学、Python代码生成、常识及常识推理等任务的多个基准测试中,表现优于Meta的Llama 2 7B和13B模型。
具体而言,在MMLU(多模态学习理解)基准测试中,Gemma 7B不仅超越了所有同等规模或更小规模的开源模型,甚至还超过了一些规模更大的模型,包括Llama 2的13B版本。
开放模型并不是指开源
Google在强调“开源”与“开放”模型之间的区别时,明确指出了两者的不同优势。Google指出,开源代码的一个显著优点是,一旦发布,许可证便授予用户完全的创作自由,这为开发人员和最终用户获得技术提供了强有力的保障。另一个优势是,开源技术可以自由地被修改,以满足最终用户的特定需求。
然而,Gemma模型遵循的是“开放模型”而非开源原则。开放模型的特征在于,尽管模型权重可以免费获得,但使用、再分发以及变体的所有权条款则根据模型的具体使用条款而异,这些条款可能并非基于开源许可证。
根据Gemma模型的使用条款,个人开发者、研究人员以及商业用户都可以自由地访问和重新分配这些模型。用户还被允许自由地创建和发布模型的变体。在使用Gemma模型时,开发者需同意避免任何有害的使用方式,这反映了Google对于负责任地开发人工智能技术的承诺,并进一步加强了对该技术使用的监管。
Google之所以不将“开源”一词用于描述Gemma的属性,是因为它认为现有的开源概念并不总是能够直接适用于AI系统。这引发了关于如何在人工智能领域应用开源许可证的问题。Google所面临的挑战在于,需要明确开源AI的定义,并解决衍生作品和作者归属等问题。
Gemma 与 Gemini 什么区别?
Gemma是一系列轻量级的最先进开源模型,它们是基于创建Gemini模型的相同研究和技术构建的。由Google DeepMind和Google的其他团队开发,Gemma的灵感来自于Gemini,其名称反映了拉丁语中“宝石”的意思。除了模型权重,谷歌还发布了一些工具来支持开发者的创新,促进合作,并指导Gemma模型的负责任使用。
官方技术报告 pdf
需要源文件的,可留言免费领取
关于 Gemma 的权威参考资料:
-
Google Gemma 官方博客:https://blog.google/technology/developers/gemma-open-models/
-
官方地址:https://ai.google.dev/gemma?hl=zh-cn
-
Google炸场,推出开“放”可商用的大语言模型Gemma!超级轻量,个人电脑即可运行