手机端可部署的开源大模型；通义千问2.5训练和推理需要的内存和外存

OpenELM：由苹果公司开源，在AI代码社区Hugging Face上发布。它由多个旨在高效执行文本生成任务的小模型组成，有2.7亿、4.5亿、11亿与30亿参数四种规模，各模型均有预训练与指令微调两个版本。采用层级缩放策略，在公开数据集预训练后微调，能在商用笔记本电脑甚至部分智能手机上运行。苹果公司在“示例代码许可证”下发布了模型权重等相关内容。
Ministraux：由法国Mistral.AI开源，有Ministral 3B和8B两个版本，专为手机、平板、笔记本等移动设备设计。在文本生成、推理、函数调用和效率方面表现出色，支持128k上下文长度，在主流基准测试平台中的分数较高，超过了谷歌的Gemma-2、Meta的Llama-3.2等模型。
Gemma 2B：谷歌发布的紧凑型高性能LLM，利用多查询注意力机制，减少推理期间对内存带宽的需求，适合内存带宽有限的设备端场景。仅用20亿个参数，在语言理解、推理和安全等方面的学术基准测试上成绩出色，在18项基于文本的任务中，11项表现胜过大小相似的开放模型。
Phi-2：微软的小型模型，有27亿个参数。在某些基准测试中ÿ

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/web/75792.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！