能在手机上运行,仅仅0.5B大小的小语言模型MobiLlama


aca4dd793755ee5ce30eb13be6260763.jpeg

模型介绍

该模型基于LLaMA-7B架构设计,旨在能够在边缘设备上高效运行,无需将数据发送到远程服务器或云端处理。如智能手机、平板电脑、智能手表等。

MobiLlama模型虽然体积小、对资源的需求低,但仍能提供高精度的语言理解和生成能力。

项目还提供了在安卓上运行MobiLlama模型的方法和安装包下载链接。mbzuaiac-my.sharepoint.com/:f:/g/personal…

主要能力

1、高精度的语言理解与生成:即便参数规模相对较小(0.5亿参数),MobiLlama也能高效处理自然语言理解和生成任务,如文本摘要、问答系统、自然语言推理等。

2、轻量级设计:通过优化模型架构和采用参数共享技术,MobiLlama实现了模型大小和计算资源需求的显著减少,使其适合在计算能力有限的设备上运行。

3、资源效率高:MobiLlama在设计时考虑了能效和内存使用效率,使其在执行任务时消耗更少的电力和存储空间,适合长时间运行在移动设备上。

4、适应性强:由于其轻量级和高效的特性,MobiLlama可以轻松集成到各种应用中,从智能助手到语言翻译工具,都能从其快速、精确的处理能力中受益。

5、全透明:MobiLlama项目开源,提供了模型的训练数据、代码和训练过程的详细信息,使其他研究者和开发者可以完全了解模型的工作原理,有助于促进技术的进步和应用的开发。

模型版本

MobiLlama项目提供了不同配置的模型版本,包括0.5B、0.8B、1B及其聊天版本的模型。

0.5B:这个版本的模型有0.5亿参数,是设计中最轻量级的一个,旨在提供较高的效率和速度,同时保持良好的性能,特别适合在资源受限的设备上使用。

0.8B:0.8亿参数的模型在0.5B的基础上增加了参数,以改进模型的性能和理解能力,适合于需要更复杂处理能力的场景。

1B:1亿参数的模型进一步增强了模型的能力,能够处理更复杂的语言理解和生成任务,适用于对性能要求更高的应用。

数据集

项目使用了预处理过的Amber数据集,总计约1.2万亿token,数据来源包括Arxiv、Book、C4、Refined-Web、StarCoder、StackExchange和Wikipedia等,总大小约为8TB。

评估结果

基准测试性能

MobiLlama模型在包括HellaSwag、TruthfulQA、MMLU、ARC_C、CrowsPairs、PIQA、RACE、SIQA、WinoGrande等测试中的性能表现,与其他模型进行了比较。在这些基准测试中,MobiLlama表现出色,尤其是在0.5B和0.8B配置下,展现了其高效处理复杂语言任务的能力。具体的评估结果如下:

MobiLlama (0.5B):在多项任务中取得了优异的成绩,平均得分达到46.00,突出显示了模型的高效率和准确性。
MobiLlama (0.8B):进一步提升了性能,平均得分达到46.67,表明了通过增加模型规模可以进一步提升性能。

比较分析

与其他模型相比,如GPT-NEO、TinyStarCoder、Cerebras-GPT等,MobiLlama在相同或更小的参数规模下,能够实现更高的准确度和效率。这些结果凸显了MobiLlama在设计上的优势,即通过参数共享和模型优化,实现了在资源有限的设备上运行高性能模型的目标。

具体性能对比

GPT-NEO (0.15B):平均得分为40.93。
TinyStarCoder (0.17B):平均得分为37.86。
Cerebras-GPT (0.26B):平均得分为40.69。

MobiLlama的性能优于这些模型,展现了其作为小型语言模型的竞争力和潜力。

模型下载:huggingface.co/MBZUAI

GitHub:https://github.com/mbzuai-oryx/MobiLlama

论文:arxiv.org/abs/2402.16840

在线体验:845b645234785da51b.gradio.live

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/708585.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java 通过 microsoft graph 调用outlook

废话不多说 一 官方文档 先看一下官方文档,https://learn.microsoft.com/zh-cn/graph/tutorials/java?contextoutlook%2Fcontext&tabsaad&tutorial-step1 其中的代码,可以通过地址下载:https://developer.microsoft.com/en-us/gra…

NutUI + taro +vue 开发遇到的问题 使用popup组件 内部元素滚动遇到的的问题

1 popup 弹出内容时 弹出的框内元素数据很长需要滚动时 本地可以正常滚动 打包成小程序后无法滚动 如这样的免责条款内容 代码如下 解决办法 1 把2处的单位换成百分比 弹框能滚动但是 是popup 里面所有的元素都一起滚动 导致标题都滚走了 2 scroll-y 改成: :scrol…

单片机05__串口USART通信__按键控制向上位机传输字符串

串口USART通信 通用UART介绍 1.通信的概念 计算机与外界进行信息交换的过程称之为通信。 在通信的过程中,通信双方都需要遵守的规则称之为通信协议。 硬件协议:将数据以什么样的方式传输过去 软件协议:将数据以什么样的顺序传输过去 2.常用…

微服务之qiankun主项目+子项目搭建

主项目使用history,子项目使用hash模式 1. 下载安装"qiankun": "^2.10.13"2. 手动调用qiankun,使用vue脚手架搭建的项目1. 主项目配置(我使用的是手动调用乾坤,在指定页面显示内容)1. 要使用的页面中引入乾坤…

MyBatis概述

三层架构 表现层:直接和前端交互,接受AJAX请求,返回json数据业务层:一是处理前端的请求,二是返回持久层获取的数据持久层(数据访问层):直接操作数据库,完成CRUD,返回数据给业务层 …

李沐动手学习深度学习——3.2练习

以下是个人理解,希望进行讨论求解。 练习 1. 如果我们将权重初始化为零,会发生什么。算法仍然有效吗? 根据SGD算法公式如上,第一次迭代的值可知w只与b相关,而对于b的迭代更新,只是与b的初始值相关&#x…

docker中hyperf项目配置虚拟域名

在使用hyperf框架时,直接用了docker环境进行开发 下载镜像运行容器 docker run --name hyperf -v /data/project:/data/project -p 9501:9501 -itd -w /data/project --privileged -u root --entrypoint /bin/sh 镜像ID配置docker-compose.yml version: "3.…

亚马逊自养号测评:如何安全搭建环境,有效规避风险

要在亚马逊上进行自养号测评,构建一个真实的国外环境至关重要。这包括模拟国外的服务器、IP地址、浏览器环境,甚至支付方式,以创建一个完整的国际操作环境。这样的环境能让我们自由注册、养号并下单,确保所有操作均符合国际规范。…

企业级指针仪表读数YOLOV8NANO

企业级指针仪表读数,采用YOLOV8NANO训练,检测表盘和表芯,得到PT模型,然后转换ONNX,让OPENCV调用。然后提取表芯区域,通过极坐标转换为直角坐标,再通过检测指针和刻度,换算成比例&…

Chapter 8 - 19. Congestion Management in TCP Storage Networks

Queue Depth Monitoring and Microburst Detection Queue depth monitoring and microburst detection capture the events that may cause congestion at a lower granularity but are unnoticed by other means due to long polling intervals. 队列深度监控和微爆检测可捕捉…

前端-BOM和DOM的区别和用法

首先上图,这是整个JAVASCRIPTD 结构,因此我们可以得出一个关系等式 JavaScript ECMAscript BOM DOMECMAscript: 是一种由 ECMA国际(前身为欧洲计算机制造商协会)通过 ECMA-262 标准化的脚本程序设计语言&#xff0…

二分图---染色法(判断二分图),匈牙利算法(二分图的最大匹配) //概念,应用场景,判定证明,算法思路,示例

目录 二分图概念 二分图应用场景 如何判定一个图是否可以划分成二分图 证明 染色法 原理步骤 时间复杂度 算法思路 例子 匈牙利算法 概念 匈牙利使用算法前提,场景 时间复杂度 算法思路 例子 二分图概念 二分图是图论中的一个重要概念,指的是一个图的…

Java四大引用类型

四大引用类型 从JDK 1.2版本开始,对象的引用被划分为4种级别,从而使程序能更加灵活地控制对象的生命周期。这4种级别由高到低依次为:强引用、软引用、弱引用和虚引用 不同的引用类型,主要体现的是对象不同的可达性(r…

【vue3学习笔记】Suspense组件;vue3中的其它改变

尚硅谷Vue2.0Vue3.0全套教程丨vuejs从入门到精通 课程 P167节 《Suspense组件》笔记 想要学习suspense,先来了解静态组件与异步组件。 静态引入与异步引入: 在network中将网速调慢,观察在静态引入和异步引入模式下,两个组件的加载…

CI/CD笔记.Gitlab系列.`gitlab-ci.yml`中的头部关键字

CI/CD笔记.Gitlab系列 gitlab-ci.yml中的头部关键字 - 文章信息 - Author: 李俊才 (jcLee95) Visit me at: https://jclee95.blog.csdn.netMy WebSite:http://thispage.tech/Email: 291148484163.com. Shenzhen ChinaAddress of this article:https://blog.csdn.ne…

【MySQL】主从同步原理、分库分表

主从同步原理 1. 主从同步原理 MySQL 经常先把命令拷入硬盘的日志,再执行日志的命令,这样的好处: 日志的位置固定,拷入硬盘的开销不大;将命令先准备好,而不是边读边执行,性能更好,…

Google Genie vs OpenAI Sora:互动世界模型之争,谁将引领AI的未来?

近年来,生成式AI异军突起,从文字到图像,再到视频,它们的创造力令人瞩目。 但今天,我们要介绍Google Genie,不仅仅满足于生成静态的内容。 它能把单一的图片提示,变成一个你可以亲身参与的互动…

【系统分析师】-软件工程

1、信息系统的生命周期 1、四阶段划分 立项阶段:企业全局、形成概念、需求分析。包含【系统分析师】-系统规划-CSDN博客开发阶段:总体规划--系统分析--设计--实施--验收运维阶段:通过验收、移交之后消亡阶段:更新改造、功能扩展…

K8S部署postgresql

(作者:陈玓玏) 一、前置条件 已部署k8s,服务端版本为1.21.14 二、部署postgresql 拉取镜像,docker pull postgres,不指定版本,自动从docker hub拉取最新版本;配置configmap&…

【UE 材质】制作加载图案

目录 效果 步骤 一、形成圆环 二、使圆环转起来 效果 步骤 一、形成圆环 新建一个材质,这里命名为“M_Loading” 打开“M_Loading”,设置混合模式为半透明,着色模型为无光照,勾选双面 下面开始先创建一个圆环,将…