VLM MobileVLM 部署笔记

目录

模型是自动下载的

在1060显卡上能跑

LLaMA Meta

MobileVLM V2

MobileLLaMA-1.4B 调错


开源项目地址:

GitHub - Meituan-AutoML/MobileVLM: Strong and Open Vision Language Assistant for Mobile Devices

模型是自动下载的

路径:

C:\Users\xxx\.cache\huggingface\hub

models--mtgv--MobileLLaMA-1.4B-Chat

在1060显卡上能跑

LLaMA Meta

2023年7月,Meta公司发布了人工智能模型LLaMA 2的开源商用版本

MobileVLM V2

from scripts.inference import inference_once
# model_path = "mtgv/MobileVLM-1.7B" # MobileVLM
model_path = "mtgv/MobileVLM_V2-1.7B" # MobileVLM V2
image_file = "assets/samples/demo.jpg"
prompt_str = "Who is the author of this book?\nAnswer the question using a single word or phrase."
# (or) What is the title of this book?
# (or) Is this book related to Education & Teaching?args = type('Args', (), {"model_path": model_path,"image_file": image_file,"prompt": prompt_str,"conv_mode": "v1","temperature": 0,"top_p": None,"num_beams": 1,"max_new_tokens": 512,"load_8bit": False,"load_4bit": False,
})()inference_once(args)

MobileLLaMA-1.4B 调错


import torch
from transformers import LlamaTokenizer, LlamaForCausalLMmodel_path = 'mtgv/MobileLLaMA-1.4B-Chat'tokenizer = LlamaTokenizer.from_pretrained(model_path)
model = LlamaForCausalLM.from_pretrained(model_path, torch_dtype=torch.float16, device_map='auto',
)prompt = 'Q: What is the largest animal?\nA:'
input_ids = tokenizer(prompt, return_tensors="pt").input_ids.cuda()generation_output = model.generate(input_ids=input_ids, max_new_tokens=32
)
print(tokenizer.decode(generation_output[0]))

原版报错:

RuntimeError: Expected all tensors to be on the same device, but found at least two devices, cuda:0 and cpu! (when checking argument for argument index in method wrapper_CUDA__index_select)

改进后,发现input_ids需要改为cuda运行, input_ids.cuda()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/22163.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

解决Mac ~/.bash_profile 配置的环境变量重启终端后失效问题

在Mac系统中,配置环境变量通常是在~/.bash_profile文件中进行。然而,有时会遇到配置的环境变量在重启终端后失效的问题。 解决办法: 在~/.zshrc文件最后或最前面,增加一行 source ~/.bash_profile

SARscape雷达图像处理软件简介

合成孔径雷达(SAR)拥有独特的技术魅力和优势,渐成为国际上的研究热点之一,其应用领域越来越广泛。SAR数据可以全天候对研究区域进行量测、分析以及获取目标信息。高级雷达图像处理工具SARscape,能让您轻松将原始SAR数据…

Leetcode 第 131 场双周赛题解

Leetcode 第 131 场双周赛题解 Leetcode 第 131 场双周赛题解题目1:3158. 求出出现两次数字的 XOR 值思路代码复杂度分析 题目2:3159. 查询数组中元素的出现位置思路代码复杂度分析 题目3:3160. 所有球里面不同颜色的数目思路代码复杂度分析 …

AI 时代,产品经理该如何进化

前言 传统的互联网业务或者游戏业务,产品或者业务输出需求,技术人员只需要指哪打哪就好了。而人工智能发展到当下这个尴尬的阶段,仿佛它能干很多事,但是真把它往业务里搁就发现,这个叛逆的小东西不一定胜任的了这些有…

AI大模型学习笔记之四:生成式人工智能是如何工作的?

OpenAI 发布 ChatGPT 已经1年多了,生成式人工智能(AIGC)也已经广为人知,我们常常津津乐道于 ChatGPT 和 Claude 这样的人工智能系统能够神奇地生成文本与我们对话,并且能够记忆上下文情境。 GPT-4多模态分析对话 Midj…

数字机顶盒、显示器方案DCDC芯片OC5816 2A,18V同步降压DC-DC

概述 OC5816 是一款 2A 的高集成度、高效率同步整流降压转换器。在一个相当宽的输出电流负载范围内,OC5816 可以高效工作。 OC5816 的两种工作模式,固定频率PWM 峰值电流控制和轻载 PFM 开关模式,允许系统高效工作在一个相当宽的输出电流…

i 人 聊 天 手 册(e人禁止入内)

在之前的读书笔记-《蔡康永的说话之道》中,作者给大家分享了很多具体的要点,其更偏向于战术层面,我更想要的是一个类似聊天手册的东西,就让我自己来总结下吧。 虽然在 MBTI 中,按照获取能量的方式定义了 i 人、e 人&a…

【面试干货】如何选择MySQL数据库存储引擎(MyISAM 或 InnoDB)

【面试干货】如何选择MySQL数据库存储引擎(MyISAM 或 InnoDB) 💖The Begin💖点点关注,收藏不迷路💖 MySQL数据库存储引擎是一个 关键 的考虑因素。MySQL提供了多种存储引擎,其中最常用的是 MyISAM 和 InnoD…

封装一个页面自适应方法

封装一个页面自适应方法 在 Vue 中,你可以封装一个页面自适应的方法来根据屏幕大小动态调整页面的布局和样式。以下是一个示例代码: export const getPageSize () > {const { innerWidth, innerHeight } window;const width innerWidth > 192…

攻防世界---misc---a_good_idea

1、下载附件得到一张图片,winhex分析,发现有压缩包 2、在kali中用普通用户对jpg进行binwalk 3、得到两张图片和一个文本,查看文本信息:提示试着找到像素的秘密 4、提到像素就想到了Stegsolve这个工具,将这两张图片用该…

rpm打包 postgres14.9 repmgr pgpool

rpm打包 postgres14.9 repmgr pgpool 上一篇讲解了rpm打包的基础知识之后,我们就可以根据实际业务自行打包了,需要注意的是依赖问题,需要提前讲依赖准备好,对于各种系统需要的依赖的依赖也不一致,可以根据具体报错去相…

Python项目开发实战:二手房数据分析预测系统(案例教程)

一、项目背景与意义 在房地产市场日益繁荣的今天,二手房市场占据了重要地位。对于购房者、房地产中介和开发商来说,了解二手房市场的动态、价格趋势以及潜在价值至关重要。因此,开发一个基于Python的二手房数据分析预测系统具有实际应用价值和商业意义。本项目旨在利用Pytho…

2024.05.21 校招 实习 内推 面经

绿*泡*泡VX: neituijunsir 交流*裙 ,内推/实习/校招汇总表格 1、实习 | 云鲸智能暑期实习热招岗位(内推) 实习 | 云鲸智能暑期实习热招岗位(内推) 2、实习 | 亚马逊实习生招聘倒计时! 实习…

HOW - Lodash 使用指南和源码学习

目录 一、什么是 lodash二、为什么需要 Lodash三、API 分类ArrayCollectionDateFunctionLangMathNumberObjectStringSeqUtil 我们经常在项目里遇到 Lodash 函数的引入,如: debounce(Function)cloneDeep(Lang)isNull(Lang)isUndefined(Lang)isNil(Lang)i…

106、python-第四阶段-3-设计模式-单例模式

不是单例类,如下: class StrTools():pass str1StrTools() str2StrTools() print(str1) print(str2) 运用单例,先创建一个test.py class StrTools():pass str1StrTools()然后创建一个hello.py,在这个文件中引用test.py中的对象&a…

JVM-JAVA-双亲委派机制

双亲委派机制 双亲委派机制Tomcat打破双亲委派机制 双亲委派机制 双亲委派机制,加载某个类时会先委托父加载器寻找目标类,找不到再委托上层父加载器加载,如果所有父加载器在自己的加载类路径下都找不到目标类,则在自己的类加载路径…

网络攻击的常见形式

开篇 本篇文章来自于《网络安全 ——技术与实践》的学习整理笔记。 正篇 口令窃取 相比于利用系统缺陷破坏网络系统,最容易的方法还是通过窃取用户的口令进入系统。因为人们倾向于选择很糟糕的口令作为登录密码,所以口令猜测很容易成功。通常&#xff0…

C语言:基础知识

创作不易,友友们给个三连吧 一、C语⾔的基本概念与发展历史 1.1 人和计算机进行交流的语言 通常,我们使用英语、中文等语言来进行两个人之间的交流。这意味着当我们想要和他人进行交流时,我们需要一种语言来表达自己的感受。同样的&#xf…

10分钟了解ERP软件系统

ERP(Enterprise Resource Planning,企业资源规划)软件是一种集成的管理信息系统,旨在通过优化公司内部资源的分配和使用,提高企业的运营效率和管理水平。ERP系统通常包含多个功能模块,这些模块覆盖了企业运…

喜讯!易知微入选2024年第一批浙江省专精特新中小企业

近日,杭州市经济和信息化局对2024年第一批浙江省专精特新中小企业名单进行公示。 图片 经过专业化程度、技术创新与研发能力、品牌影响力、经营管理水平等多方面因素的考量筛选,杭州易知微科技有限公司荣幸地入选了2024年第一批浙江省专精特新中小企业…