AutoDL部署视觉大模型llama3.2-vision,从视频中寻找特定目标

注: windows11系统。示例为此项目:https://github.com/win4r/VideoFinder-Llama3.2-vision-Ollama

在当今的人工智能领域,深度学习模型的计算需求日益增长,特别是在处理复杂的视觉任务时,强大的算力往往是实现高效应用的关键。如果您的算力有限,租用云服务器无疑是一个高性价比的选择。在众多服务平台中,AutoDL AI算力云https://www.autodl.com/home凭借其卓越的性价比和强大的算力资源,成为了许多开发者和企业的首选。本文将以部署 Ollama 的视觉大模型 llama3.2-vision 为例,详细介绍如何在 AutoDL 平台上进行模型的部署。我们将利用 llama3.2-vision 的图像分析功能,展示如何从视频中寻找特定目标,从而帮助读者快速上手并高效实现目标检测任务。

**为便于测试我已将项目源代码、Linux下的Ollama安装文件已分享:链接:https://pan.baidu.com/s/1Wfv15jS3hBVEnQ4tHamLSA?pwd=r8vs **

1、租用服务

注册、充值、创建实例
在这里插入图片描述

2、配置环境

  • 点击JupyterLab->启动页->进入终端
    在这里插入图片描述

  • 初始化base环境
    终端输入conda init, 关闭此终端,重新开启新的终端,初始化生效。
    | 在这里插入图片描述
    在这里插入图片描述

3、上传项目压缩文件

上传前可以将压缩文件名改一下,我这里改为VideoFinder.zip, 当然你上传后在文件上右键亦可重命名。
在这里插入图片描述

4、解压项目

# 解压
unzip VideoFinder.zip

将解压后的文件夹我也重命名为VideoFinder。

5、创建项目运行环境

# 创建虚拟环境
conda create -n VideoFinder 
# 激活虚拟环境
conda activate VideoFinder
# 进入项目目录
cd VideoFinder
# 安装项目依赖
pip install -r requirements.txt 

6、安装ollama

参考https://github.com/ollama/ollama 依照官网给出的安装命令,安装非常慢!非常慢!非常慢!可以采用后面的方法。

curl -fsSL https://ollama.com/install.sh | sh
ollama run llama3.2-vision

可以将Linux下的安装文件下载到本地后上传到AutoDL 上,再进行安装。

准备工作

  1. 下载并上传文件
    • 从官方网站下载 Ollama 的 Linux 安装文件(ollama-linux-amd64.tgz)。
    • 上传该文件到 autodl-tmp 文件夹(可以通过直接拖拽或使用其他上传方式)。

安装和配置步骤

  1. 解压和安装 Ollama

    # 进入上传文件的目录
    cd ~/autodl-tmp# 解压文件到 /usr 目录
    sudo tar -C /usr -xzf ollama-linux-amd64.tgz# 确保 Ollama 可执行
    sudo chmod +x /usr/bin/ollama
    
  2. 配置环境变量

    • 使用以下命令修改 /etc/profile 文件以设置 Ollama 的相关环境变量:
    # 在文件末尾添加以下两行
    echo 'export OLLAMA_HOST="0.0.0.0:6006"' | sudo tee -a /etc/profile
    echo 'export OLLAMA_MODELS="/root/autodl-tmp/models"' | sudo tee -a /etc/profile# 使以上配置生效
    source /etc/profile# 验证配置是否生效
    echo $OLLAMA_HOST   # 如果输出 "0.0.0.0:6006" 则配置成功。
    
  3. 启动 Ollama 服务

    # 启动 Ollama 服务并让它在后台运行
    nohup ollama serve &# 检查 Ollama 是否正在运行
    ps aux | grep '[o]llama'
    

    在这里插入图片描述

7、运行视觉大模型llama3.2-vision

在启动ollama服务后,运行以下指令

# 启动llama3.2-vision, 如果第一次运行会拉取模型  11B近8个G,90B的有55个G,如果你想跑90B的要租更牛B的服务器了。
ollama run llama3.2-vision

在这里插入图片描述

8、运行程序

1、将欲要分析的视频上传至项目目录下,在终端运行程序, 视频名称和要找的目标在程序入口处修改。

视频地址:https://cdn.pixabay.com/video/2020/02/13/32287-391434445_large.mp4

python app.py

在这里插入图片描述
在这里插入图片描述
2、以网页形式运行

python main.py

程序启动,在本地http://0.0.0.0:8000上运行。

在这里插入图片描述

在本地访问服务器上的服务,使用“2.配置环境”图中的“自定义服务”, 安装隧道工具。
在这里插入图片描述
网页中访问
在这里插入图片描述
在本文中,我们探讨了在 AutoDL 平台上成功部署 Ollama 的视觉大模型 llama3.2-vision 的全过程。在实际部署过程中,我们详细解析了模型的调用方式,介绍了如何有效地进行图像预处理,并探讨了如何解读和解析分析结果。得益于 llama3.2-vision 的强大能力,我们能够实现快速而精准的目标识别和视频内容分析。这种技术的应用不仅为智能监控和安防领域带来了巨大的便利,还为其他相关场景提供了可靠的解决方案。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/59951.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【机器学习】聚类算法原理详解

聚类算法 性能度量: 外部指标 jaccard系数(简称JC)FM指数(简称FMI)Rand指数(简称RI) 内部指标 DB指数(简称DBI)Dunn指数(简称DI) 距离计算&am…

前端性能优化深入解析:提升用户体验的几个关键点

文章目录 前言一、代码分割与动态导入二、图片和脚本的懒加载三、缓存策略四、如何根据项目特点选择合适的前端性能优化策略?结语 前言 在当今的互联网环境中,网页加载速度直接影响到用户的满意度和留存率。因此,前端性能优化对于提高用户体…

系统架构设计师论文

资源库:https://blog.csdn.net/weixin_43905586/article/details/118719986 2019年 2019年下半年试题二:论软件系统架构评估及其应用 2012年 2012年下半年试题一:论基于架构的软件设计方法及应用

用 Android Studio 从零开发一个多功能计算器应用

简介 计算器是每个学习 Android 开发者必经的经典项目之一。本篇文章将带你创建一个功能更强大的计算器应用,支持基本的加减乘除运算、带小数点的输入以及更多操作符功能。通过这个项目,你将全面掌握 Android 的布局设计、事件处理和逻辑实现技巧。 一、…

【代码随想录day33】【C++复健】62.不同路径;63. 不同路径 II;343. 整数拆分;96.不同的二叉搜索树

感觉dp的题真的很适合背,当然不是死记硬背,而是当做一种模板题,出来一道新的题就往模板题上面去靠,如果套对模板的话剩下的事情其实就简单了。所以只要看一遍解法知道大致思路其实就够了,毕竟大部分dp的代码也不算难写…

SHELL笔记(条件测试)

基本概念: 条件测试用于在 Shell 脚本中对各种条件进行判断,根据判断结果来决定是否执行特定的命令或代码块。条件测试可以用于比较数值、字符串,检查文件或目录的属性,以及判断命令的执行结果等。 格式: 格式1&…

JDK、MAVEN与IDEA的安装与配置

1.认识JDK、MAVEN与IDEA JDK 提供了编译和运行Java程序的基本环境。Maven 帮助管理项目的构建和依赖。IDEA 提供了一个强大的开发环境,使得编写、调试和运行Java程序更加高效。 2. 安装与环境配置 2.1 官网地址 选择你需要的版本下载: MAVEN下载传送…

微信小程序-prettier 格式化

一.安装prettier插件 二.配置开发者工具的设置 配置如下代码在setting.json里: "editor.formatOnSave": true,"editor.defaultFormatter": "esbenp.prettier-vscode","prettier.documentSelectors": ["**/*.wxml"…

【Mac】未能完成该操作 Unable to locate a Java Runtime

重生之我做完产品经理之后回来学习Data Mining Mac打开weka.jar报错"未能完成该操作 Unable to locate a Java Runtime" 1. 打开终端执行 java -version 指令,原来是没安装 JDK 环境 yyzccnn-mac ~ % java -version The operation couldn’t be comple…

【ArcGIS微课1000例】0127:计算城市之间的距离

本文讲述,在ArcGIS中,计算城市(以地级城市为例)之间的距离,效果如下图所示: 一、数据准备 加载配套实验数据包中的地级市和行政区划矢量数据(订阅专栏后,从私信查收数据),如下图所示: 二、计算距离 1. 计算邻近表 ArcGIS提供了计算点和另外点之间距离的工具:分析…

【WPF】Prism学习(五)

Prism Commands 1.错误处理(Error Handling) Prism 9 为所有的命令(包含AsyncDelegateCommand)提供了更好的错误处理。 避免用try/catch包装每一个方法根据不同遇到的异常类型来提供特定的逻辑处理可以在多个命令之间共享错误处…

【element-tiptap】Tiptap编辑器核心概念----结构篇

core-concepts 前言:这篇文章来介绍一下 Tiptap 编辑器的一些核心概念 (一)结构 1、 Schemas 定义文档组成方式。一个文档就是标题、段落以及其他的节点组成的一棵树。 每一个 ProseMirror 的文档都有一个与之相关联的 schema,…

2024.6使用 UMLS 集成的基于 CNN 的文本索引增强医学图像检索

Enhancing Medical Image Retrieval with UMLS-Integrated CNN-Based Text Indexing 问题 医疗图像检索中,图像与相关文本的一致性问题,如患者有病症但影像可能无明显异常,影响图像检索系统准确性。传统的基于文本的医学图像检索&#xff0…

PGMP-练DAY26

1. Which of the following items are key elements of the program charter?以下哪些项目是项目集章程的关键要素? A.Scope, assumptions,constraints,goals and objectives, timing, key stakeholders.范围、假设、约束、目标和目的、时间安排、主要利益相关者 …

Spark_写ORALCE:ORA-01426 numeric overflow 问题解决

问题 是这样的,20241118,我spark程序写Oracle时候,关联完HBase数据后,在写入ORACLE中,遇到了这个bug, 数据入到一半,每次都报错ORA-01426 numeric overflow,具体呢,也不告…

初识Linux · 信号处理 · 续

目录 前言: 可重入函数 重谈进程等待和优化 前言: 在前文,我们已经介绍了信号产生,信号保存,信号处理的主题内容,本文作为信号处理的续篇,主要是介绍一些不那么重要的内容,第一个…

流量模型 -20241118

流量模型 个体的注意力注意力提升销量,转化为直接收益,同时提升品牌价值购物平台的出现使注意力变现变得简单,开拓了注意力的的使用方式,使其分散使用转变为集中使用各个视频,直播平台集中注意力,使得流量…

微信小程序 最新获取用户头像以及用户名

一.在小程序改版为了安全起见 使用用户填写来获取头像以及用户名 二.代码实现 <view class"login_box"><!-- 头像 --><view class"avator_box"><button wx:if"{{ !userInfo.avatarUrl }}" class"avatorbtn" op…

WPF MVVM框架

一、MVVM简介 MVC Model View Control MVP MVVM即Model-View-ViewModel&#xff0c;MVVM模式与MVP&#xff08;Model-View-Presenter&#xff09;模式相似&#xff0c;主要目的是分离视图&#xff08;View&#xff09;和模型&#xff08;Model&#xff09;&#xff0c;具有低…

云原生周刊:Kubernetes v1.32 要来了

开源项目推荐 Woodpecker Woodpecker 是一款轻量级且功能强大的 CI/CD 引擎&#xff0c;以其高度可扩展性和易用性著称。它支持多种版本控制系统与编程语言&#xff0c;能够灵活适配不同开发流程&#xff0c;帮助团队实现高效的持续集成与交付。无论是个人项目还是大型团队&a…