AutoDL部署视觉大模型llama3.2-vision,从视频中寻找特定目标

注: windows11系统。示例为此项目:https://github.com/win4r/VideoFinder-Llama3.2-vision-Ollama

在当今的人工智能领域,深度学习模型的计算需求日益增长,特别是在处理复杂的视觉任务时,强大的算力往往是实现高效应用的关键。如果您的算力有限,租用云服务器无疑是一个高性价比的选择。在众多服务平台中,AutoDL AI算力云https://www.autodl.com/home凭借其卓越的性价比和强大的算力资源,成为了许多开发者和企业的首选。本文将以部署 Ollama 的视觉大模型 llama3.2-vision 为例,详细介绍如何在 AutoDL 平台上进行模型的部署。我们将利用 llama3.2-vision 的图像分析功能,展示如何从视频中寻找特定目标,从而帮助读者快速上手并高效实现目标检测任务。

**为便于测试我已将项目源代码、Linux下的Ollama安装文件已分享:链接:https://pan.baidu.com/s/1Wfv15jS3hBVEnQ4tHamLSA?pwd=r8vs **

1、租用服务

注册、充值、创建实例
在这里插入图片描述

2、配置环境

  • 点击JupyterLab->启动页->进入终端
    在这里插入图片描述

  • 初始化base环境
    终端输入conda init, 关闭此终端,重新开启新的终端,初始化生效。
    | 在这里插入图片描述
    在这里插入图片描述

3、上传项目压缩文件

上传前可以将压缩文件名改一下,我这里改为VideoFinder.zip, 当然你上传后在文件上右键亦可重命名。
在这里插入图片描述

4、解压项目

# 解压
unzip VideoFinder.zip

将解压后的文件夹我也重命名为VideoFinder。

5、创建项目运行环境

# 创建虚拟环境
conda create -n VideoFinder 
# 激活虚拟环境
conda activate VideoFinder
# 进入项目目录
cd VideoFinder
# 安装项目依赖
pip install -r requirements.txt 

6、安装ollama

参考https://github.com/ollama/ollama 依照官网给出的安装命令,安装非常慢!非常慢!非常慢!可以采用后面的方法。

curl -fsSL https://ollama.com/install.sh | sh
ollama run llama3.2-vision

可以将Linux下的安装文件下载到本地后上传到AutoDL 上,再进行安装。

准备工作

  1. 下载并上传文件
    • 从官方网站下载 Ollama 的 Linux 安装文件(ollama-linux-amd64.tgz)。
    • 上传该文件到 autodl-tmp 文件夹(可以通过直接拖拽或使用其他上传方式)。

安装和配置步骤

  1. 解压和安装 Ollama

    # 进入上传文件的目录
    cd ~/autodl-tmp# 解压文件到 /usr 目录
    sudo tar -C /usr -xzf ollama-linux-amd64.tgz# 确保 Ollama 可执行
    sudo chmod +x /usr/bin/ollama
    
  2. 配置环境变量

    • 使用以下命令修改 /etc/profile 文件以设置 Ollama 的相关环境变量:
    # 在文件末尾添加以下两行
    echo 'export OLLAMA_HOST="0.0.0.0:6006"' | sudo tee -a /etc/profile
    echo 'export OLLAMA_MODELS="/root/autodl-tmp/models"' | sudo tee -a /etc/profile# 使以上配置生效
    source /etc/profile# 验证配置是否生效
    echo $OLLAMA_HOST   # 如果输出 "0.0.0.0:6006" 则配置成功。
    
  3. 启动 Ollama 服务

    # 启动 Ollama 服务并让它在后台运行
    nohup ollama serve &# 检查 Ollama 是否正在运行
    ps aux | grep '[o]llama'
    

    在这里插入图片描述

7、运行视觉大模型llama3.2-vision

在启动ollama服务后,运行以下指令

# 启动llama3.2-vision, 如果第一次运行会拉取模型  11B近8个G,90B的有55个G,如果你想跑90B的要租更牛B的服务器了。
ollama run llama3.2-vision

在这里插入图片描述

8、运行程序

1、将欲要分析的视频上传至项目目录下,在终端运行程序, 视频名称和要找的目标在程序入口处修改。

视频地址:https://cdn.pixabay.com/video/2020/02/13/32287-391434445_large.mp4

python app.py

在这里插入图片描述
在这里插入图片描述
2、以网页形式运行

python main.py

程序启动,在本地http://0.0.0.0:8000上运行。

在这里插入图片描述

在本地访问服务器上的服务,使用“2.配置环境”图中的“自定义服务”, 安装隧道工具。
在这里插入图片描述
网页中访问
在这里插入图片描述
在本文中,我们探讨了在 AutoDL 平台上成功部署 Ollama 的视觉大模型 llama3.2-vision 的全过程。在实际部署过程中,我们详细解析了模型的调用方式,介绍了如何有效地进行图像预处理,并探讨了如何解读和解析分析结果。得益于 llama3.2-vision 的强大能力,我们能够实现快速而精准的目标识别和视频内容分析。这种技术的应用不仅为智能监控和安防领域带来了巨大的便利,还为其他相关场景提供了可靠的解决方案。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/59951.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SHELL笔记(条件测试)

基本概念: 条件测试用于在 Shell 脚本中对各种条件进行判断,根据判断结果来决定是否执行特定的命令或代码块。条件测试可以用于比较数值、字符串,检查文件或目录的属性,以及判断命令的执行结果等。 格式: 格式1&…

JDK、MAVEN与IDEA的安装与配置

1.认识JDK、MAVEN与IDEA JDK 提供了编译和运行Java程序的基本环境。Maven 帮助管理项目的构建和依赖。IDEA 提供了一个强大的开发环境,使得编写、调试和运行Java程序更加高效。 2. 安装与环境配置 2.1 官网地址 选择你需要的版本下载: MAVEN下载传送…

微信小程序-prettier 格式化

一.安装prettier插件 二.配置开发者工具的设置 配置如下代码在setting.json里: "editor.formatOnSave": true,"editor.defaultFormatter": "esbenp.prettier-vscode","prettier.documentSelectors": ["**/*.wxml"…

【Mac】未能完成该操作 Unable to locate a Java Runtime

重生之我做完产品经理之后回来学习Data Mining Mac打开weka.jar报错"未能完成该操作 Unable to locate a Java Runtime" 1. 打开终端执行 java -version 指令,原来是没安装 JDK 环境 yyzccnn-mac ~ % java -version The operation couldn’t be comple…

【ArcGIS微课1000例】0127:计算城市之间的距离

本文讲述,在ArcGIS中,计算城市(以地级城市为例)之间的距离,效果如下图所示: 一、数据准备 加载配套实验数据包中的地级市和行政区划矢量数据(订阅专栏后,从私信查收数据),如下图所示: 二、计算距离 1. 计算邻近表 ArcGIS提供了计算点和另外点之间距离的工具:分析…

【WPF】Prism学习(五)

Prism Commands 1.错误处理(Error Handling) Prism 9 为所有的命令(包含AsyncDelegateCommand)提供了更好的错误处理。 避免用try/catch包装每一个方法根据不同遇到的异常类型来提供特定的逻辑处理可以在多个命令之间共享错误处…

【element-tiptap】Tiptap编辑器核心概念----结构篇

core-concepts 前言:这篇文章来介绍一下 Tiptap 编辑器的一些核心概念 (一)结构 1、 Schemas 定义文档组成方式。一个文档就是标题、段落以及其他的节点组成的一棵树。 每一个 ProseMirror 的文档都有一个与之相关联的 schema,…

2024.6使用 UMLS 集成的基于 CNN 的文本索引增强医学图像检索

Enhancing Medical Image Retrieval with UMLS-Integrated CNN-Based Text Indexing 问题 医疗图像检索中,图像与相关文本的一致性问题,如患者有病症但影像可能无明显异常,影响图像检索系统准确性。传统的基于文本的医学图像检索&#xff0…

初识Linux · 信号处理 · 续

目录 前言: 可重入函数 重谈进程等待和优化 前言: 在前文,我们已经介绍了信号产生,信号保存,信号处理的主题内容,本文作为信号处理的续篇,主要是介绍一些不那么重要的内容,第一个…

微信小程序 最新获取用户头像以及用户名

一.在小程序改版为了安全起见 使用用户填写来获取头像以及用户名 二.代码实现 <view class"login_box"><!-- 头像 --><view class"avator_box"><button wx:if"{{ !userInfo.avatarUrl }}" class"avatorbtn" op…

WPF MVVM框架

一、MVVM简介 MVC Model View Control MVP MVVM即Model-View-ViewModel&#xff0c;MVVM模式与MVP&#xff08;Model-View-Presenter&#xff09;模式相似&#xff0c;主要目的是分离视图&#xff08;View&#xff09;和模型&#xff08;Model&#xff09;&#xff0c;具有低…

【算法】【优选算法】前缀和(下)

目录 一、560.和为K的⼦数组1.1 前缀和1.2 暴力枚举 二、974.和可被K整除的⼦数组2.1 前缀和2.2 暴力枚举 三、525.连续数组3.1 前缀和3.2 暴力枚举 四、1314.矩阵区域和4.1 前缀和4.2 暴力枚举 一、560.和为K的⼦数组 题目链接&#xff1a;560.和为K的⼦数组 题目描述&#x…

两大新兴开发语言大比拼:Move PK Rust

了解 Move 和 Rust 的差异有助于开发者根据项目的具体需求选择最合适的语言。选择不恰当的语言可能会导致项目后期出现技术债务。不同语言有其独特的优势。了解 Move 和 Rust 的差异可以帮助开发者拓展技术视野&#xff0c;发现不同语言在不同领域的应用潜力。 咱们直奔主题&a…

Scaling Law的“终结“还是新起点?——开源实践者的深度思考

作者&#xff1a;宋大宝&#xff0c;与大宝同学因那篇《回顾总结展望「融合RL与LLM思想&#xff0c;探寻世界模型以迈向AGI」》结识于今年春天&#xff0c;虽我们当时某些思想观念有些出入&#xff0c;也碰撞出了很多火花与共鸣&#xff0c;并持续地相互启发的走到了现在。他是…

“fc-async”提供了基本的异步处理能力

在开发中,异步处理已经成为提升系统性能和用户体验的常用方式。然而,传统的@Async注解和基础的异步处理工具在面对复杂的任务场景时,存在局限性。这些局限性包括但不限于高并发环境下的稳定性、任务失败后的恢复机制、以及任务的监控和管理。 开源项目“fc-async”提供了基…

Ubuntu 的 ROS 操作系统 turtlebot3 导航仿真

引言 导航仿真是机器人自动化系统中不可或缺的一部分&#xff0c;能够帮助开发者在虚拟环境中测试机器人在复杂场景下的运动与路径规划。 在 Gazebo 仿真环境中&#xff0c;TurtleBot3 配合 ROS 操作系统提供了强大的导航功能。在进行导航仿真时&#xff0c;首先需要准备地图&…

FFmpeg 4.3 音视频-多路H265监控录放C++开发十三.2:avpacket中包含多个 NALU如何解析头部分析

前提&#xff1a; 注意的是&#xff1a;我们这里是从avframe转换成avpacket 后&#xff0c;从avpacket中查看NALU。 在实际开发中&#xff0c;我们有可能是从摄像头中拿到 RGB 或者 PCM&#xff0c;然后将pcm打包成avframe&#xff0c;然后将avframe转换成avpacket&#xff0…

java八股-jvm入门-程序计数器,堆,元空间,虚拟机栈,本地方法栈,类加载器,双亲委派,类加载执行过程

文章目录 PC Register堆虚拟机栈方法区(Metaspace元空间双亲委派机制类加载器 类装载的执行过程 PC Register 程序计数器&#xff08;Program Counter Register&#xff09;是 Java 虚拟机&#xff08;JVM&#xff09;中的一个组件&#xff0c;它在 JVM 的内存模型中扮演着非常…

使用Web Animations API实现复杂的网页动画效果

&#x1f493; 博客主页&#xff1a;瑕疵的CSDN主页 &#x1f4dd; Gitee主页&#xff1a;瑕疵的gitee主页 ⏩ 文章专栏&#xff1a;《热点资讯》 使用Web Animations API实现复杂的网页动画效果 使用Web Animations API实现复杂的网页动画效果 使用Web Animations API实现复杂…

本草纲目数字化:Spring Boot在中药实验管理中的应用

1系统概述 1.1 研究背景 随着计算机技术的发展以及计算机网络的逐渐普及&#xff0c;互联网成为人们查找信息的重要场所&#xff0c;二十一世纪是信息的时代&#xff0c;所以信息的管理显得特别重要。因此&#xff0c;使用计算机来管理中药实验管理系统的相关信息成为必然。开发…