CMT(Cross Modal Transformer)实验环境搭建

项目地址:https://github.com/junjie18/CMT
论文地址:https://arxiv.org/pdf/2301.01283.pdf
环境:Ubuntu 20.04、cuda 11.1、python 3.8
1.创建虚拟环境CMT

conda create -n CMT python=3.8 -y
conda activate CMT

2.安装pytorch的GPU版本,在这里我选择了离线安装,直接下载whl文件,然后pip安装。whl官方的地址是whl传送门,或者另一个传送门。

pip install torch-1.9.0+cu111-cp38-cp38-linux_x86_64.whl  torchvision-0.10.0+cu111-cp38-cp38-linux_x86_64.whl torchaudio-0.9.0-cp38-cp38-linux_x86_64.whl

也可以用官方命令安装(你连了外网的情况下)

pip install torch==1.9.0+cu111 torchvision==0.10.0+cu111 torchaudio==0.9.0 -f https://download.pytorch.org/whl/torch_stable.html

3.安装mmcv-full 1.6.0

pip install mmcv-full==1.6.0 -f https://download.openmmlab.com/mmcv/dist/cu111/torch1.9.0/index.html

4.安装mmdet mmsegmentation

pip install mmdet==2.24.0 mmsegmentation==0.29.1

5.安装mmdet3d,GitHub访问太慢可以手动去下载tags里面v1.0.0rc5 版本的代码,然后直接执行最后一步 pip install -v -e . 的命令就行。过程中如果看到关于CUDA的报错就检查cuda版本对没对。

git clone https://github.com/open-mmlab/mmdetection3d.git
cd mmdetection3d
git checkout v1.0.0rc5 
pip install -v -e . -i https://pypi.tuna.tsinghua.edu.cn/simple

8.安装spconv-cu111==2.1.21

pip install spconv-cu111==2.1.21

9.安装flash-attn == 0.2.2,(加速attention,具体还没读过论文),我这里源码编译也挺慢的(好像半小时,具体多久没太注意),用pip下载估计会更慢,所以还是推荐源码编译。

git clone -b 'v0.2.2' https://github.com/Dao-AILab/flash-attention.git --single-branch flash-attn
cd flash-attn
python setup.py install

到这里GitHub仓库给出的requirements就装完了,下一步是准备数据集进行训练。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/776631.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

U盘惊变:文件夹竟成应用程序?数据恢复全攻略!

一、U盘突发异状:文件夹秒变应用程序 在数字化时代,U盘作为便携存储设备,在日常生活和工作中扮演着重要角色。然而,近期不少用户反映,他们的U盘突然出现了诡异的现象:原本整齐划一的文件夹图标&#xff0c…

STM32G473之flash存储结构汇总

STM32G4系列单片机,为32位的微控制器,理论上其内部寄存器地址最多支持4GB的命名及查找(2的32次方,地址命名为0x00000000至0xFFFFFFFF)。STM32官方对4GB的地址存储进行编号时,又分割成了8个block区域&#x…

vulnhub靶场之driftingblues-3

一.环境搭建 1.靶场描述 get flags difficulty: easy about vm: tested and exported from virtualbox. dhcp and nested vtx/amdv enabled. you can contact me by email for troubleshooting or questions. This works better with VirtualBox rather than VMware 2.靶场…

Markdown 编辑器使用

CSDN 在博客开头加上 [TOC](你的目录标题)就可以根据博客内容自动生成如下所示的目录: 你的目录标题 Markdown 编辑器功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表无序列表…

代码设计原则

目录 软件设计的本质设计模式的六大原则设计模式的三种模式框架设计 软件设计的本质 开闭原则,核心是高内聚,低耦合 设计模式的六大原则 单一职责原则:就一个类而言,应该仅有一个引起它变化的原因开闭原则:对扩展开…

如何压缩视频到最小?教会你压缩原理~

在网上上传视频时,经常会遇到因为视频体积过大上传失败等情况发生,怎么降低视频体积呢?科普一个小知识:视频体积和视频的时长、编码格式、分辨率和比特率(又称码率)有关。视频文件大小计算公式:…

如何优化财务管理?中小型外贸企业实用指南

在当今全球化的商业环境中,越来越多的中小企业涉足外贸领域,以寻求更广阔的市场和发展空间。在这一过程中,财务管理的重要性尤为凸显,需关注外汇风险、税务合规性、现金流等多个方面的问题。 一、中小企业外贸财务管理难题 币种核…

Python入门练习 - 学生管理系统

Python 实现读书管理系统 """ 实现一个命令行版的读书管理系统 """ import os.path import sys# 使用这个全局变量,来管理所有的学生信息 # 这个列表的每个元素都是一个‘字典’,每 个 字典就分别表示了一个同学students …

okcc呼叫中心系统如何配置呼入?

在OKCC呼叫中心系统中配置呼入通常包括以下步骤: 登录管理界面:使用管理员账户登录OKCC系统。 创建呼入号码:在系统内添加或选择一个用于呼入的电话号码,并将其与呼入队列关联。 设置呼入队列:配置呼入队列的基本参数…

利用R语言和curl库实现网页爬虫的技术要点解析

R语言简介 R语言是一种自由、跨平台的编程语言和软件环境,专门用于统计计算和数据可视化。它具有丰富的数据处理、统计分析和图形展示功能,被广泛应用于数据科学、机器学习、统计建模等领域。 R语言技术优势 丰富的数据处理功能: R语言拥有…

【C++】静态成员

静态成员在 C 类中是一个重要的概念,它包括静态成员变量和静态成员函数。 一、静态成员变量 1.理论 定义:由关键字static修饰类体中成员,称为类静态成员(static class member)。特点:静态成员变量是类的所…

Python实现猜数字游戏:一次编程旅程

博主猫头虎的技术世界 🌟 欢迎来到猫头虎的博客 — 探索技术的无限可能! 专栏链接: 🔗 精选专栏: 《面试题大全》 — 面试准备的宝典!《IDEA开发秘籍》 — 提升你的IDEA技能!《100天精通鸿蒙》 …

Vue3+Element Plus+TS开发企业管理后台(一)

系列文章,讲述一个企业管理后台的前后端设计,持续集成常见的页面功能和服务端设计思路。 效果展示 支持多种布局、主题配色随意切换 侧边菜单背景设置 主题色调切换 移动端完美适配 菜单侧边收起,适合移动端小空间场景。 功能开发计划 #merm…

外包干了4年,技术退步明显。。。。

说一下自己的情况,本科生,19年通过校招进入上海某软件公司,干了接近4年的功能测试,今年年初,感觉自己不能够在这样下去了,长时间呆在一个舒适的环境会让一个人堕落!而我已经在一个企业干了四年的功能测试&a…

【机器学习】代价函数

🎈个人主页:豌豆射手^ 🎉欢迎 👍点赞✍评论⭐收藏 🤗收录专栏:机器学习 🤝希望本文对您有所裨益,如有不足之处,欢迎在评论区提出指正,让我们共同学习、交流进…

【LVGL-界面切换】

LVGL-界面切换 ■ LVGL-界面切换■ 方法一: 删除法■ 方法二: 隐蔽法 ■ LVGL-界面切换 ■ 方法一: 删除法 当用户删除一个父对象时,它所有的子对象也会被一并删除。 可以调用 lv_obj_del 函数,直接删除基础对象&…

PD DRP+OTG 极致简单玩转边充电边传输数据

在USB2.0端口的Data Role里,USB根据数据传输的方向定义了Host/Device/OTG三种角色,其中OTG即可作为Host,也可作为Device,在Type-C中,也有类似的定义,只是名字有了些许修改。 1. DFP (Downstream Facing Po…

MySQL基础语法之判断语句的学习如何将检索数据的返回值赋值给变量,以及如何查看变量

3月25日 条件函数 条件函数 select if(1<0,正确,错误); -- 1<0是条件&#xff0c;当条件正确后&#xff0c;则放回第一个值&#xff0c;正确&#xff0c;如果错误将返回第二个值错误 select ifnull(null,hello world) -- 用于检测数据是否为空值&#xff0c;如果为空值…

__attribute__((optimize(“O0“)))阻止了编译器进行可能的性能改进

在GCC&#xff08;GNU Compiler Collection&#xff09;中&#xff0c;__attribute__((optimize("O0")))是一个函数属性&#xff0c;用于指示编译器在编译该函数时应用特定的优化级别。在这个例子中&#xff0c;O0指示编译器不进行任何优化&#xff0c;并生成最直接的…