分割——半自动打标签工具ISAT详细安装及使用教程

在这里插入图片描述

💪 专业从事且热爱图像处理,图像处理专栏更新如下👇:
📝《图像去噪》
📝《超分辨率重建》
📝《语义分割》
📝《风格迁移》
📝《目标检测》
📝《暗光增强》
📝《模型优化》
📝《模型实战部署》


在这里插入图片描述

ISAT(Image Segmentation Annotation Tool)结合了Meta推出的Segment Anything Model(SAM),是一款功能强大且灵活的图像语义分割和打标签工具。ISAT结合SAM是一款非常优秀的图像语义分割和打标签工具,适合需要高效、准确标注的大规模项目。其自动化能力和用户友好界面使其在提高工作效率和数据质量方面表现出色。对于图像算法工程师和数据标注团队来说,这是一个值得推荐的工具组合。

目录

  • 一、ISAT工具
    • 1.1 ISAT功能特点
      • 1.1.1 多样化的标注工具
      • 1.1.2 多格式支持
      • 1.1.3 团队协作
      • 1.1.4 用户友好界面
    • 1.2 SAM功能特点
      • 1.2.1 强大的分割能力
      • 1.2.2 快速响应和自动化
    • 1.3 ISAT 与 SAM 结合的优势
      • 1.3.1 高效性
      • 1.3.2 高精度
      • 1.3.3 灵活性
  • 二、ISAT安装
    • 2.1 源码运行
      • 2.1.1 源码包准备
      • 2.1.2 环境准备
      • 2.1.3 运行源码
    • 2.2 pip安装ISAT包
    • 2.3 可执行文件.exe运行
      • 2.3.1 exe文件下载
      • 2.3.2 运行exe
      • 2.3.3 问题
  • 三、下载Segment anything预训练模型
    • 3.1 网址下载
    • 3.2 界面下载
  • 四、ISAT标注工具使用方法
    • 4.1 常用按钮
      • 4.1.1 中英文切换
      • 4.1.2 常用快捷键
      • 4.1.3 手动添加类
      • 4.1.4 导入提前准备好的类名
      • 4.1.5 删除类
      • 4.1.6 开启自动保存
      • 4.1.7 载入图像文件
      • 4.1.8 标签保存位置
      • 4.1.9 模型选择
      • 4.1.10 轮廓模式选择
    • 4.2 打标签
      • 4.2.1 开始标记
      • 4.2.2 修改类名
      • 4.2.3 删除标记
    • 4.3 格式转换
      • 4.3.1 转VOC格式
      • 4.3.2 转实例分割
    • 4.4 标签结果图
  • 五、总结

一、ISAT工具

1.1 ISAT功能特点

1.1.1 多样化的标注工具

支持矩形、圆形、多边形和自由形式的标注。

提供了自动化标注功能,通过机器学习算法辅助标注过程,提高效率。

1.1.2 多格式支持

支持多种图像格式和标注格式,方便数据导入和导出。

可以与其他机器学习和深度学习框架无缝对接。

1.1.3 团队协作

提供了项目管理和团队协作功能,方便多用户同时进行标注和审核。

支持版本控制和变更记录,确保标注数据的可追溯性。

1.1.4 用户友好界面

界面简洁直观,操作简单,适合不同水平的用户。

提供了丰富的快捷键和自定义功能,提高工作效率。

1.2 SAM功能特点

1.2.1 强大的分割能力

SAM可以处理任意类型的图像和视频,并进行高精度的分割。

通过少量的标注数据,SAM可以快速适应并生成准确的分割结果。

1.2.2 快速响应和自动化

利用深度学习技术,SAM可以在短时间内生成分割结果,减少人工标注的工作量。

支持交互式标注,用户可以通过简单的点击和调整,快速生成所需的分割结果。

1.3 ISAT 与 SAM 结合的优势

1.3.1 高效性

利用SAM的自动化分割能力,ISAT可以大幅提高标注效率,减少人工干预的时间。

对于大量数据集,尤其是复杂的图像数据集,自动化分割可以显著提高生产力。

1.3.2 高精度

SAM的高精度分割能力确保了标注结果的准确性,从而提升了数据质量。

结合ISAT的多样化标注工具,可以对自动化分割结果进行细化和调整,确保精度。

1.3.3 灵活性

ISAT与SAM的结合使用户可以根据具体需求选择自动化或手动标注,灵活应对不同任务。

支持多种格式和框架,方便集成到现有的工作流程中。

二、ISAT安装

ISAT的安装目前有三种方法,源码安装需要配置运行环境,相对麻烦一些,但也是我最推荐的,因为官网最先更新的内容都优先是源码包;还可以通过pip安装发布包,版本略低于源码包;最后一种方法是在windows电脑上直接运行可执行文件.exe,这种方法的版本很古老了,作者长时间没有更新。下面依次展开讲解三种安装方法。

2.1 源码运行

2.1.1 源码包准备

本教程配套的源码包获取方法文章末扫码到公众号「视觉研坊」中回复关键字:分割工具ISAT。获取下载链接。我提供的源码包中有少了图片和标签,有几个预训练模型在ISAT\checkpoints路径下,可直接运行代码使用。

官网源码链接:ISAT

下载源码包解压后的样子如下:

在这里插入图片描述

2.1.2 环境准备

在这里插入图片描述
上面相关依赖包使用下面命令进行安装:

pip install -r requirements.txt -i https://pypi.mirrors.ustc.edu.cn/simple/

我自己运行的环境见下,仅供参考,其它版本也行:

在这里插入图片描述

2.1.3 运行源码

在终端输入下面命令:

python main.py

在这里插入图片描述

运行后打开的界面见下:

在这里插入图片描述

使用方法见后面4.1,4.2

2.2 pip安装ISAT包

通过pip方法安装ISAT使用下面命令:

pip install isat-sam -i https://pypi.mirrors.ustc.edu.cn/simple/

通过上面命令安装好在终端使用下面命令启动ISAT:

isat-sam

启动后的样子见下:

在这里插入图片描述
使用方法见后面4.1,4.2

2.3 可执行文件.exe运行

2.3.1 exe文件下载

.exe文件较大,需要获取的文章末扫码到公众号「视觉研坊」中回复关键字:分割ISAT_exe。获取下载链接。

下面后解压后缀为001的压缩包,如下:

在这里插入图片描述

2.3.2 运行exe

运行方法见下:

在这里插入图片描述

2.3.3 问题

我下载官网提供的exe文件后运行没有成功,没有反应,后查相关资料,看到官方作者给出的解答见下:

在这里插入图片描述

因为exe版本较老,后续我没有再深入研究exe问题,后期如果有学者解决的exe问题,欢迎留言讨论。

三、下载Segment anything预训练模型

预训练模型必须提前下载好,不然等会运行后用不了segment anything功能,只能手动逐个像素点标记。
现在支持 SAM, Sam-HQ, MobileSAM, 及 EdgeSAM 等模型。

预训练模型有两种下载方法,见下:

3.1 网址下载

下面是目前支持的模型,直接点击表格中网络链接下载,下载速度慢的复制对应下载链接到迅雷中,速度较快。

模型预训练模型显存文件大小
SAMsam_vit_h_4b8939.pth6462M2.6G
sam_vit_l_0b3195.pth5016M1.3G
sam_vit_b_01ec64.pth3302M375M
sam-hqsam_hq_vit_h.pth6464M2.6G
sam_hq_vit_l.pth5016M1.3G
sam_hq_vit_b.pth3304M379M
sam_hq_vit_tiny.pth598M43M
mobile-sammobile_sam.pt534M40M
edge-samedge_sam.pth360M38.8M
edge_sam_3x.pth360M38.8M
sam-medsam-med2d_b.pth1500M2.4G

上面链接的下载实操见下,打开网址后直接下载:

在这里插入图片描述
在这里插入图片描述

将下载好的模型权重文件存放到ISAT/checkpoints路径中,如下:

在这里插入图片描述

3.2 界面下载

界面中的下载是直接链接国内网址,下载速度较快,直接点击模型后面按钮即可下载。

在这里插入图片描述

在这里插入图片描述

如果想删除预训练模型,点击delete

在这里插入图片描述

四、ISAT标注工具使用方法

4.1 常用按钮

4.1.1 中英文切换

在这里插入图片描述

4.1.2 常用快捷键

在这里插入图片描述
在这里插入图片描述

4.1.3 手动添加类

添加类可自定义类名和颜色
在这里插入图片描述

4.1.4 导入提前准备好的类名

还可以导入提前准备好的类名,类名信息存放在.yaml文件中,yaml文件中存放内容及格式见下:

在这里插入图片描述

下面是导入.yaml文件的方法:

在这里插入图片描述

4.1.5 删除类

在这里插入图片描述

4.1.6 开启自动保存

在这里插入图片描述

4.1.7 载入图像文件

在这里插入图片描述

4.1.8 标签保存位置

标签保存位置自定义。

在这里插入图片描述

4.1.9 模型选择

模型有很多,不同模型的标出效果不一样且需要的显存大小也不一样,学者根据自己电脑选择合适的模型标注。

在这里插入图片描述

4.1.10 轮廓模式选择

在这里插入图片描述

4.2 打标签

载入图片后的样子见下:

在这里插入图片描述

4.2.1 开始标记

我常用的按键有:

键盘上按下Q键调用模型准备标记,鼠标左键在目标物体上点击,自动框选,可多次点击鼠标左键选择想要区域,有不想要的区域时按鼠标右键。当一张图像上有多个物体时,标记好一个物体按下键盘E键,再从新开始标记其它物体,一幅图标记好后按D键下一张,A键上一张,撤回按Z键。

更多的按键查看上面4.1.2。

在这里插入图片描述

标记好后的样子见下:

在这里插入图片描述

4.2.2 修改类名

如果类名标记错了,可以在编辑里面修改,见下:

在这里插入图片描述

在这里插入图片描述

4.2.3 删除标记

如果不想要已经标记好的标签,直接删除即可。

在这里插入图片描述

4.3 格式转换

支持转换COCO,YOLO,LABELME,VOC,VOC目标检测格式标签,我以转换VOC格式为例进行讲解。

在这里插入图片描述

4.3.1 转VOC格式

在这里插入图片描述

转换成功样子见下:

在这里插入图片描述

4.3.2 转实例分割

在这里插入图片描述

4.4 标签结果图

下面是转换的标签图:

在这里插入图片描述

五、总结

以上就是f半自动打标签工具ISAT详细安装及使用教程,预训练模型较多,部分模型很省事,能快速框选目标区域,学者多尝试。

关于语义分割数据标注之前出过一篇博文关于Labelme,感兴趣学者看一下:使用Labelme打标签

感谢您阅读到最后!😊总结不易,多多支持呀🌹 点赞👍收藏⭐评论✍️,您的三连是我持续更新的动力💖

关注公众号「视觉研坊」,获取干货教程、实战案例、技术解答、行业资讯!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/45553.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C语言中的数组:掌握数据的有序集合【一维数组,二维数组,字符串数组,直方图打印,计算全排列,字符数组常用函数】

目录 C语言中的数组:掌握数据的有序集合【一维数组,二维数组,字符串数组】一维数组一维数组的创建数组的七种初始化完全初始化:部分初始化:字符数组的初始化:自动初始化为0:使用memset函数初始化…

[C++]初识C++(命名空间,命名空间使用,函数重载,缺省参数等)

💖💖💖欢迎来到我的博客,我是anmory💖💖💖 又和大家见面了 欢迎来到C探索系列 作为一个程序员你不能不掌握的知识 先来自我推荐一波 个人网站欢迎访问以及捐款 推荐阅读 如何低成本搭建个人网站…

c++之类和对象上

目录 1. 类的定义 2. 访问限定符 3. 类域 4. 实例化 5. 对象的大小 6. 为什么要内存对齐 7. this指针 1. 类的定义 • class为定义类的关键字,Stack为类的名字,{}中为类的主体,注意类定义结束时后⾯分号不能省 略。类体中内容称为类的…

(篇一)走进FreeRtos—认识FreeRtos

【温故知新篇】 【在现在的工作中一直在使用FreeRtos,但是对它的了解还是不够深入,现在由浅入深,分模块学习和记录,最后将自己基于FreeRtos开发项目实践】 首先我们将这个系统当作一座庄园,开始第一步走进庄园&#…

【备战秋招】——算法题目训练和总结day4

【备战秋招】——算法题目训练和总结day4😎 前言🙌Fibonacci数列我的题解思路分享代码分享 单词搜索我的题解思路分享代码分享 杨辉三角我的题解思路分享代码分享 总结撒花💞 😎博客昵称:博客小梦 😊最喜欢…

ubuntu重装系统后,安装cuda,cudnn

一、 先安装驱动,如果驱动安装不成功,会影响桌面,再重装系统还来得及,尝试了很多方法,还是用系统安装最靠谱: 首先进入Ubuntu搜索栏目,找到软件更新器的一个图标,点开之后是这样的。…

开发个人Ollama-Chat--5 模型管理 (二)

开发个人Ollama-Chat–5 模型管理 (二) ChatGPT 这是该项目的最终效果,使用ollama的open-webui进行人与机器的对话功能,对话的后端服务则完全对接自己开发的Go项目。 如何实现呢?则通过这篇文章,一一给大家剖析后端的原理及功能…

mmaction2的GPU环境配置记录RTX3090,cuda12.2,ubuntu22.04版本

1、配置镜像源 最重要的一个步骤,先看下镜像源地址,如果镜像源有问题,所有的包安装都会有问题 镜像源地址获取地址:选择对应的ubuntu版本号,将里面的镜像源地址复制出来,更新到服务器 ubuntu | 镜像站使用帮助 | 清华大学开源软件镜像站 | Tsinghua Open Source Mirro…

牛客小白月赛98

骰子魔术 jackle 会拿出一枚骰子,骰子的表面分别写上了从 1∽5001\backsim 5001∽500 的数字,朋友会随便说一个 1∽5001\backsim 5001∽500 之间的点数,jackle 都能保证百分之百的掷出这个点数。 当然 jackle 有备而来,他准备了 …

LeetCode分发糖果(贪心思路分析)

题目描述 贪心思路 思路及解法 我们可以将「相邻的孩子中&#xff0c;评分高的孩子必须获得更多的糖果」这句话拆分为两个规则&#xff0c;分别处理。 左规则&#xff1a;当 ratings[i−1]<ratings[i] 时&#xff0c;i 号学生的糖果数量将比 i−1 号孩子的糖果数量多。 …

实现win10多用户同时远程连接登陆(详细实验步骤版)

目录 目的环境实验步骤&#xff08;在需要被远程的win10上&#xff09;1. 开启远程桌面服务2. 编辑组策略实现多用户登录3. 安装RDPWrap实现多用户同时登录 测试 目的 默认情况下&#xff0c;win10 专业版只支持本地或远程只能同时存在一个连接。windows server支持多连接。 比…

【unity笔记】十、Obi绳索插件使用

一. 创建绳索 1.1 新建蓝图 在Assets中右键选择创建->Obi->Rope Blueprint&#xff0c;其属性如图所示 1.2 Obi solver 在场景下创建一个obi solver对象&#xff0c;在该对象下再创建Obi Rope对象。 随后将蓝图拖到Obi Rope对象下的Obi Rope组件&#xff0c;即可看到…

MES系统与其他系统的集成:提升制造业智能化的关键路径

在当今高度竞争的制造业环境中&#xff0c;企业对于生产效率、质量控制、资源优化以及快速响应市场变化的需求日益迫切。制造执行系统&#xff08;MES&#xff09;作为连接企业计划层与车间控制层的重要桥梁&#xff0c;其在提升生产透明度和优化生产流程方面发挥着不可替代的作…

【SQL】如何用SQL写透视表

【背景】 报表中有一大需求是透视表,目前有很多分析类应用也搭载了此类功能,那么我们能不能直接用SQL做透视表呢? 【分析】 BI类软件将透视表功能做在了前端,但是数据本身还是存储在数据库中,所以必然有方法可以用SQL直接实现透视表。 【心法】 透视表是任意选取一个…

2024最新6月泛二级域名秒收泛目录(二级域名泛站群)

5月免费版本无后台 无更新功能不自动引蜘蛛 2024年5月最新泛程序&#xff0c;秒收秒排&#xff01;&#xff08;泛型程序&#xff09; - 虚良SEO博客 新曾功能&#xff1a; 后台管理 蜘蛛统计 域名添加 一键强引蜘蛛 蜘蛛统计 识别真假蜘蛛 全自动引蜘蛛 域名要求 …

Vue3-15 表单的绑定

在Vue 3中&#xff0c;表单输入绑定是实现动态数据双向绑定的重要部分&#xff0c;它让开发者可以轻松地管理和响应用户输入。本文将详细介绍如何在Vue 3中利用v-model指令以及一些特定修饰符来处理不同类型的表单输入。 响应式表单数据 首先&#xff0c;我们定义了一个响应式…

Linux /etc/profile 详解

概述 Linux是一个多用户的操作系统。每个用户登录系统后&#xff0c;都会有一个专用的运行环境。通常每个用户默认的环境都是相同的&#xff0c;这个默认环境实际上就是一组环境变量的定义。用户可以对自己的运行环境进行定制&#xff0c;其方法就是修改相应的系统环境变量&…

如何检测代理IP是否有效?检查因素与方法全解

代理IP是一种网络代理技术&#xff0c;它是通过中间服务器来转发网络请求的IP地址。当我们使用代理IP时&#xff0c;我们的真实IP地址会被隐藏起来&#xff0c;而代理服务器的IP地址会被用作我们的身份标识。使用代理IP的步骤如下&#xff1a; 1.选择合适的代理服务器 考虑服务…

【JavaEE】网络原理——传输层协议

&#x1f921;&#x1f921;&#x1f921;个人主页&#x1f921;&#x1f921;&#x1f921; &#x1f921;&#x1f921;&#x1f921;JavaEE专栏&#x1f921;&#x1f921;&#x1f921; &#x1f921;&#x1f921;&#x1f921;上一篇文章&#xff1a;【JavaEE】网络编程—…

CDGA|数据治理:标准化处理与确保数据可溯源性

在当今信息爆炸的时代&#xff0c;数据已成为企业决策、科学研究和政府管理的核心要素。然而&#xff0c;随着数据量的不断增加和来源的多样化&#xff0c;数据治理成为了一个亟待解决的问题。特别是在处理复杂数据时&#xff0c;标准化处理和确保数据的可溯源性显得尤为重要。…