【深度学习:标记数据】为医生标记数据缓解疼痛

在这里插入图片描述

【深度学习:标记数据】为医生标记数据缓解疼痛

    • 问题
    • 实验
    • 结果
    • 结论

我开始在物理学方面进行学术研究,但在第一年就退学了(抱歉,休学了)我的博士学位,并在定量金融领域做了很长一段时间。因此,在我第一篇经过同行评审的已发表论文的所有可能主题中:投资组合优化、暗物质特征、密度泛函理论,我最终选择了……在结肠镜检查视频上绘制矩形的主题。我没想到事情会发展到这个地步,但我们到了。但实际上,在结肠镜检查视频上画方框是我研究过的最有趣的问题之一。

这篇文章的目的是回顾我们(包括我在 Encord 的联合创始人 Ulrik)最近发表的关于这个主题的论文:“新型人工智能驱动的软件显着缩短了计算机视觉项目中注释所需的时间”。这篇论文发表在《内窥镜国际公开赛》杂志上,可以在这里找到。这是在伦敦国王学院的合作者 Bu Hayee 博士和 Mehul Patel 博士的灵巧和耐心协助下共同编写的。

为了说服您在已经看到“注释”和“结肠镜检查”这两个词后继续阅读,我们可以首先声明胃肠病学领域对人类福祉非常重要。这既包括癌症发病率,也包括日常慢性疾病。来自 cancer.org:

在美国,结直肠癌是男性和女性癌症相关死亡的第三大原因,也是男性和女性癌症死亡的第二大常见原因。预计 2021 年将造成约 52,980 人死亡。

更普遍的是炎症性肠病(IBD)。2015 年,美国约有 300 万人被诊断出患有 IBD,这种疾病与呼吸系统、肝脏和心血管疾病等的可能性更高有关。

但胃肠病学对人工智能社区也非常重要。它是医疗人工智能商业采用的早期先锋之一。宾得(Pentax)、富士胶片(FujiFilm)和美敦力(Medtronic)等公司都是医疗设备公司的一部分,这些公司正在进入该领域,以建立自己的人工智能范围界定技术。这些模型可以对息肉进行实时检测,并在范围界定过程中充当胃肠病学家的助手,有时甚至可以捕捉到医生的盲点。

在这里插入图片描述

息肉检测在行动

这一领域的进展将成为持怀疑态度的医学界的灯塔,即人工智能不仅仅是数学家和计算机科学家的游乐场,而是一种直接影响人们生活的实用工具。

但是,有一个问题。

问题

与机器学习模型不同,机器学习模型向毫无戒心的注意力受害者提供狂欢的Netflix节目(错误的赌注是你最终观看了一集艾米丽在巴黎),错误或错误诊断溃疡性结肠炎对人们的健康有重大影响。因此,开发的模型需要像机器学习世界中那样万无一失。这需要大量的数据。

从经验上讲,模型往往需要不断增加的数据量来对抗性能停滞。获得 0% 到 75% 的模型准确率可能需要与 75% 到 85% 相同的数据量,这需要与 85% 到 90% 相同的数据量,依此类推。为了获得超过99%的准确率,使用我们目前拥有的方法和模型,您需要将大量数据投入到这个问题中。

问题在于,要使模型从这些数据进行训练,需要对其进行注释。这些注释只能由医生自己有效地完成,他们拥有正确识别和分类患者视频和图像的专业知识。这是对医生时间的巨大消耗。

一个高精度的内窥镜检查模型可能需要一百万个注释帧。假设保守估计每帧 20 秒,包括一到两名其他医生的审核,这相当于 230 天的医生时间,大约相当于一年的工作日。医生在这一年的工作时间里,最好用于治疗和护理病人(以及练习书写)。

这种机会成本正是创办 Encord 的最初动机。我们希望为任何需要进行数据注释的人节省宝贵的时间,医生就是最典型的例子。在建立了我们的平台后,我们想看看它是否真的有效。于是,我们做了一个实验。

实验

我们决定对我们的平台与使用最广泛的开源视频注释工具(CVAT)进行一次简单的 A/B 测试。开放的视频注释工具很难找到,但 CVAT 是 GitHub 上用户最活跃的平台之一,也是 GitHub 上的明星产品。

我们从开源胃肠道数据集(Hyper-Kvasir 数据集)中设置了一个数据样本来执行实验。从论文中:

利用 Hyper-Kvasir 数据集[7] 中的息肉视频子样本,要求五名独立标注者在数据集中的视频中识别出的息肉周围画出边界框。测试集包含 25,744 个帧。

实验装置为

  • 每位注释员将有两个小时的时间学习 Encord,两个小时的时间学习 CVAT
  • 注释者将在两个平台上以相同的顺序运行数据,并使用每个平台的任何可用功能
  • 注释者只能提交他们在流程结束时审查过并满意的图框
  • 两个小时结束后,我们将简单地计算每个平台上每个注释者认可的帧数

Encord 平台(论文中称为 CdV)的强大之处在于其快速训练和使用注释特定模型的能力,但在实验中,没有为注释者提供任何标签或模型种子。他们只能使用在实验时限内用自己标注的数据自行训练的模型。当然,通常情况下不会这样。如果你要标注成百上千帧的数据,你就已经有了模型和情报可以利用,但我们希望尽可能地增加不利因素,让标注者从冷启动开始。

结果

结果不相上下。摘自论文:

在 120 分钟的项目中,CVAT 的平均(±SD)标记帧数为 2241±810(不到总数的 10%),而 CdV 的平均(±SD)标记帧数为 10674±5388(p=0.01)。平均标记速度分别为 18.7/min 和 121/min(增加了 6.4 倍;p=0.04),而 CdV 的标记动态也更快(p<0.0005;图 2)。使用 CdV 时,5 位标注者中有 3 位完成了项目数据集的标注(平均耗时为 99.1±15.2 分钟),而使用 CVAT 时,所有标注者均未完成标注。

在使用 CVAT 时,大多数标注者都无法完成第三段视频的标注。与 CVAT 相比,Encord 能为每位注释者生成更多的标签。最令人鼓舞的是,注释者中最资深的博士,也就是使用任何注释软件经验最少的人,使用 Encord 的效率提高了 16 倍。这正是我们设计该平台的目标用户,因此看到这些结果非常令人鼓舞。这是实现我们假设的一个重大胜利。

简而言之,Encord 效率较高的原因只是大部分贴标工作实现了自动化:

标签制作者可以利用每个平台提供的任何功能采用自己的标签制作策略。在 CVAT 平台上,这包括绘制边界框的工具,以及使用边界框坐标线性插值法在帧间传播边界框的工具。在 CdV 平台上,标注者可以使用手工标注注释工具和 CdV 的嵌入式智能功能。这种嵌入式智能功能包括物体跟踪算法以及训练和运行卷积神经网络(CNN)来标注数据的功能。

即使在完全冷启动的情况下,Encord 的 "嵌入式智能 "也能自动完成实验过程中超过 96% 的标签制作:

使用 CdV 时,只有 3.44%±2.71% 的标签是由注释者手工绘制的。其余的都是通过模型或跟踪算法生成的。因此,在使用 CdV 的情况下,用较少的初始人工输入就能生成更多的标签(图 3)。自动生成的标签仍然需要人工审核和/或调整。对于模型生成的标签,标注者平均需要花费 36.8±12.8 分钟的时间逐帧查看并进行修正。

在这里插入图片描述

在我看来,最有趣的观察是在Encord平台下标签率的加速。对于CVAT,标签率在实验期间保持大致恒定。然而,使用Encord,在平台上每隔20分钟,注释速度中位数提高55%(!)。每个标签对下一个标签的影响微乎其微。希望随着更多的标签和更大的项目,这种效果将导致创建训练数据集的时间(和财务)成本急剧下降。

结论

虽然结果不错,但我们认识到还有很多工作要做。息肉检测是一项相对简单的标注任务,因此虽然对医生来说是一项昂贵的税收,但我们意识到还有更昂贵的税收需要我们去解决。我们的软件旨在处理任意复杂的标记结构,但围绕这种复杂性设计自动化是一个棘手但有趣的问题,我们正在努力解决。

尽管如此,我们已经证明,我们可以为医生节省大量的数据注释时间。给他们提供智能但易用的工具,他们就能节省自己的时间。有了这些,医疗人工智能下一次迭代的瓶颈就不需要是缺乏训练数据了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/701960.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

宝塔面板安装了mysql5.7和phpMyadmin,但是访问phpMyadmin时提示502 Bad Gateway

操作流程截图如下&#xff1a; 原因是没有选择php版本 选择php版本 下一页找到phpMyAdmin&#xff0c;选择设置 目前只有纯净态&#xff0c;说明没有php环境&#xff0c;前去安装php环境 点击安装&#xff0c;选择版本&#xff0c;这里选择的是7.4版本&#xff0c;编译安…

创建者模式(Builder Pattern):构造复杂对象的通用解决方案

文章目录 **一、技术背景与应用场景****为何使用创建者模式&#xff1f;****典型应用场景包括但不限于&#xff1a;** **二、创建者模式定义与结构****三、使用步骤举例**四、优缺点分析总结 一、技术背景与应用场景 创建者模式是一种对象创建型设计模式&#xff0c;它通过将复…

Apache Doris 发展历程、技术特性及云原生时代的未来规划

文章目录 每日一句正能量前言作者介绍Apache Doris 特性极简架构高效自运维高并发场景支持MPP 执行引擎明细与聚合模型的统一便捷数据接入Apache Doris 极速 1.0 时代极速列式内存布局向量化的计算框架Cache 亲和度虚函数调用SIMD 指令集 稳定多源基于云原生向量数据库Milvus 的…

基于ZYNQ的PCIE高速数据采集卡的设计(三)硬件设计

采集卡硬件设计 3.1 引言 采集卡的硬件设计是实现采集功能的基础&#xff0c;良好的硬件设计可以使采集功能更容 易实现&#xff0c;方便软件开发。本章基于第二章的硬件设计方案来详细介绍采集卡硬件设计。 包括载卡和子卡的芯片的选型、配置和具体电路的设计。载卡和子卡…

蓝桥杯《修剪灌木》

题目描述 爱丽丝要完成一项修剪灌木的工作。有 N 棵灌木整齐的从左到右排成一排。爱丽丝在每天傍晚会修剪一棵灌木&#xff0c;让灌木的高度变为 0 厘米。爱丽丝修剪灌木的顺序是从最左侧的灌木开始&#xff0c;每天向右修剪一棵灌木。当修剪了最右侧的灌木后&#xff0c;她会…

【程序员必备技能】Git入门

目录 &#x1f308;前言&#x1f308; &#x1f4c1; Git的概念 &#x1f4c2; 版本控制 &#x1f4c2; 集中式 和 分布式 ​ &#x1f4c1; 创建和配置本地仓库 &#x1f4c1; 理解工作区&#xff0c;暂存区&#xff0c;版本库 &#x1f4c1; Git的基本操作 &#x1f4c2;…

JMeter实现接口自动化测试

一、JMETER的环境搭建 参考&#xff1a;https://www.cnblogs.com/qmfsun/p/4902534.html 二、JMETER的汉化 临时汉化方法&#xff1a;打开jmeter&#xff0c;options-->choose language-->选择语言 可以根据自己的需要选择简体中文或者繁体中文&#xff0c;如图&#xf…

字符串(算法竞赛)--字典树Trie与最大异或对

1、B站视频链接&#xff1a;F06 字典树(Trie)_哔哩哔哩_bilibili 题目链接&#xff1a;【模板】字典树 - 洛谷 #include <bits/stdc.h> using namespace std; const int N100010; int n; char s[N]; int ch[N][26];//ch[0][2]1表示0号节点通过c边走到了节点1 int cnt[…

【电子通识】认识FMEA(失效模式和影响分析)

FMEA是Failure Mode and Effect Analysis的英文缩写&#xff0c;中文名称为失效模式和影响分析。主要应用于航空航天、食品、汽车和核电等行业。 FMEA讨论的是事先策划以及执行措施&#xff0c;预防问题的发生或控制问题的发展&#xff0c;降低设计和过程的风险。由于问题还没…

基于java Springboot实现教务管理系统

基于java Springboot实现教务管理系统《视频版-建议收藏》 博主介绍&#xff1a;5年java开发经验&#xff0c;专注Java开发、定制、远程、文档编写指导等,csdn特邀作者、专注于Java技术领域 作者主页 央顺技术团队 Java毕设项目精品实战案例《1000套》 欢迎点赞 收藏 ⭐留言 文…

亲孙子和外孙女真的不一样吗

对老人来说&#xff0c;带孩子的性价比&#xff0c;孙子≥孙女≥外孙女&#xff1e;外孙。 没错&#xff0c;外孙是最差的选择。以上几个&#xff0c;出“白眼狼”概率最大的&#xff0c;是外孙。 因为男性天然家族意识强而血缘意识弱&#xff0c;女性则血缘意识强家族意识弱…

回归预测 | Matlab实现CPO-HKELM冠豪猪算法优化混合核极限学习机多变量回归预测

回归预测 | Matlab实现CPO-HKELM冠豪猪算法优化混合核极限学习机多变量回归预测 目录 回归预测 | Matlab实现CPO-HKELM冠豪猪算法优化混合核极限学习机多变量回归预测效果一览基本介绍程序设计参考资料 效果一览 基本介绍 1.Matlab实现CPO-HKELM冠豪猪算法优化混合核极限学习机…

C语言------操作符的巧妙使用

1.计算一个数字二进制补码里面1的个数 &#xff08;1&#xff09;方法一 根据这个10进制的整数&#xff0c;对这个数进行%10&#xff0c;/10不断地进行下去&#xff0c; %10得到最后一位&#xff0c;/10得到舍去最后一位之后剩余的数&#xff1b; 同理得到&#xff1a;二进…

Kubernetes(K8s)的一些重要概念以及术语简短解释

前言 温故而知新&#xff0c;不学就容易忘&#xff0c;本文将迅速介绍k8s的一些关键概念&#xff0c;供随时回顾 正文 Pod&#xff1a;Pod是Kubernetes中最小的部署单位&#xff0c;通常一个Pod内运行一个容器应用。Pod封装了容器&#xff08;可能是多个&#xff09;&#xf…

09 呼吸灯

呼吸灯简介 呼吸灯实际展示的效果就是一个 LED 灯的亮度由亮到暗&#xff0c;再由暗到亮的变化过程&#xff0c;并且该过程是循环往复的&#xff0c;像呼吸一样那么有节奏。 呼吸灯通常是采用 PWM(Pulse Width Modulation&#xff0c;即脉冲宽度调制) 的方式实现&#xff0c;在…

计算机视觉初探--LeNet原理与实践

LeNet&#xff1a;深度学习图像识别的里程碑 LeNet是卷积神经网络&#xff08;Convolutional Neural Network, CNN&#xff09;领域的先驱模型&#xff0c;由Yann LeCun等人在1998年提出&#xff0c;被广泛应用于手写数字识别和其他计算机视觉任务。本文将介绍LeNet模型的数学…

随想录刷题笔记 —二叉树篇11 538二叉搜索树转换为累加树 77组合

538二叉搜索树转换为累加树 递归&#xff1a;使用pronode标记仅小于该节点的节点&#xff0c;使用右中左的顺序 根据pronode值修改节点值 class Solution {TreeNode pronode null;public TreeNode convertBST(TreeNode root) {if (rootnull){return root;}if (root.right!nu…

深入了解计算机系统——1.计算机系统初步

文章目录 计算机系统信息是什么我们来看看hello在哪 程序被其他程序翻译成不同的格式处理器读取并解释内存中的指令硬件组成 计算机系统 信息是什么 信息是位上下文 下面写一段程序 ...(省略&#xff09; printf("hello world"); ... hello.c上面是一段hello程序…

Vue-Json-Schema-Form: 如何基于模板定制前端页面

本人从事的是工业物联网, 面对工业设备的通讯难题是各大设备都有各自的通讯协议, 如果想要用一款硬件去和所有设备做通讯的话, 就得面对怎么把自己想要采集的配置下发给自己的采集器的问题, 以前都是采用各种模型去尝试构建配置项, 但是因为配置可能会有深层次嵌套, 而且…

13-ATF中的Switch cpu context

快速链接: . 👉👉👉 个人博客笔记导读目录(全部) 👈👈👈 付费专栏-付费课程 【购买须知】我的联系方式-自建交流群-学习群 【必看/必看!!】ATF架构开发精讲-专题目录👈👈👈【精选】ARMv8/ARMv9架构入门到精通-[目录] 👈👈👈目录 <