李飞飞高徒:斯坦福如何打造基于视觉的智能医院?

640?wx_fmt=jpeg

作者:Albert Haque、Michelle Guo

来源:机器之心


自 2009 年担任斯坦福人工智能实验室和视觉实验室的负责人,李飞飞在推动计算机视觉方面研究的同时,还密切关注 AI 医疗的发展。昨日,李飞飞离任斯坦福 AI 实验室负责人一职,Chris Manning 接任,并推出了全新的斯坦福 AI 技术博客。近日,斯坦福 AI 实验室博客更新,介绍了基于视觉的智能医院,将 AI 用于改善医疗卫生状况。博客作者 Albert Haque 和 Michelle Guo 均为李飞飞的学生。


每年,死于医院内感染的人数比车祸还要多。这意味着去医院就医比不去医院病情加重的概率要高 1/30。


这当然是极端情况,但医院可以通过创造更好的卫生条件轻松改善这种状况。众所周知,无论是在医院还是机场、饭店等公共场所,手部卫生是阻止传染病传播的第一道防线,因此,这点不容忽视。检查手是否洗干净需要自动检验技术的帮助。解决这一问题最简单的方法可能是利用最普通的人类策略——利用计算机视觉来确认大家有没有洗手。


640?wx_fmt=png


开发这样一种技术解决方案是斯坦福 Partnership in AI-Assisted Care(PAC)项目及其世界各地的合作者多年以来的努力方向。尽管还有很多的工作要做,但我们希望该技术可以帮助医院降低感染率,改善患者的健康状况。


为什么要借助视觉?


目前,医院通过医学院课程、公告牌上的宣传材料、员工周会等教育手段来强化手部卫生意识。世界卫生组织(WHO)甚至提出了手部卫生的「五大时刻」(Five Moments),详细规定了医务工作者应该洗手的时间点。为了检查医务人员是否遵守规定,医院让员工佩戴 RFID 卡或标识来追踪他们的手部卫生状况。这种方法有一定效果,但对工作流程造成的干扰也时有发生,如人冲进一间新的房间时皂液器会刷到 RFID 卡产生响应。这主要是由技术原因造成的:一般 RFID 卡通讯距离较短,而长距离的「活跃」RFID 卡受自身定向天线的控制,且需要电池。显然,我们需要一种可以克服 RFID 技术局限的新型解决方案。


计算机视觉与医院


斯坦福 AI 实验室与斯坦福大学露西尔帕卡德儿童医院(Lucile Packard Children』s Hospital)合作,共同开发了一种新的手部卫生追踪高级方法。该方法采用最前沿的计算机视觉技术,不需要临床医生改变他们的日常习惯。计算机视觉已经应用于医学成像,但在物理医院空间中还没有得到充分利用。所幸计算机视觉在另一个问题中已经用在物理空间中:自动驾驶汽车。自动驾驶汽车利用大量传感器来了解周围环境。那么,我们能将其中一些传感器用在医院里以更好地了解医院的卫生状况吗?


深度传感器


深度传感器(如 Xbox Kinects)看起来很像相机,但它记录的是距离而非颜色。在一幅正常的彩色图像中,每个像素代表一种颜色。而在深度图像中,每个像素代表到现实世界空间中像素的「距离」,通常是一个浮点数,如 1.337 米。


640?wx_fmt=png

(左)用手机相机拍摄的医院彩色照片。(右)天花板上的传感器拍摄的对应深度图像。颜色越深表示物体距离深度传感器越近。


观察以上深度图像可以发现,虽然看不清人脸,但你还是能分辨出他们在做什么。这么做可以保护用户隐私,而隐私在医院中非常重要。为了改进和验证该技术,我们在两家医院(一家儿童医院的心血管科室,一家成人医院的 ICU 病房)的天花板上安装了深度传感器。


640?wx_fmt=png

装在儿童医院天花板上的深度传感器。


把深度传感器装在两家不同的医院之后,我们可以利用 3D 计算机视觉工具来自动测量手部卫生活动。这需要三个步骤:


1. 检测医护人员。

2. 对在医院内走动的医护人员进行追踪。

3. 对他们的手部卫生行为进行分类。


行人检测


640?wx_fmt=png


继续用自动驾驶汽车打比方:为了理解环境,我们首先需要检测环境中的人。尽管有很多种目标检测方法,但它们大多数都是为彩色 RGB 图像开发的。因此,我们选择一种可在任何类型的图像上运行的方法,该方法利用了该问题的两个层面:在给定房间图像中,人只占据很小的空间,而深度图像中的人看起来则像地板背景上醒目的「一坨」。


640?wx_fmt=png

字典条目(dictionary entry):每个字典条目包含一张合成图像,对应某个人所处的位置。


检测人的一种方法是确定地面的占据网格,这是一个二值矩阵,表示一个人是否占据地面的某个特定位置。我们可以创建一个字典,其在地面的每个点包含一「坨」。对于多个人,我们可以渲染场景中的多「坨」。在测试期间,我们只需要每一「坨」的图像,这可以利用前景/背景分离或目标分割算法来实现。现在,给定一张测试图像,我们可以对该字典执行 K 近邻搜索来寻找每一「坨」的位置。


手部卫生活动分类


目前,我们已经识别了单位中所有行人的轨迹(即全局医院单位地面上的位置)。最后一步是检测手部卫生活动,并将其和特定轨迹关联起来。当一个人使用了洗手液时,手部卫生活动被定义为正。然后我们将每个行人的轨迹标记为「干净」或「不干净」。


在现实世界中部署传感器通常受限于安装过程。无论是否有意,建筑和维护技术人员都安装了角度和位置各不相同的传感器,这意味着我们的模型必须对这些差异具有鲁棒性,从而它可以适用于任何传感器视点。由于传统的卷积神经网络(CNN)通常不是视点不变的,我们可以使用空间变换网络(STN)代替。


640?wx_fmt=png

(左)带有人物分割的数据增强阶段。

(右)手部卫生活动分类器:空间变换网络加上密集连接卷积网络。


STN 的输入是任意图像,输出是变形图像。为了帮助模型更快地学习,我们还向 STN 提供人物分割(即身体掩模)。可以使用经典的前景/背景分离技术或深度学习方法来提取该身体掩模。STN 将图像变形成学习到的「视点不变」形式。从这个变形的图像中,我们使用标准 CNN(即,DenseNet)来执行是否有人使用洗手液的二进制分类。


该技术与人类观察员和 RFID 的对比结果


如今,很多医院使用 secret shopper 来衡量手部卫生是否合格,训练有素的人会在医院各处巡视,观察医护人员私下是否洗手。这种 secret shopper 可能是护士、医生,甚至是访客。我们将这种行为称之为秘密观察,与为审核而进行的公开观察相反。这种秘密观察可以最小化霍桑效应(即当你发现有人在观察自己时,会刻意改变行为)。如上所述,我们把计算机视觉和多个站在固定位置的观察员、在医院内走动的单个观察员以及 RFID 标签的使用进行了比较。


对比结果


RFID 产生了大量的假阳性,并且判断是否合格的准确率比较低。它正确预测干净或肮脏的概率只有 18%。


观察员效果比这好得多,准确率为 63%,而三个人做得更好,72%。但是,我们的算法甚至超过了人类观察员,达到了 75% 的准确率。这个结果在意料之中,毕竟观察员的对手是具有「全局视野」的计算机视觉系统。不过,既然真实标签是由人类标注的,人类观察员怎么会比算法做得还差呢?这是因为真实标签是被远程标注而非实时标注的。远程标注者可以访问所有的传感器,并及时向前或向后播放视频以确保其标注是准确的。而在现场的观察员不能「访问」所有传感器,也无法及时回放事件来确定自己的观察是否准确。


640?wx_fmt=png

不同时段的手部卫生检测。蓝色方块表示有人使用了手部卫生分配器。深蓝色表示更多同时发生的事件。底部显示了真实标签。一般来说,空白越多表示结果越差。


抛开数字不说,一个更有趣的结果是视觉效果。上图显示了现场观察员检测手部卫生活动的频率之低。注意到所有的空白部分了吗?如果你仔细观察真实标签那一行,你会发现几乎没有空白。这意味着人类观察员错过了很多手部卫生活动。这通常是由观察员的注意力分散造成的:他们可能打瞌睡了,也可能在看区域内的无关活动,或者就只是没有看到手部卫生活动的进行。


640?wx_fmt=gif

走在重症监护病房的人的时空热图。黄色/红色表示该区域内有更多人站立/行走。


我们得出一个最终的可视化图。上面的动画显示了医院内的俯视图。因为我们可以追踪整个医院里的人,所以我们几乎一直都知道他们的特定(x,y,z)位置。我们绘制了每个点,并随着时间的推移创建了热图。这种类型的空间分析可用于识别交通模式并可能追踪疾病的传播。始终为黄色/红色的区域表示拥挤的空间。这些空间通常位于走廊交叉点或紧邻病房外。如果你仔细观察,就会发现我们的固定观察员是红色的。


未来方向


我们已经展示了如何使用计算机视觉和深度学习来自动监控医院的手部卫生活动。在 AI-Assisted Care 的斯坦福合作项目中,手部卫生只是医疗保健中应用计算机视觉的一个案例。我们还在开发计算机视觉系统,以监测患者的活动水平,分析外科手术的质量,并检查老年人生活中的异常情况。我们希望这项工作能够向世人展示人工智能辅助医疗的潜力和影响。


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

640?wx_fmt=jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/493542.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

tensorflow知识点

一.bazel编译tensorflow注意版本号: 在/tensorflow/tensorflow/configure.py 查看bazel版本号 https://github.com/tensorflow/tensorflow https://github.com/bazelbuild/bazel/releases?after0.26.1 https://tensorflow.google.cn/ 二,基础知识点 1.打印出…

eclipse中如何导入jar包

如图,首先右键点击项目,选择最下面的properties, 然后进去之后点击java build path,右边会出来4个选项卡,选择libraries, 这时候最右边会有多个选项,第一个add jars是添加项目文件中的jar包&…

线性-LR-softmax傻傻分不清楚

softmax 对于分类网络,最后一层往往是全连接层,如果是N分类,那么最终的全连接层有N个结点。很显然,每个节点对应一个类,该节点的权重越大,说明网络越倾向于认为输入样本属于该类。这其实就是Softmax的思想…

一图看懂国外智能网联汽车传感器产业发展!

来源:赛迪智库编辑:煜 佳未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测&#…

深度学习中的信息论——交叉熵

信息量 可以说就信息量是在将信息量化。首先信息的相对多少是有切实体会的,有的人一句话能包含很多信息,有的人说了等于没说。我们还可以直观地感觉到信息的多少和概率是有关的,概率大的信息也相对低一些。为了量化信息,一个做法…

传统手工特征--opencv

一,颜色特征: 简单点来说就是将一幅图上的各个像素点颜色统计出来,适用颜色空间:RGB,HSV等颜色空间, 具体操作:量化颜色空间,每个单元(bin)由单元中心代表&…

特写李飞飞:她激励了人工智能的发展,更要给人工智能赋予人的价值

文 | MrBear 编辑 | 杨晓凡来源:雷锋网摘要:李飞飞无疑是人工智能界最响亮的名字之一。她既对机器学习领域的发展做出了杰出的贡献,也是普通大众眼中温和的人工智能技术宣扬者,还是谷歌这一科技巨头的人工智能技术领导人之一。WI…

Chap-4 Section 4.2.4 指令修正方式

对于X86平台下的ELF文件的重定位入口所修正的指令寻址方式只有两种:绝对近址32寻址和相对近址32寻址。 这两种指令修正方式每个被修正的位置的长度都为32位,即4个字节,而且都是近址寻址,不用考虑Intel的段间远址寻址。r_info成员的…

没见过女人的小和尚——SVDD

是的,即便是出生在山上的小和尚,从来没有下过山,没有见过女人,但是一旦有女施主上山,小和尚依然可以轻松地区分出眼前的人是如此不同。 传统的SVM是寻找一个超平面,而SVDD寻找的超平面更进一步&#xff0c…

解读GAN及其 2016 年度进展

作者:程程 链接:https://zhuanlan.zhihu.com/p/25000523 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 GAN,全称为Generative Adversarial Nets,直译为生成式对抗网络…

全国首套中小学生人工智能教材在沪亮相

来源:网络大数据中小学 AI 教材正式亮相11 月 18 日,优必选与华东师范大学出版社共同发布了《AI 上未来智造者——中小学人工智能精品课程系列丛书》(以下简称“AI 上未来智造者”丛书)。据了解,该丛书根据教育部“义务…

numpy基础知识点

1. np.squeeze 一,np.squeeze """ np.squeeze 删除单维度的条 对多维度无效 """ import numpy as np anp.array([[1,2],[3,4],[4,5]]) print(a) print(a.shape) bnp.squeeze(a) print(b) ca.reshape(1,6,1) print(c) print(np.squeeze(c)) pri…

从智能交通到智能能源:智慧城市在7个方面的应用实践

来源:资本实验室目前,智慧城市已经成为全球众多城市未来规划和设计的方向,并致力于通过各种新技术的应用来改善城市居民的工作与生活。但什么样的技术应用能够推动智慧城市的建设?如何让新技术在智慧城市中的应用效率最大化&#…

别以为if slse很简单——决策树

怎么分——熵与Gini指数 熵,表示信息量的期望,含义是混乱程度,也是对随机变量编码所需的最小比特数。请参考之前的文章。 信息增益建立在熵之上,是选择某特征之后熵减少的多少(熵减少即信息增加)&#xf…

tensorflow实现回归

直线拟合:yw*xb """ 回归:直线拟合 """ import tensorflow as tf import numpy as np import matplotlib.pyplot as plt x_datanp.random.rand(100) y_datax_data*51Wtf.Variable(0.) btf.Variable(0.) y_predW*x_databxtf.placehol…

微软亚研院20周年独家撰文:数据智能的现在与未来

文:微软亚洲研究院软件分析组来源:雷锋网摘要:今年是微软亚洲研究院(MSRA)20周年,站在这个大节点上,MSRA副院长张冬梅以及她的团队写了这篇有关数据智能的文章,对该领域的发展和未来…

二维与三维之间的桥梁——点云

在做图像配准时就听闻过一些点云的方法,却没对其有太多的认识,只是知道点云point cloud顾名思义就是一些离散点的集合。现在在无人驾驶中一些激光雷达的作用其实就是生成点云数据,接下来介绍一下点云数据的含义和基础的使用方法。 虽然特斯拉…

python刷题+leetcode(第一部分)

1. 设计前中后队列 思路:python代码直接利用list的insert特性 class FrontMiddleBackQueue:def __init__(self):self.queque []def pushFront(self, val: int) -> None:self.queque.insert(0, val)def pushMiddle(self, val: int) -> None:self.queque.insert(len(self…

LINQ基础概述

介绍LINQ基础之前,首说一下LINQ 的历史和LINQ是什么,然后说一下学习 LINQ要了解的东西和 LINQ基础语法LINQ 的历史从语言方面的进化 –委托 –匿名方法 –Lambda表达式 –Linq查询表达式 上边这四个我会在下边一一解说 从时间方面的演进 –2004年 –2005…

机器人“快递小哥”上岗了!京东配送机器人编队长沙亮相

11 月 22 日上午,京东物流配送机器人智能配送站启用仪式在长沙举行,随着载有用户订单的配送机器人编队从站内依次发出,全球首个由机器人完成配送任务的智能配送站正式投入使用。首个京东配送机器人智能配送站位于长沙市科技新城,占…