人工智能在医疗行业一些应用

人工智能在很多年前就医疗行业广泛使用

2000年,俺刚参加工作时,公司就在做这方面的应用。是一个医疗“转录”系统。先介绍一下具体背景:医生有着录不完那些电子病历(在美国一个外科医生,上完高中之后,最快要还要再读11年书才能拿下执照。学费接近80万美元。然后每天花费大量时间录入电子病历,就是坐在键盘前敲啊敲,医生会觉得是一种浪费)。这时候就形成了一个新的行业,就是“转录”行业。医生把要录入的内容录音到磁带中,交给“转录”公司,后来医生开始使用座机电话进行录音(拨打公司的服务电话即可)。公司安排人听录音进行录入。然后以每录入一行文字8美分到1毛的价格进行收费。 

到了2003年左右,Nuance公司的Dragon语音识别引擎已经开始实用了。虽然这个时期的语音识别引擎还是基于隐含马尔可夫链的。但是对于特定人群和特定行业,要比后来的非待定人群的深度神经网络的识别引擎的识别质量要好很多很多。实际上特定人群就是为每个医生创建特征库,那怕这个医生是墨西哥或者印度那种口音特别严重(叽里咕噜)的,因为针对每个医生都创建了特征库(Nuance的一个医生的特征库大约是 50-200M),所以识别质量还是不错的。这个时候我们公司就用了Nuance的引擎(离线版),然后用了大量服务器搭建了自己的平台。这样我们公司的工作模式就改成了 对于医生的录音先识别语音,再人工检查修改(医疗报告要求内容准确,我们有多级质检)。这样大幅度提高了工作效率,降低了价格,然后更多的医生开始接受这种服务(主要是便宜了)。公司的也壮大了。就这段时间来看,是人工智能增加了工作机会。

2010年之后,又有很多语音识别引擎出现,例如Google 、微软、 Siri等等。但是这些大部分都是非待定人群的服务。俺一直在关注这方面的技术。过段时间就用真实的语音进行 质量比对。例如使用200份3-5分钟的录音,使用各种识别引擎进行识别。在对识别的结果进行比较。这些识别引擎的识别结果非常差。经常大段的缺失(一般是医生的声音忽大忽小,或者医生开始叽里咕噜,语速贼快),识别出的内容大部分不到Nuance特定人群识别的三分之一,对于一些医疗专业术语更是无法识别。不过这个时候出现了一个新人M*Modal,这小伙也是特定人群识别的识别。但是有两个的优点:

1、通过在不断的再训练提高识别质量

在完成了医生的报告之后,把完成好的报告和语音回传给M*Modal,M*Modal就会为这个医生再次训练模型。这样经过一段时间后,这个医生的语言识别的质量就非常好了。哪怕这个医生有很多单词的发音有问题,识别的结果也是正确的。另外M*Modal 也通过语义分析语法规则等等,对识别的结果再处理,特别是数字 日期 等的处理有很好的结果。

2、生成结构化的电子病历

M*Modal 基于语义分析,对识别的内容进行整理,对不同的段落进行归类标注 形成结构化的文档

通过这些优点,M*Modal 快速发展,成为医疗语音识别的第2大公司。第1还是Nuance。

这样“转录”服务的价格进一步下降,有些合同 每一行的价格只有5美分。更多的医院和医生开始使用这种服务。当时在印度有超过10万人从事这种工作(就是对识别后的内容进行检查和纠正)。

接下来这个行业基本就是 Nuance 和 M*Modal 两家公司的舞台。俺们公司使用了这2家公司的识别服务,但是太贵了。所以我们自己开发了一套自己的流水线,把一些没啥口音的医生放在我们自己的识别引擎上。这样一个月能够节省很多美元。为啥不用便宜的或者免费的。Google 、微软的是便宜,几乎没有成本,但是识别质量实在是不行,非待定人群的没法和特定人群识别的比质量。

后来 M*Modal 被3M收购了。Nuance被微软收购了。

在十几年中,语音识别在医疗中的使用确实是很多,也带来了几十万个新的工岗位。

百家争鸣

2018年之后,随着人工智能的发展,很多视觉领域的应用也在医疗行业上出现。例如医疗影像的辅助阅片。还有一些疾病的辅助诊断。之前遇接触一个从事皮肤疾病的人工智能公司。他们通过对皮肤拍照进行分析,从而得出可能的皮肤病,这对于一些基层医疗机构(乡镇医院)的医生有很多帮助。还有就是OCR,其实医疗行业上也有很多纸张资料需要处理。我写过的一个项目就是对病人的各种资料进行归类,经常有些扫描件需要处理。前一段时间,俺看到的统计数字是这个项目最近12个月处理了2.07亿页的资料。在语音识别方面, 2020年出现了一家新的公司Soniox,这家公司的医疗语音识别的质量很不错。当然还出现了很多很多其他的公司。但是质量比不过Soniox。原来的老大Nuance 被微软收购后,还是第一。 

GPT的横空出世

GPT 来了 ,GPT真不错,GPT是个好同志。俺们也开始在一个项目上开始使用GPT了。还在对接中。这个项目其实是个Teams机器人,我们公司有个业务叫做医疗助手服务,其实就是给医生打下手。医生和我们公司的人在Microsoft Teams里进行网络会议,同时把我们的机器人也加入会议。会议结束后,俺们的Teams机器人就把会议的录音识别成文档,同时使用GPT做出会议摘要。这里插一句,现在的复杂场景的语音识别很不错了,能够识别出 每句话是哪个人说的。需要上传每个人的特征语音,就是随便说几句话,然后识别引擎就记住这个人的声音。俺们另外的一个法庭录音处理的项目也是用了新的语音识别(就是上面说的Soniox)。

人工智能改变了正在改变着很多行业的工作模式。分工也更加精细化,也带来了海量的工作岗位。在没有人工智能的时候,很多事情没法做或者太耗费人工。有了人工智能后,这些事情就变成了可行的方案,然后落地 、发展。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/157101.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2022最新版-李宏毅机器学习深度学习课程-P49 GPT的野望

GPT→类似于Transformer Encoder 训练任务:Predict Next Token 使用MASK-attention,不断预测“下一个token”。 可以用GPT生成文章。 How to use GPT? 给出描述和例子 给出前半段,补上后半段 In-context Learning(no GD) 结果 目前看起…

vue3 uniapp h5 安卓和iOS开发适配踩坑记录

font-size适配屏幕大小及iOS和安卓状态栏及安全距离的处理 App.vue <script setup lang"ts"> import { onLaunch, onShow, onHide } from "dcloudio/uni-app"; import ./main.scss onLaunch(() > {console.log("App Launch");var wid…

广西桂林钢结构钣金折弯件3d扫描全尺寸偏差检测-CASAIM中科广电

钣金是一种针对金属薄板&#xff08;通常在6mm以下&#xff09;的综合冷加工工艺&#xff0c;包括剪、冲/切/复合、折、焊接、铆接、拼接、成型&#xff08;如汽车车身&#xff09;等&#xff0c;其显著的特征就是同一零件厚度一致&#xff0c;通过钣金工艺加工出的产品叫做钣金…

uni-app:实现request请求的递归(设置request请求的访问次数),并且调用自定义方法给出返回值

一、效果展示 失败效果 成功效果 二、写入后端请求部分 分析 ①自定义一个模块common.js主要用于封装所有的请求函数 ②核心代码 function requestWithRetry(cmd, username, password, retryCount) {return new Promise((resolve, reject) > {uni.request({url: ip sys…

Openlayer【三】—— 绘制多边形GeoJson边界绘制

1.1、绘制多边形 在绘制多边形和前面绘制线有异曲同工之妙&#xff0c;多边形本质上就是由多个点组成的线然后连接组成的面&#xff0c;这个面就是最终的结果&#xff0c;那么这里使用到的是Polygon对象&#xff0c;而传给这个对象的值也是多个坐标&#xff0c;坐标会一个个的…

抖音本地生活服务商申请怎么做?无保证金的申请方法来了

想做抖音的本地生活服务项目&#xff0c;却不知道去哪里申请&#xff0c;或者如何申请&#xff0c;其实&#xff0c;官方的通道在今年上半年还是有的&#xff0c;自己去平台上提交资料申请就可以了&#xff0c;但需要缴纳高额的保证金。 而在今年下半年&#xff0c;平台已经关…

揭秘MySQL SLEEP()函数:避免这些常见误区,不再被时间迷惑!

点击上方蓝字关注我 关于MySQL sleep()函数&#xff0c;很多同学会觉得这个很简单&#xff0c;但是在和研发同学沟通时发现&#xff0c;很多人对此函数存在误解&#xff0c;本文举3个典型的例子进行说明。 1.误区一 以下SQL的运行结果是什么样的 SELECT NOW(),SLEEP(2),NOW()&a…

redis的数据类型的增删改查

redis的高可用 在集群中有一个非常重要的指标&#xff0c;提供服务的时间的百分比&#xff08;365天&#xff09;99.9% redis的高可用含义更加宽泛&#xff0c;正常服务是指标之一&#xff0c;数据容量的扩展&#xff0c;数据的安全性 在redis中实现高可用技术 持久化&…

Prometheus监控mysql nginx tomcat 黑盒监控

部署consul_exporter https://github.com/prometheus/consul_exporter/releases/download/v0.9.0/consul_exporter-0.9.0.linux-amd64.tar.gz 注册 ootubuntu20:~# cat consul_export.json rootubuntu20:~# cat consul_export.json {"services": [{"id"…

手机上玩.NET的两种方式

少见&#xff01;手机上玩 .NET_哔哩哔哩_bilibili 小米平板敲代码&#xff0c;termux安装dotnet和vscode_哔哩哔哩_bilibili 都是先容器加载linux rootfs&#xff0c;然后安装 linux-arm64 版本的 dotnet 命令行方式运行 dotnet&#xff0c;代码编辑到是可以安装使用 vscode…

前端实现动态切换主题色-使用 css/less 动态更换主题颜色(换肤功能)或通过单击更改背景颜色

前言 提示&#xff1a;使用 css/less 动态更换主题色&#xff08;换肤功能&#xff09;&#xff0c;方法共通&#xff0c;不限制技术栈&#xff1a; 其实在日常项目开发中经常会遇到有些用户想要一些自定义的的主题色来满足不同的视觉需求&#xff0c;这时候就需要通过动态更改…

搜索引擎trick:成为搜索高手的秘籍

诸神缄默不语-个人CSDN博文目录 文章目录 1. 搜索指令1.1 "完全匹配搜索"1.2 -1.3 site1.4 filetype1.5 * 模糊搜索1.6 intitle1.7 inurl1.8 related1.9 inanchor 2. 组合搜索技巧3. 搜索引擎的选择4. 使用高级搜索功能4.1 时间限定搜索4.2 语言限定搜索4.3 使用搜索…

技术为业务赋能:深度剖析开发与业务的紧密结合

技术为业务赋能&#xff1a;深度剖析开发与业务的紧密结合 很多做开发的同学有一种认知&#xff0c;技术最牛&#xff0c;进而忽视了对业务的理解和积累&#xff0c;眼里认为技术和游戏一样&#xff0c;有着层出不穷的新技术&#xff0c;更新迭代的非常快&#xff0c;而业务方…

Flask笔记二之blueprint和session介绍

本文首发于公众号&#xff1a;Hunter后端 原文链接&#xff1a;Flask笔记二之blueprint和session介绍 前面我们使用 app.route() 的方式实现了一个简单的接口&#xff0c;用于访问系统接口&#xff0c;接下来介绍一下如何使用 Blueprint 来实现路由的分组以及 Flask 中 session…

Modbus转Profinet网关在大型自动化仓储项目应用案例

Modbus转Profinet网关在大型自动化仓储项目应用案例 在自动化仓储项目中&#xff0c;Modbus是一种常见的通信协议&#xff0c;用于连接各种设备&#xff0c;例如传感器、PLC和人机界面。然而&#xff0c;Modbus协议只支持串行通信&#xff0c;并且数据传输速度较慢。为了提高通…

【C++历练之路】stack||queue||底层原理知多少

W...Y的主页 &#x1f60a; 代码仓库分享&#x1f495; &#x1f354;前言&#xff1a; C标准模板库&#xff08;Standard Template Library&#xff0c;STL&#xff09;是C语言的一个重要组成部分&#xff0c;提供了一组通用的数据结构和算法&#xff0c;以便开发人员能够高…

计算机算法分析与设计(24)---分支限界章节复习

文章目录 一、分支界限法介绍二、旅行商问题应用三、装载问题应用3.1 问题介绍与分析3.2 例题 四、0-1背包问题应用4.1 问题介绍与分析4.2 例题 一、分支界限法介绍 二、旅行商问题应用 三、装载问题应用 3.1 问题介绍与分析 3.2 例题 四、0-1背包问题应用 4.1 问题介绍与分析…

java 数据库 查询 select 2

Day2 组函数 以组为操作单位&#xff0c;一组数据得到一个结果。 在没有手动分组的前提下&#xff0c;整张表默认为一组数据 max(列名)&#xff1a;获取最大值 min(列名)&#xff1a;获取最小值 sum(列名)&#xff1a;获取总和 avg(列名)&#xff1a;获取平均值 count(列…

TensorFlow实战教程(十九)-Keras搭建循环神经网络分类案例及RNN原理详解

从本专栏开始,作者正式研究Python深度学习、神经网络及人工智能相关知识。前一篇文章分享了卷积神经网络CNN原理,并通过Keras编写CNN实现了MNIST分类学习案例。这篇文章将详细讲解循环神经网络RNN的原理知识,并采用Keras实现手写数字识别的RNN分类案例及可视化呈现。基础性文…

【C++进阶之路】第十篇:C++的类型转换

文章目录 1.C语言中的类型转换2.为什么C需要四种类型转换3.C强制类型转换3.1 static_cast3.2 reinterpret_cast3.3 const_cast3.4 dynamic_cast 4.RTTI&#xff08;了解&#xff09;5.常见面试题 1.C语言中的类型转换 在C语言中&#xff0c;如果赋值运算符左右两侧类型不同&…