该让医疗垂类大模型,走出“试题”了

图片

图源:123rf

“现阶段,许多医疗垂类大模型就是伪命题,推理能力不行。” 一位观望大模型已久的医疗从业者玄彬(化名)发出了极为尖锐的批评。

在他看来,目前人工智能是靠scaling law涌现的,模型性能随着模型规模、数据规模和算力规模等因素的增大而提升。只要还是Transformer,就不可能有垂类的机会。

过去两年,为了追上生成式AI的热潮,不少企业将开源大模型稍加“改造”后就冠以自有产品名,套牌、过度宣传屡见不鲜,铺天盖地的榜单,各种评测熙熙攘攘。“大模型用不用不重要,先要拥有大模型。”思潮下,历经井喷式的发展,也造就了医疗大模型圈里鱼龙混杂、良莠不齐。

当通用大模型掀起了低价肉搏战,从5元到1元,不断击穿大模型低价,巨头们降价正酣。

医疗大模型虽在病历书写、诊断等细分领域展示出巨大潜力,但商业化路径仍不清晰,行业仍在苦苦寻觅杀手级场景。

与此同时,技术不断迭代,随着OpenAI和 Mistral AI的助力,专家混合(MoE)一时间炙手可热。这种混合模型,由多个子模型(即专家)组成,每个子模型都是一个局部模型,专门处理输入空间的一个子集。简而言之,它使用一个门控网络来决定每个数据应该被哪个模型去训练,从而减轻不同类型样本之间的干扰。

天才黑客乔治・霍兹曾爆料,GPT-4其实是一个混合模型,采用了由8个专家模型组成的集成系统, 每个专家模型都有2200亿个参数。

2023年底,微软首席科学家埃里克・霍尔维茨曾发布一项调研报告《The Power of Prompting》,他们研究发现,在相同的基准上,利用提示词工程就能让GPT-4的性能明显优于专门针对医疗应用进行微调的领先模型。

Medprompt研究表明,更深入地探索将通用模型转化为专业模型的提示可能性, 并将这些模型的优势扩展到新领域和新应用,是非常有价值的。”埃里克·霍尔维茨欣喜写道。

以上种种,使得医疗垂类大模型的质疑声越来越响:医疗大模型是伪命题吗?我们可以期待怎样的医疗大模型?

01

衡量标准:忍受VS享受,要求VS需要

在和缓医疗CEO李宇看来,判断大模型的应用是否成立,主要在于两个点:一是对于用户来说,大模型是忍受,还是享受;二是对于使用者而言,是要求还是需要。

“现在整个医疗行业都在寻找杀手级应用,找场景,其实很重要一点就在于找到强要求、强监管下的应用。”他阐述道,邮件和Office这种才叫杀手应用,发生在每天应用的工具中,具备非常高的便捷性。

纵览目前的医疗大模型,多聚焦患者问诊、医生助手、药物研发、健康科普等领域。李宇最看好的则是病历质控系统以及DRG/DIP下,监管医院的临床诊疗行为和收费合理性的医保控费应用。

“对于医院至关紧要的,才会有大规模商业机会。”李宇认为,文字模型的杀手级应用应该还是在病历相关的场景上,比如DRG要求的病案首页等医生极易出错的地方,抓住了医院端需求,并打通了业务场景,落地了才能有未来。

当大模型进入医疗领域之后,更多的资源应该探索如何寻找高频且刚需的场景,如此才能诞生下一个超级应用的可能性。当享受与需要二者兼备,医疗大模型才能真正成立。

复旦大学中国研究院副研究员刘典曾在线下论坛中一针见血指出,行业的核心是数据和原有的工作流。只要大模型能很好解决这两件事,且成本不高于原有方案,就不能说是伪命题。

换言之,只有在医疗领域真正实现“降本增效”,积累真实世界数据,才能称得上医疗大模型。

要知道,大模型想要真正脱颖而出,几方面能力至关重要:一是获取最新知识能力,医学知识是不断更迭的,需要动态获取最新的医学知识;二是理解多模态数据,医学影像、X光片,心电图等;三是高级推理能力,大模型不能永远只做“应试教育的高材生”,真正应用于医疗场景中,非常依赖模型的推理能力,毕竟好的医生都是推理专家;四是长文本能力……

百模大战尽管听起来热闹,但是真正具备模型能力的仍是少数,毕竟大模型推理这类访存密集型任务需要真金白银的投入。财通证券曾经测算,支撑 GPT-3.5推理任务的A100数量或至少在5万张左右。

“我觉得**医疗垂直大模型不成立的原因就是它的推理能力会很弱,**你不会希望一个熟读各类医学百科、疾病诊疗指南书籍的学生来当你的医生。”玄彬坚定说道,虽然它是个专业的学生,但作为医疗场景应用,还是有些危险。

02

大模型的终局——通用还是垂直?

事实上,通用大模型与垂直大模型之争从2024年初便备受关注。

一个理想的范式中,通用大模型以“百科全书式”的通用能力安身,垂直大模型以某一领域的专家立命,两者融合共同构筑枝繁叶茂的大模型生态。然而,随着AGI时代的到来,通用大模型完全能够覆盖各种垂直模型的业务场景,垂直模型存在的必要性便被质疑。

一位生物医学工程博士在社交媒体撰文指出,目前一个很尴尬的事情:许多垂类大模型在他垂直领域里能力似乎没有超过通用大模型。所谓垂类大模型,感觉就是用小部分已经用过的文本数据做复读机一样的训练,用通用领域的性能下降换专业领域的sota。

判断一个大模型够不够聪明,很重要的一点就是它能不能解决复杂问题。玄彬在过去一年多测试了许多医疗大模型,悲哀地发现,有时候医疗大模型宣称“更懂医疗”,其实只是把医疗领域的俗称与全称对应一下。“比如甲减,你不翻译成甲状腺功能性减退,通用大模型就听不懂了,而一些垂直模型所做的事情就是把这些俗称对应一下。”

如果烧了几亿,只能培育出停留在“纸上谈兵”里的人工智能,何尝不是一种资源浪费?那么医疗垂类大模型存在的必然性在哪?答案就是落地部署、成本与数据。

在亿欧大健康总裁高昂看来,从技术上面,垂直大模型或许是伪命题,但从产业角度讲,其反而可能是现阶段企业落地的主要方向。

纵览如今的通用大模型,早已演变成巨头们和明星创业者的赛场。阿里、腾讯、百度、科大讯飞、商汤自是不用多提,百川智能的王小川、智谱AI则由清华大学计算机系知识工程实验室的技术成果转化而来……

只有他们,或许才能付得起动辄一两万亿训练Token,以及训练GPU集群的成本,扛得住如火如荼的降价潮。

居高不下的研发成本、GPT—4明珠在前,注定了垂直大模型或许才是国内企业真正落地所要走的路。

科技博主“Magic”的观点一针见血,垂直大模型必然是存在的,且会长在通用模型之上,即将垂域知识融入到一个相对智能的通用模型之上,打造行业/领域的专有模型,并进行私有化部署,是To B业务未来非常重要的一条发展路径。

在他看来,如果垂直大模型也变成算力跟数据的竞争,那么落地这条路可能又遥遥无期了,“你训不完的模型,我等不起的业务啊。”

毕竟,企业的第一要务便是赚钱。从商业化落地来看,企业或许并不需要一个“全能”的通用大模型,而是更需要针对细分领域场景、解决实际问题的产业大模型。

“单纯地追求大模型的规模与复杂度,并无实质性的意义。真正有价值的,是将这些技术应用于实际场景中,发掘出更大的商业机会。”百度创始人李彦宏的早前呼吁,意义在此时或许不言自明。

入局者别再为了抢夺大模型概念融资红利,一哄而上,静下心来明确企业定位,结合自家业务,找到适合自己的生存空间和发展路径,健康有序的市场格局或许才能出现。

03

破局:先选择应用场景,再定义应用

“场景和数据,是医疗大模型脱颖而出的关键。” 李宇剖析道,功能是打动不了人的,场景才能打动人,解决某一场景的具体需求。

以智能监控为例,它可以完全替代人看,且完成人根本看不过来的量级,甚至比人看的效果好得多。在他看来,医疗大模型商业化如今动力不足的很大一部分原因,则是没有完全打透的场景、没有彻底替代人的工作、没有完成人完成不了的工作。

李宇指出,B2B解决方案之间的PK,将不会把重点放在令人眼花缭乱的AI技术能力,而更关注这些技术层面的能力,将如何帮助企业用户具备(或重新定义)更有价值的企业工作流程。

聚焦多场景覆盖,也是不少医疗大模型企业的出发点。商汤医疗健康大模型“大医”,覆盖了健康管理、患者服务、临床诊疗、医学科研四大领域超过20个细分医疗场景;医渡科技强调打造多任务引擎,可以同时解决多个任务,这使其在处理复杂多样的临床情况时具有更大的潜力……

究其原因,则是某个单一场景的大模型产品局限性更大,要实现在每个场景中的可用性并不容易,这需要深入理解场景的本质。另外一些企业则从自家业务出发,结合大模型特点,为原有产品作升级,实现对原有工作流的改造。

圆心科技的源泉大模型将每一个用户设有标签,管理服务会根据不同特性的人进行针对性关注患者药物依从性、联合用药预以及疾病康复管理,通过大模型数字化应用为患者生成定制化疾病科普和药品服务;

全病程管理平台微脉推出健康管理大模型CareGPT,为医院、医生和微脉个案管理师提供全新的辅助工具;和缓医疗即将推出合成式人工智能健康Copilot服务,构建一种全新的AI+真人医生复合服务工作流;左医则把把知识图谱和医疗大模型进行融合,实现智能自诊、智能分诊、智能预问诊、智能用药和智能随访五大功能。

“大家在维持原有场景的商业模式下做技术改进,虽然现在并不会有明显溢价,但未来没有AI的大概率要被淘汰。”李宇预判道。

场景端革新,或许是中国应用市场后来居上的传统优势,同时也具有反哺大模型能力的作用。场景服务下,大模型与人交互产生的数据,将成为未来技术迭代下的关键资产。细分的产业场景上,依靠交互数据,实现大模型自我优化和改进,提升输出精度。

“大模型的场景落地,不止是一个IT硬件+软件的服务,而是针对具体场景结果的交付,这个过程中还可能涉及使用者的运营与服务。” 高昂言简意赅,软硬一体对于传统行业客户或许更“友好”,毕竟买了具体的实物,但硬件迭代周期过长,跟不上模型进步速度,需要一次吃透场景解决问题,生态圈的建立就显得尤为重要。

在数据为制药企业、医院命脉的当下,私有化部署将是一条重要布局路径。而放眼未来,与其说是算力、算法、数据的竞争,倒不如说是大模型生态的角逐。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/43343.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【前端】使用chrom浏览器Network,查看前后台数据传输请求

使用chrom浏览器Network查看前后台数据传输请求 写在最前面查看前后台数据传输请求① 首先,打开开发者工具(F12)打开控制台,切换到Network面板。Network面板右键界面copy ②清空请求log ctrle两次或者点击clear图标 案例展示&…

鸿蒙开发HarmonyOS NEXT (三) 熟悉ArkTs (上)

一、自定义组件 1、自定义组件 自定义组件,最基础的结构如下: Component struct Header {build() {} } 提取头部标题部分的代码,写成自定义组件。 1、新建ArkTs文件,把Header内容写好。 2、在需要用到的地方,导入…

html——VSCode的使用

快捷键 快速生成标签:标签名tab 保存文件:CtrlS 设置自动保存【文件】→【自动保存】 快速查看网页效果:右击→Open in Default Browser 快捷键:altb 注意:必须安装了open in brows…

windows10下的游戏怎么卸载?

在Windows 10中卸载游戏可以通过多种途径进行,下面是一些常见的方法: 方法一:通过“设置”应用卸载 1. 点击左下角的“开始”按钮,打开“开始”菜单。 2. 选择“设置”图标(齿轮形状)。 3. 在“设置”窗…

2024年5款最佳免费博客程序——对比和测评

多年来,我试用了许多不同的博客网站,并评估了它们在各种需求上的表现。这篇文章记录了我的发现(截至2024年),旨在帮助您为您的项目选择最佳解决方案。 我将介绍五个非常优秀的博客平台,它们让您能够轻松创建…

知识改变命运 第二集:Java的数据类型与变量

数据类型与变量 1. 字面常量2. 数据类型3. 变量3.1 变量概念3.2 语法格式3.3 整型变量3.3.1 整型变量3.3.2 长整型变量3.3.3 短整型变量3.3.4 字节型变量 3.4 浮点型变量3.4.1 双精度浮点型3.4.2 单精度浮点型 3.5 字符型变量3.6 布尔型变量3.7 类型转换3.7.1 自动类型转换(隐式…

mybatilsplaus 常用注解

官网地址 baomidou注解配置

CATIA二次开发VBA入门(5)——catia文档操作vb.net程序案例,打开catia文件,进行视图操作,退出程序

目录 引出catia文档操作案例1.初始化窗体,始终置顶始终置顶方式2 2.打开文件3.视图切换4.退出5.完整代码 总结认识CATIA二次开发刘瑞欣 vb程序设计教程Excel中的vba开发catia中的vba开发 宏的录制、回放和编辑宏代码精简画圆柱阵列宏Macro文件的3种类型宏的保存&…

如何安全隐藏IP地址,防止网络攻击?

当您想在互联网上保持隐私或匿名时,您应该做的第一件事就是隐藏您的 IP 地址。您的 IP 地址很容易被追踪到您,并被用来了解您的位置。下面的文章将教您如何隐藏自己,不让任何试图跟踪您的活动的人发现。 什么是 IP 地址? 首先&am…

Apache Flink核心特性应用场景

Flink的定义 Apache Flink是一个分布式处理引擎,用于处理 无边界数据流, 有边界数据流上金秀贤有状态的计算。Flink能在所有常见的集群环境中运行,并能以内存速度和任意规模进行计算如下Flink官网的一张图 Flink 与Spark的区别 Flink 中处…

白盒测试的概念、特点、应用阶段、实施流程、现状与前景

文章目录 前言一、白盒测试的应用阶段二、白盒测试的特点三、白盒测试的流程四、白盒测试的现状与前景总结 前言 白盒测试(White Box Testing),又称为结构测试(Structural Testing)、透明盒测试(Glass Box…

Riscv 调试系统的合规测试

Riscv debug release框图 仿真环境下的Riscv debug框图 平头哥调试环境 XuanTie DebugServer是一个调试代理软件,它通过CKLINK,以JTAG的方式连接目标板,并支持“GDB Remote Protocol” 。开发者可以通过GDB对运行在玄铁800系列和玄铁900系列处…

24.可乐机拓展练习--综合训练

(1)设计要求:仍以可乐机为背景,一瓶可乐的价格是2.5 元,用按键控制投币(加入按键消抖功能),可以投 0.5 元硬币和 1元硬币,投入 0.5 元后亮一个灯,投入 1元后亮…

从微软 Word 中提取数据

从 Microsoft Word 文档中提取数据可以通过编程来实现,有几种常见的方法,其中之一是使用 Python 和 python-docx 库。python-docx 是一个处理 .docx 文件(Microsoft Word 文档)的 Python 库,可以读取和操作 Word 文档的…

语雀平替,一款私有化功能丰富的开源知识库系统

背景介绍 现代企业面临的文档管理挑战日益严峻,包括信息冗余,存在多份数据,难以做到统一 ,文档数量激增,查找麻烦,知识的信息安全问题频发以及团队协作需求不断上升。同时,随着知识管理在企业运…

文章SameStr(二):图2代码

title: “Publication Figure 2” 百度云盘链接: https://pan.baidu.com/s/15g7caZp354zIWktpnWzWhQ 提取码: 4sh7 Libraries Standard Import library(tidyverse) library(cowplot) library(scales) library(ggpubr)Special library(lme4) library(sjPlot) library(sjst…

基于Java中的SSM框架实现学生网上请假系统项目【项目源码+论文说明】计算机毕业设计

摘要 本学生网上请假系统是针对目前学生网上请假系统的实际需求,从实际工作出发,对过去的学生网上请假系统存在的问题进行分析,结合计算机系统的结构、概念、模型、原理、方法,在计算机各种优势的情况下,采用目前最流…

数据结构与算法:顺序表和链表

目录 一、线性表 二、顺序表 三、链表 一、线性表 线性表( linear list )是n个具有相同特性的数据元素的有限序列。线性表是一种在实际中广泛使用的数据结构,常见的线性表:顺序表、链表、栈、队列、字符串... 线性表在逻辑上是线…

MyBatis框架学习笔记(一):MyBatis入门

1 MyBatis 介绍 1.1 官方文档 MyBatis 中文手册: (1)https://mybatis.org/mybatis-3/zh/index.html (2)https://mybatis.net.cn/ Maven 仓库: https://mvnrepository.com/ 仓库作用:需要…

(三)前端javascript中的数据结构之集合

集合的特点 1.无序 2.唯一性 3.不可重复 集合相对于前面几种数据结构,比较简单好理解,看看代码实现就能知道他的用法了 集合的创建 function MySet() {this.item {}; } MySet.prototype.has function (value) {return value in this.item; };//增 M…