2024年中国医疗领域AI Models Overview

1. 神农(ShenNong-TCM) (2023-06-25)

  • Code: ShenNong-TCM-LM
  • 基座模型: Chinese-Alpaca-Plus-7B
  • 数据:
    • 以开源的中医药知识图谱为基础
    • 调用 ChatGPT 得到 1Iw+的围绕中医药的指令数据
  • Model:
    • Chinese-Alpaca-Plus-7B
    • Dataset: ShenNong_TCM Dataset, 中医药指令数据集 ShenNong_TCM_Dataset
  • Performance: 专有预测大学
  • 院校: 华东师范大学

2. 孙思邈(Sunsimiao) (2023-06-21)

  • Code: Sunsimiao
  • License: Apache 2.0
  • 基座模型:
    • Sunsimiao: baichuan-7B
    • Sunsimiao-6B: ChatGLM2-6B
  • 数据:
    • 十万级高质量的中文医疗数据
  • Performance:
    • 千万级百科的中文医疗知识
    • 专有医学大语料的自然语言理解
  • 院校: 华东理工大学信息科学与工程学院
  • Paper: https://arxiv.org/abs/2306.09968

3. ClinicalGPT (2023-06-16)

  • 基座模型: BLOOM-7B
  • 数据:
    • cMedQA2 (120K: 10K RM + 4K RL)
    • cMedQA-KG (100K)
    • MD-EHR (100K)
    • MEDQA-MCMLE (34K)
    • MedDialog (100K)
  • Model:
    • BLOOM-7B
  • Performance: 医疗信息检索
  • 院校: 北京邮电大学

4. MedicalGPT (2023-06-05)

  • Code: MedicalGPT
  • License: Apache 2.0
  • 基座模型: Ziya-LLaMA-13B-v1 等
  • 数据:
    1. 医疗数据集: 240 万条中文医疗数据集(包括预训练、指令微调和奖励数据集):shibing624/medical
    2. 22 万条中文医疗对话数据集(华佗项目):FreedomIntelligence/HuatuoGPT-sft-data-v1
    3. 50 万条中文 ChatGPT 指令 Belle 数据集:BelleGroup/train_0.5M_CN
    4. 100 万条中文 ChatGPT 指令 Belle 数据集:BelleGroup/train_1M_CN
    5. 5 万条英文 ChatGPT 指令 Alpaca 数据集:50k English Stanford Alpaca dataset
    6. 2 万条中文 ChatGPT 指令 Alpaca 数据集:shibing624/alpaca-zh
    7. 69 万条中文指令 Guanaco 数据集(Belle50 万条+Guanaco19 万条):Chinese-Vicuna/guanaco_belle_merge_v1.0
  • 通用数据: 8. 5 万条英文 ChatGPT 多轮对话数据集:RyokoAI/ShareGPT52K 9. 80 万条中文 ChatGPT 多轮对话数据集:BelleGroup/multiturn_chat_0.8M 10. 116 万条中文 ChatGPT 多轮对话数据集:fnlp/moss-002-sft-data
  • 通用数据: 8. 5 万条英文 ChatGPT 多轮对话数据集:RyokoAI/ShareGPT52K 9. 80 万条中文 ChatGPT 多轮对话数据集:BelleGroup/multiturn_chat_0.8M 10. 116 万条中文 ChatGPT 多轮对话数据集:fnlp/moss-002-sft-data
  • Reward Model datasets: 11. 原版的 oasst1 数据集:OpenAssistant/oasst1 12. 2 万条多语言 oasst1 的 reward 数据集:tasksource/oasst1_pairwise_rlhf_reward 13. 11 万条英文 hh-rlhf 的 reward 数据集:Dahoas/full-hh-rlhf 14. 9 万条英文 reward 数据集(来自 Anthropic’s Helpful Harmless dataset): Dahoas/static-hh 15. 7 万条英文 reward 数据集(来源同上):Dahoas/rm-static 16. 7 万条繁体中文的 reward 数据集(翻译自 rm-static): liswei/rm-static-m2m100-zh 17. 7 万条英文 Reward 数据集:yitingxie/rlhf-reward-datasets 18. 3 千条中文知乎问答偏好数据集:liyucheng/zhihu_rlhf_3k
  • 作者: 徐明

5. 华佗 GPT (HuaTuoGPT) (2023-05-24)

  • Papser: arXiv:2305.15075
  • Code: HuatuoGPT
  • License: Apache 2.0
  • 基座模型: BLOOMZ-7bl
  • 数据:
    1. 用 ChatGPT 构成的指令数据集 (61K)
    2. 真实的医生指令集 (70K)
    3. ChatGPT 角色扮演医患对话数据集 (68K)
    4. 真实的医患对话数据集 (26K)
  • 算力: 8×NVIDIA A100 GPUs, 3 epochs, 16000 steps
  • 院校: 香港中文大学(深圳)

6. XrayGLM (2023-05-23)

  • Code: XrayGLM
  • License: CC BY-NC-SA 4.0
  • 基座模型: VisualGLM-6B
  • 数据:
    1. MIMIC-CXR (377K Image + 227K Report)
    2. OpenI (6459 Image + 3955 Report)
  • 算力: 4×NVIDIA A100 GPUs 80GB
  • 院校: 澳门理工大学应用科学学院

7. 启真医学大模型 (QiZhenGPT) (2023-05-23)

  • Code: QiZhenGPT
  • License: GPL-3.0
  • 基座模型:
    • ChatGLM-6B
    • CaMA-13B
    • Chinese-LLaMA-Plus-7B
  • 数据:
    • 真实医患知识问答数据集
    • 药品适应症评测数据集
  • 算力: 7×NVIDIA A800 GPU 80GB
    • ChatGLM-6B, 16h20m (2500)
    • CaMA-13B, 54h30m (6000) / 114h46m (12400)
    • Chinese-LLaMA-Plus-7B, 40h56m (6000)
  • 院校: 浙江大学
  • Paper: arXiv:2305.00450

8. MeChat (2023-04-30)

  • Code: Smile
  • License: CC0-1.0
  • Model: MeChat
  • 基座模型: ChatGLM-6B
  • 微调方式: LoRA
  • 数据:
    • PsyQA
  • 院校: 西湖大学 & 浙江大学
  • Paper: arXiv:2304.14454

9. PMC-LLaMA (2023-04-27)

  • Code: PMC-LLaMA
  • 基座模型: LLaMA-13B
  • 数据:
    • PubmedCentral papers (4.8M)
  • 院校: 上海交通大学未来媒体网络协同创新中心

10. ChatDoctor (2023-03-24)

  • Paper: arXiv:2303.14070
  • Code: ChatDoctor
  • License: Apache 2.0
  • 基座模型: LLaMA-7B
  • 数据:
    • HealthCareMagic-100k
    • icliniq-10k
    • GenMedGPT-5k
    • disease database
  • 算力: 6×NVIDIA A100 GPUs, 18h, batch size 192, 3 epochs
  • 院校:
    • Department of Radiation Oncology, University of Texas Southwestern Medical Center, Dallas, USA
    • Department of Computer Science, University of Illinois at Urbana-Champaign, Illinois, USA
    • Department of Computer Science and Engineering, The Ohio State University, Columbus, USA
    • 杭州电子科技大学计算机学院

11. DoctorGLM (2023-04-03)

  • Paper: arXiv:2304.01097
  • Code: DoctorGLM
  • 基座模型: THUDM/chatglm-6b
  • 数据:
    • Surgical (116K)
    • Obstetrics and Gynecology (229K)
    • CMD
    • Pediatrics (117K)
    • Internal Medicine (307K)
    • Andriatria (113K)
    • MedDialog (3.4M)
    • ChatDoctor (5.4K)
    • HealthCareMagic (200K)
  • 算力: 1×NVIDIA A100 GPU 80GB, 13h
  • 院校:
    • 上海科技大学
    • 上海交通大学
    • 复旦大学华山医院

12. MedicalGPT-zh (2023-04-08)

  • Code: MedicalGPT-zh
  • License: Apache 2.0
  • 基座模型: ChatGLM-6B
  • 数据:
    • 情景对话 (52K)
    • 28 科室的中文医疗共识与临床指南文本
    • 知识问答 (130K)
  • 算力: 4× NVIDIA 3090 GPUs
  • 院校: 上海交通大学未来媒体网络协同创新中心

13. Chinese-Vicuna-Medical (2023-04-11)

  • Code: Chinese-Vicuna-Medical
  • License: Apache 2.0
  • 基座模型: Chinese-Vicuna-7B
  • 数据:
    • cMedQA2
  • 算力: 70w of data, 3 epochs, a 2080Ti about 200h
  • 原名: 华佗(HuaTuo)
  • Paper: arXiv:2304.06975
  • Code: Huatuo-Llama-Med-Chinese

14. 本草(BenTsao) (2023-04-14)

  • Paper: arXiv:2304.06975
  • Code: BenTsao
  • License: Apache 2.0
  • 基座模型:
    • LLaMA-7B
    • Chinese-LLaMA-Alpaca
    • ChatGLM-6B
  • 数据:
    • 公开和自建的中文医学知识库,主要参考了 cMeKG
    • 2023 年关于肝癌疾病的中文医学文献
    • 利用 GPT3.5 接口围绕医学文献多轮问答数据
  • 算力: A100-SXM-80GB, 10 epochs, 2h17m, batch_size=128
  • 院校: 哈尔滨工业大学社会计算与信息检索研究中心健康智能组

15. OpenBioMed (2023-04-17)

  • Paper: arXiv:2305.01523
  • Code: OpenBioMed
  • License: MIT
  • 模型: BioMedGPT-1.6B
  • 数据: DeepDTA
  • 院校: 清华大学计算机系

16. ChatMed (2023-04-19)

  • Code: ChatMed
  • License: Apache 2.0
  • 基座模型: LLaMA-7B + Chinese-LLaMA-Alpaca
  • 数据:
    • 中文医疗在线问诊数据集
    • 中医药指令数据集 ChatMed_TCM_Dataset
    • 中医药知识图谱
    • ChatGPT 得到 1Iw+的围绕中医药的指令数据
  • 算力: 4 × NVIDIA 3090 GPUs
  • 院校: 华东师范大学

17. 扁鹊(BianQue) (2023-04-22)

  • Code: BianQue
  • 基座模型:
    • V1:元语智能
    • V2: ChatGLM-6B
  • 数据:
    • 中文医疗问答指令与多轮问询对话混合数据集包含了超过 900 万条样本
    • 扩充了药品说明书指令
    • 医学百科知识指令
    • ChatGPT 蒸馏指令等数据
    • MedDialog-CN
    • 健康大数据 BianQueCorpus
    • IMCS-V2
    • CHIP-MDCFNPC
    • MedDG
    • cMedQA2
    • Chinese-medical-dialogue-data
  • 算力: 8 张 NVIDIA RTX 4090 显卡上微调了 1 个 epoch, 大约 16 天
  • 院校: 华南理工大学未来技术学院

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/780815.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

汇总:五个开源的Three.js项目

Three.js 是一个基于 WebGL 的 JavaScript 库,它提供了一套易于使用的 API 用来在浏览器中创建和显示 3D 图形。通过抽象和简化 WebGL 的复杂性,Three.js 使开发者无需深入了解 WebGL 的详细技术就能够轻松构建和渲染3D场景、模型、动画、粒子系统等。 T…

K8S基本概念+pod生命周期+容器重启策略+Init容器和边车容器+pod探针+postStart和preStop

一 kubernetes 基础 Kubernetes是谷歌以Borg为前身,基于谷歌15年生产环境经验的基础上开源的一个项目,Kubernetes致力于提供跨主机集群的自动部署、扩展、高可用以及运行应用程序容器的平台。 二 Master 节点 kube-APIServer:集群的控制中…

Java数据结构-双向不带头非循环链表(模拟实现LinkedList)

目录 1. 双向不带头非循环链表的介绍2. 相关功能的实现2.1 基本框架2.2 size2.3 addFirst2.4 addLast2.5 addIndex2.6 contains2.7 remove2.8 removeAllKey2.9 clear 3. 全部代码 前面我们学习了最简单的链表:单链表,今天我们学习双向不带头非循环链表&a…

分布式图床项目

一、图床架构分析 二、后台数据处理框架 秒传: 如果上传的文件已经在服务器中存在了,就不需要二次上传了,但是服务器会对这个文件的引用计数加一,这样服务器就知道这个文件是多个人持有的。先对上传的文件进行 md5 校验来判断服务器中已经存在相同的文件了(同样的文件拿到…

OpenHarmony无人机MAVSDK开源库适配方案分享

MAVSDK 是 PX4 开源团队贡献的基于 MavLink 通信协议的用于无人机应用开发的 SDK,支持多种语言如 C/C、python、Java 等。通常用于无人机间、地面站与通信设备的消息传输。 MAVLink 是一种非常轻量级的消息传递协议,用于与无人机(以及机载无…

[flink 实时流基础]源算子和转换算子

文章目录 1. 源算子 Source1. 从集合读2. 从文件读取3. 从 socket 读取4. 从 kafka 读取5. 从数据生成器读取数据 2. 转换算子基本转换算子(map/ filter/ flatMap) 1. 源算子 Source Flink可以从各种来源获取数据,然后构建DataStream进行转换…

【MySQL】mysql数据库小功能整理,持续更新~

目录 1、把从数据库中查询出的两个字段拼接 2、自定义新字段 1、把从数据库中查询出的两个字段拼接 在ThinkPHP中使用 field 查询数据库字段时,使用数据库自带的CONCAT函数使两个字段拼接成一个新的自定义字段。 示例: 有两个字段 number 和 filenam…

Day55:WEB攻防-XSS跨站CSP策略HttpOnly属性Filter过滤器标签闭合事件触发

目录 XSS跨站-安全防御-CSP XSS跨站-安全防御-HttpOnly XSS跨站-安全防御-XSSFilter(过滤器的意思) 1、无任何过滤 2、实体化 输入框没有 3、全部实体化 利用标签事件 单引号闭合 4、全部实体化 利用标签事件 双引号闭合 5、事件关键字过滤 利用其他标签调用 双引号闭合…

代码随想录训练营第60天 | LeetCode 84.柱状图中最大的矩形、总结

LeetCode 84.柱状图中最大的矩形 文章讲解:代码随想录(programmercarl.com) 视频讲解:单调栈,又一次经典来袭! LeetCode:84.柱状图中最大的矩形_哔哩哔哩_bilibili 思路 代码如下: ​​​​​​总结 感…

代码随想录|Day28|贪心03|1005.K次取反后最大化的数组和、134.加油站、135.分发糖果

1005.K次取反后最大化的数组和 思路: 优先取反 绝对值最大的负数如果没有负数,不断取反 绝对值最小的数,直到次数 K 耗尽 取反最小数有一个优化技巧: 如果 K 为偶数,则取反 K 次后,正负不变。如果 K 为奇数…

聊聊java中的CountDownLatch,CyclicBarrier,Semaphore

CountDownLatch(倒计时器) 是什么: CountDownLatch是Java中的一个同步工具类,它允许一个或多个线程等待其他线程完成操作。 使用场景: 当一个线程需要等待多个其他线程执行完毕后才能继续执行时,可以使用…

ROM-IP

1.原理 通过添加数据文件,使ROM看起来不是易失性存储器, 产生256个数据,每个数据的位宽是8 如果前面为x,后面就是x256-1 2.单端口ROM配置 FPGA内部没有非易失性存储器。调用的ROM和RAM都是用RAM来生成的 3.双端口ROM配置 使用第一…

大学 Python 程序设计实验报告:判断密码是否符合要求

目录: 利用 string 模块判断使用正则表达式判断 密码强度判断,输入一个密码,判断密码是否符合要求。 要求密码长度8-12位,密码中必须包含大写字母、小写字母和数字,不能含有其他符号。 如果符合要求输出"密码符合…

Dubbo 几种方式来传递和使用隐式参数

在 Dubbo 中,隐式参数通常指的是那些不直接作为 RPC 方法参数传递,但需要在 RPC 调用过程中共享或传递的信息。这些信息可能包括用户身份、请求标识、认证令牌等。Dubbo 提供了几种方式来传递和使用这些隐式参数。 以下是使用 Dubbo 隐式参数的一些常见…

马斯克旗下xAI发布Grok-1.5,相比较开源的Grok-1,各项性能大幅提升,接近GPT-4!

本文原文来自DataLearnerAI官方网站:马斯克旗下xAI发布Grok-1.5,相比较开源的Grok-1,各项性能大幅提升,接近GPT-4! | 数据学习者官方网站(Datalearner) 继Grok-1开源之后,xAI宣布了Grok-1.5的内测消息&…

C#热门技术应用:跨平台、异步编程与云原生

C#热门技术应用:跨平台、异步编程与云原生 C#,作为微软主导的编程语言,近年来在跨平台应用开发、异步编程以及云原生应用等领域展现出了强大的生命力。这些热门技术的应用,使得C#成为了现代软件开发中不可或缺的一部分。 一、跨平…

手撕算法-跳跃游戏

描述 分析 如果某一个作为 起跳点 的格子可以跳跃的距离是 3,那么表示后面 3 个格子都可以作为 起跳点可以对每一个能作为 起跳点 的格子都尝试跳一次,把 能跳到最远的距离 不断更新如果可以一直跳到最后,就成功了 代码 class Solution {…

07-JavaScript DOM事件

1. 事件 1.1 事件概述 JavaScript 使我们有能力创建动态页面,而事件是可以被 JavaScript 侦测到的行为。 简单理解: 触发--- 响应机制。 网页中的每个元素都可以产生某些可以触发 JavaScript 的事件,例如,我们可以在用户点击某…

【漏洞潜在风险】弹框干扰类风险

弹框干扰风险定义: 游戏过程中,客户端经常会以文字类形式对玩家进行说明和指引,而对于一些更为重要的信息,便会用游戏中的弹框进行强调。由玩家主动触发对其他玩家造成重复弹框进而干扰到正常游戏的都可以称之为弹框干扰类风险。弹框干扰风险…

C++项目——集群聊天服务器项目(六)MySQL模块

Hello,大家好啊,最近比较忙,没来得及更新项目,实在抱歉~今天就恢复更新拉~ 在验证完网络模块与业务模块代码可以正常使用后,需完成的操作是与底层数据库进行交互,为实现各类用户查询、增删业务奠定良好的基…