AI辅助医学统计分析APP
医学统计分析的困难点在于开始阶段分析的规划和得出分析结果之后分析结果的解释,前者之所以困难是因为分析方法繁多又有不同的使用条件,后者则是因为结果中术语较多,且各种分析方法术语又有不同,非统计专业认识难以掌握。而AI的特点就是知识丰富,正好适合处理以上两个医学统计中的困难点,所以如果统计分析过程中能够使用AI进行辅助,将会是再好不过。
AI辅助统计分析的两种形式
这里不是完全依赖AI进行统计分析,而是进行AI辅助,是因为AI本身在结果的准确性和重复性方面都有待提高和完善,还不适合统计分析这种对结果准确性要求较高的工作,结果的指标也不可控。
如果想实现AI辅助统计分析,目前的做法有两种,一种是让LLM大模型生成数据分析所需要的代码,然后执行代码,获得统计分析的结果,典型的例子是豆包的数据分析模块,这种方法的特点是,功能丰富,但是技术难度大;另外一种,就是这里用到的,将可以进行医学统计分析的Python库(pingouin)构建成API,然后通过百度千帆平台将API服务接入到LLM模型中,通过LLM解析用户的意图,解释分析的结果,但是统计分析的结果是API产生的,这种方式技术门槛低,功能没有那么全面,适合小型的项目。
APP功能介绍和说明
目前的APP可以处理重复测量的方差分析类,普通的方差分析类和t检验类等三类数据分析,除了主要的分析方法,还包括分析前的正态性检验、方差齐性检验、球形检验和分析后的两两比较、power计算等分析方法,也设计了分析规划和分析报告等两个功能。
这里采用的是数据为基础的分析方式,通过数据来判断进行什么样的检验,通过数据来判断检验的效能等,。所有的分析都是以提供json格式的模拟数据或者真实数据开始的,提供数据之后,1. 可以要求进行特定的分析或者做出分析的规划,其中的特定分析是通过关键词来触发的,比如在输入框内输入”球形检验“可以触发重复测量方差分析中的球形检验API;2. 得到特定分析结果之后,可以要求将分析结果整理成表格或者形成分析报告,但是目前不支持一次性进行多个分析步骤(这一点还有待改进)。3. 还是有一定的不完善的地方,比如有时候没有要求进行分析步骤规划,却给出了分析步骤的规划,可能是promot撰写不够完善导致的。
APP访问地址:1. 可以通过百度的链接访问:「AI医学统计」:https://appbuilder.baidu.com/s/aAI5O8cA;2. 也可以通过部署的streamlit链接来访问https://ai-assistant-medical-stats.streamlit.app/,各有优缺点,前者速度更快一些,显示功能也更佳(不同的输出有不同的形式),后者的有点是可以集成更多模块,部署也可以个性化,后续将部署在我自己的平台appmatrix上(app.clinicalmodelmatrix.com, 这个平台上目前开通免费账号:test(密码tset),展示了部分APP)。两种途径是访问的是同一个APP,streamlit平台仅仅是引用了百度平台的API。
待完成的规划
目前的APP仅具备了对连续性变量的分析,而医学统计中还包括离散性变量分析,比如卡方检验等,还包括回归分析等,需要进一步完善。可能遇到的问题是,检验方法多了之后,APP在检验方法的选择上会不会出现混淆等,需要在实践过程中进行探索。也欢迎大家多提宝贵意见。
总结
初步体会LLM+API构成的APP在医学统计方面的应用,良好的感觉是LLM对统计规划和统计结果解释方面,算是比较专业,但是也感觉LLM不是很好控制,有些要求并不能完全按照想象中的样子来实现。总体来说,目前的APP已经能体现AI辅助的概念,在分析步骤规划和分析结果解释等环节有不错的表现,弥补一般人在统计分析知识储备上的不足,但是还有进一步完善的空间。
LLM+API这种形式不仅仅可以用在医学统计领域,可以算是一种新型的APP,也以用于完成其它的任务,这种形式的GUI是LLM的对话框,通过对话框来实现用户和机器之间的交流。
本账号专注于医学类streamlit,shiny ,gradio等可视化以及新形式的APP的制作和部署研究,包括各种APP构建和部署咨询,代码的分享,欢迎联系咨询。