小罗碎碎念
医学数据属于小样本,或许源于资源不对等
今天这篇推文,源于一场对话。
我和他(粉丝)聊完以后,觉得心里总是压了点什么东西,直到我写完那篇关于医学数据类别不平衡
的文章,我才大致理清了关系——医学数据属于小样本,或许源于资源不对等。
感谢这位粉丝的真诚,让这次对话给了我不小的冲击,也引发了我持续几日的思考,最后得出了结论——在时间来得及并且赛道很倦的情况下,不要急着出发,问题不重要时,答案根本不重要。一旦选择了工作,就会被各种琐事缠上,再回过头来想恶补之前落下的东西,对于自己是多么大的一场考验。你有那个毅力,为什么不用来做更有意义的事情。
“农村包围城市,从群众中来,到群众中去”,这个理念依然适用
上面那个结论其实只是一个副产品,我隐隐感觉到这背后其实藏着很大的机会——基层医疗数据的整合。
这个想法绝对有大佬很早之前就想到过,但是有能力的人没兴趣,有兴趣的人没能力。科技的进步,目的就是服务于尽可能多的人,试图用个人的努力推动一点社会的进步。当然了,就像很久之前能搞科研的,都是家里有矿的一样,这一切的前提都是保证自己完成既定任务——学生保证自己顺利毕业,老师保证一家人不愁温饱。
医院不缺病人,机构不缺数据,但是缺乏能整合病人&数据的方案。
很多数据出现了断层,硬件和软件不应该分开,而应该共同进步。目前智能穿戴设备
如此广泛,每天都能产生海量的数据;体检机构和医院人满为患,每天也都有海量的数据产出,如果能把这些关联起来,何尝不是一个新赛道?
康复机器人与养老机器人,也是一个值得布局的产业。从出身到成长,再到衰老,整个链路的数据收集起来,难道就没有办法从中寻找到一些规律?
受限于地域与医生的水平,基层医院做的检查可能没有大医院准确,但是他们的数据用来做模型的初步训练也未尝不可。随着数据量大增大,模型肯定会越来越准确。还有,部分患者因为经济上存在压力,总是疾病恶化了才去大医院,这其实是在变相增加治疗的难度。如果我们可以开发出实用的算法或产品,能让这些患者更早得到诊断,能在当地就得到治疗,那能节省多少公众资源?
资源分配问题,其实是利益分配问题。
临床上收集数据有多么不容易,我是清楚的,一篇顶刊,光临床数据就需要收集数年。现在大家都知道临床数据很宝贵,所以很多人都捂着,其实没必要。
我现在没有能力,但是我希望能有人牵头建立一个平台,这个平台类似购物平台一样,数据作为商品,但是所有权不属于平台,而是收集这批数据的课题组。当然了,有人会担心这批数据可能给出去就是一次性的,我只能说这凭你自愿。你可以私聊,把数据给对方,也可以把数据上传平台,对方通过平台调用你的数据进行训练,但是拿不到实际数据,只能拿到最后的结果。当然了,平台需要专门的质检部门
,对数据进行筛选,对质量进行把关。放心,套路都是一样的,只不过是流程化批量操作而已。(我现在是没能力,如果有幸能在毕业前发几篇高分论文,我一定会在小范围内试点尝试一下)
这样做还有一个好处,能一定程度打破资源分配不对等的现象——现在多中心数据的获取,基本都是靠自己或老板的人脉——这样获取有点慢了,并且那些基层医院的医生,可能根本就没有机会认识这一类人,更别提获取数据了。就算是获取到数据了,也很难匹配上同方向的工科课题组。所以,迫切需要一个这样的平台来阻止这种资源浪费,为更多有能力的人提供一个舞台。
任重而道远,脑海中想法很多,想做的事也很多。理性逼着我专注当下,但是不影响我规划未来。感谢你能看到这里,我的想法肯定有很多不成熟的地方,欢迎批评指正。我是罗小罗同学,明天见!!