参考资料:python统计分析【托马斯】
1、灵敏度和特异度
灵敏度:也叫作效能。被检验正确识别出来的阳性结果(=病人中有疾病且检验结果是阳性的概率)。
特异度:被检验正确识别出来的阴性结果(=病人健康且检验结果是阴性的概率)。
阳性预测值(PPV):检验结果为阳性的病人中被正确诊断的比例。
阴性预测值(NPV):检验结果为阴性的病人中被正确诊断的比例。
我们经常用检验的灵敏度和特意度来判断检测结果是否改变了状态(比如疾病状态)存在的概率。
假阳性率α=Ⅰ类错误=1-特异度=FP/(FP+TN)
假阴性率β=Ⅱ类错误=1-灵敏度=FN/(TP+FN)
效能=灵敏度=1-β
阳性似然比=灵敏度/(1-特异度)
阴性似然比=(1-灵敏度)/特异度
2、ROC曲线
和灵敏度、特异度紧密相关的是受试者操作特征曲线(ROC)曲线。它是一个展示真阳性率(在纵轴)和假阳性率(在横轴)之间关系的图形。
举个例子:我们有两个不同的分布,比如一个是来自鸟的雷达信号,一个是来自飞机的雷达信号,我们必须为指示器确定一个截断值,将检测结果分配给分布一(鸟)或分布二(飞机)。我们能改变的唯一的参数就是截断值,那么问题来了:是否有最佳的截断值?
答案是肯定的:它就是ROC曲线上离对角线距离最大的那个点: