有没有想过如何提高分类模型的可靠性?
在现实生活中,许多决策都依赖于分类模型。例如在医疗诊断中,一个模型可能用于预测一个肿瘤是良性还是恶性的。但是这些模型有时会给出不准确的概率估计。
考虑一个场景,医生使用一个模型来预测肿瘤性质。假设有以下模拟数据:
患者ID | 年龄 | 肿瘤大小 | 细胞不规则性 | 预测结果(良/恶) |
---|---|---|---|---|
1 | 45 | 3.5 | 7 | 良 |
2 | 50 | 2.1 | 4 | 良 |
3 | 60 | 4.0 | 10 | 恶 |
4 | 35 | 1.2 | 2 | 良 |
5 | 40 | 3.0 | 5 | 良 |
… | … | … | … | … |
问题在于这个模型可能给出的预测概率并不总是可靠的。这就是CalibratedClassifierCV
派上用场的地方。
文章目录
- CalibratedClassifierCV
- sklearn 实现
- Sklearn API参数详解与调参</