一个模型的好坏的评估基准可以从下面几个方面考虑:
1.考虑人类在这个问题上的表现
2.对比竞争算法的表现
3.根据经验猜测
判断是高偏差还是高方差
训练样本数量越多,越难完美地拟合每个样本,因此 J_train 会逐渐增大一点点,但泛化能力也逐渐增强;
高偏差的情况:
模型太简单了,再怎么加数据误差也差不多,假设以人类水平为基准,则J_train和基准之间差距较大,图像一直水平向右延伸,增加样本数量并不会有什么改变。
高方差的情况:
J_train可能会比人类的表现好一些,但 J_cv 仍远大于 J_train。这种情况下可以增加样本数量或许能使模型表现得更好。