<aside>
💡 这张有点看不懂,做个大概的了解先~
</aside>
本章内容围绕比较检验,方差和偏差展开
比较检验
比较检验可以检验测试的错误率和繁华错误率是否分布相差太远,也可以比较两个学习器的性能。比较检验使用了统计学中的假设检验方法,进行定量处理不同分布之间的关系。
偏差和方差
- 定义:偏差指的是预测的期望值和真实值的偏差,方差指的是训练中每次的预测值和预测值的期望值之间的查军方。
- 偏差体现了学习器预测的准确度,方差体现了学习器预测的稳定性。
- 期望的泛化误差= 方差 + 偏差
- 随着训练程度的提升,期望预测值与真实值之间的差异越来越小,即偏差越来越小,但是另一方面,随着训练程度加大,学习算法对数据集的波动越来越敏感,方差值越来越大。换句话说:在欠拟合时,偏差主导泛化误差,而训练到一定程度后,偏差越来越小,方差主导了泛化误差。因此训练也不要贪杯,适度辄止。