本章介绍了一些机器学习中用到的基础知识
误差的分类: 训练集产生的误差是训练误差 测试集产生的是测试误差 在新样本上的误差称为泛化误差
过拟合与欠拟合 在过拟合问题中,训练误差十分小,但测试误差教大;在欠拟合问题中,训练误差和测试误差都比较大。
过拟合将训练集中的自身特点以为成了普通特征,甚至普通特征没有学习出来,导致学习器出现泛化能力差的情况
[<https://camo.githubusercontent.com/4a2f66579a44d926c7bf7d21500611fa1de151b92bacfb1b1f1802fc55d3bed3/68747470733a2f2f692e6c6f6c692e6e65742f323031382f31302f31372f356263373138313137323939362e706e67>](<https://camo.githubusercontent.com/4a2f66579a44d926c7bf7d21500611fa1de151b92bacfb1b1f1802fc55d3bed3/68747470733a2f2f692e6c6f6c692e6e65742f323031382f31302f31372f356263373138313137323939362e706e67>)
记录各种测试集和训练集的划分方法
优点:快,简单