过拟合与欠拟合基础

本文最后更新于 7 个月前，文中所描述的信息可能已发生改变。

加载中... 浏览

模型效果不好，常见原因可以先从两个方向看：一个是学得太少，另一个是学得太死。

1. 欠拟合

欠拟合是模型没有学到数据中的规律。

表现通常是：

比如用一条直线去拟合明显弯曲的数据，模型太简单，表达能力不够。

欠拟合可能原因：

解决思路包括：

过拟合是模型把训练数据学得太死。

表现通常是：

模型不仅学到了规律，还学到了训练集里的噪声和偶然性。

可以理解为考试前把练习题答案背下来了，但换一套题就不会了。

过拟合可能原因：

解决思路包括：

机器学习真正关心的是泛化能力。

也就是模型面对没见过的数据时表现如何。

训练集表现好只是第一步，测试集表现稳定才更重要。

可以这样记：

判断模型问题时，不要只看一个分数，要同时看训练集和验证集、测试集表现。

加载评论中...