过拟合与欠拟合基础

加载中... 浏览

模型效果不好,常见原因可以先从两个方向看: 一个是学得太少,另一个是学得太死。

1. 欠拟合

欠拟合是模型没有学到数据中的规律。

表现通常是:

  • 训练集效果差。
  • 测试集效果也差。

比如用一条直线去拟合明显弯曲的数据,模型太简单,表达能力不够。

欠拟合可能原因:

  • 模型太简单。
  • 特征太少。
  • 训练不足。
  • 数据中的规律没有被表达出来。

解决思路包括:

  • 增加有效特征。
  • 使用更复杂的模型。
  • 训练更充分。

2. 过拟合

过拟合是模型把训练数据学得太死。

表现通常是:

  • 训练集效果很好。
  • 测试集效果明显变差。

模型不仅学到了规律,还学到了训练集里的噪声和偶然性。

可以理解为考试前把练习题答案背下来了,但换一套题就不会了。

过拟合可能原因:

  • 模型太复杂。
  • 数据量太少。
  • 特征太多但质量不高。
  • 训练时间过长。

解决思路包括:

  • 增加数据。
  • 做正则化。
  • 简化模型。
  • 使用交叉验证。
  • 做特征选择。

3. 泛化能力

机器学习真正关心的是泛化能力。

也就是模型面对没见过的数据时表现如何。

训练集表现好只是第一步,测试集表现稳定才更重要。

4. 小结

可以这样记:

  • 欠拟合:没学会。
  • 过拟合:背答案。
  • 好模型:学到规律,并能用于新数据。

判断模型问题时,不要只看一个分数,要同时看训练集和验证集、测试集表现。

留言板

加载评论中...
浏览器进阶:彻底理解 DOM 事件体系
CSS 核心布局与样式手写实现专题
Valaxy v0.28.0-beta.1 驱动|主题-Yunv0.28.0-beta.1