机器学习基础:模型在学习什么

本文最后更新于 6 个月前,文中所描述的信息可能已发生改变。
加载中... 浏览

机器学习里的“学习”不是像人一样理解世界。 更准确地说,模型是在数据中寻找输入和输出之间的规律。

1. 模型是什么

可以把模型理解成一个函数:

txt
输入特征 -> 模型 -> 输出结果

比如房价预测:

txt
面积、位置、楼层、年份 -> 模型 -> 房价

模型要学习的是这些特征和房价之间的关系。

2. 学习的过程

训练模型通常需要历史数据。

数据里包含:

  • 输入特征。
  • 正确答案。

模型先根据当前参数做预测,再把预测结果和真实答案比较,得到误差。

然后算法会调整参数,让误差尽量变小。

这个过程可以理解为:

txt
预测 -> 计算误差 -> 调整参数 -> 再预测

重复很多次后,模型逐渐拟合数据规律。

3. 特征很重要

模型不是凭空学习。

它能看到什么,取决于我们给它什么特征。

比如预测用户是否流失,如果只给用户昵称,意义不大;如果给最近登录时间、消费次数、使用频率,模型才可能学到有效规律。

所以机器学习里常说:

数据和特征决定了模型效果的上限。

4. 模型不是万能的

模型学到的是历史数据中的模式。

如果历史数据有偏差,模型也会学到偏差。

如果未来环境变化很大,过去的规律可能失效。

所以模型预测不是绝对真理,而是基于已有数据的概率判断。

5. 小结

机器学习可以先这样理解:

  • 模型是从输入到输出的映射。
  • 训练是不断减少预测误差。
  • 特征决定模型能看到的信息。
  • 模型学到的是数据规律,不是常识本身。

学习机器学习时,不要一开始就被公式吓住。先理解“模型到底在根据什么做判断”,后面的算法才更容易学。

留言板

加载评论中...
模型评估基础:准确率、召回率与 F1
数据挖掘基础(三):关联规则
Valaxy v0.28.0-beta.1 驱动|主题-Yunv0.28.0-beta.1