机器学习基础：模型在学习什么

本文最后更新于 8 个月前，文中所描述的信息可能已发生改变。

加载中... 浏览

机器学习里的“学习”不是像人一样理解世界。更准确地说，模型是在数据中寻找输入和输出之间的规律。

1. 模型是什么

可以把模型理解成一个函数：

txt

输入特征 -> 模型 -> 输出结果

比如房价预测：

txt

面积、位置、楼层、年份 -> 模型 -> 房价

模型要学习的是这些特征和房价之间的关系。

训练模型通常需要历史数据。

数据里包含：

模型先根据当前参数做预测，再把预测结果和真实答案比较，得到误差。

然后算法会调整参数，让误差尽量变小。

这个过程可以理解为：

txt

预测 -> 计算误差 -> 调整参数 -> 再预测

重复很多次后，模型逐渐拟合数据规律。

模型不是凭空学习。

它能看到什么，取决于我们给它什么特征。

比如预测用户是否流失，如果只给用户昵称，意义不大；如果给最近登录时间、消费次数、使用频率，模型才可能学到有效规律。

所以机器学习里常说：

数据和特征决定了模型效果的上限。

模型学到的是历史数据中的模式。

如果历史数据有偏差，模型也会学到偏差。

如果未来环境变化很大，过去的规律可能失效。

所以模型预测不是绝对真理，而是基于已有数据的概率判断。

机器学习可以先这样理解：

学习机器学习时，不要一开始就被公式吓住。先理解“模型到底在根据什么做判断”，后面的算法才更容易学。

加载评论中...