本文最后更新于 6 个月前,文中所描述的信息可能已发生改变。加载中... 浏览
机器学习里的“学习”不是像人一样理解世界。 更准确地说,模型是在数据中寻找输入和输出之间的规律。
1. 模型是什么
可以把模型理解成一个函数:
txt
输入特征 -> 模型 -> 输出结果比如房价预测:
txt
面积、位置、楼层、年份 -> 模型 -> 房价模型要学习的是这些特征和房价之间的关系。
2. 学习的过程
训练模型通常需要历史数据。
数据里包含:
- 输入特征。
- 正确答案。
模型先根据当前参数做预测,再把预测结果和真实答案比较,得到误差。
然后算法会调整参数,让误差尽量变小。
这个过程可以理解为:
txt
预测 -> 计算误差 -> 调整参数 -> 再预测重复很多次后,模型逐渐拟合数据规律。
3. 特征很重要
模型不是凭空学习。
它能看到什么,取决于我们给它什么特征。
比如预测用户是否流失,如果只给用户昵称,意义不大;如果给最近登录时间、消费次数、使用频率,模型才可能学到有效规律。
所以机器学习里常说:
数据和特征决定了模型效果的上限。
4. 模型不是万能的
模型学到的是历史数据中的模式。
如果历史数据有偏差,模型也会学到偏差。
如果未来环境变化很大,过去的规律可能失效。
所以模型预测不是绝对真理,而是基于已有数据的概率判断。
5. 小结
机器学习可以先这样理解:
- 模型是从输入到输出的映射。
- 训练是不断减少预测误差。
- 特征决定模型能看到的信息。
- 模型学到的是数据规律,不是常识本身。
学习机器学习时,不要一开始就被公式吓住。先理解“模型到底在根据什么做判断”,后面的算法才更容易学。
留言板