1500字范文 > 机器学习：监督学习无监督学习强化学习

机器学习：监督学习无监督学习强化学习

时间：2019-12-20 23:18:42

相关推荐

机器学习：监督学习无监督学习强化学习

监督学习简单来说就是通过学习许多有标签的样本，然后对新的数据做出预测。

机器学习的两大任务：回归和分类。

在回归问题中，我们会预测一个连续值，比如说预测明天多少度，预测房价多少钱等等，而另一类问题是分类问题，比如给你一张图片，这是猫还是狗，这就是分类问题。分类问题的预测结果不是对就是错，而回归问题是对真实值的一种逼近预测，你的预测值与真实值差距越小则越好，不会存在绝对的对错概念，

比如预测房价，我们给出房价的真实价格数据，然后再给出相关的的影响因素数据，然后根据这些关系去训练出一个模型，用来预测房价。这个训练过程中数据是有标签的（就是在某一条件下的房价我们是已知的），这就是有监督学习。

比如分类图片，我们训练的时候每张图片都是有标签的，也就是这张图的所属类别我们是知道的，让模型去不断地训练和学习，最终得到一个好的结果，这就是有监督学习。

无监督学习的训练数据没有标签。

无监督学习可以从给定的数据中寻找隐藏的结构。比如我们给定肿瘤数据（肿瘤大小和年龄），但是不告诉它哪些是恶性肿瘤哪些是良性肿瘤，让他自己学习。无监督型算法会去寻找具有相同结构的数据，并把它们分类，最终识别出两类来。无监督学习算法的目标是以某种方式组织数据，然后找出数据中存在的内在结构。

强化学习强调如何基于环境而行动，以取得最大化的预期利益。他的本质是解决决策问题，即自动进行决策。它是这样工作的：机器被放在一个能让它通过反复试错来训练自己的环境中。机器从过去的经验中进行学习，并且尝试利用了解最透彻的知识作出精确的判断。

强化学习的例子：马尔可夫决策过程。

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。

机器学习：监督学习 无监督学习 强化学习