1500字范文,内容丰富有趣,写作好帮手!
1500字范文 > 机器学习:监督学习 无监督学习 强化学习

机器学习:监督学习 无监督学习 强化学习

时间:2019-12-20 23:18:42

相关推荐

机器学习:监督学习 无监督学习 强化学习

监督学习

监督学习简单来说就是通过学习许多有标签的样本,然后对新的数据做出预测。

机器学习的两大任务:回归和分类。

在回归问题中,我们会预测一个连续值,比如说预测明天多少度,预测房价多少钱等等,而另一类问题是分类问题,比如给你一张图片,这是猫还是狗,这就是分类问题。分类问题的预测结果不是对就是错,而回归问题是对真实值的一种逼近预测,你的预测值与真实值差距越小则越好,不会存在绝对的对错概念,

比如预测房价,我们给出房价的真实价格数据,然后再给出相关的的影响因素数据,然后根据这些关系去训练出一个模型,用来预测房价。这个训练过程中数据是有标签的(就是在某一条件下的房价我们是已知的),这就是有监督学习。

比如分类图片,我们训练的时候每张图片都是有标签的,也就是这张图的所属类别我们是知道的,让模型去不断地训练和学习,最终得到一个好的结果,这就是有监督学习。

无监督学习

无监督学习的训练数据没有标签

无监督学习可以从给定的数据中寻找隐藏的结构。比如我们给定肿瘤数据(肿瘤大小和年龄),但是不告诉它哪些是恶性肿瘤哪些是良性肿瘤,让他自己学习。无监督型算法会去寻找具有相同结构的数据,并把它们分类,最终识别出两类来。无监督学习算法的目标是以某种方式组织数据,然后找出数据中存在的内在结构。

强化学习

强化学习强调如何基于环境而行动,以取得最大化的预期利益。他的本质是解决决策问题,即自动进行决策。它是这样工作的:机器被放在一个能让它通过反复试错来训练自己的环境中。机器从过去的经验中进行学习,并且尝试利用了解最透彻的知识作出精确的判断。

强化学习的例子:马尔可夫决策过程。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。