1500字范文,内容丰富有趣,写作好帮手!
1500字范文 > 机器学习之道学习笔记

机器学习之道学习笔记

时间:2021-01-19 18:49:05

相关推荐

机器学习之道学习笔记

1. 机器学习简介

机器学习是一门多学科交叉专业,涵盖概率论知识,统计学知识,近似理论知识和复杂算法知识,使用计算机作为工具并致力于真实实时的模拟人类学习方式,并将现有内容进行知识结构划分来有效提高学习效率。

机器学习有下面几种定义:

(1)机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能。

(2)机器学习是对能通过经验自动改进的计算机算法的研究。

(3)机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。

2. 基本思想

K 折交叉验证:将数据 D 划分为 k 个大小相等的互斥子集;然后用其中的 k-1 个子集作为训练集,余下的那个子集作为测试集;这样就可以得到 k 组训练集/测试集,这样就可以进行 k 次训练和测试,最终返回的是这 k 个测试结果的平均值。

留一法:k 折交叉验证的一种特例,每次取一个样本作为测试集,其余的样本组成的集合作为训练集,训练和测试的次数等于样本的个数。

3. 大数据环境下的机器学习现状

随着大数据时代各行业对数据分析需求的持续增加,通过机器学习高效地获取知识,已逐渐成为当今机器学习技术发展的主要推动力。大数据时代的机器学习更强调“学习本身是手段"机器学习成为一种支持和服务技术。如何基于机器学习对复杂多样的数据进行深层次的分析,更高效地利用信息成为当前大数据环境下机器学习研究的主要方向。所以,机器学习越来越朝着智能数据分析的方向发展,并已成为智能数据分析技术的一个重要源泉。另外,在大数据时代,随着数据产生速度的持续加快,数据的体量有了前所未有的增长,而需要分析的新的数据种类也在不断涌现,如文本的理解、文本情感的分析、图像的检索和理解、图形和网络数据的分析等。使得大数据机器学习和数据挖掘等智能计算技术在大数据智能化分析处理应用中具有极其重要的作用。

4. 总结

总结一下,机器学习最适合的应用场景是什么样的呢?首先是允许一定的错误,而且是那种不完全可控的错误;同时问题本身又复杂得难以直接总结出好的规则,那我们就可以考虑使用机器学习了。例如搜索和推荐这两个常见的问题,出错时并不会有啥大问题(推荐错了一个商品并不是啥大事),只要整体推荐的准确率能提高,那就很有意义。而这两个问题本身也比较复杂,数据量也够大,非常适合训练机器学习模型来解决,而不仅仅靠总结规则。而自动看病等一旦出错就会有严重后果的问题,机器学习的应用难度就大很多。而一些简单统计等写几个规则就搞定的事情,就完全不需要机器学习出马了。

参考文献

[1] 基于机器学习方法的智能机器人探究.万方.

[2] 陈海虹、黄彪、刘峰、陈文国.机器学习原理及应用.成都:电子科技大学出版社,:2-19

[3] 机器学习及其相关算法简介.万方.

[4] 大数据下的机器学习算法探讨.万方.

[5] 零基础理解机器学习的基本思想.知乎.欧阳.-11-01

[6] 机器学习理论基础-常用算法思想要点.博客园.泰初.-12-06

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。