分享最适合新手入门的10种机器学习算法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

分享最适合新手入门的10种机器学习算法

编者按:Medium博主James Le近日在网络上分享了他认为的最适合新手的机器学习算法,并授权论智进行编译。以下是我们对原文的编译,如有错误还请指出。

在机器学习界,有这样一个“没有免费午餐”的定理。简单地说,该理论认为,没有一种算法能解决所有问题,尤其对监督学习而言。

例如,你不能认为神经网络总比决策树要好,或决策树永远优于神经网络。这其中还有许多因素需要考虑,比如你的数据量大小和数据结构。

这样就导致我们在面对一个问题时需要尝试不同的算法,同时还要用测试的数据集来评估算法的性能,选出最合适的那一种。

当然,你所选的算法必须适合你的问题,就像当我们需要清理房子的时候,可以使用吸尘器、扫把或拖把,但不会用铲子来挖地。

首要原则

然而,在为监督式机器学习创建预测模型之前,要记得一条最重要的原则:

机器学习算法可以看做学习一种目标函数(f),该函数是输入变量(X)到输出变量(Y)的完美映射:Y=f(X)

这是一个通用的学习任务,我们希望用新输入的变量(X)能输出预测变量(Y)。我们不知道函数(f)是什么样子的,或者什么形式的。如果我们知道的话就直接使用了,不需要再用机器学习算法从大量的数据中学习它。

最常见的机器学习类型是学习映射Y=f(X),用它来预测Y的值。这被称为预测建模或预测分析,我们的目标是做出最准确的预测。

对于想了解机器学习基础知识的新手,以下是数据科学家最常用的10种机器学习算法。

1.线性回归

线性回归也许是数据科学和机器学习中最知名、最好理解的算法了吧。

预测建模主要关注的是,以可解释性为基础,将模型的误差降到最小并尽量作出最准确的预测。我们将借鉴、多次使用甚至“窃取”包括数据统计在内的多个不同领域的算法,从

相关文档
最新文档