randomforest随机森林 参数

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

randomforest随机森林参数
Random Forest(随机森林)参数
Random Forest(随机森林)是一种基于决策树的集成学习(ensemble learning)方法,通过构建多个决策树,将它们拼接在一起,从而形成一个强有力的、具有良好泛化能力的决策树模型。

它非常适合做分类和回归任务。

Random Forest有如下重要参数:
1. n_estimators:决策树的数量,即构建森林时使用的树的数量,默认值为10 。

2. max_features:决策树每次生成时,所使用的最大特征数量,默认值为None,也可以设置一个整数或者浮点数。

3. min_samples_split:决策树中每个节点最少需要分割的样本数,默认值为2。

4. min_samples_leaf:决策树每个叶子节点所需要的最少样本数,默认值为1。

5. max_depth:决策树深度,即从根节点到叶子节点的最大分入数量,如果为None,则节点的深度将不受限,默认值为None。

6. bootstrap:是否有放回的采样,默认值为True,即有放回采样。

7. criterion:决策树所使用的评价准则,默认值为“gini”,也可以选择“entropy”。

8. oob_score:是否使用袋外数据来估计泛化精度,默认值为
False,即不使用袋外数据。

相关文档
最新文档