决策树的python实现方法

合集下载

决策树的python实现方法
决策树说白了就好像是if-else结构一样，它的结果就是你要生成这个一个可以从根开始不断判断选择到叶子节点的树，但是这里的if-else必然不会是让我们认为去设置的，我们要做的是提供一种方法，计算机可以根据这种方法得到我们所需要的决策树。

这个方法的重点就在于如何从这么多的特征中选择出有价值的，并且按照最好的顺序由根到叶选择。

完成了这个我们也就可以递归构造一个决策树了
划分数据集的最大原则是将无序的数据变得更加有序。

既然这又牵涉到信息的有序无序问题，自然要想到信息熵了。

这里我们计算用的也是信息熵。

数据需要满足的要求：
①数据必须是由列表元素组成的列表，而且所有的列白哦元素都要具有相同的数据长度
②数据的最后一列或者每个实例的最后一个元素应是当前实例的类别标签。