Paul C's Blog

To be funny,to grow up!

0%

C4.5

【十大经典数据挖掘算法】C4.5 - Treant - 博客园 (cnblogs.com)

决策树(decision tree)决策树学习的本质是从训练数据集中归纳出一组分类规则

其主要的优点:模型具有可读性,计算量小,分类速度快。

image-20220314182626031

1.如何选择较优的特征属性进行分裂?

每一次特征属性的分裂,相当于对训练数据集进行再划分,对应于一次决策树的生长。ID3算法定义了目标函数来进行特征选择。

2.什么时候应该停止分裂?

有两种自然情况应该停止分裂,

  • 一是该节点对应的所有样本记录均属于同一类别,

  • 二是该节点对应的所有样本的特征属性值均相等。

  • 但除此之外,是不是还应该其他情况停止分裂呢?