决策树(decision tree)决策树学习的本质是从训练数据集中归纳出一组分类规则。
其主要的优点:模型具有可读性,计算量小,分类速度快。
1.如何选择较优的特征属性进行分裂?
每一次特征属性的分裂,相当于对训练数据集进行再划分,对应于一次决策树的生长。ID3算法定义了目标函数来进行特征选择。
2.什么时候应该停止分裂?
有两种自然情况应该停止分裂,
一是该节点对应的所有样本记录均属于同一类别,
二是该节点对应的所有样本的特征属性值均相等。
但除此之外,是不是还应该其他情况停止分裂呢?