文章预览
1 算法简介 决策树学习作为目前应用最为广泛的分类算法之一,凭借其优秀的健壮性并且在分类的同时能够很好地析取分类规则特点,近年来一直受到数据挖掘领域内研究者们的关注。决策树构建是一个递归过程,基本思路为:若树节点包含的训练集样本均属于同一类, 则视其为叶节点,并标记类别号;否则,按决策标准选出最优属性并按该属性将训练样本分成子集,依次处理每个子集,最后完成分类树的构建。其中, ID3算法是由Ross Quinlan在1986年提出的决策树学习算法,易于理解和解释,是决策树的核心算法。 ID3算法采用自上而下的贪 心策略,通过选择每次最佳的属性来构建决策树,这种策略使得算法在每个节点都做出当前看来最好的选择,但并不保证全局最优。ID3算法的关键在于如何选择一个分裂属性形成决策树的决策节点,并从当前节点生成决策分枝。在
………………………………