决策树学习
维基百科,自由的 encyclopedia
决策树学习是统计学、数据挖掘和机器学习中使用的一种预测建模方法。它使用决策树作为预测模型(英语:Predictive modelling),从样本的观测数据(对应决策树的分支)推断出该样本的预测结果(对应决策树的叶节点)。
按预测结果的差异,决策树学习可细分两类。(1)分类树,其预测结果仅限于一组离散数值。树的每个分支对应一组由逻辑与连接的分类特征,而该分支上的叶节点对应由上述特征可以预测出的分类标签。(2)回归树,其预测结果为连续值(例如实数)。
在决策分析中,一棵可视的决策树可以向用户形象地展示决策的结果和过程。在数据挖掘和机器学习中,一棵决策树主要用于描述数据(此后亦可基于习得的预测模型去支持决策)。本页侧重描述数据挖掘中的决策树。