CART算法


CART算法及R语言实现

   CART 的英文是Classification And Regression Tree,直译即为分类回归树算法,简称CART算法,它是决策树的一种实现,通常决策树主要有三种实现,分别是 ID3算法、CART算法和C4.5算法。CART算法是一种二分递归分割技术,把当前样本划分为两个子样本,使得生成的每个非叶子节点都有两个分支,因此CART算法生成的决策树是结构简洁的二叉树。即使一个feature有多个取值,也是把数据分为两部分。如果目标变量是连续的,则CART算法找出一组基于树的回归方程来预测目标变量。

#鸢尾花数据集

library(rpart)

train.idx<-sample ( 1:nrow (iris) , 100)

iris.train <-iris[train.idx, ]

iris.test<- iris[-train.idx,]

modelcart <- rpart (Species ~ ., data = iris.train, method = "class")

rescart <- predict (object = modelcart,newdata = iris.test, type = "class")

table(iris.test$Species, rescart,dnn=c("Actual","predicted"))

相关