在插入符号包的训练函数中,可以执行预测变量的居中和缩放,如下例所示:
knnFit <- train(Direction ~ ., data = training, method = "knn", preProcess = c("center","scale"))
在训练中设置此变换应该在重新采样期间更好地评估算法的性能.
在这种情况下,当我使用模型来预测新数据的响应时,我应该关心居中和缩放还是这个操作包含在最终模型中?
以下操作是否足够?
pred <- predict(knnFit, newdata = test)
谢谢!
火车对象中指定的preProces将应用于新数据,而无需先对新数据进行预处理。这样您的操作就足够了。
还可以查看下面插入符号网站的摘录。还有一整节纯粹关于预处理。绝对值得您花时间阅读它。
您可以在此处找到插入符号网站。
这些处理步骤将在使用predict.train,extractPrediction或extractProbs生成的任何预测期间应用(请参阅本文档后面的详细信息)。预处理将不适用于直接使用object $ finalModel对象的预测。