我正在尝试学习一些机器学习,并想知道什么是数据的二次和三次转换以及它是如何完成的?论坛上的一个人正在谈论它,我想知道变量的转换是什么以及它是如何完成的.谢谢
多项式特征(二次,三次等)用于减少模型中的偏差并允许术语之间的相互作用.在scikit-learn中,它被实现为sklearn.preprocessing.PolynomialFeatures中的转换.
我们的想法是,如果你有三个特点a
,b
和c
.二次特征将通过扩展生成(a + b + c) ^ 2
.因此a^2
,b^2
c^2
,a*b
,a*c
,b*c
将是集二次特点.
在scikit-learn中PolynomialFeatures
,当参数degree
通过时,将创建所有达到该程度的项.
这通常在构建线性模型之前使用.它允许较低的偏置,但它会非常快速地增加功能集的大小.