重复行如何影响决策树？

作者：mobiledu2402852413 | 2023-09-08 19:02

如何解决《重复行如何影响决策树？》经验，为你挑选了1个好方法。

我正在使用Rpart {}为分类变量构建决策树,我想知道是否应该使用仅有一组唯一行的完整数据集.

1> Gordon Linof..：

我回答这是关于决策树的一般问题,而不是R实现.

决策树的参数通常基于记录计数 - 最小叶子大小和最小分割搜索大小.此外,在构建树时,纯度度量会受节点大小的影响.如果您有重复的记录,那么您将隐含地对这些行中的值加权.

这既不好也不坏.您只需要了解要构建的数据和模型.如果重复的值来自不同的实验运行,那么它们应该没问题.

在某些情况下,重复(或等效权重)可能非常糟糕.例如,如果您对数据进行过采样以在目标上获得平衡样本,那么额外的行将会出现问题.单个叶子可能最终由原始数据中的单个实例组成 - 并且过度拟合将是一个问题.

推荐阅读

程序员
如何创建使用用户定义函数的BigQuery视图？

如何解决《如何创建使用用户定义函数的BigQuery视图？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何要求gson避免在json响应中转义json？

如何解决《如何要求gson避免在json响应中转义json？》经验，为你挑选了1个好方法。 ... [详细]
程序员
重新绑定Elixir中外部作用域中的变量

如何解决《重新绑定Elixir中外部作用域中的变量》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Win10中拼写检查文本框 - 慢

如何解决《在Win10中拼写检查文本框-慢》经验，为你挑选了1个好方法。 ... [详细]
程序员
Flask:NameError:未定义全局名称"redirect"

如何解决《Flask:NameError:未定义全局名称"redirect"》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法在Tensorflow中优化多元线性回归

如何解决《无法在Tensorflow中优化多元线性回归》经验，为你挑选了1个好方法。 ... [详细]
程序员
R:如何得到两个分布的总和？

如何解决《R:如何得到两个分布的总和？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在ReactiveCocoa 4中创建自定义信号？

如何解决《如何在ReactiveCocoa4中创建自定义信号？》经验，为你挑选了1个好方法。 ... [详细]
程序员
任何状态更新,在Tensorflow的iOS示例上？

如何解决《任何状态更新,在Tensorflow的iOS示例上？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何列出所有Presto工作人员？

如何解决《如何列出所有Presto工作人员？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在配置单元中,有没有办法指定添加新列的列之间？

如何解决《在配置单元中,有没有办法指定添加新列的列之间？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Android AWS S3 SDK TransferUtility在服务中不起作用

如何解决《AndroidAWSS3SDKTransferUtility在服务中不起作用》经验，为你挑选了1个好方法。 ... [详细]
程序员
std :: transform命令保证

如何解决《std::transform命令保证》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用python将opencv图像传输到ffmpeg

如何解决《使用python将opencv图像传输到ffmpeg》经验，为你挑选了1个好方法。 ... [详细]
程序员
序列化UTC时间c#

如何解决《序列化UTC时间c#》经验，为你挑选了0个好方法。 ... [详细]
程序员
模型中的Laravel 5.1 bool属性在模型类中加入时返回空数组

如何解决《模型中的Laravel5.1bool属性在模型类中加入时返回空数组》经验，为你挑选了1个好方法。 ... [详细]
程序员
等待使用异步方法的Task.Run不会在正确的线程上抛出异常

如何解决《等待使用异步方法的Task.Run不会在正确的线程上抛出异常》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否有可能将一个clojure矢量解构为最后两个项目,其余的？

如何解决《是否有可能将一个clojure矢量解构为最后两个项目,其余的？》经验，为你挑选了2个好方法。 ... [详细]
程序员
不使用Marshmallow调用Spinner onItemSelected

如何解决《不使用Marshmallow调用SpinneronItemSelected》经验，为你挑选了0个好方法。 ... [详细]
程序员
清除所有setIntervals

如何解决《清除所有setIntervals》经验，为你挑选了1个好方法。 ... [详细]

mobiledu2402852413

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章