当前位置:  开发笔记 > 编程语言 > 正文

如何使用scipy的hierchical聚类将聚类分配给新的观察(测试数据)

如何解决《如何使用scipy的hierchical聚类将聚类分配给新的观察(测试数据)》经验,为你挑选了1个好方法。



1> Anony-Mousse..:

你没有.

群集没有培训和测试阶段.这是一种探索性的方法.您可以浏览数据,还可以通过重新运行算法来浏览新数据.但是根据这种算法的本质,你不能有意义地将新数据"分配"给旧结构,因为这些数据可以完全改变发现的结构.

如果要分类,请使用分类器.

聚类算法用于分类的替代品.如果要对新实例进行分类,请使用分类器,并使用此工作流程:

    通过群集探索数据(多次)

    使用您的域专家认为有意义的集群标记培训数据(验证clstering!)

    训练分类器

    使用分类器以相同的方式标记新实例

当然,有一些例外.在k-means和Ward中(但不是例如在单链路中),最近的质心分类器可以将发现的模型直接应用于新数据.但是,这意味着将聚类"转换"为静态分类器,结果可能不再是整个数据集的局部最优值(另请参见:概念漂移)

推荐阅读
李桂平2402851397
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有