当前位置:  开发笔记 > 运维 > 正文

关于聚类方法的问题

如何解决《关于聚类方法的问题》经验,为你挑选了1个好方法。

最近我开始研究数据挖掘中的聚类,我研究了顺序聚类和层次聚类以及k-means.

我还读到了一个区分k-means和其他两种聚类技术的陈述,说k-means在处理名义属性方面不是很好,但是文本没有解释这一点.到目前为止,唯一的区别就在于可以看出,对于K-means,我们事先会知道我们将需要确切的K个簇,而我们不知道其他两个聚类方法需要多少簇.

所以有人可以在这里给我一些关于为什么存在这样的陈述的想法,即k-means在处理名义属性的例子时有这个问题,有没有办法克服这个问题?

提前致谢.



1> Stompchicken..:

k-means算法通过获取集群中所有点的平均值来计算集群质心.如果参数是标称值,则不能取平均值.

有时可以将名义值放入一种顺序中,然后映射到实际值.例如,一周中的几天可以映射到范围[1.0 - 7.0],但有时候有时也是不可能的,例如具有值[Windows,Linux,OSX]的属性.

推荐阅读
放ch养奶牛
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有