7赞

Python群集的“纯度”指标

作者：喜生-Da | 2023-09-11 12:16

如何解决《Python群集的“纯度”指标》经验，为你挑选了1个好方法。

我使用的是高斯混合模型（GMM）从sklearn.mixture执行我的数据集的群集。

我可以使用该函数score()来计算模型下的对数概率。

但是，我正在寻找本文定义的称为“纯度”的指标。

如何在Python中实现它？我当前的实现如下所示：

from sklearn.mixture import GMM

# X is a 1000 x 2 array (1000 samples of 2 coordinates).
# It is actually a 2 dimensional PCA projection of data
# extracted from the MNIST dataset, but this random array
# is equivalent as far as the code is concerned.
X = np.random.rand(1000, 2)

clusterer = GMM(3, 'diag')
clusterer.fit(X)
cluster_labels = clusterer.predict(X)

# Now I can count the labels for each cluster..
count0 = list(cluster_labels).count(0)
count1 = list(cluster_labels).count(1)
count2 = list(cluster_labels).count(2)

但是我无法遍历每个群集以计算混淆矩阵（根据此问题）

1> Ugurite..：

大卫的答案有效，但这是另一种方法。

import numpy as np
from sklearn import metrics

def purity_score(y_true, y_pred):
    # compute contingency matrix (also called confusion matrix)
    contingency_matrix = metrics.cluster.contingency_matrix(y_true, y_pred)
    # return purity
    return np.sum(np.amax(contingency_matrix, axis=0)) / np.sum(contingency_matrix)

同样，如果您需要计算逆纯度，您要做的就是将“ axis = 0”替换为“ axis = 1”。

替换为

。

推荐阅读

程序员
使用Java从外部库修改文件

如何解决《使用Java从外部库修改文件》经验，为你挑选了0个好方法。 ... [详细]
程序员
为什么在UI线程上调用启动新任务

如何解决《为什么在UI线程上调用启动新任务》经验，为你挑选了1个好方法。 ... [详细]
程序员
进行\ G锚定解析循环的Python方式是什么？

如何解决《进行\G锚定解析循环的Python方式是什么？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Python函数没有修改传递给它的列表

如何解决《Python函数没有修改传递给它的列表》经验，为你挑选了1个好方法。 ... [详细]
程序员
未初始化的字节数组是Scala

如何解决《未初始化的字节数组是Scala》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用Java加密/解密文件中的文本

如何解决《如何使用Java加密/解密文件中的文本》经验，为你挑选了1个好方法。 ... [详细]
程序员
aiohttp:提供单个静态文件

如何解决《aiohttp:提供单个静态文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用CMake在调试器中将follow-fork-mode设置为child

如何解决《如何使用CMake在调试器中将follow-fork-mode设置为child》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用ES寄存器会出错

如何解决《使用ES寄存器会出错》经验，为你挑选了1个好方法。 ... [详细]
程序员
Java字符串"1603"浮动16.03

如何解决《Java字符串"1603"浮动16.03》经验，为你挑选了1个好方法。 ... [详细]
程序员
简化`if'foo'在kwargs和kwargs ['foo']是真的:`

如何解决《简化`if'foo'在kwargs和kwargs['foo']是真的:`》经验，为你挑选了1个好方法。 ... [详细]
程序员
模拟Spock的最后一堂课

如何解决《模拟Spock的最后一堂课》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么Java 8中的Cloneable中没有默认的clone()

如何解决《为什么Java8中的Cloneable中没有默认的clone()》经验，为你挑选了2个好方法。 ... [详细]
程序员
Python:通过非整数因子下采样2D numpy数组

如何解决《Python:通过非整数因子下采样2Dnumpy数组》经验，为你挑选了0个好方法。 ... [详细]
程序员
href无法处理dropdown-toggle - bootstrap

如何解决《href无法处理dropdown-toggle-bootstrap》经验，为你挑选了2个好方法。 ... [详细]
程序员
CSS布局的类型

如何解决《CSS布局的类型》经验，为你挑选了1个好方法。 ... [详细]
程序员
折叠工具栏上未显示的菜单选项

如何解决《折叠工具栏上未显示的菜单选项》经验，为你挑选了2个好方法。 ... [详细]
程序员
C程序提供意外的输出

如何解决《C程序提供意外的输出》经验，为你挑选了1个好方法。 ... [详细]
程序员
C和C++中几乎完全相同的代码之间的执行时间差异很大(x9)

如何解决《C和C++中几乎完全相同的代码之间的执行时间差异很大(x9)》经验，为你挑选了3个好方法。 ... [详细]
程序员
Twitter API返回401(未授权),无效或过期令牌

如何解决《TwitterAPI返回401(未授权),无效或过期令牌》经验，为你挑选了0个好方法。 ... [详细]

喜生-Da

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章