如何使用mahout计算k均值聚类中的成本函数值?
我正在上Coursera的机器学习课程。并且建议如果我们在k均值聚类期间进行聚类的随机初始化,要计算聚类,我们应该使用不同的初始聚类质心值多次执行。然后,我们应该检查成本函数的值,以查看其迭代成本最小。
您能否建议在Apache mahout的k-means集群实现中如何计算成本值?
它与实现无关。只需计算点到其质心的平方距离之和即可。这是您的成本函数。