4赞

Python实现k-means算法

作者：k78283381 | 2021-10-22 21:04

这篇文章主要为大家详细介绍了Python实现k-means算法，具有一定的参考价值，感兴趣的小伙伴们可以参考一下

本文实例为大家分享了Python实现k-means算法的具体代码，供大家参考，具体内容如下

这也是周志华《机器学习》的习题9.4。

数据集是西瓜数据集4.0，如下

编号,密度,含糖率
1,0.697,0.46
2,0.774,0.376
3,0.634,0.264
4,0.608,0.318
5,0.556,0.215
6,0.403,0.237
7,0.481,0.149
8,0.437,0.211
9,0.666,0.091
10,0.243,0.267
11,0.245,0.057
12,0.343,0.099
13,0.639,0.161
14,0.657,0.198
15,0.36,0.37
16,0.593,0.042
17,0.719,0.103
18,0.359,0.188
19,0.339,0.241
20,0.282,0.257
21,0.784,0.232
22,0.714,0.346
23,0.483,0.312
24,0.478,0.437
25,0.525,0.369
26,0.751,0.489
27,0.532,0.472
28,0.473,0.376
29,0.725,0.445
30,0.446,0.459

算法很简单，就不解释了，代码也不复杂，直接放上来：

# -*- coding: utf-8 -*- 
"""Excercise 9.4"""
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import sys
import random

data = pd.read_csv(filepath_or_buffer = '../dataset/watermelon4.0.csv', sep = ',')[["密度","含糖率"]].values

########################################## K-means ####################################### 
k = int(sys.argv[1])
#Randomly choose k samples from data as mean vectors
mean_vectors = random.sample(data,k)

def dist(p1,p2):
  return np.sqrt(sum((p1-p2)*(p1-p2)))
while True:
  print mean_vectors
  clusters = map ((lambda x:[x]), mean_vectors) 
  for sample in data:
    distances = map((lambda m: dist(sample,m)), mean_vectors) 
    min_index = distances.index(min(distances))
    clusters[min_index].append(sample)
  new_mean_vectors = []
  for c,v in zip(clusters,mean_vectors):
    new_mean_vector = sum(c)/len(c)
    #If the difference betweenthe new mean vector and the old mean vector is less than 0.0001
    #then do not updata the mean vector
    if all(np.divide((new_mean_vector-v),v) < np.array([0.0001,0.0001]) ):
      new_mean_vectors.append(v)  
    else:
      new_mean_vectors.append(new_mean_vector)  
  if np.array_equal(mean_vectors,new_mean_vectors):
    break
  else:
    mean_vectors = new_mean_vectors 

#Show the clustering result
total_colors = ['r','y','g','b','c','m','k']
colors = random.sample(total_colors,k)
for cluster,color in zip(clusters,colors):
  density = map(lambda arr:arr[0],cluster)
  sugar_content = map(lambda arr:arr[1],cluster)
  plt.scatter(density,sugar_content,c = color)
plt.show()

运行方式：在命令行输入 python k_means.py 4。其中4就是k。
下面是k分别等于3，4，5的运行结果，因为一开始的均值向量是随机的，所以每次运行结果会有不同。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持。

推荐阅读

程序员
HTML,身高100%不起作用

如何解决《HTML,身高100%不起作用》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在获取"无法解决放置符号"错误时向Hashmap添加键和值

如何解决《如何在获取"无法解决放置符号"错误时向Hashmap添加键和值》经验，为你挑选了1个好方法。 ... [详细]
程序员
tvos:UITextView焦点外观像电影App

如何解决《tvos:UITextView焦点外观像电影App》经验，为你挑选了0个好方法。 ... [详细]
程序员
QML：即使drag属性处于活动状态，也不会调用onDragStarted / finish

如何解决《QML：即使drag属性处于活动状态，也不会调用onDragStarted/finish》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用enable_if进行C++模板重载:使用g ++和clang进行不同的行为

如何解决《使用enable_if进行C++模板重载:使用g++和clang进行不同的行为》经验，为你挑选了0个好方法。 ... [详细]
程序员
C++ atoi返回错误的值

如何解决《C++atoi返回错误的值》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法将数据推送到Firebase onclick

如何解决《无法将数据推送到Firebaseonclick》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Symfony2中使用Beip与Liip\FunctionalTestBundle？

如何解决《如何在Symfony2中使用Beip与Liip\FunctionalTestBundle？》经验，为你挑选了0个好方法。 ... [详细]
程序员
在transformClassesWithDexForDebug上Gradle构建缓慢

如何解决《在transformClassesWithDexForDebug上Gradle构建缓慢》经验，为你挑选了4个好方法。 ... [详细]
程序员
Java代理 - 无法正确地从HTTP GET/POST请求交换数据

如何解决《Java代理-无法正确地从HTTPGET/POST请求交换数据》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在Django 1.9中传递callable

如何解决《如何在Django1.9中传递callable》经验，为你挑选了1个好方法。 ... [详细]
程序员
谷歌地理编码api不如使用地址的谷歌地图准确

如何解决《谷歌地理编码api不如使用地址的谷歌地图准确》经验，为你挑选了0个好方法。 ... [详细]
程序员
以数组形式访问返回的值

如何解决《以数组形式访问返回的值》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么AppDelegate.swift窗口是可选的？

如何解决《为什么AppDelegate.swift窗口是可选的？》经验，为你挑选了2个好方法。 ... [详细]
程序员
Webpack错误 - 无法解析文件或目录

如何解决《Webpack错误-无法解析文件或目录》经验，为你挑选了1个好方法。 ... [详细]
程序员
指定的LocalDB实例不存在

如何解决《指定的LocalDB实例不存在》经验，为你挑选了0个好方法。 ... [详细]
程序员
Q_OBJECT和moc进行继承

如何解决《Q_OBJECT和moc进行继承》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在目录中的所有文件中搜索字符串？我出现了内存异常

如何解决《如何在目录中的所有文件中搜索字符串？我出现了内存异常》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Swift中讨论,将来会有新的声明语法吗？

如何解决《在Swift中讨论,将来会有新的声明语法吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法从iframe中找到FileHiddenName

如何解决《无法从iframe中找到FileHiddenName》经验，为你挑选了1个好方法。 ... [详细]

k78283381

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章