700字范文 > Python实现Iris数据集（鸢尾花卉数据集）kmeans聚类

Python实现Iris数据集（鸢尾花卉数据集）kmeans聚类

时间：2019-07-03 06:03:59

一，鸢尾花Iris数据集解析

二，绘制Iris数据集散点图，数据集已经给出具体类别

from sklearn import datasetsimport matplotlib.pyplot as plt#加载数据集，是一个字典类似Java中的maplris_df = datasets.load_iris()#挑选出前两个维度作为x轴和y轴，你也可以选择其他维度x_axis = lris_df.data[:,0]y_axis = lris_df.data[:,2]#c指定点的颜色，当c赋值为数值时，会根据值的不同自动着色plt.scatter(x_axis, y_axis, c=lris_df.target)plt.show()

三，Python使用kmeans聚类，并绘制新的聚类散点图。

from sklearn import datasetsimport matplotlib.pyplot as pltfrom sklearn.cluster import KMeans#加载数据集，是一个字典类似Java中的maplris_df = datasets.load_iris()#挑选出前两个维度作为x轴和y轴，你也可以选择其他维度x_axis = lris_df.data[:,0]y_axis = lris_df.data[:,2]#这里已经知道了分3类，其他分类这里的参数需要调试model = KMeans(n_clusters=3)#训练模型model.fit(lris_df.data)#选取行标为100的那条数据，进行预测prddicted_label= model.predict([[6.3, 3.3, 6, 2.5]])#预测全部150条数据all_predictions = model.predict(lris_df.data)#打印出来对150条数据的聚类散点图plt.scatter(x_axis, y_axis, c=all_predictions)plt.show()