iris数据集下载(免费):/download/weixin_44940488/20718531
使用的分析软件:jupyter notebook
主要语法知识:Python数据清洗与整理、seaborn数据可视化。
1.导入相关库和数据集
from pandas import Series,DataFrameimport pandas as pdimport numpy as npimport matplotlib.pyplot as plt plt.rcParams['font.sans-serif'] = 'SimHei' # 用来正常显示中文plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号
iris = pd.read_csv(open('数据\iris-data.csv'))iris.head()
鸢尾花数据集经常用于及其学习(分类算法)的入门例子。其中,sepal_length_cm:为花萼长度;sepal_width_cm:为花萼宽度;petal_length_cm:为花瓣长度;petal_width_cm:花瓣宽度。
2. 散点图绘制
plt.figure(figsize=(12,6),dpi=100)plt.scatter(x = iris.petal_width_cm, y = iris.petal_length_cm, s =10, color = 'steelblue')plt.xlabel('花瓣宽度',fontsize = 15)plt.ylabel('花瓣长度',fontsize = 15)plt.title('鸢尾花花瓣长度与宽度关系图', fontsize = 20, pad = 20)plt.show()
3. 数据处理
iris['class'].value_counts()
# 修改iris.ix[iris['class'] == 'versicolor', 'class'] = 'Iris-versicolor'iris.ix[iris['class'] == 'Iris-setossa', 'class'] = 'Iris-setosa'iris['class'].unique()
# 不同类别鸢尾花统计iris['class'].value_counts()
4. 不同类型鸢尾花散点图绘制
# 设置不同种类鸢尾花的颜色colors_iris = ['steelblue','indianred','green']class1 = ['Iris-setosa', 'Iris-versicolor', 'Iris-virginica']marker_iris = ['o','s','x']# 设置绘图窗口大小plt.figure(figsize=(12,6),dpi=100)for i in range(0,3): # 循环plt.scatter(x = iris.petal_width_cm[iris['class']== class1[i]],y = iris.petal_length_cm[iris['class']== class1[i]],color = colors_iris[i],marker = marker_iris[i],label = class1[i])plt.xlabel('花瓣宽度',fontsize = 15) # X轴标题plt.ylabel('花瓣长度',fontsize = 15) # Y轴标题plt.title('鸢尾花花瓣长度与宽度关系图', fontsize = 20, pad = 20) # 图表标题plt.legend(loc='best') # 图例标签plt.show() # 图表展示