详细介绍可以看seaborn官方API和example galler。
1 set_style( ) set( )
set_style( )是用来设置主题的,Seaborn有五个预设好的主题: darkgrid , whitegrid , dark , white ,和 ticks 默认:darkgrid
importmatplotlib.pyplotasplt
importseabornassns
sns.set_style("whitegrid")
plt.plot(np.arange(10))
plt.show()
set( )通过设置参数可以用来设置背景,调色板等,更加常用。
importseabornassns
importmatplotlib.pyplotasplt
sns.set(style="white",palette="muted",color_codes=True)#set()设置主题,调色板更常用
plt.plot(np.arange(10))
plt.show()
2 distplot( ) kdeplot( )
distplot( )为hist加强版,kdeplot( )为密度曲线图
importmatplotlib.pyplotasplt
importseabornassns
df_iris=pd.read_csv("../input/iris.csv")
fig,axes=plt.subplots(1,2)
sns.distplot(df_iris["petallength"],ax=axes[0],kde=True,rug=True)#kde密度曲线rug边际毛毯
sns.kdeplot(df_iris["petallength"],ax=axes[1],shade=True)#shade阴影
plt.show()
importnumpyasnp
importseabornassns
importmatplotlib.pyplotasplt
sns.set(palette="muted",color_codes=True)
rs=np.random.RandomState(10)
d=rs.normal(size=100)
f,axes=plt.subplots(2,2,figsize=(7,7),sharex=True)
sns.distplot(d,kde=False,color="b",ax=axes[0,0])
sns.distplot(d,hist=False,rug=True,color="r",ax=axes[0,1])
sns.distplot(d,hist=False,color="g",kde_kws={"shade":True},ax=axes[1,0])
sns.distplot(d,color="m",ax=axes[1,1])
plt.show()
3 箱型图boxplot( )
importmatplotlib.pyplotasplt
importseabornassns
df_iris=pd.read_csv("../input/iris.csv")
sns.boxplot(x=df_iris["class"],y=df_iris["sepalwidth"])
plt.show()
plt.rc("font",family="SimHei",size=13)
#fliersize=1将异常点虚化,showmeans=True显示平均值,order表示按x轴显示进行排序sns.boxplot(x="is_overdue",y="gjj_loan_balance",hue="education",hue_order=["HighSchool","Colege","University","Master","other"],data=df,showmeans=True,fliersize=1,order=["0","1-15","15-30","30-45","45+"])plt.legend(loc="upper right")#图示靠右显示plt.show
4 联合分布jointplot( )
tips=pd.read_csv("../input/tips.csv")#右上角显示相关系数
sns.jointplot("total_bill","tip",tips)
plt.show()
tips=pd.read_csv("../input/tips.csv")
sns.jointplot("total_bill","tip",tips,kind="reg")
plt.show()
5 热点图heatmap( )
internal_chars = ["full_sq", "life_sq", "floor", "max_floor", "build_year", "num_room", "kitch_sq", "state", "price_doc"]
corrmat = train[internal_chars].corr()
f, ax = plt.subplots(figsize=(10, 7))
plt.xticks(rotation="90")
sns.heatmap(corrmat, square=True, linewidths=.5, annot=True)
plt.show()
6 散点图scatter( )
f, ax = plt.subplots(figsize=(10, 7))
plt.scatter(x=train["full_sq"], y=train["price_doc"], c="r")
plt.xlim(0,500)
plt.show()
7.pointplot画出变量间的关系
grouped_df = train_df.groupby("floor")["price_doc"].aggregate(np.median).reset_index()
plt.figure(figsize=(12,8))
sns.pointplot(grouped_df.floor.values, grouped_df.price_doc.values, alpha=0.8, color=color[2])
plt.ylabel("Median Price", fontsize=12)
plt.xlabel("Floor number", fontsize=12)
plt.xticks(rotation="vertical") plt.show()
8pairplot( )
importseabornassns
importmatplotlib.pyplotasplt
iris=pd.read_csv("../input/iris.csv")
sns.pairplot(iris,vars=["sepalwidth","sepallength"],hue="class",palette="husl")
plt.show()
9 FacetGrid( )
facetGrid可以根据类别特征各种不同组合进行显示,下面就是根据婚姻与学历情况进行分成了10组,横(row)的表示按婚姻分类显示,竖(col)的表示按学历分类显示grid=sns.FacetGrid(df,row="martial_status",col="education",palette="seismic",size=4)grid.map(plt.scatter,"gjj_loan_balance","max_overduer_days")grid.add_legend()plt.show()
10 barplot( )
f, ax=plt.subplots(figsize=(12,20))
#orient="h"表示是水平展示的,alpha表示颜色的深浅程度
sns.barplot(y=group_df.sub_area.values, x=group_df.price_doc.values,orient="h", alpha=0.8, color="red")
#设置y轴、X轴的坐标名字与字体大小
plt.ylabel("price_doc", fontsize=16)
plt.xlabel("sub_area", fontsize=16)
#设置X轴的各列下标字体是水平的
plt.xticks(rotation="horizontal")
#设置Y轴下标的字体大小
plt.yticks(fontsize=15)
plt.show()
注:如果orient="v"表示成竖直显示的话,一定要记得y=group_df.sub_area.values, x=group_df.price_doc.values调换一下坐标轴,否则报错
f, ax=plt.subplots(figsize=(12,20))
sns.barplot(y="area", x="fre",data=df_idcard_city,orient="h", color="red")
plt.ylabel("地域", fontsize=16)
plt.xlabel("频数", fontsize=16)
plt.xticks(rotation="horizontal")
plt.yticks(fontsize=15)
plt.show()
11.bar图
import matplotlib.pyplot as plt
import numpy as np
plt.rc("font", family="SimHei", size=13)
num = np.array([13325, 9403, 9227, 8651])
ratio = np.array([0.75, 0.76, 0.72, 0.75])
men = num * ratio
women = num * (1-ratio)
x = ["聊天","支付","团购\n优惠券","在线视频"]
width = 0.5
idx = np.arange(len(x))
plt.bar(idx, men, width, color="red", label="男性用户")
plt.bar(idx, women, width, bottom=men, color="yellow", label="女性用户") #这一块可是设置bottom,top,如果是水平放置的,可以设置right或者left。
plt.xlabel("应用类别")
plt.ylabel("男女分布")
plt.xticks(idx+width/2, x, rotation=40)
#bar图上显示数字
for a,b in zip(idx,men):
plt.text(a, b+0.05, "%.0f" % b, ha="center", va= "bottom",fontsize=12)
for a,b,c in zip(idx,women,men):
plt.text(a, b+c+0.5, "%.0f" % b, ha="center", va= "bottom",fontsize=12)
plt.legend()
plt.show()
12、双Y轴绘图
本例主要用dataframe的两个列进行双Y轴画图
eng_name,chn_name,GDP,rate
a, 中国,100,0.6
b,美国,180,0.3
c,日本,80,0.2
d,瑞典,65,0.15
f,荷兰,56,0.23
#读取的时候,讲索引列变为chn_name,这样画图时候X轴自动为索引
df=pd.read_csv("b.csv",index_col="chn_name")df.index.name="国家"#这样x轴的label就变成‘国家了’。
plt.rc("font", family="SimHei", size=13)plt.figure() df["GDP"].plot(kind="bar") plt.ylabel("GDP") plt.title("国家发展情况对比") p = df["rate"] p.plot(color="black",secondary_y=True,style="--o",linewidth=2) #style--表示虚线,-表示实线plt.ylabel("增长速度")
x=[0,1,2,3,4]#因为x轴是汉字,所以默认对应的数值是从0开始的
for a,b in zip(x,p):
plt.text(a+0.1, b+0.02, "%.2f" % b, ha="center", va= "bottom",fontsize=12)
education=df.education.value_counts()df_education=pd.DataFrame({"education":education.index[1:],"fre":education.values[1:]})df_education.index=df_education.educationplt.figure() df_education.fre.plot(kind="bar") plt.ylabel("人数")plt.xlabel("学历") plt.title("学历分布情况")plt.show()
13、画饼状图
import numpy as np import matplotlib.mlab as mlab import matplotlib.pyplot as plt
#根据value_counts结果画饼图
phone=df.phone_operator.value_counts()
df_phone=pd.DataFrame({"phone_operator":phone.index[1:],"fre":phone.values[1:]})
plt.rc("font", family="SimHei", size=13)
fig = plt.figure()
plt.pie(df_phone.fre,labels=df_phone.phone_operator,autopct="%1.2f%%") #画饼图(数据,数据对应的标签,百分数保留两位小数点)
plt.title("手机运营商分布")
plt.show()
来源:/qq_34264472/article/details/53814653
也可以参考:/tutorial/distributions.html
知乎专栏关于seaborn的:/p/27570774