700字范文,内容丰富有趣,生活中的好帮手!
700字范文 > python数据分析pandas画图_Pandas数据可视化基础绘图教程

python数据分析pandas画图_Pandas数据可视化基础绘图教程

时间:2021-02-06 05:16:44

相关推荐

python数据分析pandas画图_Pandas数据可视化基础绘图教程

众所周知,Pandas是基于Python平台的大数据分析与处理的利器。在数据为王的时代,想要掌握数据分析能力,学会Pandas数据可视化工具是十分重要的。本文将带领大家一步一步学习Pandas数据可视化基础绘图,内容比较基础,相信有一定Python基础的小伙伴看完可以很快上手,现在就让我们一起来看看教程吧!

1、环境

IDE : jupyter notebook

Anaconda 3.X

2、基于matplotlib

import matplotlib.pyplot as plt

注:导入matplotlib.pyplot

import matplotlib

matplotlib.style.use('ggplot')

%matplotlib inline

注:使用ggplot样式,并且将图画在jupyter notebook中

import pandas as pd

import numpy as np

ts = pd.Series(np.random.randn(1000), index=pd.date_range('1/1/2000', periods=1000))

ts.plot()

注:使用pandas创建一个Series(序列),序列值是随机生成的1000个标准正态分布值,索引是从2000-1-1开始的1000个时间序列值。

然后使用plot默认画图。可以看出,下图非常不规则,因为相邻的两个值也是随机大小。

import pandas as pd

import numpy as np

ts = pd.Series(np.random.randn(1000), index=pd.date_range('1/1/2000', periods=1000))

ts = ts.cumsum()

ts.plot()

注:这里加上了ts = ts.cumsum(),意思是返回累积值,在时间序列分析中,经常观察累积值曲线观察走势

这个累积值就看起来规则多了。

df = pd.DataFrame(np.random.randn(1000, 4), index=ts.index, columns=list('ABCD'))

df = df.cumsum()

plt.figure()

df.plot()

注:这里使用pandas创建了一个DataFrame(数据框,有点像excel表格那种),为什么不用刚才的Series呢?因为这里DataFrame中创建了4组数据,这4组数据都是随机生成的1000个标准正态分布值,索引是从2000-1-1开始的1000个时间序列值,并且也是求他们各自的累积值并且画图。

df3 = pd.DataFrame(np.random.randn(1000, 2), columns=['B', 'C']).cumsum()

df3['A'] = pd.Series(list(range(len(df))))

df3.plot(x='A', y='B')

注:使用DataFrame创建了2组数据,也是1000个标准正态分布,分别命名为B、C(就行excel中列名)。并且求累积值,再在原来的df(DataFrame的简称)(这里名字是df3)上加上一列名为A,A的值是0-999(使用df3的长度为1000,然后range被套列表生成一列数,作为x轴),y轴是B列数据(累积值),c列数据最后绘图没有用上。

最后Pandas基础绘图plot就完成了!

以上Pandas数据可视化基础绘图教程,大家都看懂了吗?没看明白也没关系,博学谷官网有视频课程《数据分析进阶必备技能:Pandas》。该教程采用实操案例的教学方式,使大家能够快速掌握数据获取、数据清洗与整理、数据可视化等等技能。想要了解教程的更多内容,可以进入课程链接:/promote/detail-1480.html

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。