700字范文 > 金融学习之十四——使用Tushare获取数据计算投资组合的预期收益率和波动率

金融学习之十四——使用Tushare获取数据计算投资组合的预期收益率和波动率

时间：2021-07-21 12:55:05

为了降低风险，投资者在购买股票时往往会构建一个投资组合，以对冲风险和最大获益。在投资组合中，描述该投资组合效果的两个重要变量是预期收益率及其波动率。

1.投资组合的预期收益率

预期收益率的计算公式为：

E（R）=E（∑k=1nwiRi\displaystyle \sum_{k=1}^n w_i R_ik=1∑nwiRi )=[w1,w2,w3...wn[ \displaystyle \ w_1,w_2,w_3...w_n[w1,w2,w3...wn ][E(R1),E(R2),...E(Rn)]T\displaystyle \ E(R_1),E(R_2),...E(R_n)]^TE(R1),E(R2),...E(Rn)]T

其中，wiw_iwi表示投资组合中第i支股票的权重，通常为股票市值占投资总值的比例，满足∑k=1nwi=1\displaystyle \sum_{k=1}^n w_i =1k=1∑nwi=1。而E（RiR_iRi）表示第i支股票的预期收益率，通常用该股票过去的收益率均值表示。

假设我们任选5支股票（就拿Tushare里获取的前几支股票为例），计算其预期收益率。

首先获取所有股票的信息：

import tushare as tspro=ts.pro_api('b497571a3ddd7dde8ebe28b372879594b2f8356c918ad80dae01605b') #此token已过期，只有基础积分，随便用df = pro.stock_basic(exchange='', list_status='L', fields='ts_code,symbol,name,area,industry,list_date')df.head()

为了简化操作，我们就选前5支数据较好的股票，先获取其行情数据，这里是收盘价close，日期为7月1日至8月31日：

dt=pd.DataFrame() #构建一个空数据框，装载所有股票行情信息for i in df.loc[:5][['ts_code','name']].values:name=i[1]dt[name]=pro.daily(ts_code=i[0], start_date='0701', end_date='0831')['close']dt

发现国华网安的数据后面有很多空数据，所以把它删掉，剩余5支作为待计算数据。

dt.drop('国华网安',axis=1,inplace=True)dt

首先先做一个股票走势绘图：

from pylab import mplmpl.rcParams['font.sans-serif']=['SimHei']mpl.rcParams['axes.unicode_minus']=False(dt/dt.iloc[0]).plot(figsize=(10,8)) #所有数据都对首日数据进行归一处理

可以看到ST全新有点疯狂啊，而平安银行则有点萎靡不振。

接着对所有股票计算收益率，并绘制直方图。

r=np.log(dt/dt.shift(1)) #求收益率公式r=r.dropna()#去除其他有空数据的行r.hist(bins=40,figsize=(10,8))

可以看到，除了ST全新，基本上收益率都还是比较符合正态分布的。

接着随机生成一个股票投资比例，计算一下，该投资组合的预期收益率：

#先求每支股票的年化平均收益率r_mean=r.mean()*252r_mean

结果是：

平安银行 -0.235112

万科A 0.054881

ST星源 0.063218

深振业A 0.072212

*ST全新 0.382847