700字范文,内容丰富有趣,生活中的好帮手!
700字范文 > 如何用python进行相关性分析_如何在python中检查连续变量和分类变量之间的相关性?...

如何用python进行相关性分析_如何在python中检查连续变量和分类变量之间的相关性?...

时间:2023-10-06 09:55:07

相关推荐

如何用python进行相关性分析_如何在python中检查连续变量和分类变量之间的相关性?...

将分类变量转换为虚拟变量,并将变量放在numpy.array中。例如:

data.csv:age,size,color_head

4,50,black

9,100,blonde

12,120,brown

17,160,black

18,180,brown

提取数据:import numpy as np

import pandas as pd

df = pd.read_csv('data.csv')

DF:

将分类变量转换color_head为虚拟变量:df_dummies = pd.get_dummies(df['color_head'])

del df_dummies[df_dummies.columns[-1]]

df_new = pd.concat([df, df_dummies], axis=1)

del df_new['color_head']

df_new:

把它放在numpy数组中:x = df_new.values

计算相关性:correlation_matrix = np.corrcoef(x.T)

print(correlation_matrix)

输出:array([[ 1. , 0.99574691, -0.23658011, -0.28975028],

[ 0.99574691, 1. , -0.30318496, -0.24026862],

[-0.23658011, -0.30318496, 1. , -0.40824829],

[-0.28975028, -0.24026862, -0.40824829, 1. ]])

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。