Pandas 数据帧corr()方法

原文:https://www.studytonight.com/pandas/pandas-dataframe-corr-method

相关性是对两个变量之间线性关系的度量。在本教程中,我们将学习 PythonPandasDataFrame.corr()方法。此方法计算列的成对相关性,不包括空值。它返回相关矩阵数据帧。

下图显示了DataFrame.corr()函数的语法。

句法

DataFrame.corr(method='pearson', min_periods=1)

因素

方法 { '皮尔逊','肯德尔','斯皮尔曼' }或可调用

关联方法:

  • 皮尔逊:标准相关系数

  • 肯德尔:肯德尔τ相关系数

  • 斯皮尔曼:斯皮尔曼等级关联

  • 可调用:输入两个 1d 数组并返回一个浮点数即可调用。请注意,从 corr 返回的矩阵沿对角线将有 1,并且将是对称的,与可调用的行为无关。

min_periods: int,可选。每对列获得有效结果所需的最小观察次数。目前仅适用于皮尔逊和斯皮尔曼相关。

这些方法的输出介于 1 和-1 之间。

  • 1 表示强烈的正关系。
  • -1 表示强烈的负面关系。
  • 零的结果表示根本没有关系。

示例 1:使用DataFrame.corr()方法查找数据帧各列之间的相关性

下面的例子显示了如何使用pearson方法找到数据帧各列之间的相关性。

import pandas as pd
chart = {'Name':['Chetan','yashas','yuvraj'],'Age':  [20,25,30],'Height': [155,160,175],'Weight': [55,60,75]}
df = pd.DataFrame(chart)
print(df)
print(df.corr(method='pearson'))

一旦我们运行该程序,我们将获得以下输出。在输出中,我们可以看到列之间的正相关性。

姓名年龄身高体重 0 车坛 20 155 55 1 雅夏士 25 160 60 2 尤瓦拉吉 30 175 75 年龄身高体重 年龄 1.000000 0.960769 0.960769 身高 0.960769 1.00000 1.00000 体重 0.960769 1.000009

示例 2:使用DataFrame.corr()方法查找数据帧各列之间的相关性

下面的例子显示了如何使用kendall方法找到数据帧各列之间的相关性。

import pandas as pd
chart = {'Name':['Chetan','yashas','yuvraj'],'Age':  [20,25,30],'Height': [155,160,175],'Weight': [55,60,75]}
df = pd.DataFrame(chart)
print(df)
print(df.corr(method='kendall'))

一旦我们运行该程序,我们将获得以下输出。

姓名年龄身高体重 0 车坛 20 155 55 1 雅夏 25 160 60 2 尤瓦拉吉 30 175 75 年龄身高体重 年龄 1.0 1.0 1.0 身高 1.0 1.0 1.0 体重 1.0 1.0 1.0

结论

在本教程中,我们学习了 Pandas DataFrame.corr()方法。我们使用皮尔逊、肯德尔和斯皮尔曼方法找到数据帧列之间的相关性。