0%

皮尔逊相关系数

本文包括相关性分析-PCC皮尔逊相关系数内容及python代码实现

什么是相关?

相关(Correlation,或称相关系数关联系数),显示两个随机变量之间线性关系的强度和方向。

所以当我们谈到相关,我们谈的就是线性相关。相关系数也有很多种,一般常用的是Pearson相关系数 (Pearson product-moment correlation coefficient),在 -1 到 +1 之间,其中 +1 表示完全线性正相关,-1 为完全线性负相关, 0 为线性不相关。

功能

计算特征与目标变量之间的相关度

函数代码实现

1
2
from scipy.stats import pearsonr
pearsonr(x, y) #x,y为两个数字列表

输入和返回值

1
2
3
(1)输入:x为特征,y为目标变量.在我第一次用的时候,x为吸附能,y为成键原子个数,晶体方向,bader等等
(2)输出:r:相关系数 [-11]之间。一般用r分析即可,大于0正相关,小于0负相关,绝对值越靠近1相关性越大。
p-value: p值。p值越小,表示相关系数越显著,一般p值在500个样本以上时有较高的可靠性。