pearson spearman,Kendall和Spearman三种相关分析方法的异同

数学统计(6)
pearson(皮尔逊), kendall(肯德尔)和spearman(斯伯曼/斯皮尔曼)三种相关分析方法有什么异同
&&&&&&两个连续变量间呈线性相关时,使用Pearson积差相关系数,不满足积差相关分析的适用条件时,使用Spearman秩相关系数来描述.
&&&&&&Spearman相关系数又称秩相关系数,是利用两变量的秩次大小作线性相关分析,对原始变量的分布不作要求,属于非参数统计方法,适用范围要广些。对于服从Pearson相关系数的数据亦可计算Spearman相关系数,但统计效能要低一些。Pearson相关系数的计算公式可以完全套用Spearman相关系数计算公式,但公式中的x和y用相应的秩次代替即可。
&&&&&&Kendall's
tau-b等级相关系数:用于反映分类变量相关性的指标,适用于两个分类变量均为有序分类的情况。对相关的有序变量进行非参数相关检验;取值范围在-1-1之间,此检验适合于正方形表格;
&&&&&计算积距pearson相关系数,连续性变量才可采用;计算Spearman秩相关系数,适合于定序变量或不满足正态分布假设的等间隔数据;
计算Kendall秩相关系数,适合于定序变量或不满足正态分布假设的等间隔数据。
&&&&&计算相关系数:当资料不服从双变量正态分布或总体分布未知,或原始数据用等级表示时,宜用
spearman或kendall相关
&&&&&&Pearson&相关复选项
积差相关计算连续变量或是等间距测度的变量间的相关分析&
Kendall&&&&&复选项
等级相关 计算分类变量间的秩相关,适用于合并等级资料
&&&&&&Spearman&&&复选项
等级相关计算斯皮尔曼相关,适用于连续等级资料
1若非等间距测度的连续变量 因为分布不明-可用等级相关/也可用Pearson&相关,对于完全等级离散变量必用等级相关
2当资料不服从双变量正态分布或总体分布型未知或原始数据是用等级表示时,宜用 Spearman 或 Kendall相关。
3 若不恰当用了Kendall 等级相关分析则可能得出相关系数偏小的结论。则若不恰当使用,可能得相关系数偏小或偏大结论而考察不到不同变量间存在的密切关系。对一般情况默认数据服从正态分布的,故用Pearson分析方法。
在SPSS里进入Correlate-》Bivariate,在变量下面Correlation Coefficients复选框组里有3个选项:
&&&&Pearson
&&&&Kendall's tau-b
&&&&Spearman:Spearman
spearman(斯伯曼/斯皮尔曼)相关系数
&&&&&&斯皮尔曼等级相关是根据等级资料研究两个变量间相关关系的方法。它是依据两列成对等级的各对等级数之差来进行计算的,所以又称为“等级差数法”
&&&&&&斯皮尔曼等级相关对数据条件的要求没有积差相关系数严格,只要两个变量的观测值是成对的等级评定资料,或者是由连续变量观测资料转化得到的等级资料,不论两个变量的总体分布形态、样本容量的大小如何,都可以用斯皮尔曼等级相关来进行研究。
Kendall's相关系数
&&&&&&肯德尔(Kendall)W系数又称和谐系数,是表示多列等级变量相关程度的一种方法。适用这种方法的数据资料一般是采用等级评定的方法收集的,即让K个评委(被试)评定N件事物,或1个评委(被试)先后K次评定N件事物。等级评定法每个评价者对N件事物排出一个等级顺序,最小的等级序数为1 ,最大的为N,若并列等级时,则平分共同应该占据的等级,如,平时所说的两个并列第一名,他们应该占据1,2名,所以它们的等级应是1.5,又如一个第一名,两个并列第二名,三个并列第三名,则它们对应的等级应该是1,2.5,2.5,5,5,5,这里2.5是2,3的平均,5是4,5,6的平均。
&&&&&&肯德尔(Kendall)U系数又称一致性系数,是表示多列等级变量相关程度的一种方法。该方法同样适用于让K个评委(被试)评定N件事物,或1个评委(被试)先后K次评定N件事物所得的数据资料,只不过评定时采用对偶评定的方法,即每一次评定都要将N个事物两两比较,评定结果如下表所示,表格中空白位(阴影部分可以不管)填入的数据为:若i比j好记1,若i比j差记0,两者相同则记0.5。一共将得到K张这样的表格,将这K张表格重叠起来,对应位置的数据累加起来作为最后进行计算的数据,这些数据记为γij。
正态分布的相关检验
&&&&&&&对来自正态总体的两个样本进行均值比较常使用T检验的方法。T检验要求两个被比较的样本来自正态总体。两个样本方差相等与不等时用的计算T值的公式不同。
&&&&&&进行方差齐次性检验使用F检验。对应的零假设是:两组样本方差相等。P值小于0.05说明在该水平上否定原假设,方差不齐;否则两组方差无显著性差异。
&&&&&&U检验时用服从正态分布的检验量去检验总体均值差异情况的方法。在这种情况下总体方差通常是已知的。
&&&&&&虽然T检验法与U检验法所解决的问题大体相同,但在小样本(样本数n)=30作为大样本)且均方差未知的情况下就不能用U检验法了。
&&&&&&均值检验时不同的数据使用不同的统计量
&&&&&&使用MEANS过程求若干组的描述统计量,目的在于比较。因此必须分组求均值。这是与Descriptives过程不同之处。
&&&&&&检验单个变量的均值是否与给定的常数之间存在差异,用One-Sample T Test 单样本T检验过程。
&&&&&&检验两个不相关的样本是否来自来具有相同均值的总体,用Independent-Samples T test 独立样本t检验过程。
&&&&&&如果分组样本不独立,用Paired Sample T test 配对t检验。
&&&&&&如果分组不止两个,应使用One-Way ANOVO一元方差分析(用于检验几个独立的组,是否来自均值相等的总体)过程进行单变量方差分析。
&&&&&如果试图比较的变量明显不服从正态分布,则应该考虑使用一种非参数检验过程Nonparametric test.
&&&&&如果用户相比较的变量是分类变量,应该使用Crosstabs功能。
&&&&&当样本值不能为负值时用右侧单边检验。
参考知识库
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
访问:4664次
排名:千里之外SPSS中Pearson,Kendall和Spearman三种相关分析方法的异同
&SPSS在做相关分析时,在双变量部分会出现三种方法,Pearson、Spearman、Kendall's
tau-bu,这三张方法有何区别,我们该如何选用?
&1、Pearson相关系数:当&两个连续变量间呈线性相关时,使用Pearson积差相关系数,不满足积差相关分析的适用条件时,使用Spearman秩相关系数来描述。只要有一个变量属于等级变量,则不能用Pearson相关法。
& 2、Spearman相关系数:又称秩相关系数,是利用两变量的秩次大小作线性相关分析,对原始变量的分布不作要求,属于非参数统计方法,适用范围要广些。对于服从Pearson相关系数的数据亦可计算Spearman相关系数,但统计效能要低一些。Pearson相关系数的计算公式可以完全套用Spearman相关系数计算公式,但公式中的x和y用相应的秩次代替即可。
如果变量的等级分类比较少,则也不适合用此法,比如学历等级和收入等级,二者等级很少,虽然可以分析,但严格来说其结果偏差比较大。
&3、Kendall's tau-b等级相关系数:用于反映分类变量相关性的指标,适用于两个分类变量均为有序分类的情况。对相关的有序变量进行非参数相关检验;取值范围在-1-1之间,此检验适合于正方形表格。
& 【如您遇到数据分析相关问题,可以联系博主解决——本博首页左侧
“联系我”】
我的更多文章:
( 12:50:43)( 11:44:23)( 09:11:17)( 13:01:11)( 17:29:12)( 03:14:36)( 09:50:57)( 11:44:35)( 09:27:41)( 10:17:17)
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。《未来已来:AI时代就业指南》 沙龙活动
你想了解未来10年最火爆的职位是什么吗?
35所高校新发布了“数据科学与大数据技术”专业你知道吗?点击链接报名:/event/0
> Pearson,Kendall和Spearman三种相关分析方法的异同
在SPSS软件相关分析中,pearson(皮尔逊), kendall(肯德尔)和spearman(斯伯曼/斯皮尔曼)三种相关分析方法有什么异同
&&&&&&两个连续变量间呈线性相关时,使用Pearson积差相关系数,不满足积差相关分析的适用条件时,使用Spearman秩相关系数来描述.
&&&&&&Spearman相关系数又称秩相关系数,是利用两变量的秩次大小作线性相关分析,对原始变量的分布不作要求,属于非参数统计方法,适用范围要广些。对于服从Pearson相关系数的数据亦可计算Spearman相关系数,但统计效能要低一些。Pearson相关系数的计算公式可以完全套用Spearman相关系数计算公式,但公式中的x和y用相应的秩次代替即可。
&&&&&&Kendall's tau-b等级相关系数:用于反映分类变量相关性的指标,适用于两个分类变量均为有序分类的情况。对相关的有序变量进行非参数相关检验;取值范围在-1-1之间,此检验适合于正方形表格;
&&&&&计算积距pearson相关系数,连续性变量才可采用;计算Spearman秩相关系数,适合于定序变量或不满足正态分布假设的等间隔数据; 计算Kendall秩相关系数,适合于定序变量或不满足正态分布假设的等间隔数据。
&&&&&计算相关系数:当资料不服从双变量正态分布或总体分布未知,或原始数据用等级表示时,宜用 spearman或kendall相关
&&&&&&Pearson&相关复选项 积差相关计算连续变量或是等间距测度的变量间的相关分析&
Kendall&&&&&复选项 等级相关 计算分类变量间的秩相关,适用于合并等级资料
&&&&&&Spearman&&&复选项 等级相关计算斯皮尔曼相关,适用于连续等级资料
1若非等间距测度的连续变量 因为分布不明-可用等级相关/也可用Pearson&相关,对于完全等级离散变量必用等级相关
2当资料不服从双变量正态分布或总体分布型未知或原始数据是用等级表示时,宜用 Spearman 或 Kendall相关。
3 若不恰当用了Kendall 等级相关分析则可能得出相关系数偏小的结论。则若不恰当使用,可能得相关系数偏小或偏大结论而考察不到不同变量间存在的密切关系。对一般情况默认数据服从正态分布的,故用Pearson分析方法。
在SPSS里进入Correlate-》Bivariate,在变量下面Correlation Coefficients复选框组里有3个选项:
&&&&Pearson
&&&&Kendall's tau-b
&&&&Spearman:Spearman
spearman(斯伯曼/斯皮尔曼)相关系数
&&&&&&斯皮尔曼等级相关是根据等级资料研究两个变量间相关关系的方法。它是依据两列成对等级的各对等级数之差来进行计算的,所以又称为&等级差数法&
&&&&&&斯皮尔曼等级相关对数据条件的要求没有积差相关系数严格,只要两个变量的观测值是成对的等级评定资料,或者是由连续变量观测资料转化得到的等级资料,不论两个变量的总体分布形态、样本容量的大小如何,都可以用斯皮尔曼等级相关来进行研究。
Kendall's相关系数
&&&&&&肯德尔(Kendall)W系数又称和谐系数,是表示多列等级变量相关程度的一种方法。适用这种方法的数据资料一般是采用等级评定的方法收集的,即让K个评委(被试)评定N件事物,或1个评委(被试)先后K次评定N件事物。等级评定法每个评价者对N件事物排出一个等级顺序,最小的等级序数为1 ,最大的为N,若并列等级时,则平分共同应该占据的等级,如,平时所说的两个并列第一名,他们应该占据1,2名,所以它们的等级应是1.5,又如一个第一名,两个并列第二名,三个并列第三名,则它们对应的等级应该是1,2.5,2.5,5,5,5,这里2.5是2,3的平均,5是4,5,6的平均。
&&&&&&肯德尔(Kendall)U系数又称一致性系数,是表示多列等级变量相关程度的一种方法。该方法同样适用于让K个评委(被试)评定N件事物,或1个评委(被试)先后K次评定N件事物所得的数据资料,只不过评定时采用对偶评定的方法,即每一次评定都要将N个事物两两比较,评定结果如下表所示,表格中空白位(阴影部分可以不管)填入的数据为:若i比j好记1,若i比j差记0,两者相同则记0.5。一共将得到K张这样的表格,将这K张表格重叠起来,对应位置的数据累加起来作为最后进行计算的数据,这些数据记为&ij。
正态分布的相关检验
&&&&&&&对来自正态总体的两个样本进行均值比较常使用T检验的方法。T检验要求两个被比较的样本来自正态总体。两个样本方差相等与不等时用的计算T值的公式不同。
&&&&&&进行方差齐次性检验使用F检验。对应的零假设是:两组样本方差相等。P值小于0.05说明在该水平上否定原假设,方差不齐;否则两组方差无显著性差异。
&&&&&&U检验时用服从正态分布的检验量去检验总体均值差异情况的方法。在这种情况下总体方差通常是已知的。
&&&&&&虽然T检验法与U检验法所解决的问题大体相同,但在小样本(样本数n)=30作为大样本)且均方差未知的情况下就不能用U检验法了。
&&&&&&均值检验时不同的数据使用不同的统计量
&&&&&&使用MEANS过程求若干组的描述统计量,目的在于比较。因此必须分组求均值。这是与Descriptives过程不同之处。
&&&&&&检验单个变量的均值是否与给定的常数之间存在差异,用One-Sample T Test 单样本T检验过程。
&&&&&&检验两个不相关的样本是否来自来具有相同均值的总体,用Independent-Samples T test 独立样本t检验过程。
&&&&&&如果分组样本不独立,用Paired Sample T test 配对t检验。
&&&&&&如果分组不止两个,应使用One-Way ANOVO一元方差分析(用于检验几个独立的组,是否来自均值相等的总体)过程进行单变量方差分析。
&&&&&如果试图比较的变量明显不服从正态分布,则应该考虑使用一种非参数检验过程Nonparametric test.
&&&&&如果用户相比较的变量是分类变量,应该使用Crosstabs功能。
&&&&&当样本值不能为负值时用右侧单边检验。
PPV课精选的每一篇文章均来源于公开网络,仅供学习使用,不会用于任何商业用途,文章版权归原作者所有,如果侵犯到原作者的权益,请您与我们联系删除或者授权事宜,联系邮箱:。转载PPV课网站文章请注明原文章作者,否则产生的任何版权纠纷与PPV课无关。
转载请注明: &
or分享 (0)相关性分析
用EXCEL函数进行相关性分析
相关系数的定义:相关系数(Pearson
correlation,r)最早源自教育研究中,常涉及到两个事物(变量)的相互关系问题,例如,学习成绩与非智力因素的关系,数学成绩与物理成绩的关系,男女生学习成绩的关系,等等。
其关系表现为以下三种变化:
第一,正相关,一个变量增加或减少时,另一个变量也相应增加或减少;
第二,负相关,一个变量增加或减少时,另一个变量却减少或增加;
第三,无相关或零相关,说明两个变量是独立的,即由一个变量值,无法预测另一个变量值。
统计学中,就用“相关系数”来从数量上描述两个变量之间的相关程度,用符号“r"来表示。
相关系数(r)
取值范围限于:-1≤r≤+1相关系数表示的意义:
相关系数(r) 0.00  0.00...±0.3  ±0.30...±0.50 ±0.50...±0.80 ±0.80...±1.00
相关程度   无相关  微正负相关  &
实正负相关    显著正负相关  高度正负相关
通过系统中的“相关分析”,我们就可以对多只货币币种之间的相关、交叉关系进行定量分析。如果交易者希望分散他/她的投资组合,或者想加码但是不想投资在同一个货币对,或者仅仅想了解他们的交易风险有多大,或者仅为了寻找相关系数微正负相关的货币对建立品种组合池,那么相关性分析可以提供不错的帮助。
下面介绍一种自己摸索的相关性计算方法:
首先从MT4的工具菜单的历史数据中心导出数据,例如EURESD和GBPUSD的日线数据到CSV文件中。
然后打开这两个文件,再新建一个空白EXCEL文件。
为了避免日期错位,建议把这两个文件中的“指定时间周期的收盘价数据”复制到空白文件中,如下图,我选择的是5月14日-11月14日的数据:
在表中随便选择一个空白处,输入函数“CORREL(array1,array2)”,其中:
Array1  第一组数值单元格区域。
Array2  第二组数值单元格区域。
计算得到的数值就是EURESD和GBPUSD的相关系数,当然你也可以同样方法计算货币对的振幅值相关性。
P值如r值的关系:P&0.05是一个相关显著性系数,它指出上面所说的相关系数是否具有统计学意义。如果p&0.05,虽然r值偏大,但说目前你计算的相关系数r值是抽样误差引起,是假的。例如,小明与树同时增高,有显著相关性,但无统计学意义。
用SPSS做相关性分析:
采用pearson相关分析,spss步骤如下:
1、单击Analyze——Correlate——Bivariate...,则弹出相关分析Bivariate
Correlations对话框
2、把左边的源变量(情感温暖Q和T1)调入右边的矩形框内,同时勾选Pearson选项
3、点击OK,出现如下结果:概率P值=0.077>0.05,可认为情感温暖与T1之间不存在显著相关性
用SPSS做相关性和回归分析(一元线性方程):相关性和回归分析(一元线性方程)
Pearson,Kendall和Spearman三种相关分析方法的异同
我的更多文章:
( 15:34:25)( 12:25:04)( 12:23:43)( 10:00:55)( 12:33:07)( 20:15:48)( 14:54:29)( 12:15:28)( 18:03:35)( 09:56:59)
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

我要回帖

更多关于 kendall spearman 的文章

 

随机推荐