kendall秩相关系数
秩系数
kendall秩相关系数(R)是指设有n个统计对象,每个对象有两个属性的系数。将所有统计对象按属性1取值排列,不失一般性,设此时属性2取值的排列是乱序的。设P为两个属性值排列大小关系一致的统计对象对数。则:
基本定义
Kendall(肯德尔)系数的定义:n个同类的统计对象按特定属性排序,其他属性通常是乱序的。同序对(concordant pairs)和异序对(discordant pairs)之差与总对数(n*(n-1)/2)的比值定义为Kendall(肯德尔)系数。
属性
(1)如果两个属性排名是相同的,系数为1 ,两个属性正相关
(2)如果两个属性排名完全相反,系数为-1 ,两个属性负相关。
(3) 如果排名是完全独立的,系数为0。
例子
假如给出8个人的身高和体重(见下表):
我们看到,两个排名之间可能存在相关性,可以使用肯德尔系数,客观地衡量对应。
注意,A最高,但体重排名为 3 ,比体重排名为 4,5,6,7,8 的重,贡献5个同序对,即AB,AE,AF,AG,AH。同理,我们发现B、C、D、E、F、G、H分别贡献4、5、4、3、1、0、0个同序对,因此,同序对数
P = 5 + 4 + 5 + 4 + 3 + 1 + 0 + 0 = 22.
异序对数 Q=28-22 (总对数减去同序对数为异序对数)
因而R=((22-6)/28)=0.57。这一结果显示出强大的排名之间的规律,符合预期。
参考资料
最新修订时间:2024-04-13 19:53
目录
概述
基本定义
属性
例子
参考资料