皮尔逊余弦相关
如果两个变量都是连续性变量且服从正态分布,人为划分为两个类别,则不能用phi相关。
以下是一种近似算法:
举例:历史成绩是否及格是人为二分,地理成绩是否及格也是人为二分,a代表历史地理都及格,d代表历史地理都不及格。
注意:性别、是否得某种疾病是真正二分,不能用这种算法
独立二分样本检验
如果两个变量是真正二分的不连续变量,且二者独立
法1: 检验
法2:卡方检验 先计算边际概率,再给出理论数,最后进行计算
法3:比率差异检验(Z检验)
联系:
检验和卡方检验 。 系数的优点在于小于1, 系数大于0.6表示强的相关,小于0.3表示弱的相关。卡方的优点在于有对应的概率可以查找。
Z检验的统计量平方就是卡方检验
注意:卡方检验的自由度,对四格表而言R=C=2,
矫正公式
四格表有一格理论次数小于5,需要用矫正公式
相关样本检验
由McNemar提出,如果两个变量相关(例如同一批人对同一个问题表明意见)
矫正公式
四格表有一格理论次数小于5,需要用矫正公式