u检验是一种用来评估两个独立的顺序数据样本是否来自同一个总体的
非参数检验。使用u检验,首先需要将两个独立样本的分数转化为其所在合并样本中的名次(顺序数据),然后检验基于两样本名次计算出的u值,以此来评估两组的平均名次间是否具有显著差异。
定义
u检验是一种用来评估两个独立的顺序数据样本是否来自同一个总体的
非参数检验。当虚无假设未被拒绝时,可以得出两样本在因变量上没有差异的结论。因此,u检验验被看作非参数检验中的独立样本t检验。与t检验不同的是,u检验适用于小样本数据,并且不要求数据满足正态分布。但是作为代价,当数据为正态分布时,t检验比u检验更具统计效能(即,当假设的差异确实存在时,t检验更容易发现这些差异。
使用u检验,首先需要将两个独立样本的分数转化为其所在合并样本中的名次(顺序数据),然后检验基于两样本名次计算出的u值,以此来评估两组的平均名次间是否具有显著差异。
计算公式
若样本含量n较大,或n虽小但总体方差σ2已知,用u检验。u检验以u分布为基础,u分布是t分布的极限分布,当样本含量凡较大时(如n>60),t分布近似u分布,t检验等同u检验。u分布和u检验也称z分布和z检验。u
检验统计量公式为:
式中, 为样本均数;μ0为已知总体均数;n为样本含量; 为标准误的估计值; 为标准误的理论值。
在成组设计的两样本均数比较的统计量u值计算中,需计算出两样本均数差的标准误,因此统计量u的计算公式为:
u检验与t检验
t检验是英国统计学家Gosset在1908年以笔名“student”发表的,因此亦称student t检验( Student's t test)。t检验是用t分布理论来推断差异发生的概率,从而判定两总体均数的差异是否有统计学意义,主要用于样本含量较小(如n<60),总体标准差盯未知,呈正态分布的计量资料。若样本含量较大(如n >60),或样本含量虽小,但总体标准差盯已知,则可采用u检验(亦称z检验)。但在统计软件中,无论样本量大小,均采用t检验进行统计分析。
t检验和u检验的适用条件:①样本来自正态总体或近似正态总体;②两样本总体方差相等,即具有方差齐性。在实际应用时,如与上述条件略有偏离,对结果亦不会有太大影响;③两组样本应相互独立。根据比较对象的不同,t检验又分为单样本t检验、配对t检验和两独立样本t检验。
率的u检验
当样本含量较大时,且样本率p和(1-p)均不太小,如np ≥5和n(1-p)≥5时,样本率p也是以总体率π为中心呈正态分布或近似正态分布的。故应用正态分布的原理对两个率的差异进行假设检验(称为u检验),其假设检验的原理、步骤及方法均数的u检验相同。
1、样本率与总体率比较的u检验,样本率与总体率作比较的目的是推断样本率所代表的总体率π与某已知总体率π0是否相等。若π0不太靠近0或1时,当样本含量n足够大,np>5,n(1-p)>5时,样本率的抽样分布逼近正态分布,可用u检验计算其样本检验统计量。公式为:
式中p为样本率,π0为已知总体率(常为理论值或标准值),n为样本含量。