重测信度(test-retest reliability),又称
再测信度、
稳定性系数(coefficient of stability),反映测验跨越时间的稳定性和一致性,即应用同一测验方法,对同一组
被试者先后两次进行测查,然后计算两次测查所得分数的关系系数。该信度能表示两次测试结果有无变动,反映了测验分数的稳定程度。相关程度高,表示前后测量一致性高,稳定性好。重测的过程考虑了不同的条件(环境的、人的)带来的测量结果的
误差,这种误差与两次施测的情境相关联。
含义及计算
含义
1)重测信度(test-retest reliability),又称为再测
信度、
稳定性系数,是指用同一个量表对同一组被试施测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的皮尔逊
积差相关系数。
该信度能表示两次测试结果有无变动,反映了测验分数的稳定程度。
2)重测信度(test-retest coefficient)用于判断测量是否具有时间一致性,也被称为
稳定性系数(cofficient of stability),它是指一组人在一个测验上第一次得分和第二次得分的相关。
重测的过程考虑了不同的条件(环境的,人的)带来的测量结果的
误差,这种误差与两次施测的情境相关联。因为在前后两种情境中施测的是同一个测验,所以重测系数不能反映测验题目样本不同所带来的
误差。此外,两次施测的条件也和时间间隔有关,时间间隔越长,误差变异越大。因此,当第一次施测和第二次施测的时间间隔相对较短时(几天或几周),重测的稳定性系数会较大;反之,当第一次施测和第二次施测的时间间隔较长时(几个月或几年),该系数就会偏小。
3)重测信度(test-retest reliability)是指对同一批被试进行有一定的间隔的两次相同的测验,得出第一次测验和第二次测验的分数,再对所得数据进行皮尔逊积矩相关系数计算便可直接得出信度值。
①如果相关值为1,则该测验具有完美无瑕的信度,表明被试在两次测验上得到了完全一致的分数,但这种情况在心理学和教育学的研究中基本不会出现。②如果两次测验的相关系数为0,则该测验完全不可靠,表明被试在第二次测验时得到了与第一次完全不一致的分数。在此种情况下,这些分数毫无意义。③如果两次测验之间的相关值为负值,则表明被试在第一次测验中取得的分数越高,在第二次测验中所取得的分数越低;反之亦然。即便出现这种意外情况,测验的信度也同样被认定为0。
简而言之,把同一
被试者、同一个测验在不同的
时间测量两次所得结果的
相关系数称为重测信度。重测信度侧重评估时间差异所造成的误差及其对测验稳定性的影响,评价重测信度时应注意重测间隔时间长短对重测相关系数的影响。
重测信度的样本涉及范围可以很小。几十人也行。
计算方法
其计算公式为:
式中x和 是第一次测量的实得分及实得分的平均值,y和 是第二次测量的实得分及实得分的平均值, 是重测信度。
所有测验的重测信度都介于0和1之间。
优点及局限
优点
用再测法估计信度能提供有关测验结果是否随时间而改变的资料,可作为预测受测者将来行为表现的依据。
局限
再测信度易受练习和记忆的影响,前后两次施测间隔的长短务必适宜。如果相隔时间太短,则记忆犹新,练习的影响较大;如果相隔时间太长,则身心的发展与学习经验的累积等均足以改变测验分数而使相关降低。
另外,第一次测试所发现的错误也可能导致第二次反应的变化而增加
误差变异。
同时,再测信度只适用于测量那些不会随时间的变化而改变的特质。
计算再测信度的假设
几个假设
1.测量信度稳定
计算再测信度的前提是假设所测量的特质是稳定的,但这个假设意义并不明确。如果假设被测的特性是稳定的,但再测信度很低,这时我们就无法确定是我们的假设错误,还是其它情况影响了信度。相反,如果假定其特性是不稳定的,但两次施测的相关很高,我们也无法知道是假设错了,还是因为有某些
系统误差而产生偏高的信度。因此,只有当我们对所测量的特性充分了解时,才能对
稳定性的意义作解释。
2.被试遗忘与练习的效果基本相同或相互抵消
在做第一次测验时,被试可能会获得某种技巧,但只要间隔的时间适度,这种练习效果会基本上被遗忘掉。在任何一种情况下,假如遗忘和练习的影响对被试各不相同,
信度就会降低。
3.在两次施测的间隔时期内,被试的学习效果没有差别
假如,拿同一测验在课程开始时作为前测验,在课程结束时作为后测验。若学生所学的量不同,前测验—后测验的相关将反映出学习效果的差别,从而使信度降低。
补充说明
由于以上三条假设很难做到,所以有些测验不宜用再测法估计信度。一般只有在没有
复本可用,而现实条件又允许重复施测的情况下才采用此法。
一些测量
推理和
创造力的测验,一旦被试掌握了解决问题的原则,在以后重测时,他就会很容易地做出反应,此时测验的性质和功能就发生了变化。因此,只有那些不容易受重复使用影响的测验才能用再测法估计信度,如感觉运动测验、
人格测验,等。
注意
时间间隔
用再测法估计信度,由于
练习效应(指第一次测验影响了第二次测验的成绩)的存在,所以必须谨慎选择和评定测验之间的时间间隔。
如果测验的两次施测时间非常接近,就得冒着更大的风险去承受练习效应。但随着测试间隔时间的延长,又会有很多其它的因素介入进来,作为两次测验分数差异的替代解释。
一般来说,相隔时间越长,
稳定系数越低。最适宜的时距依据测验的目的、性质及被试特点而异,短则几分钟、几个小时,长则数月,甚至一、两年之久。一般来说,无论对于哪种被试,初测与再测的间隔最好不超过六个月。
系数数量
由于测验的
稳定性系数受时间和其它各种因素的影响,故任何一个测验都可能不止一个再测信度系数,所以在编制测验时应该在测验手册中报告重测信度的时间间隔以及在此间隔中被试的有关经历,如受过何种教育训练、心理治疗及有何学习经历等。
一份完备的测验应有很多重测系数,分别与不同的测验间隔时间相对应。
相关度
有时候,重测相关很低并不意味着测验不可信,而是可能提示:被研究的特性发生了改变。
经典测验理论的一个问题就是它假设行为倾向始终不随时间的变化而变化;但一些重要的行为特征,如动机就会随时间而波动。因此需要测验理论家们建立新的
模型来解释这些系统变异。