20xx年4月“心理测量”串讲资料北大版(编辑修改稿)内容摘要:

分数能否有效地区分由效标所定义的团体的一种方法。 算出 t值后,便可知道分数的差异是否显著。 若差异显著,说明该测验能够有效地区分由效标定义的团体,否则,测验是无效的。 重叠百分比可以通过计算每一组内得分超过(或低于)另一组平 均数的人数百分比得出;另外,还可以计算两组分布的共同区的百分比。 重叠量越大,说明两组分数差异越小,即测验的效度越差。 命中率法:是当测验用来做取舍的依据时,用其正确决定的比例作为效度指标的一种方法。 命中率的计算有两种方法,一是计算总命中率,另一种是计算正命中率。 预期表法:是一种双向表格,预测分数排在表的左边,效标排在表的顶端。 从左下至右上对角线上各百分数字越大,而其它的百分数字越小,表示测验的效标效度越高 ;反之,数字越分散,则效度越低。 二、 效度的应用 预测误差:效度系数的平方,统计 学上称这种指标为决定系数,表示测验正确预测或解释的效标的方差占总方差的比例。 另一种表达方式是估计的标准误,简写为 Sest,它是指所有具有某一测验分数的被试其效标分数( Y)分布的标准差,也即预测误差大小的估计值, (公式 49)估计的标注误可如同其他标准误一样解释。 真正效标分数落在预测效标分数 177。 1Sest 的范围内,有 68%的可能性;落在预测效标分数 177。 的范围内,有 95%的可能性;落在预测效标分数 177。 的范围内,有 99%的可能性。 预测效标分数:如果 X与 Y两变量呈直线相关,只 要确定出二者间的回归方程,就可以从一个变量推估出来另一个变量。 在测验工作中,人们感兴趣的是从测验分数预测效标成绩。 预测效标指数:公式 49中的 又称作无关系数,以 K表示之, K值大小表明预测源分数与效标分数无关的程度。 ( 1- K)可作为预测效率的指数,用 E表示: E= 100( 1- K) (公式 415) E值大小表明使用测验比盲目猜测能减少多少误差。 第四节 影响效度的因素 一、 测验本身的因素 测验题目的质量 测验的长度。 (一般而言,增加测验的长度通常可以提高测验的信度,而信度又制约着效度,因 此增加测验的长度也能提高测验的效度。 ) 二、测验实施中的干扰因素 主试的影响因素。 测验实施过程中主试的因素会影响效度。 对于效标效度,测验与效标二者实施时间间隔时间越长,测验与效标越容易受到很多机遇因素的影响,因此所求的相关必然很低。 测验情镜,如场地的布置、材料的准备、测验场所有无噪音和其他干扰因素等也会影响到测验的效度。 被试的影响因素。 被试在测验时的兴趣、动机、情绪、态度和身心状况、健康状态等都会影响测验的效度。 (被试的反应定势也会降低测验的效度。 ) 三、样本团体的性质 样本团体的异质性。 与信 度系数一样,如果其它条件相同,样本团体越同质,分数分布范围越小,测验效度就越低;样本团体越异质,分数分布范围越大测验效度就越高。 ( 1)只以选拔上的被试为样本团体参加效度研究,降低了测验的效度。 ( 2)选拔标准太高,样本团体的同质性增高,降低了测验的效度。 干涉变量。 样本团体的性质对效度的影响还表现在:对于同性质的团体,同一测验的效度会有很大的不同。 这些样本团体的特质包括:年龄、性别、教育水平、智力、动机、职业和任何有关的特征。 由于这写特征的影响,使得测验对于不同的团体具有不同的预测能力,故测量学上称这些特 征为干涉变量。 吉赛利提出的如何找出干涉变量的一套方法: ① 用回归方程求得每个人的预测效标分数,将该分数与实际效标分数想比较,获得差异分数D。 如果 D的绝对值很大,说明测验中可能存在干涉变量。 ② 根据样本团体的组成分析,找出对照组,分别计算效度,从而象上述关于出租汽车司机的例子一样,找出干涉变量。 ③ 对于欲测团体,根据某些易见的干涉变量将其区分为预测性高和预测性低的两个亚团体。 对于预测性高的团体,获得的测验效度会有所提高。 三、 效标的性质 ( 1) 效标与测验分数之间的关系是否线性关系是一个很重要的因素。 皮尔 逊剂差相关系数的前题是假设两个变量的关系是线性的分布。 ( 2) 效标测量本身的可靠性如何亦是值得考虑的一个问题。 第五章 项目分析 一般来说,测验的项目分析包括定性分析和定量分析两个方面。 第一节 难度分析 难度是指项目的难易程度。 在能力测验中通常需要一个反映难度水平的指标,在非能力测验(人格测验)中,类似的指标是 “ 通俗性 ” ,即取自相同总体的样本中,能在答案方向上回答该题的人数。 (名词解释) 一、 难度的指标 : 难度的指标通常以通过率表示,即以答对或通过该题的人数百分比来表示。 (公式 51) 二、难度的计算 二分法记分的项目:心理测验的项目大多为选择题,通过记 1分,不通过记 0分。 当被试人数较多时,可根据测验总成绩将被试分为三组:分数最高的 27%被试为高分组( ),分数最低的 27%被试为低分组( )中间 46%的被试为中间组。 分别计算高分组和低分组的通过率,以两组通过率的平均值作为每一题的难度。 由于选择题允许猜测,所以通过率可能因机遇作用而变大。 备选答案的数目越少,机遇的作用越大,越不能真正反映测验的难度。 为此,吉尔福特提出了一个 P值校正公式。 例题:假定某题有 75%的被试通过 ,若该题有 5个备选答案,则校正后的通过率为: (当有 4个备选答案时, CP=;有 3个, CP= ;有 2个, CP= ) 非二分记分的项目:如果人为地明确通过每一题的分数线,也可以用公式 52计算难度。 但此种方法的缺点在于,采用不同的分数线会得到不同的难度值,因此不常用。 三、难度水平的确定 项目难度的确定:进行难度分析的主要目的是为了筛选项目,项目的难度多高合适,取决于测验的目的、性质以及项目的形式。 为了使测验具有更大的区别力,应选择难度在 左右的试题比较合适。 但是在实际各种中 并得非如此简单。 在选择题目时,最好使试题的平均难度接近 ,而各题难度在。 当测验用于选拔或诊断时,应该比较多地选择难度值接近录取率的项目。 对于选择题来说, P值一般应大于概率水平。 测验难度的确定:测验的难度直接依赖于组成测验的项目的难度。 通过考察测验分数的分布,可以对测验的难度做出直观检验。 第二节 项目的区分度 一、 项目区分度的概念:也叫鉴别力,是指测验项目对被试的心理特性的区分能力。 (名词解释) 二、项目区分度的估计方法 鉴别指数:首先分别计算高分组与低分组在该项目上 的通过率,然后用高分组在该项目上的通过率减去低分组在该项目上的通过率。 (公式 57) 项目鉴别指数与评价标准 鉴别指数 项目评价 很好 良好,修改后会更佳 尚可,但需修改 差,必须淘汰 相关系数: ① 点二列相关:适用于一类变量为二分称名变量,另一类变量为连续变量的成对变量的相关计算。 ② 二列相关:适用于两个连续变量,但其中一个变量被人为分成两类。 ③ 相关:适用于两个变量均为二分称名变量。 区分度与 难度的关系 ( 1) 假如样本中通过某一项目的人数比率为 0,说明高分组与低分组在通过率上不存在差异,因此 D为 0;假如项目的通过率为 ,则可能是高分组的所有人都通过了,而低分组却无人通过,这样 D的最大值可能达到。 ( 2) 为了使整个测验项目的潜在区分度最大,似乎应该使每个项目的难度处于 ,但事实并非如此简单。 如果每一个项目的难度均处于 ,由于项目难度相同,有可能大多趋向于有关的内容或技能,结果造成项目同质性提高。 在极端情况下,有可能 50%的被试全部通过各项目得满分,另外 50%的被试全部为 0分,形成 U形分布,这样反而降低总分的区分能力。 如果测验的所有项目都是中等难度,只有项目的内在相关为 0时,整个测验才能产生常态分布。 考虑到一般测验项目之间具有某种程度的相关难度的分布要广一些,梯度多一些,是合乎需要的。 第三节 项目分析的特殊问题 项目特征曲线:是项目特征函数或项目反应函数的图解形式,它反映了被试对某一测验项目的正确反应概率与该项目所对应的能力或特质的水平之间的一种函数关系。 ( 1)项目特征曲线可图解测验的鉴别力,项目鉴别力的高低主要在于其曲线的倾斜度,曲线坡度越陡,鉴 别能力越好,预测的误差越小。 ( 2)项目特征曲线可以图解项目难度。 ( 3)项目特征曲线还可以图解选择题的诱答反应。 (简答、名词解释) 第六章 测验的实施、记分及其误差 第一节 测验的实施及其误差的控制 一、 的程序及其要素(简答) 标准化指导语:测验标准化的第一步是指导语标准化,即在测验实施过程中应使用统一的指导语。 指导语通常包括两部分:一部分对被试的指导语,另一部分对主试的指导语。 标准时限:时限也是测验标准化的一项内容。 大多数典型行为测验是不受时间限制的,例如人格测验中被试的反应速度就不很重 要。 但在最高作为测验中,速度是需要考虑的重要因素之一。 在速度测验中,尤其要注意时间限制,不得随意延长或缩短。 测验的时间安排,也是影响测验结果的一个重要因素。 测验的环境条件:有许多研究表明,测验环境会对测验的结果造成影响。 尤其需要强调的是,心理测验进行之时,务必不能有外界干扰。 为此,测验室的房门上应挂一个牌子,示意测验正在进行,旁人不许进入。 因此,对于测验的环境条件:( 1)遵从测验手册的要求;( 2)下任何以外的测验环境因素;( 3)测验结果时也必须考虑这一因素。 二、主试误差及控制方法 测验前的准备 工作 ( 1)预告测验:应当事先通知被试( 2)准备测验材料( 3)熟悉测验指导语( 4)熟悉测验的具体程序:于个别测验来说,测验的实施必须由受过专业训练的人来完成。 测验中主试的职责 ( 1)应按照指导语的要求实施测验,不带任何暗示,当被试询问指导语意义时,尽量按照中性方式作进一步的澄清。 ( 2)测验前不讲太多无关的话( 3)对于被试的反应,主试不应作出点头、皱眉、摇头等暗示性反应;( 4)对特殊问题要有心理准备 建立协调关系:在心理测验实施中,协调关系是指主试和被试之间一种友好的、合作的、能促使被试最大限度地做 好测验的一种关系。 例如再智力测验中,这种关系会促使被试尽最大努力发挥自己的能力;在人格测验中,它会促使被试真实坦白地回答有关个人一般行为特点的问题。 三、被试误差及控制方法(大答题) 即使一个测验经过精心编制,题目取样具有代表性,又有标准化的实施和积分程序,这种误差是最难控制的。 被试技巧与练习效应:被试对测验的经验或应试技巧会影响测验成绩,对测验的程序和技能熟悉程度不同,所得分数便不能直接比较。 任何一个涉及认知功能的成绩,在第二次应用或重复测量时,都会有练习效应而使测验成绩提高。 要控制应试技巧和练习 效应的影响,可尽量设法使每个被试对测验材料的步骤和所需技巧有相同的熟悉程度。 被试的动机与焦虑因素 ( 1) 被试参加测验的动机不同,会影响其回答问题的态度、注意力、持久性以及反应速度等,从而影响测验的成绩;在成就、智力和能力倾向等变量时,只有被试动机强力才可能尽力回答,取得好成绩。 动机效应在测量态度、兴趣及人格等典型行为表现时也有影响。 某些被试若欲给人以好印象,就会考虑主试的期望或社会赞许行为,而不按自己的真实情况回答,从而使测验分数降低。 相反,为了某重动机若欲给人以坏影响,则会使测验分数升高。 ( 2) ○b 测验焦虑是指被试在应试前和测试中出现的一种不愉快的、表现为焦虑、担心、恐惧和紧张的情绪体验。 适度的焦虑会使人兴奋型提高,注意力增强,提高反应速度,提高智力测验、成就测验和能力倾向测验的成绩。 测验焦虑会受到下列因素影响: ○1 能力高的人,测验焦虑一般较低,而对自己能力没有把握的人,测验焦虑较高; ○2 抱负水平过高,求胜心切,测验焦虑较高; ○3 具有某种人格特点,如缺乏自信、患得患失、情绪不稳定的人易产生测验焦虑; ○4 测验成绩与被试的关系重大,或被试受到的压力过大,容易使其产生测验焦虑 ; ○5 经常接受测验的人焦虑较低,而对测验程序不熟悉,尤其是测验中采取了新的题目形式或实施程式会增加测验焦虑。 通过教学或辅导可以降低测验焦虑,而熟悉测验程序也是降低焦虑的有效方法。 反应定势:亦称反应风格,是指独立于测验内容的反应倾向,即由于每个人回答问题的习惯不同,而使能力相同的被试得到不同的测验分数。 几种常见的反应定势是: ( 1)求快与求精确的反应定势;( 2)喜好正面叙述的反应定势;大量研究发现,被试在无法确定 “ 是非题 ” 的正确答案时,选择 “ 是 ” 的人往往多于选 “ 否 ” 的人,或者说选 “ 是 ”的人多于实际上 应该选 “ 是 ” 的人。 ( 3)喜好特殊位置的反应定势;( 4)喜好较长选项的反应定势( 5)猜测的反应定势。 第二节 测验的记分及其误差的校正 对于测验编制者而言:记分标准化应该包括选择和设计合式的标准化记分程序,考虑分数的分配、权数的分配、猜测的处理以及分数是由原始分数表示还是转化成其他形式。 对测验使用者而言:记分标准化则是要求完全按照测验手册的规定和标准答案给予被试分数,有时还可以完全依据套板或计算机记分。 记分的基本步骤和要求:( 1)记录被试反应。 ⑵ 参。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。