关于百分位常模参照测验 分数线,什么不是计算低于某测验分数的人数百分比

出自 MBA智库百科()   常模是指一定人群在测验所测特性上的普遍水平或水平分布状况,是一种供比较的量数,由结果计算而来,即某一标准化样本的和。它是用于比较和解释测验结果时的参照分数标准。测验分数必须与某种标准比较,才能显示出它所代表的意义。   常模可分为组间常模和组内常模两大类。前者有年级、年龄常模,反映不同在测验上表现的差异。后者有百分等级、、等常模。   常模的构成要素为:1、原始分数;2、导出分数;3、对常模团体的有关具体描述。   ①科学抽样,从清楚而明确地定义的“特定人群”中,抽取到容量足够大、并确具代表性的被试样组;   ②要用拟建立常模的测验,采用施测手续与方法对标准化样组(常模组)中的所有被试,施测该测验,以便恰当而准确地收集到所有这些被试在该测验上的实际测值;   ③对收集到的全部资料进行处理,真正把握被试样组在该测验上的普遍水平或水平分布状况。   就是根据不同年龄上各种的人的平均表现(如智力、、感觉运动等方面的发展水平)所制定的量表。   1、发展顺序量表:与发育正常的儿童相比,按年龄评定一个儿童的心理发展水平。   (1)葛尔塞发展程序量表:按月份显示发育正常儿童在运动水平、适应性、语言、社会性四个方面的发展水平,以此作为标准,评定个体的发展水平。强调儿童早期行为的发展是有规律的。   (2)的发展理论——对守恒概念的研究:5岁时才会理解质量守恒;6岁才会掌握重量守恒;7岁时才有容量守恒概念。(守恒:是指二种等量的物体,只要无增无减,无论怎么,它们在、重量、长度、数量及容量等方面仍然是相等的。)   2、智力年龄(的智力所达到的年龄水平——智龄):是指一个儿童在年龄量表上所得的分数。   (1)比内-西蒙智力量表——首先使用智力年龄的概念;   智龄是年龄量表上度量智力的。编制出可区分各年龄儿童的智力水平的测题,这些测题的难度随年龄而逐渐加大。   (2)为每个年龄水平都编制一些适当的题目,其中的每个测题是该年龄组大部分儿童都能完成的。以智力年龄(智龄)作为度量智力的单位。   (3)智力年龄的计算方法:   范例:每个年龄组各有6个测题,每答对一题增加智龄2个月。先确定基础年龄(智力量表中全部被通过的那一组测题所代表的年龄)。例如:六岁组的测题全部答对,更高年龄组的测题只有部分答对,或都未通过,则基础年龄为六岁,再求答对的更高年龄组上的测题数量,每答对一题增加智龄2个月。   智力年龄=基础年龄+更高年龄组上通过的测题数量所代表的智龄增长的月数   3、不分年龄组测题:以标准化样本中每个年龄组的平均分数作为年龄常模;将个人的原始分数与年龄常摸作比较,计算其智力年龄。   4、年级量表:将一个学生和同年级学生相比。年级量表的单位通常为10个月间隔(故10个月为一个学年)。   1、百分等级:   (1)是应用最广的表示测验分数的方法;   (2)一个测验分数的百分等级是指在常模样本中低于该分数的人数百分比;即百分等级指出的是个体在常模团体中所处的位置,百分等级越低,个体所处的位置就越低;   (3)分类:A.未分组资料的:计算:PR = 100 -(100R-50)/N R是原始分数排列顺序,N是指总人数(样本的总人数)。B.分组资料的百分等级。   2、百分点(百分位数):是计算处于某一百分的人对应的测验分数是多少;是分数量表上相对于某一百分等级的分数点,又称百分位数(PP)根据直线计算(举例:高考成绩):   (100-百分等级)/(最高分-PP)=(百分等级-1/PP-最低分)   原始分数和百分等级可互相转换,由此编制的原始分数与百分等级的对照表,称为百分位常模。   3、和十分位数   (1)四分位数:将分数量表分成四等份,相当于百分等级的25%、50%和75%三个百分点分成的四段;   (2)十分位数:将分数量表分为十段:10%、20%等。   1、是将原始分数与平均数的距离以标准差为单位表示出来的量表;   2、其基本单位是标准差;   3、常用的标准分数有:z分数、Z分数、T分数、标准九分数、离差智商(IQ)等。   4、分类:   (1)线性转换的标准分数:   (A)适用于正态(常态)分布的数据资料;   (B)z分数为最典型的线性转换的标准分数;   (C)z分数:z =(X-M)/SD   X为任一原始分数,M为样本平均数,SD为样本标准差。z分数可以用来表示某一分数与平均数之差是标准差的几倍。   (D)转换后的Z分数:Z=A+Bz   Z为转换后的标准分数,A、B为根据指定的常数;加上一个常数是为了去掉负值,乘以一个常数是为了使单位变小而去掉小数点;加或乘一个常数并不改变原来分数间的关系。   (2)非线性转换的标准分数:   (A)原始分数不是常态分布——使之常态化(常态化过程是非线性的);   (B)常态化过程主要是将原始分数转化为百分等级,再将百分等级转化为常态分布上相应的离均差,并可以表示为任何平均数和标准差。   (C)计算步骤:   1、对每个分数值计算累积百分数;   2、在常态曲线面积中,求出对应的该百分比的z分数;   所得的z分数可将分布分成几部分,称之为z'分数,以区别线性转换所求得的z分数。   与线性导出分数一样,常态化标准分数也可以被转化为任何方便的形式,并可用以下表示:   3、T分数——以50为(即加上一个常数50),以10为(乘以一个常数理10),即: T= 50 +10 z' (平均数为50,标准差为10);   4、标准九分:其量表是个9级分数量表(平均数为5,标准差为2);   5、标准十分——平均数为5.5,标准差为1.5; 标准二十分——平均数为10,标准差为3。   (使用最广、影响最大的一种常态化标准分数是离差智商。)   建立标准分数常模步骤:①从明确界定好的该测验测查的被试总体中,抽取一个容量足够大的代表性样组,即建立起常模组(常模团体);   ②对该代表性样组按应有规范施测该测验,获得代表性样组中每一被试的测验分数,即得到常模团体的测验分数组   ③求取常模团体测验分数组的平均数与标准差,按公式求取从-3.000到3.000这一区间上若干个点的标准分数(Z值)跟测验原始分数的对照表,就得到了标准分数常模表。   若心理年龄高于其生理年龄,则智力较一般儿童高,若低于其生理年龄, 则智力较一般儿童低.但在使用中发现,单纯用心理年龄来表示智力高低的方法缺乏不同年龄儿童间的可比性   1.:IQ=MA/CA*100 ;   比率智商被为心理年龄(MA)与实足年龄(CA)之比.这避免小数,将商数乘以100.如果一个儿童的心理年龄等于实足年龄,他的智商就为100。   IQ等于100代表正常的或平常的智力,IQ高于100代表发展迅速,低于100代表发育迟缓. 由于个体智力增长是一个由快到慢再到停止的过程,即心理年龄与实足年龄并不同步增长,所以比率智商并不适合于年龄较大的被试。   2.离差智商   离差智商是一种以年龄组为样本计算而得到标准分数,为使其与传统的比率智商基本一致,韦克斯勒将离差智商的平均数定为100,标准差定为15.所以离差智商建立在的基础上,它表示的是个体智力在年龄组中所处的位置,因而是表示智力高低的一种的,具体公式:IQ=100+15Z`=100+15(X-X)/SD   公式中X表示被试的量表分数,X表示被试所在年龄水平的平均量表分数,SD表这一年龄水平被试的量表分数的标准差.1960年修订的斯-比测验中,就使用的是平均数为100,标准差为16的标准分数量表。   必须指出:从不同的测验获得的离差智商只有当标准差相同或接近时才可以比较,标准差不同,其分数的意义便不同。   1、转换表法   ——是最简单而且最基本的表示常模的方法。   1、一个转换表显示出一个特定的标准化样组的原始分数与其对应的等值分数——百分位、标准分数、T分数或其他任何分数。利用转换表可将原始分数转换为与其对应的导出分数,从而对测验的分数作出有意义的。   2、简单的转换表就是将单项测验的原始分数转换成一种或几种导出分数。复杂的转换表通常包括几个分测验或几种常模团体的原始分数与导出分数的对应关系。   2、剖面图   ——是将测验分数的转换关系用图形表示出来。可以很直观地看出被试在各分测验上的表现及其相对位置。   标准差代表一组数据的,如一个班内学生数学成绩的离散程度从理论上说,数据一般为,或接近正态分布。的形状取决于标准差,但曲线下的面积始终为1个单位在心理测量中,个体在团体中的相对位置,以Z分数的大小表示,而Z分数是标准差作为单位,既以包含几个标准差表示个体分数与总体平均分数的距离,而不是用两者的绝对分数之差表示表示个体在团体中的相对位置。 根据Z分数可确定低于或某或高于某个分数的人数比例,也可以对不同的进行比较心理基本。   常模的作用是让测验者明白测验结果分数的意义。测验者在人才测评系统中完成以后,将会得到一个自己的位置,比如当你完成判断推理测验以后,可能被告知你的判断推理能力要比75%的人都要高,你会不会觉得这是不可思议的呢?你会问,经过测验就可以知道我会比多少人要高吗?还是同样的比喻,你为什么会信任一个血压计的?因为血压计是客观的,其实测验的结果也是客观的,两者的结果都是以数值的形式表现,你之所以能够从血压计显示的数值中了解自己的血压是高了还是低了,那是因为你知道正常的血压范围是多少,这是一个比较的结果,将你自己的血压与正常的血压范围进行比较,然后你得出了一个关于自己血压的结论。   1、常模分数:就是施测常模样本后,将被试者的原始分数按一定规则转换出来的导出分数。   原始分数:是指被试者的反应与标准答案相比较而获得的测验分数。   导出分数:原始分数本身没有多大意义,必须有一个参照标准才行,在心理测验中,这种标准是由原始分数构成的分布转换而来的分数,叫导出分数。导出分数具有一定的对照点和单位,它实际上是一个有意义的测验量表,它与原始分数等值,可以进行比较。   2、常模:就是常模分数构成的分布,它是解释心理测验分数的基础。   一般常模:常为测验指导书上列出的常模。   特殊常模:为非典型群体建立的,如某个单位。特殊常模的建立方法:根据的原始分数制作次数分布图,再计算出导出分数,最后制成转换表。 本条目对我有帮助9 &&如果您认为本条目还有待完善,需要补充新内容或修改错误内容,请。 本条目相关文档 & 15页& 1页& 1页& 1页& 1页& 1页& 1页& 1页& 1页& 1页 本条目由以下用户参与贡献 (window.slotbydup=window.slotbydup || []).push({ id: '224685', container: s, size: '728,90', display: 'inlay-fix' 评论(共0条)提示:评论内容为网友针对条目"常模"展开的讨论,与本站观点立场无关。 发表评论请文明上网,理性发言并遵守有关规定。 以上内容根据网友推荐自动排序生成【图文】第二节 测验的常模(2)_百度文库 两大类热门资源免费畅读 续费一年阅读会员,立省24元! 评价文档: 测验的常模(2) 上传于|0|0|暂无简介 大小:2.69MB 登录百度文库,专享文档复制特权,财富值每天免费拿! 你可能喜欢当前位置: >> 测量心理学 第 五 章 心 理 测 量 学郑 威 第一节 概述第一单元一、测量 依据一定的法则用数字对事物加以确定。 测量定义的三要素: ⑴事物 ⑵数字 ⑶法则 要测量的对象――心理能力、个性特征等 表示某一属性的量,表明差别程度 测量所依据的规则和方法 如:温度计量温度,依据热胀冷缩规律
测量与测量量表 二、测量要素测量的二要素:参照点 单位 ㈠参照点――测量时计算的起点 ? 绝对零点 测量长度,从零计算 ? 相对零点 测量海拔高度,人为确定以东海平 面为起点心理测量中很难找到绝对零点,多采用人为 标定的零点――如智商测验中的智力年龄“0”, 指0岁儿童的智力水平 ㈡单位 好的单位必须具备两个条件: ? 确定的意义――不会曲解 ? 相同的价值――等距 ? 但心理测量的单位: 1、没有统一单位 2、不符合等距要求 三、测量量表(一)测量的本质: 根据某一法则,在一个定有单位和参照点的连续体 上,把事物的属性表现出来,这个连续体称为量表 测量的四种水平(从低级到高级):1、命名量表 用数字代表事物或把事物归类 代号 学生的学号 类别 用“1”代表男,“2”代表女2、顺序量表 其数字既代表类别,也指明类别大小或程度 如成绩量表 A\B\C\D代表的不同等级 3、等距量表 有大小关系,有相等单位,数值可做加 减法 如温度量表4、等比量表 有相等单位、绝对零点,可做加减乘除 如体重、身高心理量表 一般属顺序量表,无绝对零点,不可运算。 但运用统计方法可以把顺序量表中的数据换算成等 距量表,进行统计运算 量表绝对零点 加减运算 乘除运算统计分析命名 量表无否否次数、众数、百分比、 χ2顺序 量表等距 量表 等比 量表无否否中位数、百分位数、 等级相关平均数、标准差、积 差相关、t检验、F检 验 几何平均数无可以否有可以可以 第二单元 心理测量的基本概念一、心理测量 依据心理学理论, 使用一定的操作程序, 通过观察人的少数有代表性的行为, 对于贯穿在人的全部行为活动中的心理特点, 做出推论和数量化分析的一种科学手段。 含义: 1、心理测量的对象是人的行为 2、心理测量常是对少数选择后的行为样本进行观察,间接推知 受测者心理特征――如智商测验 行为样本 有代表性的样本,或根据某些条件取得的标准样 本。 3、测验条件对所有受测者必须相同 常模常模的作用,在于给测验分数提供比较标准,即提供某一标准化样组在某测验上的平均分,从而对测验分数加以解释。常模是否可靠,关键是有无代表性的被试样本, 即建立常模的这组被试要有足够的数量,而且是依据 随机抽样和分层抽样的原则挑选出来的。 什么是标准化测题 在测验编制时,测题的印刷和成批生 产的器具要保证物理性质上的一致; 指导语 凡是足以影响测验作业的每种情况, 都有详细说明,以保证被试者在反应时减 少误差;评分标准 要测验编制时规定清楚,必要时 还应该举例说明,以使主试者评分时都可 以按同样的标准规则记分。 二、心理测量的性质同物理测量相比较,心理测量具有以下独特性质 (一)间接性 只能通过测量人的外显行为,推知心理特质 特质 用来描述一组内部相关或有内在联系的行为时所使 用的术语,是个人对刺激作反应的一种内在倾向。 一个人喜欢排球、篮球、体操、游泳等体育运动――运动特 质 一个人喜欢唱歌、演戏、跳舞等艺术活动――艺术特质(二)相对性 个体测量分数总是要与常模做比较,从而判断他 所处的位Z。 例如测得 智商95 (三)客观性 标准化 测验用的项目或作业 度施测说明主测者的言语态 第三单元 心理测验的分类一、按测验的功能分类 ㈠智力测验 比奈―西蒙智力测验 斯坦福―比奈智力量表 ㈡特殊能力测验 音乐能力 绘画能力 ㈢人格测验(性格、气质、兴趣、态度、情绪、动机、信念) 测验方法有两种: 二、按测验材料的性质分类1、文字测验(16PF、EPQ)优点:实施方便,适合团体施测。缺点:受文化程度影响大2、操作测验(非文字测验)对图形、模型、实物进行辨认和操作,可用于不识 字的儿童和成人如:罗夏测验、智力测验中的操作部分优点:不受文化因素的限制 缺点:不宜团体施测,费时 三、按测验材料的严谨程度分类1.客观测验 测验中的词句描述、图形表现等意义明确, 不需要想象力2.投射测验 测验中,受测者需要凭借想象力进行猜测 和遐想,给出见解,以此投射出心理特征 四、按测验的方式分类1.个别测验 一对一形式进行优点:一对一交流充分了解测验状况,结果较可靠 缺点:费时、测验过程复杂、对主测要求高。 2.团体测验 同时对多个受测者实施测验 优点:省时,对主测要求低 缺点:主测不能有效控制受测者行为,结果较不可靠 团体测验材料也可以个别施测,但个别测验一般不做团体施测。 五、按测验的要求分类㈠最高作为测验 要求受测者尽量做出最好的回答 如智力测验、成就测验㈡典型行为测验 要求受测者按通常的习惯方式做出反应,没有正确答案 如人格测验 第四单元一、错误的测验观纠正错误的测验观1、测验万能论 测验可以解决一切问题,把测验分数绝对化 2、测验无用论 认为: ? ? 某些人格测验侵犯了个人隐私,违背民主原则 测验为宿命论和种族歧视提供了心理学基础 黑人心理测验 = 智力测验 = 智商 = 遗传决定论3、 心理测验就是智力测验二、正确的测验观1、心理测验是心理学的重要研究方法之一,是决策的辅助工具 ? 如人事招聘中的心理测验 2、心理测验作为研究方法和测量工具尚不完善 应谨慎对待测验结果和分数 第五单元 心理测验在心理咨询中的应用一、智力测验中国比内量表(吴天敏修订)韦氏智力量表(成人、儿童、幼儿)瑞文标准型测验二、人格测验艾森克人格问卷 明尼苏达多项人格调查表 三、心理评定量表 精神病评定量表 抑郁量表 躁狂状态评定量表 焦虑量表 恐怖量表 卡特尔16因素人格因素问卷 第六单元心理测量的发展史一、科学心理测验的产生与发展1、高尔顿(英) 首先倡导科学心理测验 2、卡特尔(美) 在杂志上发表“心理测验与测量”, 首次出现于心理学文献 ,并主张确立常模的重要性提出:心理学若不立足于实验与测量上,绝不能够有 自然科学之准确性。3、比内――编制第一个智力测验量表 19世纪80年代是高尔顿的10年 90年代是卡特尔的10年20世纪头10年是比内的智力测验的10年。 20世纪心理测验的发展四个方面1.操作测验的发展比内-西蒙量表多是文字材料,大多儿童无法使用,因此, 操作性测验问世和发展 2.团体智力测验的发展比内-西蒙量表是个别测验,费时,第一次世界大战开始, 美国开始使用团体测验 ? 奥蒂斯:陆军甲种、乙种智力测验,官兵选拔和分派兵种 3.能力倾向测验的发展韦克斯勒智力量表――将智力量表分为言语和操作两部分, 每部分又含不同的分测验,可区分智力的不同侧面 4.人格测验的发展 人格测验的先驱 克雷丕林,最早将自由联想测验施测精神病人 第二节 测验的常模第一单元 常模团体一、常模团体的性质 常模团体 由具有某种共同特征的人组成的一个群体,或 该群体的一个样本。1、常模团体必须能够代表本次测验要施测的总体。2、确定常模团体时,要先确定一般总体,再确定目标总 体,最后确定样本。 如:要研究大学生的择业取向 一般总体是全体大学生 目标总体可选择大四的学生, 样本就可从不同高校的大四学生中随机抽取 二、常模团体的条件㈠群体的构成必须明确界定,依据不同变量确定 群体,得到的常模会有显著差别如:性别、年龄、职业、文化程度、民族、 地理地域、社会经济地位 若发现某变量下得到的数据结果有较显著 差异,就应此变量为标准确立常模如:在智力测验中,在操作能力定向测验项目 上,男性分数高于女性;而在语言文字能力测 验上,女性高于男性,就可以分别建立男性和 女性在此两类测验中的常模。 ㈡常模团体必须是所测群体的代表性样本当测量样本很小时,可以逐个测验,得到所有人的分数, 平均分就是这个测量群体的可靠常模; 但当群体很大时,不可能逐一测验,就需要选取样本, 就存在样本是否恰当的问题如,测量大学生的择业取向大学生的性别――男、女 大学生的家庭背景――农村、城市,贫穷、富有 这些都可能造成测量结果的差异 因此,在收集常模资料时,通常采用随机取样、分层取 样,或二者结合的方法 ㈢样本的大小要适当 总体数目小,只有几十个人,则需要100%的样本。 如果总体数目大,相应的样本也大,一般最低不小于30或 100个。 全国性常模,一般应有人为宜。 ㈣标准化样组是一定时空的产物30年前选取的常模,可能已经不适合今天的情况因此常模必须定期修订。 应注意选择较新近的常模。 三、取样的方法取样 从目标人群中选择有代表性的样本。按照随机表顺序选择受测者,构成样本 ㈠简单随机抽样可避免因某些喜好所造成的取样偏差㈡系统抽样(等距抽样) 将编号的个体每隔若干号抽取一个 要求:目标总体无等级结构存在。 如调查伙食质量满意度,军队里每5人1班,抽取样本比例若为 1:5,那么可能抽取的都是班长㈢分组抽样 群体人太多,且多样性,可先分组,再在组内抽样 如:人口普查,按不同的行政区划进行抽样 先将群体进行分组,再在组内进行随机取样。 ㈣分层抽样 先将总体按某变量(如年龄)分若干层,再从各层 中随机抽取被试 。可避免随机抽样中样本集中于某特性的情况如:大学生对药家鑫案看法,农村和城市生源可能有不同结论 四、常模与常模分数㈠常模 一种供比较的标准量数,由标准化样本测试结果计算而来 是心理测验中用于比较和解释测验结果的参照分数标准 1、按照样本的大小和来源,通常分为: 全国常模 区域常模 特殊常模 2、按具体应用标准和分数特征,通常分为: 百分位常模 标准分常模 ㈡常模分数 施测常模样本后,将受测者的原始分数按一定规则转 换出来的导出分数 原始分数(raw score):通过将被试的反应与标准答案相比较获 得的测验分数。 导出分数:原始分数构成的分布转换来的分数(有意义、等单位、 带参照点 )。 如:艾森克人格问卷,得分:E(内、外向)――20 此分数为原始分数,须转换为导出分数,才能具体解释意义 第二单元 常模的类型一、发展常模人的许多心理特质都在发展,常把个人某年龄段的成绩与各个发展水平阶段的人的平均表现相比较。 根据这种平均表现所制成的量表就是发展常模,亦称年龄量表。㈠发展顺序量表 ――是最直观的发展常模,表明各个年龄的儿童应具备哪些 能力和行为,何为超前,何为滞后 葛塞尔发展程序表,其中按月份显示儿童在运动水平、适应性、语言、社会 性四个方面的大致发展水平。 葛塞尔发展程序表-婴幼儿智能发育阶段初步检查表关键 年龄4周成熟 阶段仰卧动作能应物能言语能应人能不能控制头部, 眼光能短暂跟随人、面部无表情,喉 仰卧姿势左右 物,给玩具立即放 头作微声 不对称 弃 颈可竖直,头 微摇动,仰卧 姿势左右对称 扶起独坐,身 体前倾 开始接近有响声的 发出咕咕声,出 玩具,注视手中有 声笑 响声的玩具 伸手拿玩具,能将 呼号,哭时作 玩具自一手递另手 “姆姆”声凝视四周, “倾听声音” 自动微笑迎 人,玩弄己 手 将足Z口中16周仰卧28周坐40周坐可独坐,爬行, 能将两样玩具放在 能呼爸爸妈妈, 扶着物件站立 一起,平指摘小丸 除爸妈外能说另 一字 搀一手行走, 摇摆 能把方木Z于杯中,能说二字,对 试堆叠二方木 “给我”二字有 反应懂得成人逗 玩,能自己 吃饼干 穿衣时能合 作52周运动 葛塞尔发展程序表-婴幼儿智能发育阶段初步检查表关键 年龄 15月 成熟阶 段 运动 动作能 应物能 言语能 应人能独自行走,微有摇 堆叠二块方木; 摆;自坐椅子中 能把6块方木置 于杯内能用4~6个字能指出并说出所 需之物,摸玩具18月运动独自行走,自坐于 堆叠3~4块方木, 能用10字言语 白天能控制大小 小椅子中 模仿一划 (无任何意义) 便;能携带及抱 娃娃2岁幼儿园 能跑,自行上下楼 堆叠6~7块方木, 能说2~3字短语, 白天预示大小便, 前期 模仿画圆圈。 能说3~5张画片 能照顾娃娃入睡 中物名 幼儿园 能骑三轮脚踏车, 模仿叠方木成品 前期 能一足短暂独立 字形、房屋型, 模仿画十字3岁能成句,能说出 能自己吃食物, 姓名、性别 能自己穿袜解扣。 ㈡智力年龄智力年龄(智龄) 在比内-西蒙量表中,每个年龄水平的人都在智力量表中 有相应的测验题目,一个人在此年龄量表上的得分,就是代表 其智力水平的年龄,这个分数就叫智力年龄。基础年龄,即全部题目都通过的那组题目所代表的年龄。 如:大部分6岁儿童,都刚好能正确完成设计好的一组题目,增 加难度就不能完成。则该组题目代表6岁基础年龄 儿童的智龄是基础年龄与在较高年龄水平的题目上获得的附 加月份之和。 有些量表中,不按年龄组编写题目,完成整个测验后,每个年龄 都有一个常模分数,通过将原始分数与年龄常模对比,便可求 某6岁儿童心理年龄的计算方法实际年龄 通过的题数 测验得到的月数 得分 年 月6岁 7岁 8岁 9岁 总分6 4 3 2― 1 1 16 ― ― ― 6― 8 6 4 18心理年龄:7岁6个月 (三)年级当量(年级量表) 说明测验结果属哪一年级的水平,在教育成就测验中最常用 如某学生 算术能力――3年级水平 理解能力――5年级水平 阅读能力――4年级水平年级当量的单位通常为10个月,即每10个月为一个年级。 二、百分位常模 包括: (一)百分等级 指在常模样本中低于这个分数的人数百分比。 百分等级越低,个体所处位Z就越低。 如:百分等级为90――在常模样本中有90%的人低于此分数 ㈡百分点(百分位数),相对于某一百分等级的分数点。 是计算处于某一百分比例的人对应的测验分数是多少。 如:百分等级为90,一般对应某一分数,高于此分数有10%的 人,低于此分数有90%的人。百分位常模 由原始分数可计算百分等级,由百分等级也可确定原始分数 这样双向方式编制的原始分数与百分等级对照表,就是百分位 常模。 (三)四分位数、十分位数 是百分位数的两个变式四分位数是将量表分成四等份,相当于百分等级25%、50%、75%对应的三个百分点分成的四段 。十分位数 是将量表分成10段,即1%――10%... 91%――100% 三、标准分常模 将原始分数与平均数的距离以标准差为单位表示出来的量表 (一)线性转换的标准分数式中:X原始分数,X拔为样本平均数,SD标准差,指一组 数的离散程度 如:离差智商测验中,100为平均数,15为标准差 前一个算式常出现负数和小数,所以常使用其转换式,即后 一个算式。(二)非线性转换的标准分数 (原始分数不是常态分布时使用) 1.对每个原始分数值计算累积百分比; 2.在常态曲线面积表中,求出对应于该百分比的z分数。 分数(X) 48 47 43 41 41 40 38 36 34 32 400x = X-M +8 +7 +3 +1 +1 0 -2 -4 -6 -8 0x2 64 49 9 1 1 0 4 16 36 64 244S = √ Σ x2 / N =4.9Z = (X C M)/ SM―为团体平均数 X―为个体所得分数 S―标准差 正态分布 ? T分数纪念Terman和Thorndike。 T= 50 + 10?z’平均数为50,标准差为10? 标准九(sta-nine) 标准化九级分制 标准九=5+2 ? z’,即平均数为5,标准差为2 ? 标准十分 = 5 + 1.5 ? z’ ? 标准二十分 = 10+3 ? z’ 四、智商及其意义最原始的比内-西蒙量表用“心理年龄”与“生理年龄”相 比较来表示被试智力高低, 但不同年龄儿童有些方面不具可比性 所以后人用比率智商和离差智商表示智力高低 (一)比率智商 IQ=(MA/CA)X100 心理年龄与实足年龄之比,所得商乘以100一儿童心理年龄=实足年龄,则智商为100,高于100则为发展超前 比率智商不适合年龄大的受测者,因为心理年龄与实足年龄增 长并非同步 ㈡离差智商 (个体智力在所处年龄组中的位Z,更理想)IQ=100+15(x-X)/SD★ 不同测验获得的离差只有在标准差相同或相近时才可比较(372) 几种导出分数间的相互关系 第三单元 常模分数的表示方法一、转换表法 最简单、最基本的表示常模的方法就是转换表,也叫常模表。 利用转换表可将测验获得的每个原始分数转换为与其对应的 导出分数,从而对测验的分数作出有意义的解释。分组分数75~79 70~74 65~69 60~64 55~59 50~54 45~49 40~44 35~39 30~34百分等级(PR)99.4(99) 96.6(97) 90.8(91) 81.8(82) 66.6(67) 43.8(44) 23.2(23) 10.6(11) 3.0(3) 0.2(0)T 分 数75 68 63 59 54 48 43 37 31 21 二、剖面图法 将测验分数的转换关系用图形表现出来韦克斯勒儿童智力量表记录纸 第三节 测验的信度第一单元 信度的概念一、信度 同一被试者在不同时间内用同一测验(或用另一套相 等的测验)重复测量,所得结果的一致程度。 信度是评价一个测验是否合格(可靠)的重要指标。 信度只受随机误差的影响。随机误差越大,信度越低。 ? 系统误差:测量工具本身引起的误差(稳定); ? 随机误差:由不稳定因素引起的误差(不稳定)。 二、信度的指标评价信度高低的指标 : (一)信度系数与信度指数 信度系数是信度的重要指标, 常是同一受测者样本所得的两组资料的相关。 信度指数,也是信度的指标,信度指数的平方就是信度系数 (二)测量标准误 SE=SX√1 C rXX SE为测量的标准误,SX为所得分数的标准差, rXX为测验的信 度系数 信度的另一个指标 第二单元 信度评估的方法每一种信度只能说明信度的不同方面,例如: 一、重测信度 又称稳定性系数。用重测法,同一测验,在 同样条件下对同一组受测者前后施测两次,求两次得分的 相关系数。 若对人的某些稳定心理特征――智力、兴趣、性格进 行重测,分数差别较大,说明此测验未能反映较稳定的心 理特征,而是受了随机变量的影响。 用重测法估计信度的优点: 1、能提供有关测验是否随时间而变化的资料 2、可作为受测者将来行为表现的依据 二、复本信度 又称等值性系数。以两个等值但题目不同的 测验(复本)测量同一群体,求得被试在两个测验上得分 的相关系数等值性系数:两个复本测验是同时连续施测的。一半受测 者先测A后测B,另一半先B后A,以抵消施测顺序效应。稳定与等值系数(重测复本信度):两个复本测验相距一 段时间分两次施测。考验时间上的稳定性、不同题目样本 反应的一致性 ? 复本信度优点:能避免重测信度的记忆、学习效应。 ? 复本信度缺点:1、复本信度只能减少而不能完全消除练 习影响 ? 2、第二个测验只改变题目内容,但解题原则可迁移到同 类问题 ? 3、许多测验要建立复本太难。 三、内部一致性信度 反映同一量表中题目之间的关系, 即测验能测量相同内容或特质的程度 (一)分半信度 采用分半法估计所得的信度系数将测验按奇、偶数分为等值的两半,并分别计算每位 被试在两半测验上的得分,求出这两半分数的相关系数。 (二)同质性信度 代表测验内部所有题目间的一致性。各个测题的得分有较高正相关,则测验为同质的反之,则测验为异质 四、评分者信度 用于测量不同评分者之间产生的误差 要求:评分者之间平均一致性达0.90以上, 才认为评分是客观的。 各种信度系数相应误差变异的来源 信度 重测信度 复本信度(连续施测) 误差变异来源 时间取样 内容取样复本信度(间隔施测)分半信度 同质性信度 评分者信度时间与内容取样内容取样 内容取样和内容的异质性 评分者间的差异 第三单元 信度与测验分数的解释一、解释真实分数与实得分数的相关 信度系数rxx=0.90时,可以认为实得分数中有90%的变 异是真分数造成的,仅10%是来自测验的误差。 二、确定信度可以接受的水平 一般原则: 1、当测验信度系数rxx&0.70时,测验不能用于对个人做 出评价或预测,而且不能作团体比较; 2、当0.70≤rxx&0.85时,可用于团体比较; 3、当rxx≥0.85时,才能用来鉴别或预测个人成绩或作为。 4、新编的测验信度应高于原有的同类测验或相似测验。 三、信度在解释个人分数上的意义? 1、估计真实分数的范围 ? 2、了解实得分数再测时可能的变化情形 三、解释个人分数的意义 SE=SX√1 - rXX 真分数的置信区间(95%)=X±1.96SE 四、比较不同测验分数的差异 SEd=S √2-rxx-ryy S为两测验的标准差(如T分数的10)。如:数学rxx为0.84,语文ryy为0.91,则Sed=10 √2-0.84-0.91=5, 1.96 Sed =9.8,只有高 9.8,才有显著差异 第四单元影响信度的因素一、样本特征 信度受样本特征影响,其中包括: (一)样本团体异质性的影响 (二)样本团体平均能力水平的影响 二、测验长度 即测题的数量 (一)测验越长,测验的测题取样或内容取样越有代表性。 如,智力测验中,需要提供难度不同、题型众多的测验 (二)测验越长,受测者的猜测因素就越小。 如,一个题目猜对的可能性50%,100题都猜中的可能性很小 但要注意,题目过多会引起疲劳和反感,可靠性――信度降低 三、测验难度 测验太难或太易,分数范围会缩小,信度则降低 即―没拉开差距,就很难发现个体存在的问题,测验就 不可靠难度存在于智力测验、成就测验、能力倾向测验等,人 格测验、兴趣测验则不存在难度四、时间间隔只对重测信度和不同时测量的复本信度有影响 第四节 测验的效度第一单元 效度的概念一、效度 指所测量的与所要测量的心理特点之间的符合程度,即 一个心理测验的准确性。 如:想测孩子的身高,把孩子放到秤上称,则 ――本测验没有效度 注意: 信度高的测验未必有高效度――秤很准,但不适合量身高 效度高的测验未必有高信度――拿秤称体重,可是秤不准 二、效度的性质 (一)效度具有相对性 每种测验各有其功能与限制 如 数学测验的成绩对学生数学学习水平预测效度高,但对音 乐能力是没什么预测效度的 (二)效度具有连续性 评价一个测验时,不应该说“有效”或“无效”,而应该用效 度较高或较低来评价。 如 用秤给一个人称体重,并以此衡量他的腰围,一定程度上 是有作用的,只是效度较低 第二单元 效度评估的方法一、内容效度 (一)什么是内容效度 指测验题目对有关内容或行为取样的适用性, 即 该测验与要测量的目标是否一致。 如 在智力测验中包含了许多与智力无关的题目,则内容效 度有问题 要想编制内容效度高的心理测验,需要: 1、首先要对所测量的心理特性有明确概念。划定出哪些行 为与这种心理特性密切相关 如 智力测验包含的内容可能有哪些方面, 2、其次,测验题目应是所界定的内容范围的代表性取样。 (二)内容效度的评估方法1.专家判断法 步骤: (1)定义好测验内容的总体范围; (2)编制双向细目表,确定内容和技能各占比例,并确定各题所测是何内容 或技能; (3)制定评定量表来测量测验的整个效度,由每位评判者做判断,从而获得 证据。 2.统计分析法 计算两个评分者之间评定的一致性 3.经验推测法 即 通过实践来检验效度 如 检验儿童发展量表的效度,可对不同年龄段的儿童进行测验,观察其结果 是否依年龄发展而有不同 如果通过率是随着年龄的增加而增加,就可推测该测验有内容效度。 (三)内容效度的特性内容效度不是普遍适用的,如时间上的特定性―― 适合过去的测验未必适合对现在的被试者使用内容效度容易与表面效度混淆,二者判断标准不同: 表面效度(face validity):由外行对测验作表面上的检查确定的,指测验 表面上看来是否是测量所要测的东西。 而内容效度是由专家详尽、系统地对测验做评价而建立的★为激发受测者的测量动机,最高行为测验要求较高表面效度;★为掩饰题目的测量目的,典型行为测验却要求较低的表面效度。 二、构想效度(一)什么是构想效度? 也叫构思效度或结构效度,指测验能够测量到理论上的 构想或特质的程度。研究和考察构想效度的宗旨是要回答下面的问题: 1、一个测验测量什么心理构想? 2、对这构想测得有多好? 3、测验分数中有多少比例的变异数是来自测验所欲测之构 想? 如:构想――弱智儿和正常儿童想比,前者适应行为显著弱 于后者 (二)构想效度的估计方法 1.对测验本身的分析 ? 内容效度 ? 测验的内部一致性指标:分半信度等指标 ? 分析被试者对题目的反应特点2.测验间的相互比较 ? 相容效度:两测验之间的相关系数――两个测验测量同一种 心理特质,一个是等待研究其效度的,另一个是效度已经验 证过的,加入相关高,说明新测验测量的特质对路 ? 区分效度:与测量不同构思的测验之间没有相关,则理想 ? 因素分析法:对一组测验进行因素分析,找到影响测验分数 的共同因素,这种因素可能就是要测量的心理特质(构想) 3.效标效度的研究证明? 根据效标将受测者分成相对照的两组,再比较两组的测验成绩,若测验分数的确能区分两组,则构想效度理想如:对算术能力测验进行考察测验前选定以前算术能力高和算术能力低的两组, 验证其测验成绩是否也分别有显著的高低差异, 若有,则该测验的构想效度理想4.实验法和观察法证实 再测法(训练前后)――预测在前测的影响下,再测的分数会 有变化,如果预测被证实,则为构想效度提供了依据 三、效标效度 又称实证效度,反映的是测验对预测个体在某种情境下 行为表现的有效性程度。 效标:即被预测的行为,它是检验效度的标准,简称效标。? 同时效度:即测验所得的分数可与效标同时验证 。 如 智力测验以学生当时的学业成绩为效标,成绩是现成的, 可直接与此次测验分数相比较,则可计算出同时效度 ? 预测效度:效标资料需要一段时间才可搜集到。 如 高考的试卷 可用学生入大学后的学习成绩作效标,之间 有时间间隔 一个好的效标必须具备以下条件: (1)效标测量本身必须有效; (2)效标必须具有较高的信度; (3)效标可以客观地加以测量; (4)效标测量的方法简单,省时省力,经济实用。 (二)效标效度的评估方法1.相关法即 求测验分数与效标资料间的相关此相关系数称为效度系数2.区分法检验测验分数能否有效区分由效标所定义的团体的方法如效标定义A组学生数学成绩好,B组数学成绩差,从测验分数看A组与B组学生成绩相近的少,A组成绩普遍高,B组成绩较低,说明测验的效度高; 反之,如果成绩相近的人数很多,则说明测验的效度低3、命中率法 当把测验用来作为取舍依据,用其正确决定的比例作为效度指标 如 高考试卷作选拔依据,95%学生按预期成绩考上理想大学, 则高考试卷效度较高 命中率工 作 表 现 测验成绩 合格 不合格合格不合格ABCD总命中率=(A+D)/(A+B+C+D) 正命中率= A/(A+C) 第三单元 效度的功能一、预测误差 决定性系数r2表示测验正确预测或解释的效标的方差占总方 差的比例。 对真正分数估计的标准误 Sest = Sy√1 C rxy2 某人真正分数95%的可能是:测验分数 ± 1.96 Sest 二、预测效标分数 ? = a + byxX 第四单元影响效度的因素一、测验本身的因素 测验取材的代表性、测验长度、试题类型、 难度、区分度以及编排方式等 1、测验材料必须对整个内容有代表性 2、测题设计应尽量避免容易引起误差的题型3、测题难度适中,具有较高区分度4、测验长度恰当,测题量不少也不能太多 5、测题的排列先易后难 二、测验实施中的干扰因素 (一)主测者的影响因素 1、是否按使用手册进行标准化施测 2、指导语是否统一 3、测验的时限是否一致 4、评分是否合理 (二)受测者的影响因素 兴趣、动机、情绪、态度和身心状况、健康状态以及是否充分 合作与尽力而为等 (三)测验情境 场地布Z、材料准备、测验场所有无噪音和其他干扰因素等 三、样本团体的性质(一)样本团体的异质性样本团体越同质,分数范围分布越小,测验效度就越低1、只以选拔出来的受测团体参加效度研究,会降低测验效度招聘销售员,只能对聘用者的业绩进行研究,缩小了样本个体差异,预测效度低2、选拔标准太高,样本同质性增加,会降低测验效度 如:90年代前高考录取率低,如用大学成绩做高考成绩的效标,则 预测效度很低 (二)干涉变量不同性质的团体,同一测验的效度会有很大不同,因为:制定常模时没有考虑到的、使测验效度降低的变量:年龄、性别、职 业、兴趣等如 对出租车伺机进行能力倾向(驾驶技能)测验,测验成绩与工作表现相 关仅0.20把其中对驾驶工作感兴趣的受测者进行效度计算,效度系数达到0.60, 大大提高因为,对驾驶无兴趣的伺机没认真完成测验 四、效标的性质效标测量的信度不可靠,则它与测验分数之间的关系也会不可靠 第五节项目分析测验的项目分析包括: 1、定性分析 效性等; 2、定量分析 包括考虑内容效度,题目编写的恰当性和有主要是指对题目难度和区分度等进行分析。通过项目分析,可以选择和修改测验题目,以提高信 度和效度 第一单元 项目的难度一、定义 难度,即项目的难易程度 难度指标,常用通过率表示,即答对或通过者人数占 测验总人数的百分比 通过率:P=R/N*100% P N R 项目的难度 全体被试者人数 答对或通过该项目的人数 二、计算方法 (一)二分法记分的项目 例如: 1、测验项目若为选择题,通过记1分,错误记0分 2、受测者人多时,可根据成绩分三组: ? 27%高分者为高分组(NH) ? 27%低分者为低分组(NL) ? 中间的46%为中间组 3、分别计算高分组和地分组的通过率 4、以两组通过率的平均值作为每题的难度 如第一题高分组通过率为90%,低分组通过率为30%,则 该题难度为 (90%+30%)/2 = 60% (二)非二分法记分的项目 ? 当测验项目为问答题等 ,不能用二分法记分时,公式: 难度 = 全体受测者在该题的平均分/该题的满分 X 100% 三、难度水平的确定(一)项目的难度――难度分析的主要目的就是筛选项目难度值P越接近0或1,则题目的区分能力越差,P越接近0.50,区别力越高? 在选拔测验(如高考)中:题目的难度应接近录取率 ? 是非题――难度0.75最合适;? 四选一的选择题――难度0。63最合适 ? (二)测验的难度? 最好使测验包含的试题难度 在0.50±0.20之间? 平均难度接近0.50时最理想 测验难度的偏态分布 正偏态 负偏态 第二单元 项目的区分度一、定义 项目区分度(item discrimination),也叫鉴别力,是指测验 项目对受测者的心理特性的区分能力。 如果一个项目,实际水平高者能顺利通过,而低者不能通过,则 说该项目区分度较高。二、计算方法 (一)鉴别指数 步骤 1、按测验总分的高低排列答卷2、确定高分组与低分组,每一组取答卷的27%3、分别计算高分组与低分组在该项目上的通过率或得分率4、按此公式估计项目的鉴别指数 项目鉴别指数与评价标准鉴别指数 题目评价0.40以上0.30~0.39 0.20~0.29 0.19以下很好良好,修改会更好 尚可,仍需修改 差,必须淘汰 (二)相关法 计算区分度最常用的方法 即 以某一项目分数与效标成绩或测验总分的相关作为 该项目区分度的指标 1、常用计算方:有点二列相关 、二列相关、φ相关法2、相关越高,表明项目越具有区分的功能3、区分度取值范围在-1至+1之间 如项目得分与实际能力水平之间呈负相关,则为负值 区分度为负值,意味着受测者实际能力越高,该项目得分越低 三、区分度与难度的关系? 一般,较难的项目对高水平受测者区分度高,较容易的项 目对低水平受测者区分度高。 ? 项目难度的分布以常态分布为好,即特别难与特别易的项 目少些,接近中等难度的项目多些,而所有项目的平均难 度为0.50最理想。 鉴别指数D与项目难度P的关系难度(P) 1.00 0.90 0.80 0.70 0.60 0.50 0.40 0.30 0.20 0.10 0 区分度(D) 0 0.20 0.40 0.60 0.80 1 0.80 0.60 0.40 0.20 0 第六节 测验编制的一般程序第一单元 测验的目标分析一、测验的对象 要明确测量对象的特点:年龄、文化、社会状况等 二、测验的用途 是要做描述还是做预测,诊断还是选拔 用途不同,取材范围和试题难度也不同 (一)显示性测验 测验题目和所要测量的心理特征相似, 如成就测验,反映受测者有什么能力,能完成什么任务(二)预测性测验 预测一些没被测量的行为的测验 如通过行政能力测验来预测一个考生在行政管理方面的才 能 三、测验的目标 即 用来测量什么心理变量或行为特征 目标分析:将测验目标转换成可操作的术语的过程 根据测验的不同,分三种情况: (一)工作分析 也叫任务分析(job analysis)。包括两个步骤: 1、确定哪些心理特征和行为可以使要预测的活动达到成功 如:招聘销售总监――语言交流能力 2、建立衡量受测者是否成功的标准(效标)。 确定 怎样的状态才是成功的状态 如:幸福感测量――什么是幸福 (二)对特定概念下定义 如 要编制智力测验,必须给智力下定义――包括哪些方面 (三)确定测验的具体内容 双向细目表 小学自然常识测验双向细目表知识 生物世界 资源利用 动力与机械 物质与能量 气象 宇宙 地球 合计 3 2 2 5 2 2 2 18 理解 5 3 3 6 4 5 2 28 应用 6 3 4 8 3 4 2 30 分析 3 1 2 3 2 1 1 13 综合 2 1 0 2 2 0 1 8 评价 1 0 1 1 0 0 0 8 合计 20 10 12 25 13 12 8 100 第二单元测题的编写一、搜集资料 (一)已出版的标准测验 (二)理论和专家的经验 (三)临床观察和记录 二、命题原则(4方面) (一)内容方面 1、题目内容符合测验目的,避免贪多胡乱出题 2、内容取样有代表性,比例适当 3、题目之间内容要相互独立,切忌一题答案影响另一题 (二)文字方面 1、避免使用生僻字句 2、排除与答案无关的因素 3、不遗漏答题依据的必要条件 4、言简意赅,意义明确,不含糊暧昧 (三)理解方面 1、题目应有确定答案,内容不超出受测团体知识水平和理解能力 2、题目不能令人费解,不能有歧义(四)社会敏感性方面 如自杀、性观念 1、应尽量避开社会敏感性问题――个人隐私、社会禁忌 2、必须设计敏感性问题时,应鼓励作答,策略: (1)命题时假定被试具有某种行为 你有几个婚外性伴侣?A、一个 B、两个 C、三个 (2)命题时假定规范不一致 有人认为手淫有害健康,也有人认为手淫是必要的,你怎样认为? (3)指出该行为是常见的 大部分青年男性有手淫行为,你有吗? 三、编制要领题目类型: 提供型:论文题、简答题、填空题等 选择型:选择题、是非题、匹配题 (一)选择题 要求: 1.题干明确,便于理解 2.选项简明扼要 3.每题只给一个正确答案 4.各选项长度应相等 5.避免题干用词与选项用词一致,不用下列词: “决不”、“从来”、“所有”、“唯一”、“绝对” 6.选项最好用同一形式――如同是日期、人名等,并随机 排列,除非本身有逻辑顺序 (二)是非题(正误题)你认为自己大部分时候很快乐吗?A、是 注意事项: 1.内容确切,不掺杂琐碎细节或无关语句 2.每道题只能包含一个概念,不要半对半错 B、否3.最好用肯定句,尽量避免否定甚至双重否定的叙述4.若是表达意见的题目,最好说明意见的来源和根据, 以便测出受测者是否了解某个人或某些人的意见、信 念或价值观等 5.是、非题比例基本相等,且随机排列。 (三)简答题编制三原则: 1.最好采用问句形式2、空格不宜太多,空格尽量放在最后3.每题应只有一个正确答案,答案简短而具体(四)操作题编制四原则:如画图、走迷津、拼物1.明确所要测量的目标,并将其操作化,找出具有代表性 的工作样本,建立作业标准 2.尽量选择逼真度较高的项目――与真实操作场景相比 3.指导语要简明扼要,如工具、时间、评价依据等4.制订评分标准,确定计分方法――完成数量、完成时间 第三单元测验的编排和组织一、合成测验 (一)选择与审定试题 1.选择试题形式――考虑三点: (1)测验的目的和材料的性质 概念和原理的记忆――简答题 事物的辨别和判断――选择题 综合运用知识的能力――论文题 (2)接受测验的团体的特点 幼儿――口头测验 文盲――不宜采用要求读和写的项目 有言语缺陷的人――操作项目 (3)各种实际因素 受测者多、供测验时间少、经费有限――选择题,团体纸笔测验 受测者少、时间充裕、需要设备――操作测验 2.审定题目 工作内容: 审查修订题目 改正意义不明确词语 取消重复和不合理题目 修订后构成一个预备测验 注意事项: ⑴题目的范围应与测验计划一致 ⑵题目的数量要比最后所需的数目多一倍至几倍,以备 筛选和编制复份 ⑶题目的难度必须符合测验目的 ⑷题目的说明必须清楚明白 (二)测题的编排 1、测题的难度排列宜逐步上升 2、尽可能将同类型的测题组合在一起 3、注意各种类型测题本身的特点 是非题的答案不要有规律性两种常见的测题排列方式: 并列直进式――多个分测验,同一分测验内题目由易到难 如:韦氏智力量表混合螺旋式――试题按难度分成若干层次,将不同性质的试 题进行组合,交叉式排列,难度渐次增大 如:比内测验 二、测验的预试 (一)预测 ? 预测对象应取自将来正式测验准备应用的群体类型。 ? 预测的实施过程与情境应力求与将来正式测验时的 情况相近似。 ? 预测的时限可稍宽一些。 ? 在预测过程中,应对被试的反应情形随时加以记录。 (二)项目分析 1、质的分析 从内容取样的适用性、题目的思想性 以及表达是否清楚等方面加以评价 2、量的分析 对预测结果进行统计分析,确定题目 的难度、区分度、备选答案的适合度等 三、信度和效度考察 1、信度(衡量测验质量的最基本指标) 信度缺乏的表现: 同一个测量工具,而多人测量结果不一致 同一个测量工具,一人多次测量结果不一致 2、效度(参见前面内容)四、常模制订 建立常模的方法: 在要测验的所有个体中,选择有代表性的一部分人 施测,将所得分数统计整理,得出一个分数分布,作为 该测验的常模 五、编写指导手册 (一)作用:向测验使用者说明如何实施测验,以提高测验 结果的信度和效度 (二)手册的内容: ? 1、测验的目的和功用 ? 2、测验编制的理论背景、测验中的材料根据什么原则, 用什么方法选出来的 ? 3、如何实施测验 ? 4、测验的标准答案或记分标准 ? 5、常模资料―常模表、常模适用的团体、对测验分数的 解释 ? 6、测验的基本特征―难度,鉴别力,信度,效度,因素 分析资料,资料取得的条件、情境和调查的样本、时间等 第七节第一单元 一、技术资质 (一)知识结构心理测验的使用主试的资格1、基础知识 普通心理学、发展心理学、社会心理学、心理统 计学等2、专业知识 人格心理学、能力心理学、变态心理学等 二、专业理论知识和专业技能 (一)专业理论知识――主测资格考察的最基本条件 1、主测对测验的特点和性质、作用和局限性有清楚认识 2、了解测验的基本特征:信度、效度、难度、区分度等 指标 3、熟悉心理测验标准化的必要性(二)专业技能 1、接受过严格、系统的心理测验专业训练 2、熟悉测验的内容、适用范围、测验程序和记分方法 3、投射测验要求主测是临床心理咨询专家或精神科医生 三、职业道德 (一)测验的保密和控制使用 1、测验的内容只有受测者事先不熟悉才有价值 2、不可在媒体上刊登测验内容 3、宣传介绍测验时,只能引用立体,不公开正式测验 4、对测验控制使用,使用者须经专业训练、具备一定资格 5、不可将测验借给无资格的人员使用,以避免误用和滥用(二)测验中个人隐私的保护 1、尊重受测者的人格 2、对测验中获得的个人信息要严格保密 3、除非对个人或社会可能造成危害才可告知有关信息 第二单元测验的选择一、所选测验必须适合测量的目的 1、了解各种测验的功用及特长、优缺点 2、不同的目的要选择不同的测验 3、要了解所选测验的适用范围和功效 二、所选测验必须符合心理测量学的要求 1、测验是否经过了标准化,信度、效度高低 2、常模样本是否符合测试对象 3、常模资料是否太久远 4、使用的测验应符合时代特征和区域特征 第三单元测验前的准备及注意事项一、测验前的准备工作 (一)预告测验 1、事先通知受测者:时间、地点、内容范围、测题类型等 2、不搞突然袭击,避免受测者智力、体力、情绪混乱 (二)准备测验材料 1、检查问卷或器材是否完整 2、清点、摆放好测验材料 (三)熟悉测验指导语 能熟练、轻松朗读指导语,不影响受测者答题情绪和态度 (四)熟悉测验的具体程序 如受测者数量大,要进行主测的人员分工 二、测验中主测的职责 1、按照指导语要求施测。不带暗示,尽量按中性方式、照字典 的意义解释。2、测验前不讲太多无关话,占用时间不宜过长3、对于受测者的反应,主测不应做出暗示性反应(点头、摇头 等),保持和蔼、微笑的态度。 4、施测时,不让受测者看见记分,避免影响其情绪和注意力5、对特殊问题(仪器故障、生病等)要有心理准备 三、建立协调关系 协调关系 主测和受测者之间一种友好的、合作、 能促使受测者最大限度地做好测验的关系。1、测验学前儿童――避免胆怯、恐惧、分心 2、测验学龄儿童――通过竞争激发测验动机3、测验成人――强调测验对其有利的方面,激发 其努力,减少伪装 第四单元 测验实施的程序及要素一、指导语 (一)对受测者的指导语――印在开始部分,由受测者自己阅 读或主测统一宣读,内容如下: 1、如何选择反应方式(答题方式――操作、笔答、口答等) 2、如何记录这些反应(答题纸、录音、录像等) 3、时间限制 4、不能确定答案时怎样操作(允许猜测?) 5、例题展示 6、有时须告知测验目的 (二)对主测的指导语 严格按照施测指导书操作,不要任意发挥和解释 二、时限 1、大多数典型行为测验无时限要求,如人格测验 2、大多数能力测验有时间要求,如行政能力测验 3、时间的选择应恰当,使受测者能正常发挥 如:应避免生病、疲劳、饥渴状态 三、测验的环境条件 1、天气状况――阴、晴、雨、雪、风、雷、闪电 2、现场环境――噪音、温度、光线、人员干扰等 第五单元受测者误差及控制方法一、应试技巧与练习效应 (一)应试技巧 尽量避免选择应试机会多的人做受测者 (二)练习效应 1、教育背景差、经验少或智力高者,受练习效应影响大 2、着重速度的测验,练习效应较明显 3、重复实施相同类型测验,练习效应影响大 4、两次测验时距越大,练习效应越小 5、平均练习效应约在五分之一个标准差以下,并限于第 一次与第二次重测,第三次以后练习效应增加不显著 控制应试技巧和练习效应的影响的办法: 1、可设法使受测者们有相同的熟练程度 2、提高标准化测验题目的编制水平 二、动机与焦虑因素 (一)应试动机 会影响态度、注意力、持久性、反应速度等 如 大学生和农民同时接受智力测验 成绩一定有很大差距,态度也会成为重要影响因素 (二)测验焦虑 受以下因素影响: 1、能力高者,测验焦虑低 2、抱负水平高者,测验焦虑高 3、某种人格特点者(缺乏自信,情绪不稳),易焦虑 4、测验成绩与受测者关系重大,易焦虑 5、常接受测验者,焦虑低 ★ 降低焦虑的方法: 1、测验前的教学、辅导和鼓励 2、受测者尽量熟悉测验程序 三、反应定势(反应风格) 独立于测验内容的反应倾向,由于每个人回答问题 的习惯不同,使能力相同者得到不同的测验分数常见的反应定势 1、求“快”与求“精确” 2、喜好正面叙述 3、喜好特殊位Z 4、喜好较长选项 5、猜测 第六单元一、原始分数的获得测验的评分评分客观的要求: 1、及时而清楚地记录反应情况。尤其是口试和操作测验 2、要有记分键――标准答案或正确反应的说明表 3、将受测者的反应和记分键比较,对反应进行分类。二、原始分数的转换 导出分数:发展分数、百分位数、标准分数等 转化表:编制者提供的常模表就是原始分数的转化表 第七单元测验结果的报告一、测验分数的综合分析 (一)根据心理测验的特点进行分析,应把测验分数视为一个范围而 不是一个确定的点。 如 韦氏测验中,常把测得的IQ值加减5,如IQ值为100,则认为其智 商在95――105范围内(二)不能把分数绝对化,更不能仅根据一次测验结果轻易下结论。 一个人在任何一个测验上的分数,都是他的遗传特征、测验前的学 习与经验以及测验情境的函数,因此: 1、必须考虑个人在测验前的经历并解释测验分数 2、要考虑测验情境的影响 3、不仅要有常模资料,还要有测验的信度和效度资料 4、对于来自不同测验的分数不能直接加以比较 若要比较,必须将两个测验分数等值化,步骤: 将两个测验对同一样本施测 将两个测验的原始分数换算成百分等级 用该百分等级作中介,得出一个等价的原始分数表 二、报告分数的具体建议 1、应告知对测验分数的解释,而不仅是测验分数。 2、避免使用专业术语。 3、要保证当事人知道这个测验测量或预测什么,不 需要作详细的技术性解释。 4、要使当事人知道他是和什么团体在进行比较。 5、要使当事人知道如何运用他的分数。 6、要考虑测验分数将给当事人带来什么心理影响。 7、要让当事人积极参与测验分数的解释,鼓励他提 出问题,并给与鼓励和支持。 一、学习目标 掌握韦氏成人智力测验的实施、记分及结果解释方法? 二、工作程序 ? 1.知识测验 ? 由29个常识问题构成,包括历史、天文、地理、文学和 自然等内容。主要测量知识广度和远事记忆。 ? 所有受试均从第5项开始,逐一提问。若第5项或第6项 失败,便回头做第1―4项,连续5项失败(得0分)终止。?每正确回答一项记1分,个别项目可记0.5分,1―4项免 作者补记4分。最高29分。 ? ? ? ? ? ? ? ? ? ?(一)测验的实施 1、测验材料: 韦氏成人智力测验由韦克斯勒于1955年编制,后于1981 年和 1997年又经过两次修订.这里选用的是龚耀先教授 于1981年修订的中文版本(WAIS-RC) . (1)手册一本; (2)记录表格一份(分成市和农村) (3)词汇卡一张;(4)填图测验和木块测验图卡; (5)图片排列测验图卡一本;(6)红白立方体一盒; (7)图形拼凑碎片四盒;(8)图形碎片摆放位置卡; (9)数字符号记分键一张。 ? 2、适用范围 ? 本测验适用于16岁以上的被试者,分城市和农村 用两式。 ? 3、实施步骤 ? 首先填好被试者的一般情况,测验时间、地点和 主测人,然后按测验的标准程序进行测验。 ? 在进行成人测验时,一般按先言语测验后操作测 验的顺序进行,但在特殊情况下可适当改变。测 验通常都是一次做完,对于容易疲劳或动作缓慢 的被试者,也可分次完成。 ? 下面是各分测验的具体实施方法: ? 1.知识测验 ? 由29个常识问题构成,包括历史、天文、 地理、文学和自然等内容。主要测量知识 广度和远事记忆。 ? 所有受试均从第5项开始,逐一提问。若 第5项或第6项失败,便回头做第1―4项, 连续5项失败(得0分)终止。 ? 每正确回答一项记1分,个别项目可记0.5 分,1―4项免作者补记4分。最高29分。 指导语:“现在我来问你一些问题,请你回答,这些问题有 的很容易,你很快便可回答;有的可能也要想一想才能回答, 你一想好了便回答。懂吗?好!现在我们开始”。? ? ? ? ? ? ? ?1、钟表有什么作用? 2、球是什么形状? 3、一年有多少月? 4、国庆节是哪一天? 5、一年中哪个季节白天最长? 6、一天中什么时间影子最短? 7、夏天穿深色衣为什么比穿浅色衣要热些? 8、端午节是哪一天? ? ? ? ? ? ? ? ? ? ? ? ? ?9、鱼用什么来呼吸? 10、月亮在一月中的什么时候最圆? 11、长城在我国的哪一方? 12、北风为什么比男风凉些,冷些? 13、《红楼梦》这书是谁写的? 14、冰和水哪一个轻? 15、《资本论》这一书是谁写的? 16、孙中山是什么人? 17、人体有哪几种血管? 18、请你列举出从我国汉朝以后五个朝代名称。 19、一天中猫眼瞳孔在什么时候最小? 20、诸葛亮是什么人? 21、一年有多少周(星期)? ? ? ? ? ? ? ? ?22、生石膏从哪里来的? 23、从武汉到印度应朝哪方向走? 24、埃及在哪一洲? 25、井水为什么冬天暖和夏天凉? 26、地中海在哪里? 27、释迦牟尼是什么人? 28、古兰经是什么? 29、阴阳历有何不同? ? 2.领悟测验 ? 由14项有关社会价值观念、社会习俗和一些现 象的理由等问题组成。主要测量社会适应能力, 尤其是对伦理道德的判断能力。? 所有受试均从第3项开始,逐一提问。若第3、 4或5项中任何未得满分,便回头作1―2项,连续 4项得0分终止。 1―2项按0、2 计分,3―14项按0、1、2三级 记分,1―2项免做者补记4分,最高分28分。? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?1、为什么要经常洗衣? 2、火车为什么要有发动机? 3、在路上捡到一封信,写了地址和收信人姓名, 贴了邮票,你将怎么办? 4、城市里为什么要有交通警察? 5、为什么说不要同坏人交朋友? 6、耕种为什么要按季节? 7、“趁热打铁”是比喻什么? 8、“独木不成林”是比喻什么? 9、“过河拆桥”是比喻什么? 10、为什么要交税? 11、结婚为什么要办登记? 12、在电影院看电影,你首先看到电影院冒烟火, 你将怎么办? 13、白天如果在森林里迷了路你将怎么办? 14、生而聋的人,为什么一般都是哑巴? ? 3.算术测验 ? 由14项有关加减乘除的心算题组成。主要测量数的概 念、心算能力、注意集中、工作记忆和解决问题的能力。?所有受试均从第3项开始,若第3或4项得0分,便回头 做1~2项,连续4项得0分终止。注意时限,记录时间, 读完题开始记时。 每一正确答案记1分,11―14项有时间加分,未说单位 可给分,不明确,可追问,1―2项免作记满分,最高分 18分。? ? 1、主试者将左手伸3个指头,右手伸4个指头,问受试者共有几个 指头? ? 2、3个梨吃掉一个还有几个? ? 3、4元加5元共几元? ? 4、拿一元去买6角钱糖,还可找回多少? ? 5、每打铅笔12支,2打半共多少支? ? 6、6角钱一尺的布,3元6角可买几尺? ? 7、2角5分一本的小本,共买6本应付多少钱? ? 8、每小时走3公里,24公里要走几小时? ? 9、5角钱买7个2分 的邮票,应找回多少钱? ? 10、一个人有18元,买书用去6元,买笔用去1元5角,还余多少? ? 11、某人每月收入60元,存入银行15%,问他还有多少元? ? 12、两瓶酒3元1角,买12瓶要付多少钱? ? 13、有人将一房家具用原价的2/3卖掉,得400元,问原价多少? ? 14、8个人在6天内可完成的工程,现在要在半天内完成,问一共 要多少人才能做完? ? 4.相似性测验 ? 由13对表示物、方向或行为的词组成, 要求找出两者的共同性。主要测量抽象, 概括能力。 ? 所有受试均从第1项开始,连续4项得0分 终止,第1项可给帮助。 ? 每1项按0、1、2三级计分,最高分26分。 ? 指导语:“这里有一对词,你看它们有什么相类似,既是 ? 说,请你把它的共同性进行概括”。 ? ? ? ? ? ? ? 1、斧头―锯子 2、狗-------狮子 3、桔子―桃子 4、桌子---椅子 5、帽子---袜子 6、蛋-------种子 7、北方---西方 8、眼睛―耳朵 9、空气----水 10、诗-------塑像 11、表扬---处罚 12、木头---酒精 13、苍蝇---树 ? 5. 数字广度测验 ? 分顺背和倒背两式,顺背有10个数字串,倒背9 个数字串。主要测量即刻记忆或短时记忆,注意 力,倒背还测量工作记忆。? 所有受试者均第1项开始,每项有两试,两试 均失败停止,每秒一数,不能分组,第1项失败缩 短位数,全部通过可加位。 按通过的数字位数记分,而不是按通过的项目 数记分,顺背最高12分,倒背10分。? ? 6.词汇测验 ? 由40个双字词组成,要求解释词义。主要测量 语义提取能力、语言表达能力、长时记忆。 ? 所有受试均从第4项开始,主试每读一词,要 求被试指认,并解释,第4―8项中有1项得0分, 回头做1―3项,连续5项得0分停止。 ? 每词按回答质量分别记0、1、或2分,免做的 记满分,最高80分。 ? 7.数字符号测验 ? 要求给数字(1―9)配上相应的符号, 共90项,主要测量学习新联想的能力、视 觉―运动协调、精细运动、持久能力和操 作速度。 ? 在90秒内,以最快的速度,按顺序填写 相应的符号,时间到停止。 ? 每正确填写一个符号记1分,倒转符号记 0.5分,最高90分。 ? 8.图画填充测验 ? 由21幅有缺失的图画构成,要求找出缺 的部分。主要测量视觉辨认能力,对物体 要素的认知能力,扫视后迅速抓住缺点的 能力。 ? 从第1项开始,全做,1―2项可给帮助, 每项时限20秒。 ? 每一正确回答记1分;要求部位正确,性 质解释正确,最高21分。 ? 指导语:我给你看一些图片,每一个图案 都缺失一重要部分,仔细看。将缺失的部 分找出来告诉我。? 现在看这一张图,图中缺失的重要部分是 什么? ? 9.木块图测验 ? 用两色立方体木块复制平面图案,共10 项,主要测量理解空间关系,视觉分析综 合能力,空间建构能力。 ? 从第1项开始,1―2项有两试,第1项第 一试用实物呈现,1―2项均可给帮助,连 续3项得0分停止。 ? 每项正确记4分,7―10项有时间加分。 最高48分 ? ? ? ?指导语:你看这些方块, 它们都一样。有一些都是 红的,有些是白的,也有 一些是一半红一半白。? 我将这些方块摆拢来成一 图案,看我摆。? 现在你来摆一个这样的图 案。 ? 10.图片排列测验 ? 调整散乱的图片,使之成为有意义的故事,共8 项。主要测量逻辑联想,生活常识,思维灵活性。 ? 从第1项开始,按规定顺序呈现(每张卡背面有 一排数字,如2-3-1/4),第一个数字(2)为项 目序号,第二个数字 (3)为呈现位置,第三个 数字(1)正确顺序,斜线的数字(4)卡片张数, 1―2项可给帮助 ? 每正确一项计4分,6-8项有时间加分。最高38 分。 指导语:这3张图片说明鸟筑巢的故事,但它们的次序摆乱了, 你将它们摆成应有的次序,那么便可说明这个故事,你懂吗? 你现在预备,开始。 你一摆好了便告诉我,说已经摆好让我停表。 ? 11.图形拼凑 ? 将物体碎片复原,共4项。主要测量想象 力、抓住事物线索的能力、手眼协调能力。 ? 4项全做,按规定位置摆放碎片。 ? 按接点数记分,每个接点记1分,完全正 确的再按时间加分,最高44分。 ? 指导语:我要将一些图形的碎片给你,要你将它们摆拢来, 拼成像一样东西。如果将这些碎片的位置摆对了,便像一 个东西,你拼凑图形时,要尽量快,你懂吗? ? 尽快把这些摆好。 (二)测验的记分? ? ? ? ? ? ? ? ? 1、原始分的获得 2、原始分换算量表分 一个分测验中的各项目得分相加,称分测验原始分。 原始分可转化为相应的平均数为10,标准差为3 的量表分。分别将言语测验和操作测验的量表分相 加,便得到言语量表分和操作量表分。再将两者相 加便是全量表分。平均数为100,标准差为15。 最后,根据相应用表换算成言语智商、操作智商 和总智商。(VIQ、PIQ、FIQ) (三)结果的解释 测量心理学要点复习_教育学/心理学_人文社科_专业资料。测量心理学 概论,心理测验的编制,测验的实施、计分和误差 ,测验的常模和分数的解释 等要点复习 ...测量心理学_教育学_高等教育_教育专区。测量前半部分基础内容 1.心理测量的定义?(稍微回忆一下) 2.测量的基本要素有什么呢?(2) 3.测量的量表(跟统计和实验...测量心理学总结_教育学_高等教育_教育专区。1, 测量的基本要素 A 参照点(绝对、相对) B 单位(确定的意义、相等的价值) 2, 测量的量表 A 命名量表 B 顺序...测验的效度 2/3 效度的概念 效度是指所测量的与所要测量的心理特点之间符合的程度,或简单地说是心理测验的准确性、真实性 效度受随机误差和系统误差的影响 信度...测量心理学历年真题(2012 年 5 月-2009 年 5 月) 2012 年 5 月单项选择题 56、随机号码表法是( (A)简单随机抽样 (A)常模分数 (A)比内一西蒙 (A)...测量心理学真题_从业资格考试_资格考试/认证_教育专区。09 年 5 月 单选 34、以 50 为平均数、以 10 为标准差表示的标准分数叫( )。 (A)标准九分数 (B)...(一)心理测量的理论基础 1.心理测量的基本概念 (1)心理测量的定义 心理测量:根据一定的法则用数字对人的行为加以确定 即依据一定的心理学理论,使用一定的操作...测量心理学总结_数学_小学教育_教育专区。测量心理学总结 1,测量的基本要素 A 参照点(绝对、相对) B 单位(确定的意义、相等的价值) 2,测量的量表 A 命名量表...3、心理测量的性质: (1)心理测量的间接性(2)心理测量的相对性 (3)心理测量的客观 性 4、心理测验的种类:(一)按测验的功能分类 1.能力测验 2.学绩测验 3...测量心理学_教育学/心理学_人文社科_专业资料。第一节 概述一、什么是测量 ? 测量就是依据一定的法则用数字对事物加以确定。 ? 定义中包括三个主要的元素:(1... All rights reserved Powered by copyright ©right 。文档资料库内容来自网络,如有侵犯请联系客服。

我要回帖

更多关于 常模参照测验 分数线 的文章

 

随机推荐