还剩11页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
1600452教育统计与测量名词解释题
0.
1.统计对事物某方面的特性的量的取值从总体上加以把握和认识就叫统计
0.2.教育统计就是对教育领域各种现象量的取值从总体上的把握与认识
0.3.测量就是按一定规则给对象在某种性质的量尺上指定值
0.4.教育测量给所考察研究的教育现象,按一定规则在某种性质的量尺上指定值
0.5.测验标准化测验在测量中,如果测量工具、施测与评分程序、解释分数的参照系或标准都已科学地实现标准化,像这样对代表性样本的宏观而标准化的测量,就是标准化测验,简称测验
0.6.量表在标准化测验中,测量工具考卷或心理测试项目的集合和分数解释的常模或标准,都有物化的形态如常模表,它们合在一起被称为量表
0.7.标准化考试在标准化测验时,如果所测的心理特质是学业成就,这样的标准化测验又称为标准化考试
1.1.数据用数量或数字表示的资料事实
1.2.称名变量数据只说明某一事物与其他事物在名称、类别或属性上的不同,并不说明事物与事物之间差异的大小、顺序的先后及质的优劣的数据
1.3.人工编码数据按一定的规则给不同类别的事物指派适当的号码后所形成的数据
1.4.次数分布一批数据中各个不同数值所出现的次数多少情况,或者是这批数据在数轴上各个区间内所出现的次数多少的情况
1.5.次数直方图由若干宽度相等、高度不一的直方条紧密排列在同一基线上构成的图形
1.6.次数多边形利用闭合折线构成多边形以反映次数变化情况的一种图示方法
1.7.散点图用平面直角坐标系上的点的散布图形来表示两种事物之间的相关性及联系模式
1.8.线形图以起伏的折线来表示某种事物发展变化及演变趋势的统计图
1.9.条形图用宽度相同的长条来表示各个统计事项之间数量关系的统计图
1.10.圆形图以单位圆内各扇形面积占整个圆形面积的百分比来表示各统计事项在其总体中所占相应比例的一种图示方法
2.1.集中量数观测数据具有向某点集中的趋势,反映次数分布集中趋势的量数叫集中量数
2.2.算术平均数一批数据的总和除以总次数后所得的商数
2.3.加权和在考虑到各个数据的重要性即权重后再相加求和就是加权和
2.4.加权平均数加权和除以所有权重之和所得的商数
2.5.中位数又称中数,是位于数据分布正中间位置上的那个数
2.6.众数一个次数分布中出现次数最多的那个数
2.7.差异量数反映一组数据离散程度的量
2.8.离中趋势数据具有偏离中心位置的趋势,它反映了一组数据本身的离散程度和变异性程度.
2.9.平均差各数据与其平均数的离差绝对值的平均值
2.10.方差指一组数据的离差平方数的算术平均数
2.11.差异系数把差异量数和集中量数两相对比后所形成的相对差异量数
2.12.地位量数反映次数分布中各数据所处地位的量
2.13.百分等级指某个观测分数以下数据个数占总个数的比例的百分数,在0到100间取值
3.1.相关指两个变量的成对观测数据在乎面直角坐标系上描点构成的散点图环绕在某一直线附近分布
3.2.相关系数用来定量描述两个变量之间的直线性相关的强度与方向的数
3.3.积差相关对两个连续变量之间的相关情况进行定量分析的一种应用最普遍、最基本的相关分析方法
3.4.等级相关根据两列顺序变量数据中各对等级数据的差数来计算相关系数的方法
3.5.点双列相关用来研究的两个变量中,一个是连续变量数据,另一个是二分类的称名变量数据,对这两个变量进行相关分析的方法是点双列相关
4.1.分数通过测量获得的、描述测量对象身心特性水平的数字
4.2.原始分数在测量工具上直接得到的测值数字
4.3.导出分数由原始分数出发,推导出的与原始分数对应的其他等值数
4.4.相对评分分数通过被试间的相互比较而确定意义的分数
4.5.绝对评分分数通过拿被试测值与应有标准作比较来确定其意义的分数
4.6.常模一定人群在测验所测特性上的普遍水平或水平分布状况
4.7.常模组从清楚而明确地定义的“特定人群”总体中抽取到的容量足够大,并确具代表性的被试样组
4.8.发展常模某类个体正常发展进程各特定阶段的一般水平
4.9.组内常模被试所属那类群体实际上即常模组被试在所测特性上的测验取值也就是分数的分布状况
4.10.比例智商通过求取被试的智力年龄与生理年龄的比而得到的智商
4.11.标准分数以一个测验分数所属分数组的标准差为单位,与它所属分数组的平均数的距离
4.12.标准分数常模就是用被试所得测验分数转换成的标准分数来揭示其在常模团体中的相对地位的组内常模
4.13.线性变换后的标准分数将一个标准分数乘以同一确定值,再加上另一确定值后所得到的另一个标准分数
4.14.离差智商通过求取被试在智力测验中所得分数的标准分数而得到的智商值
5.1.测验项目难度就是被试完成项目作答任务时所遇到的困难程度
5.2.项目难度指数定量刻画一个测验项目的被试作答困难程度的量数
5.3.项目区分度项目区分被试水平高低的能力的量度
5.4.测验信度测验在测量它所测特质时得到的分数测值的一致性
5.5.观察分数从测验实施过程中实际得到的被试分数
5.6.真分数被试在所测特质上客观具有的水平值
5.7.稳定性系数用重测法求得的信度系数
5.8.等值性系数用平行形式相关求得的信度系数
5.9.测量标准误实际测验中所测值偏离真分数的程度
5.10.测验效度就是测验实际上测到它打算要测的东西的程度
5.11.内容效度通过对测验所含项目作内容的系统考察,以确定由这些项目所构成的测验,是否是测验应测特质行为领域的代表性样本
5.12.表面效度从被试或非专业人员看来,测验表现得是否在有效地测验着应测的东西
5.13.效标关联效度测验预测个体在类似或某种特定情境下行为表现的有效性
5.15.效标污染效标测量值的评定受到了测验分数值的信息的影响
5.16.结构效度测验测得心理学理论所定义的某一心理结构或特质的程度
6.1.学业成就测验是一类广泛用于检查学习者学习任务、掌握知识的广度与深度以及取得学业进步情况的教育测验
6.2.安置性测验在学期教学开始或单元教学开始时,确定学生实有水平以便针对性地做好教学安排而经常使用的测验
6.3.形成性测验在教学过程中实施的用于检查学生掌握知识和进步情况的测验
6.4.诊断性测验为探测与确定学习困难原因而施测的一类测验
6.5.终结性测验在课程结束或教学大周期结束时,用于确定教学目标达到程度和学生对预期学习结果掌握程度的一类测验
6.6.常模参照测验参照着常模使用相对位置来描述测验成绩的一种测验
6.7.标准参照测验与一组明确的知识能力标准或教学目标内容相比时,对学习者的测验成绩作出解释的一类测验
6.8.标准化成就测验由专家编制的按照系统的科学组织实施、建立统一的标准并对测验误差作了严格控制的学业成就测验
6.1O.心理测验是通过对一组标准刺激所引起的行为样组的客观分析,对人们的心理特征及个别差异进行估测、描述和诊断的一种方法
6.11.智力测验测量一个人理解、处理和适应其周围世界的最一般能力的心理测验
6.12.能力倾向测验测量一个人获得新的知识、能力和技能的内在潜力,旨在预测未来成功可能性的一种心理测验
6.14.学习能力倾向测验是测量一个人的一般的学习能力和潜力的心理测验
6.15.创造力指独创地解决问题的能力,即产生新的想法、发现新的问题、创造新的事物方面的能力
6.17.投射测验法呈现给被试一定的刺激材料,让被试根据材料说出自由联想到的事物,以此测得被试人格的一种方法
6.19.评定量表法以自然观察为基础,通过评定量表来量化观察印象的一种人格测验方法
6.20.人格指人的性格、气质、兴趣、态度、价值观、动机、适应、理想、信念、品德等心理特征与意识倾向性的总和
7.1.随机现象又称不确定现象,指在相同条件下其结果却不一定相同的现象
7.2.随机试验对随机现象的一次演示或观察称为做了一次随机试验
7.3.随机变量记录各种随机试验结果的变量
7.4.频率在一轮随机实验中,某一事件A发生的次数f与总试验次数N之比被称为该轮试验中事件A发生的频率
7.5.概率随着随机试验次数的增多,某事件发生的频率值会越来越接近于一个固定数值,我们把这个数值称为该事件发生的概率
7.6.必然事件如果某事件发生的概率是1,表示该事件肯定会发生,这样的事件称为必然事件
7.7.不可能事件如果某事件发生的概率为D,表示该事件不可能发生,我们称这样的事件为不可能事件
7.8.小概率事件指发生概率很小的事件,一般概率小于
0.05或
0.01,就称为小概率事件
7.9.概率分布指随机变量所有取值点或取值区间上概率取值的分布情况
7.lO.总体客观世界中具有某种共同特征的元素的全体称为总体
7.11.样本从总体中抽取的部分个体组成的群体称为样本
7.12.参数在总体数据基础上求取的各种特征量数称为参数
7.13.统计量应用样本数据计算的各种特征量数称为统计量
7.14.抽样分布从一个总体中随机抽取若干个等容量的样本,计算每个样本的某个特征量数,由这些特征量数形成的分布,称为这个特征量数的抽样分布
8.2.显著性水平在统计假设检验中,公认的小概率事件的概率值被称为统计假设检验的显著性水平
8.3.虚无假设又称原假设、零假设,是作为检验的已知条件使用的带有“等于什么”成分的陈述性命题
8.4.备择假设又称解消假设、研究假设,是备以待择,是虚无假设被拒绝后被人们采择的假设
8.6.临界值统计上根据显著性水平α求出的,提供比较标准的值
8.7.危机域在抽样分布区线中,临界值以远的抽样分布曲线下的区域
8.8.I型错误虚无假设属真而被拒绝的错误,又称“拒真”错误
8.9.Ⅱ型错误虚无假设属实伪而未被拒绝的错误,又称“纳伪”错误
8.lO.单侧检验为了推断某个总体参数是否大于或小于某个定值,或者是为了推断某两个总体参数之间有无大于或小于关系,从而采用的一种假设检验方法
8.11.双侧检验为了判断某个总体参数是否等于某个定值,或者是为了推断某两个总体参数是否相等,从而采用的一种假设检验方法
8.12.检验灵敏度检验出差异的灵敏程度
8.13.方差齐性检验在统计学中检验两个或两个以上总体方差是否相等被称为方差齐性检验简答题
0.1.教育统计学包括哪两部分内容,它们的含义分别是什么1教育统计学包括描述统计和推断统计两部分内容2含义分别是
①描述统计就是把调查所获得的数据进行整理、概括和表述,使数据隐含的信息明确地揭示出来
②推断统计就是利用实际获得的样本数据资料,依据数理统计所提供的理论方法,对总体作出推论判断
0.2.测量三要素分别是什么1测量工具;2施测与评分程序;3结果解释参照系和参照物
0.3.教育测量的特点是什么怎样理解它的间接性特点1教育测量的特点是
①间接性;
②要抽样进行2所谓间接性特点,指的是测量的对象为受教育者的心理特质,不能直接测量,只有通过设置一定的情景,施以特定刺激,引发出代表性的行为样本,再对之按一定规则,在某种性质的量尺上指定值
0.4.教育测量学包括哪两部分内容1测验工具编制、施测与评分程序确定,常模与标准建立的一般理论和方法,包括项目分析与测验质量检验的具体理论和技术2各种类型教育与心理测验的具体编制与使用
1.1.数据可以分为哪些种类1从数据来源划分,可以分为
①计数数据;
②测量评估数据;
③人工编码数据2根据数据所反映的变量的性质,可分为
①称名变量数据;
②顺序变量数据;
③等距变量数据;
④比率变量数据
1.2.数据有哪些特点1数据的离散性数据通常以一个个分散的有一定间隔的数字形式出现2数据的变异性指人们在得到数据的过程中,数据总是在一定的范围内以变化的形式出现3数据的规律性一定范围内变化着的一组观测数据潜存着某些规律
1.3.简述次数直方图与次数多边形的联系与区别1次数直方图和次数多边图都是次数分布图,是为了更直观形象地表达一个次数分布的结构形态和特征2区别在于,前者是以宽度相等、高度不一的直方条来表达次数分布情况;后者则是以闭合折线构成多边形来反映次数变化情况的一种图示方法
2.1.常用的集中量数有哪些如何求取1常用的集中量数有算术平均数、加权算术平均数、中位数和众数2它们通过下列方法求取算术平均数加权算术平均数中位数观察法或求两数平均数众数观察法或用经验公式
2.2.算术平均数作为集中量数有哪些优缺点1优点反应灵敏、确定严密、简明易懂、概括直观、计算简便,并能进一步作代数运算2缺点个别数据缺失时无法进行计算,而且还易受极端数据影响
2.3.简述算术平均数据的性质1各数据与该组数据的平均数之差求和等于02每一观测值加上相同常数c后,新一组数据的平均数是原平均数加上C后所得的数3每一观测值乘以C后,所得新一组数据的平均数等于原平均数的C倍4对每一观测值作线性变换,即乘上相同的常数C,再加上另一常数d,则变换后所得数据的平均数等于原平均数乘以c后再加d所得的数
2.4.集中量数有哪些作用1向人们提供整个分布中多数数据的集结点位置;2集中反映一批数据在整体上的数量大小;3是一批数据的典型代表值
2.5.中位数在哪些情况下有较好的应用价值1当数据分布列中有个别异常值或极端值出现时;2在次数分布的某端或两端数据只有次数而没有确切数量时;3在一些态度测验、价值测验或民意问卷测试中,调查对象对一些事项进行排序,常用中数来代表各事项的排序结果
2.6.常用的差异量数有哪些如何表示1平均差,用符号AD表示;2方差S2,用符号s表示;3标准差,用符号S表示;4差异系数,用符号CV表示
2.7.百分等级的意义是什么在不同的次数分布中,数值相等的同一数据在其分布中所处地位是不相同的,为了确切地表示出该数据在所处团体中的位置情况,统计学中引入地位量数,其中百分等级是一种典型的地位量数
2.8.差异量数有何作用次数分布中的数据不但具有集中趋势,而且还有离中趋势,为了更全面和更客观地描述一组数据或比较两组数据,我们常用差异量数来表示数据的离散程度和变异性程度数据离散程度越小,说明越集中;离散程度越大,说明越分散
2.9.标准差有何运算性质1全组数据每一观测值都加上一个相同的常数c后,计算得到的标准差不变2若每一观测值都乘以一个非零常数c后,所得数据的标准差与原标准差乘以c所得的数相等3每一观测值都乘以同一非零常数c,再加上另一常数d,所得数据的标准差等于原标准差乘以这个常数c
2.10.未归类数据计算百分等级的步骤是什么1对观测值从大到小排列;2统计每个观测值的次数;3从低到高的顺序,逐个计算各观测点数据以下的累积次数不包括本得分点次数;4计算各观测点数据的“以下累积相对次数”即比例数;5把各数据的“以下累积相对次数”乘上100,就得到百分等级PR
3.1.相关的统计学意义是什么许多教育现象或教育行为之间存在着一定的相互联系,这些联系具有复杂性两个高度相关的变量,它们之间可能存在明显的因果关系,也可能只具有部分因果关系,还可能没有直接因果关系而相关系数接近零,只是表示这两个变量不存在明显的直线性相关模式,但不能肯定地说两个变量之间没有规律性联系
3.2.积差相关的计算方法是什么1计算两个变量的平均值和;2计算离差值和;3计算各对离差值乘积以及乘积和;4计算数据的离差平方和,即;5计算数据的离差平方和,即;6把上述有关结果代入公式,求出rxy
3.3.等级相关有哪些适用范围1两列观测数据都是顺序变量数据,或其中一列数据是顺序变量数据,另一列数据是连续变量数据2两个连续变量的观测数据,其中有一列或两列数据的获得,主要依靠非测量方法进行粗略评估得到
3.4.点双列相关的适用范围及基本公式分别是什么1点双列相关适用于双变量数据中,有一列是连续变量数据,另一列是二分变量数据2基本公式p、q分别是二分类数据中二类事物所占比例Sx是全部连续变量的标准差
3.5.相关的两类事物有因果关系吗两类事物高度相关时1它们之间可能具有明显的因果关系;2也可能只具有部分因果关系;3还可能没有直接的因果关系,其数量上的相互关联,只是它们共同受到其他第三变量支配的结果
4.1.相对评分分数和绝对评分分数的含义是什么1相对评分分数是通过被试之间相互比较而确定意义的分数,即分数的意义是与其他被试相互比较而确立下来的2绝对评分分数拿被试测值与要求达到的标准相比较而确定意义的分数,其他被试达标与否丝毫不影响该被试测验分数的意义
4.2.原始分数与导出分数的含义是什么1原始分数是直接从测验卷面上读到的分数,没有经过任何的转换2导出分数足从原始分数出发,考虑其他因素并经转换后得到的与原始分数对应的其他分数
4.3.可以确定原始分数含意的参照系的种类有哪些1其他被试的测值,即其他被试在测验特性上的普遍水平或水平分布状态2社会在所测特性上的客观要求,即被试在所测特性上发展应该达到程度的标准
4.4.建立常模的步骤是什么1要科学抽样,从清楚而明确地定义的“特定人群”总体中,抽取到容量足够大,并确具代表性的被试样组2用拟建立常模的测验,对常模组标准化样组采用规范化手续施测3对收集到的全部资料进行统计分析处理,真正把握被试样组在测验上的普遍水平或水平分布状况
4.6.年级常模有哪些不足1许多学科学校不连年授课,无法求取年级常模,即使多年连续授课,重点内容也不断转移2所测年级等值易引起误解,如一个四年级学生获得年级等级6.9,并不意味着他已为升入初中作好了一切知识准备
4.7.组内常模和发展常模各有何作用1组内常模可以确定某测验分数在测验团体中所处的位置,进而确定分数的含义2发展常模可以确定某个体在发展过程中处在同类总体中的相对位置
4.8.为什么说百分等级不是等单位量度心理与教育测验分数的分布状态,一般都呈正态分布,“中间大两头小”的形状,对于曲线下任一百分等级差,据其在曲线下位置的不同,曲线的高度也不同,因任一百分等级差可用曲线下的面积表示,故高度越大,面积一定时长度越小,即中部百分等级密度大,两端小
4.9.如何建立标准分数常模1从明确界定好的该测验应该测查的被试总体中,抽取一个容量足够大的代表性样组,即建立起常模组2对该代表性样组按应有规范施测,获得代表性样组中每一被试的测验分数,得到常模团体的测验分数组3求取常模团体测验分数组的平均数与标准差,按公式求取从-
3.000到
3.000这一区间上若干个点的标准分数z值与原始分数的对照表,就得到了标准分数常模表
4.10.不同测验间的分数如何比较比较不同测验问的分数,不能直接用原始分数,可用下列两种方法1求取两个测验中各原始分数的标准分数,标准分数大者越优越2求取两个测验分数在各自总体中的百分等级PR,等级数越大越优越
5.1.分析一个测验的质量应从哪两个方面进行1考察整个测验的质量指标,即考察测验效度与信度2考察所含项目题目的质量指标,即考察测验项目的难度和区分度
5.2.求取整个测验的难度指数有哪些方法1所有项目满分值都相等时,求各个项目的难度的算术平均数2各项目的满分值并不相等时,用各项目的满分作权重求取加权平均数3求取各个被试总分的平均数,除以全测验各项目的满分即得测验难度指数
5.3.教育与心理测验的误差主要来源是什么1可能是由于测验项目抽样不妥;2语言表达引起误解;3施测环境影响;4施测时指导语,完成时限、主被试关系的影响或评分过程的偏向与误差;5被试的动机或情绪等因素
5.4.观察分数、真分数、误差分数的关系怎样观察分数是测验实际得到的被试分数,而被试实际具有的水平值是真分数,真分数与观察分数的差距是误差分数,即真分数等于观察分数与误差分数的代数和
5.5.信度系数为何只能估计由于信度是测验分数的一致性程度,受误差控制的影响,对误差控制能力的大小不能定量描述,只能大致估出,故信度系数也就只能估计
5.6.稳定性系数的适用范围与不足1稳定性系数用重测相关法测得,故适用于前后两次施测的特性相对比较稳定,即多用于预测性测验上2由于重测法十分强调特质的稳定性,不适用于练习效应明显或能引起重测时厌烦的测验,再编一个等值测验很不容易
5.7.利用单一测验估计信度系数的必要性是什么1在利用重测法或平行相关法求信度系数时,已编成一个测验后,要再编一个与之完全平行等值的测验,事实上是很困难的;2另外,两个平行形式测验先后实施,要消除前测对后测的影响是很困难的;.3要求创新能力的项目,在找到办法后,其他类似的题目可以套用这种办法
5.8.说明何种类型的测验适用使用何种信度系数1稳定性系数适用于智力、能力倾向和人格特点等预测性测验上2等值性系数适于学生成绩测验;3内部一致性系数适于所有项目都测查同一特质的系数
5.9.效度有哪些种类试举例说明1内容效度测验项目构成应测行为领域代表性样本的程度,主要分析测验项目所考核的知识技能覆盖面、能力水平考核情况,以及各部分内容的深度和结构比例2效标关联效度测验预测个体在类似或特定情境下行为表现的有效性例如,参照韦氏智力测验编制一个能团体施测的纸笔形式的智力测验,要考核其效度,使用到效标关联效度3结构效度测验测得心理学理论所定义的某一心理结构或特质的程度如测智力、人格结构焦虑等
6.
1.学业成就测验如何分类1根据课堂运用测验的一般顺序,可分为
①安置性测验;
②形成性测验;
③诊断陛测验;
④终结性测验2根据解释测验的方法的不同,可分为
①常模参照测验;
②标准参照测验3根据成就测验的实施方式和测验载体,分为
①口头测验;
②纸笔测验;
③操作测验4根据测验编制程序的严格程序,分为
①标准化成就测验;
②教师自编课堂成就测验
6.2.测验标准化包括哪四个环节1命题标准化;2施测标准化;3评分标准化;4分数使用解释的标准化
6.3.形成性测验、诊断性测验、终结性测验的主要应用特点分别是什么1形成性测验主要应用于改进学习与教学,为师生双方提供有关学习成败的连续反馈信息2诊断性测验用以针对性地发现那些用形成性测验难以准确辨别的学习困难或周期性出现的认知缺陷3终结性测验用于确定教学目标达到程度和学生对预期学习结果掌握程度
6.4.诊断性测验与其他成就测验的区别在哪里1一般注重于与诊断相关的目标,对每一特定目标需要包括大量题目,每一题目之问只有很小差异2测验题目依据于对成功学习特殊技巧的详细分析以及常见的学习错误的分析研究3题目难度一般较低,重在确定学生所犯学习错误的类型以及学习困难根源所在4该测验一般限于课程教学中有限部分内容,且通常按若干部分的测验分数与测验记录来分析,很少用于测验全部内容
6.5.常模参照测验的主要用途是什么1鉴别与评价学生能力发展水平,这种发展水平是一种相对比较的结果,有利于个别差异的诊断与研究,可在班内、校内、地区内、国内或同龄人群内进行2用于教育工作中的选拔与分流方面的决策
6.6.标准参照测验的主要用途是什么1说明学习者掌握所规定的教学内容的程度,以便作出掌握与未掌握、合格与未合格的分类决策2通过标准参照测验给学习者一个成绩,以提供出学习者个人学习经历和已达水平的证明资料3评价课堂教学与课程编制的有效性
6.7.口头测验的应用领域及常用方法分别是什么1应用领域
①使用特定语言回答问题的能力;
②综合有关信息提出问题的能力;
③阐述观点并为自己的观点作解释与辩护的能力;
④口头表达时逻辑思维及概括能力;
⑤知识理解的广度与深度;
⑥态度气质与情感方面的特殊表现2常用方法
①高声朗读;
②教师提问;
③在一些题目签中随机抽选加以回答;
④按预先设计的问题进行专题发言;
⑤小组讨论;
⑥师生一般会谈;
⑦根据图片或特别设置的情景讲故事;
⑧角色扮演,如课文剧等
6.8.实验技能考核的三条原则是什么1实践性为主的原则即应以动手操作为主,不能停留在笔试形式下考核实验操作知识的方式上2全面性原则要尽力考核到实验操作及其前后的各个环节,必要时,结合口试笔试和演示进行3客观化原则要建立在行为观察为基础上,客观地评价学生的实验技能
6.9.布卢姆把认知领域中的教育目标从低到高分为哪几个层次1知识识记;2领会;3应用;4分析;5综合;6评价
6.10.简述客观题的常用题型1填空题;2简答题;3是非题;4匹配题;5选择题
6.11.主观题有哪些优点有哪些局限性1优点
①不允许简单猜测,适于考查分析综合能力、组织表达能力及计算与推论等较为复杂的心智技能;
②提倡自由反应,有利于考查应用能力乃至创造能力;
③可以获得较为丰富的作答反应过程资料,便于分析被试的技能策略和知识缺陷等;
④内容和形式更为接近教学与实践中的问题情形,被试不陌生好接受,教师命题比较方便’2局限性
①作答反应费事,有大量的书写任务,造成被试“忙于写而无暇想”,“手指累而头脑松”
②单位时间内施测的问题量减少,限制了测验内容的覆盖面,不利于测验效率提高
③允许被试以文字技巧或作答风格来搪塞胡弄主试,靠“模棱两可的词句”与“面面俱到的分析”来赚得高分
④评分易受阅卷人主观因素的影响
6.12.心理测验有哪些主要用途1人才选拔2人员安置和人事管理3临床心理学研究4学校心理服务5建立和检验假设
6.13.心理测验的分类方法及相应的分类结果是什么1根据测验编制程序是否系统、科学和完备,可以把心理测验分为标准化测验和非标准化测验2根据施测时每次测试一个人还是可同时测试一批人,可以把心理测验分为个别心理测验和团体心理测验3根据测验有先严格的时问限制,可以分为限时测验和非限时测验4根据心理测验材料刺激是语言文字形式还是非语言文字形式,可以把心理测验分为文字式心理测验和非文字式心理测验5根据测验引起的被试反应的特点,可以把心理测验分为最高成就测验和典型作为测验6按测验内容的性质划分,可以分为智力测验,能力倾向测验、创造力测验以及人格测验
6.14.最高成就测验与典型作为测验的区别是什么1最高成就测验要求被试尽其所能,测量出人的最高能力水平限度故能力型和成就型测验属于这一类2典型作为测验要求被试按照各自喜好、兴趣、态度与准则等,对测验中的刺激作出典型或习惯的反应,如人格测验中多数内容属典型作为测验
6.15.目前国内常见的几种智力测验是什么常见的几种智力测验是中国比纳智力测验、斯坦福——比纳智力测验、韦克斯勒智力测验、瑞文推理测验、中小学生团体智力筛选测验
6.16.韦克斯勒儿童智力测验的各个分测验的测量目标是什么1常识测量被试的知识广度2填图测量视觉记忆及理解性3类同测量儿童的概括抽象能力4图片排列测量被试的社会情景理解能力和统整综合能力5算术测量被试运算推理能力6积木测量儿童视觉与分析图形结构的能力7词汇测量儿童的语词及理解性8拼图测量儿童处理部分与整体关系的能力9问题理解测量儿童的实际知识与理解能力10译码测量被试学习领会与书写速度11背数测量被试的注意力及机械记忆能力12迷宫补救性测验,即判断智力测验结果
6.17.瑞文标准推理测验有哪些特色1该测验是一种非文字智力测验,是由大小图形组成的2瑞文标准推理测验包括A、B、C、D、E五组,每组12题共60题,适用于6岁以上的儿童及成人3该测验适用的年龄范围宽,测量对象不受文化、种族、语言的限制,并可用于一些生理缺陷者4测验可分别进行也可团体施测,省时省力,使用方便,且有较高的信度和效度5该测验是用百分等级来评定人的智力发展水平,评价时分为五个等级
6.18.能力倾向测验同一般的智力测验和学业成就测验之间的区别是什么能力倾向测验是一种旨在预测未来成功可能性的一种测验,是一种潜能测验,这种潜能不同于人的一般能力即智力,也不同于在教育训练下获得的某方面的专业知识技能,因此能力倾向测验同一般的智力测验和学业成就测验的测量目标是不同的
6.19.学习能力倾向测验SAT的主要功能与特点是什么1学习能力倾向测验的主要功能是用于测量一般的学习能力和潜力,即是否具有进一步学习与研究的潜在能力,而不是已在学校中学到多少知识2英国的大学学习能力倾向测验SAT是经过精心设计的标准化测验,评分采用标准分,成绩是参照全国常模加以评定的,故具有逐平可比,全国可比的特点sAT测验一般为客观题
6.20.发散性思维的特征是什么1流畅性即心智活动流利畅达,左右逢源,能在单位时间内表达出比常人多得多的观点,其反应迅速且众多2变通性指思维灵活多变,可举一反三,触类旁通,较少受心理定势影响3独特性即表现出异乎寻常,新颖独到的见解
6.21.什么叫自陈量表法有哪些典型测验1自陈量表法又称问卷法,通常是以问卷的形式提出一系列题目,每个问题陈述一种人的心理或行为上的典型表现,要求被试判断所陈述的情况在多大程度上符合自己的情况,并作出相应的回答,借此测定人的人格特征2自陈量表法的典型测验是艾森克人格测验EPQ和卡特尔十六种人格测验16PF等
6.22.投射测验可分为哪四种技术1联想技术,其特征是要求被试对测验刺激所引发的第一个字词或意象作出反应2构造技术,要求被试对某图形构建一个故事3完成技术,让被试针对测验刺激之未完成的语句、文字段落、故事情节等加以完成4表达技术,要求被试进行一种表达性活动
6.23.艾森克人格量表的依据是什么它有几个量表组成1艾森克人格量表是以艾森克的人格三维理论为依据,即认为人格的三个因素是内外倾性E、情绪性N、精神性P,这三个方面的不同倾向和不同表现程度,构成了千姿百态的人格类型2艾森克人格量表由四个量表组成
①E内外倾性量表;
②N情绪稳定性量表;
③P精神病态量表;
④L有效性量表
7.1.频率与概率有什么区别与联系1区别
①频率是一个变化的值,而概率对某事件来说却是相对固定的
②频率是对一定的总试验次数N来说的,而概率是在总实验次数趋于无穷大或足够大的情况下确定下来的
③对于某一事件A发生频率与概率往往是不同的2联系
①频率与概率的取值范围都是[O,1]
②当某一事件的频率值趋于一个稳定的数值时,该频率值就变成了概率值
③某一事件发生的频率总是围绕概率上下波动
7.2.什么叫概率分布概率分布有哪些表示方法1概率分布包括两类,一是离散性随机变量概率分布,即指该随机变量所有取值点的概率分布情况二是连续性随机变量的概率分布,指连续性随机变量所有取值区间上概率取值的分布情况2概率分布有三种表示方法
①对离散性随机变量,可以顺序地列出全部取值的概率
②用概率分布表表示概率分布
③用概率分布的密度函数图表示
7.3.正态分布是如何形成的正态分布是连续性随机变量中常见的一种概率分布形态,如果影响该随机变量的因素很多,而在这些因素中又没有哪个因素能起决定性作用,那么这个随机变量最终就会形成正态分布
7.4.正态分布有什么形态特征什么是标准正态分布1在形态上,正态分布是一条单峰、对称呈钟形的曲线,其对称轴为过x=μ的纵线从x=μ开始曲线向正负两个方向递减延伸,不断向x轴逼近,但永不与x轴相交,即曲线在正负两个方向上都以x轴为渐近线2标准正态分布是正态分布的一个典型代表,它的平均数是0,标准差为1,其它各种正态分布都可以通过一定的数学方法与它相互转化
7.5.总体与样本有什么区别和联系1区别总体包含了具有同一特征的所有个体,而样本则只包含了这些具有同一特征的所有个体中的一部分2联系总体与样本所包含的元素具有一些共同的特征,样本在数量上小于总体,是对总体的代表,故总体只有一个,样本则可以产生很多每一个样本统计量的值都是在总体参数上下波动,存在一定的抽样误差
7.6.参数与统计量有何区别与联系1区别参数是在总体基础上求取的特征量数,统计量是关于样本的特征描述2联系参数不易获得,可以通过样本统计量经过推断统计得到
7.7.如何进行简单随机抽样1抽签法预先在签条上写好入样或不入样,然后随机抽取分发给每个元素,样本自然生成2用随机数码表作简单随机抽样
①对总体所有元素编号,一般以0或l开始
②根据最大编号的位数确定随机数码的使用位数在随机数码表中任意指定一个起始数并且报告这个起始数在表中确切位置,并规定使用随机数码第几列到第几列的位数
③按从上至下或其他明确顺序,抄录随机数码表中不大于总体最大编号的所有随机数,直至抄满个数等于入样元素数
④按抄录的数码从总体中将对应元素取出组成所需样本
7.8.平均数抽样分布有哪三种情况1原总体正态,总体方差已知情况下的平均数抽样分布,此时该抽样分布呈正态分布2原总体正态,总体方差未知情况下,平均数的抽样分布,这种平均数抽样分布呈t分布3原总体非正态,但样本较大情况下平均数抽样分布,这种平均数抽样分布呈渐近正态分布
8.1.什么是小概率事件原理在教育统计中,常常把概率取值小于O.05或
0.01的随机事件称为小概率事件,我们常常认为小概率事件在一次试验中不可能发生,这就是小概率事件原理,这是一种科学的思维方式
8.2.统计假设检验的反证法与一般的数学反证法的差异是什么1数学反证法最终推翻假设的依据一定是出现了百分之百的谬误,因此推翻假设的决策无论是从决策逻辑还是从决策内容看都是100%正确的而统计假设检验的反证法最终推翻虚无假设的依据是一个小概率事件,从决策逻辑角度看是100%正确的,但决策内容却是有可能出错的2数学中的反证法最终一定是推翻原假设,而统计假设检验的反证法最终结果却可能无充分理由推翻原虚无假设
8.3.统计假设检验的步骤有哪些1根据题目的设问提出检验假设;2选定显著性水平α;3根据检验目的和已知条件找到相应的抽样分布;4写出检验统计量计算公式并按照已知条件计算检验统计量的值;5根据显著性水平α在抽样分布中确定临界值和危机域;6将求得的检验统计量值与临界值作比较,根据其是否进入危机域而作出是否拒绝虚无假设的统计结论
8.4.显著性水平仅与临界值危机域的关系怎样显著性水平α越高,α的值越小,临界值就越远离零点,危机域的面积也越小相反,显著性水平α越低,α值越大,临界值越靠近零点,危机域的面积也越大教育统计常用
0.05和
0.01两个显著性水平,O.01的水平要高于
0.05的显著性水平
0.05的显著性水平α=
0.05,临界值为±
1.96双侧,危机域在正态曲线下-
1.96和
1.96之外
0.01的显著性水平α=
0.01,临界值为±
2.58双侧,危机域在-
2.58与
2.58之外的正态曲线下
8.5.影响Ⅱ型错误概率大小的因素是什么1客观的真值与假设的伪值两者之间的差异如果我们假设的伪值与真值很近,犯Ⅱ型错误的概率就大,如果假设的伪值与真值很远,犯Ⅱ型错误的概率就小,即将伪当真的可能性就小2仅值的大小影响Ⅱ型错误的概率d值越大,犯Ⅱ型错误的概率就越小,即β越小,α值越小,犯Ⅱ型错误的概率就越大,即β越大,但β≠1-α3样本容量样本容量越大,犯Ⅱ型错误的概率越小,样本容量越小,犯Ⅱ型错误的概率越大
8.6.单侧检验和双侧检验有何不同1单侧检验只有一个危机域,检验灵敏度较高,双侧检验则有二个危机域,分别位于抽样分布曲线两侧,检验灵敏度较低2单侧检验的目的是为了推断某个总体参数是否大于或小于某个定值,或者是为了推断某两个总体参数之间有无大于或小于关系双侧检验的目的是为了判断某个总体参数是否等于某个定值,或者是为了推断某两个总体参数是否相等
8.7.两总体平均数差异的抽样分布形态以及它的各种参数估计公式受哪四个因素影响1两个总体是否相关;2两个总体的分布是否正态;3两个总体的方差是否已知或相等;4所抽样本容量大小
8.8.在什么情况下两总体相关1所检验的两列分数如果是同一批实验对象,那么这两列分数总体是相关总体;2如果是一一严格配对的两批实验对象的两列分数,此时一对对的实验对象基本上可以视为同一实验对象,因此这样的两列分数总体也视为相关总体
8.9.平均数差异显著性检验分为哪四种情况对待1总体方差已知,两独立正态总体的平均数差异显著性检验,平均数差异的抽样分布为正态2总体方差未知但相等,两独立正态总体的平均数差异显著性检验,平均数差异的抽样分布服从t分布3两独立总体分布形态不明或不服从正态分布,若抽样样本容量大于30,可以按近似正态分布计算4两相关总体平均数差异显著性检验
8.1O.F分布有哪些形态特征有何用途1形态上,F分布是一个正偏态分布,F随均为正值,处于正半轴一边,其最小值为0,最大值可为正无穷,F分布的上尾侧以横轴为渐近线F分布同时受到两个自由度的制约2研究发现,随机抽取的两样本方差之比服从F分布,故可以用F分布理论来进行方差差异显著性检验
9.1.x2统计量的一般表达式是什么它表示什么意义1一般表达式是:2x2统计量表示实际观测次数与理论期待次数之间差异程度,当实际观测次数,和理论期待次数厂相差较大时,x2值也越大,这表明观测次数分布与设想的总体理论次数分布之间的差异也越大
9.2.x2分布有哪些特点1x2≥0,即x2值从0到止无穷大;2当自由度df≥3时,x2分布是单峰正偏态分布,各曲线的尾部都向右正方面无限延伸,但终不与横轴相交;3当自由度df≥30时,x2分布曲线基本上是对称分布,且随着自由度df增大,越来越接近正态分布;4x2分布具有可加性,即不同自由度的若干个x2分布相加后还是x2分布,且自由度也是若干个不同自由度所叠加的结果5当自由度df=1时的x2分布;它与标准正态分布z值的平方正好相等,即df=1时,x2=z
29.3.x2检验的主要作用是什么1总体分布的拟合良度检验检验某抽样观测数据的分布是否与某一理论分布相一致2独立性检验检验双向分类列联表数据下,两个分数特征即两个因素变量之间是彼此相关还是相互独立的问题
9.4.x2检验的一般步骤是什么1根据所存在问题的实际特点,提出虚无假设H0,即“没有显著性差异”的假定或“两个变量相互独立”的假定2从虚无假设出发,确定各类事物的理论期待次数,这是x2检验最重要关键的一步一般要求任何一类的理论次数都不应小于5,若某类事物的理论次数小于5,则可将相邻的类合并起来观测次数也相应地合并3根据x2统计量公式计算实得X2值4选取适当的显著性水平α值,并确定自由度df,然后在x2值表中找到临界值x25做出接受虚无假设或拒绝虚无假设的统计决策其原则是
①当x2值大于临界值时,我们可以拒绝虚无假设H0,并接受研究假设H1
②当x2值小于临界值时,我们便没有充分理由拒绝虚无假设H0,故暂认为虚无假设成立
10.1.方差分析的目的是什么单向方差分析的数据形式怎样1方差分析的目的就是同时对多于两个的总体平均数有无显著性差异作出检验2单向方差分析的数据只有一个维度方面,在这个方向上可以分为k个总体水平
10.2.单向方差分析的步骤有哪些1建立假设H0μ1=μ2=…=μk;H1至少有一对μ不相等2计算各个离均差平方和
①求取总离均差平方和ss总公式为
②求取组内离均差平方和ss内,公式为
③求取组问离均差平方和,公式为SS间=SS总一ss内3编制方差分析表,完成检验统计量的计算4作统计结论如果,各水平总体均数无显著差异;如果,拒绝虚无假设,即各水平中至少有两个水平的总体均数是有显著差异的
10.3.如何判断方差分析前提条件中,总体正态性和方差齐性是否得到满足1各子样本所来自的总体是否正态性,从理论上讲我们应该应用x2检验对数据作正态拟合性检验,只有检验确认各子样本的总体服从正态分布,才能进行方差分析但在实际工作中,如果根据以往的经验可以判断条件符合,也可以不作检验2各子样本的总体方差是否齐性,在有经验信息时,可以根据经验信息作出判断,在无经验信息或信息不足时,要作方差齐性检验,具体方法是用Hartley最大F值法或k个总体方差齐性至少有一对不等,或k个总体方差非齐性所有k个样本方差中最大的方差与最小的方差之比,然后查临界值表确定总体方差是否齐性论述题
0.1.学习教育统计与测量有何意义1教育统计与测量是教学科学管理的重要手段我国教育正处在深刻的变革之中,一些重要教育现象和特别问题,都要通过统计调查加以分析研究,确定对策,改革措施的落实情况也要进行统计分析因此科学地运用教育测量与统计手段,对改革和发展有重要促进作用2教育统计与测量是教育研究的重要工具要想认识教育现象的本质与规律,可以作定性的研究,也应作定量的分析统计与测量就是强调实际,从事实资料出发,专门来作深入的量的探讨,通过量化分析来认识事物的本质与规律3通过学习可以锻炼思想方法,掌握专门化的术语和符号,提高科学素养教育统计与测量学不仅要求我们善于处理确定性现象,更注重去处理随机性现象;不但采用正面论证方法,而且十分重视使用反证法,通过证伪来求知;不仅力求用好数学手段来建立数学模型,还非常重视把这些数学形式的测量模型与认知心理学的实质理论结合起来学习这些能很好地锻炼我们的思想同时,学习统计与测量,能够使我们掌握专门化的统计语言,便于阅读教育教研文献
0.2.怎样学好教育统计与测量1切实下功夫掌握好基本概念和原理,弄懂内在的逻辑和方法、概念和原理是基础,只有首先掌握它们,才能进行更深层次的学习.2坚持理论联系实际,认真做好练习,并力争用新学知识来解决一些实际问题一些基本计算方法和逻辑思想,必须通过实践与练习才能掌握3要重视掌握计算工具,特别是具备统计功能的计算器的使用,能给我们带来很多的方便,而且计算也比手算更准确
1.
1.试述简单次数、相对次数、累积次数及累积相对次数的意义1简单次数是数据经过分组后,落在该组中的数据的个数,各组简单次数相加求和便是数据的总个数2相对次数是一组数据的简单次数与总次数即数据总个数的比值,相对次数为小于l的小数,各组相对次数之和为13累积次数分“以下”累积次数和“以上”累积次数分别表示从该组数据向下或向上累加,所得的总次数,都包括该组的次数所得的总次数便是该组的“以下”或“以上”累积次数4累积相对次数同累积次数意义基本相同,不同的是,累积相对次数累加的是相对次数而非简单次数累积相对次数也是小数,累积的最终值是1;累积相对次数也分“以下”累积相对次数和“以上”累积相对次数
2.
1.分析平均差与平均数两者之间的区别1意义不同平均差是一个差异量数,它表示的是一组数据的离散程度它以平均数作为中心位置,求各个数据与平均数的平均距离,以表示数据的离散性平均数是一个集中量数,它表示一组数据的集中程度,算术平均数是最基本的特征量数2计算方法不同平均差的计算公式为或即各个数据与平均数差的绝对值求和,再除以数据个数平均数分为算术平均数和加权算术平均数算术平均数的计算公式加权算术平均数3应用特点不同平均差从平均的角度反映了各个数据偏离中心位置的整体差异程度,比较直观,易于理解,科学性较强,实用性较好,在许多领域中得到广泛应用但是,平均差指标计算中含有绝对值计算,这种计算一方面不利于计算器来快速处理大批数据,另一方面不便于作进一步的代数运算和处理平均数特别是算术平均数具有反应灵敏、确定严密、简明易懂、概括直观、计算简便,并能作进一步代数运算等优点,足应用最普遍的集中量数因此在大多数情况下,人们喜欢使用平均数这一指标来代表一批数据或用它来反映大量事物的整体水平,但是算术平均数需要每一个数据都加入运算,因此在数据有个别缺失的情况下,无法准确计算特别是算术平均数宜受极端数据影响
3.
1.试述积差相关、等级相关、点双列相关的联系与区别1联系
①三种相关都可以描述两列变量的相关情况只是适用范围不同
②描述积差相关的两个变量,如各自排列等级后,亦可按等级相关求取相关系数,但不够精确,故能计算积差相关系数时,不计算按等级求得的相关系数
③按各种方法求得的相关系数,其统计学意义相同2区别三种相关的区别主要表现在适用范围上
①积差相关是一种应最普遍、最基本的相关分析方法,尤其适用于两列连续变量的定量分析
②等级相关是在无法得到准确的连续变量数据时使用,计算时首先把非等级变量数据排成等级,按等级求两列变量的相关
③点二列相关主要应用于求含称名变量数据的相关系数,变量中一列为称名变量.另一列是与之对应的连续变量数据
4.1.百分等级常模与标准分数常模的异同1相同点由于不同测验的原始分数不能直接比较,看不出那个更优越,用百分等级常模和标准分数常模,可以把它们转化成都没有数量单位米、千克、分等的数字进行比较,以获得有意义的资料2不同点
①表示方法不同百分等级常模用0~100的数字来表示,标准分数常模一般用-
3.000~
3.000的数字表示
②意义不相同百分等级常模用小于该分数的人数或次数占总人数或次数的百分数来表示,标准分数的意义是某分数在同类群体中距平均数的远近
③功能作用不完全相同百分等级常模只用于比较,而不能求和;标准分数常模除了能比较不同测验分数的优劣之外,还能对不同测验成绩求和,获取总成绩
4.2.试述对标准分数进行线性变换的必要性1一组分数中,总有不少的分数会比平均数小,所以转换成z值后有不少负值2由于全组分数的z值,常会落在六个标准差r离平均数正负、各三个标准差范围之内,要精确地标明其位置,z值的数字形式还必须带有多位小数3带负号和多位小数的数字,对一般学校师生和社会公众来说,很不好理解,甚至可能引起误解,所以不方便使用基于以上三条原因,需要对标准分数变换形式而不改变实质,线性变换实现了这种可能性
5.1试述什么是测验项目的恰当难度分布1一般的标准化常模测验,目的是尽可能地把握住被试的个别差异,即希望测验后所有被试的分数“尽可能地拉开距离”,这样测验项目的恰当难度就应该尽量使p值接近
0.50,而其难度分布,就是围绕p O.50这个点,尽量作窄全距分布同时考虑到希望在考试开始时施测一些低难度试题,末尾测验一些高难度试题因此,测验项目的难度分布在o.40至
0.60之间或
0.30至
0.70之间较合适2有一些测验,其目的是要考察被试水平是否达到应有要求故此,测验项目的难度,便由测验项目的考核要求是否体现了应有标准来决定相应地其难度分布便应根据实际需要使P由高到低分布3还有一些测验,如筛选性测验,其目的是要在一特定水平点上,把被试分成两组,即高于这一水平的组和低于这一水平的组,这样的测验的难度分布应该是对处在划界点决断点上的被试来说,通过率为
0.50因此,此类筛选测验,其项目就应针对划界点决断点水平来确定恰当难度和恰当难度分布
6.1.试述常模参照测验与标准参照测验的主要差异,及两者的共同点1主要有如下一些差异
①常模参照测验通常是一种相对评分,采用相对等级分数、百分等级分数或标准分数体系,说明的是被试在某一被试团体中的相对地位;而标准参照测验的成绩通常是一种绝对评分,采用卷面分数,或者参照既定标准下的等级评定分数,或者答对题目的百分比即掌握百分比,说明的是被试达成某一教学目标,或掌握某一范围内的知识技能的实有程度
②常模参照测验在设计意图上比较强调对个体能力的区分鉴别,因而在题目的难度方面多为中等而不用偏难或偏易的题目,以增加测验的区别功能和选拔功能;而标准参照测验在设计意图上考虑的是测验内容抽样是否良好地代表一组既定的能力标准或既定的教学目标,在此理念支配下,题目难度要与既定的学习任务相匹配,而不管题目是否偏易还是偏难
③常模参照测验通常涉及更Jr“泛的、难以明确限定的学习内容与能力目标,对每一项能力或目标一般只用少量题目加以测量;而标准参照测验相对来说,测验内容集中在限定的学习任务上,对每一项学习任务或目标通常用较多数量的题目来测量,在许多情况下,测验分数要针对各个具体的目标能力进行分项解释2常模参照测验和标准参照测验之间也有许多共同之处
①它们都以所学过的教学内容为命制题目的素材;
②它们都使用大体相同的题目类型;
③它们都需要讲究题目的质量如信度和效度等;
④它们通常都有相同的答题方式和评分准则;
⑤它们通常都以相同的方式来安排题目构成试卷等
6.2.选择题在知识能力测验中的优点和局限性1优点
①选择题不仅可以准确地测量简单学习结果,而且可以测量理解、运用、分析及综合等领域中更为复杂的高级学习成就
②选择题兼具其他几种客观题型的优点,同时还克服了其他客观题型的缺点如它避免了简答题经常存在的题意不清的缺陷,克服了是非题的简单判断所带来的过高的猜测概率
③选择题答题方式简便,在单位时间内可以考查更广泛的学习内容范围,提高测验效率
④选择题题型规范,答题方式可以采用专用答题卡和特殊型号的铅笔,因而它适合于考试机器评分,提高了评分的效率与准确性,能有效控制阅卷者的评分误差,确保了评分的客观性
⑤选择题采用大量似真的诱惑选项,这给教师分析学生的理解错误与学习困难提供易于诊断的线索,因而在诊断性学业成就测验中广泛采用精心编制的选择题型2局限性
①选择题只要求学生识别与选择正确答案,因而不太适合测量诸如数学和自然科学领域许多需要解题技巧,展示学生思维过程及特点方面的学习成就
②选择题只要求学生识别与选择正确答案,因而,减少了对学生自己回忆与自己提供正确答案方面的学习要求,这可能会削弱对低年级学生巩固知识以及掌握各学科基本知识方面的要求
③选择题的解题思路要求归一与归真,因此选择题既不能考查学生组织与表达自己观点的能力,也不能考查学生的思维发散力与创造力
④选择题在编题时,要求技巧性较高,特别是要考查学生的分析综合等方面的高级学业成就时,不仅在题目内容取材与表达方面需要精心思考,而且要编出若干个似是而非的、具有同样强的迷惑作用的干扰项,确实需要花费更多的智慧与精力因而,编制选择题需要专门技能和创造性
6.3.请联系实际谈谈心理测验在学校教育领域的应用人的心理发展存在着明显的个别差异,青少年时期是人的心理形成与发展的关键时期,为了提高教育水平与质量,需要对学生个体间的差异进行了解,并结合实际引导学生朝健康方向发展,具体来说1把心理学方法同传统的德育工作方法相结合,可以更有效地收集学生的心理资料,建立学生心理档案,了解学生心理特点和个别差异,发现与预测行为有问题者,进行及早预防还可以了解学生群体在特定社会环境下的道德认识、学习态度和心理症结等2通过心理测验,可以了解与评估学生的能力结构及发展水平,探测学生的职业倾向,为学生树立自己的人生理想提供心理支持;同时,可以开发学生潜能天赋,在学生升学就业时,起到一定的指导作用;对一些学生针对某门学科所出现的学习困难或不适应,可以通过适当的心理测验进行有效地分析、诊断和辅导帮助3通过心理测验方法,了解特殊学生个体在特定环境下的心理问题,包括人际关系紧张、神经官能症、焦虑、认知障碍、情感障碍、人格障碍以及精神性疾病等具体来说,例如新生开学的不适应、早恋、同学关系不融洽、考试恐惧等,这些心理问题,可以通过全面的健康教育和心理辅导,以及个别化心理咨询与心理治疗得到改善与解决,为学生正常的学习和健全的人格提供保障
6.4.如何编制和评价一个命题双向细目表1编制命题双向细目表主要有如下步骤
①确定考试内容要目,并把它们排列在表中最左一栏上有两种方法一是按教材章节名称排列;二是根据教学内容知识块排列
②界定该科目要考查的掌握目标层次,并把这些目标层次从低级到高级依次安排在表中顶端第一行格子上
③确定各项考试内容要目下的分数比重
④把每项考试内容的分数比重,逐一分配到若干必要的考查目标即掌握层次上去,形成网格的分数分配方案,即命题双向细目表2评价一个命题双向细目表,从以下几方面着手进行
①看该命题细目表是否以教学大纲或考试大纲为依据,是否能清晰地反映出考试大纲或教学大纲的要求
②考察该表是否易于命题操作,各考核项的分数比例是否合理
③看该命题双向细目表的形式是否能确切地与考核内容相适应,即能否灵活地编制命题双向细目表
7.
1.分层抽样方法和分阶段抽样方法有什么异同1相同点
①两种抽样方法都是随机抽样方法;
②两种方法都含有简单随机抽样的成分,在层内或阶段内部的抽样是简单随机抽样;
③它们的目的都是为了使所抽样本更好的代表总体,而不致使样本有所偏颇2不同点主要表现在适用的总体特征上的不同分层抽样方法适用的总体的特征是总体分成若干个部分,各部分元素之间差异较大如果按照简单随机抽样,某些容量较小的部分将会没有元素人样,而这些元素与其他部分的元素在质上有较大差异,没有这些元素将失去样本对总体的代表性分阶段抽样,适用的总体的特征是总体之下虽有部分之别,其间却无明显差异,但是“部分”的个数却很多如果所抽样本的容量较小,应采用分阶段抽样,第一阶段,按简单随机抽样方法对“部分”抽样,抽出一些“部分”进入第二阶段的抽样,第二阶段是对这些第一阶段抽出的“部分”的元素做简单随机抽样,最终形成所需样本
7.2.试述你对t分布有哪些认识t分布又叫学生氏分布,它与正态分布一样,也是一个单峰对称呈钟形的分布,其对称轴通过分布的平均数,t分布曲线在正负两个方向上以横轴为它的渐近线,t分布曲线中间低而尖峭,两头高而平缓t分布的最大特点是其实质是一族分布,每一个t分布的形态受自由度制约每个f分布都对应于一个自由度,自由度越大,t分布曲线的中间就越来越高,越来越平缓,两头却越来越低,越来越陡,整条曲线都越来越趋于正态分布,当自由度接近无穷大时,t分布就变成了正态分布在平均数抽样分布中,如果原总体正态,总体方差未知,那么该平均数的抽样分布就服从t分布t分布曲线下的面积代表概率大小,与z分数一样,t分布中,也有t分数,其计算公式;为样本平均数标准误,根据t分数,查t分布表便可求得相应的概率面积
8.1.试述统计假设检验的思想方法统计假设检验就是一种带有概率值保证的反证法有些命题从正面进行推论难以证明,而从反而进行论证,也就是说去证明它的否命题的荒谬性却往往事半功倍,这就是反证法的思想方法这样做的理由是从逻辑上说,否命题不成立,则其原命题自然成立统计假设检验从逻辑上说也是一种反证法统计假设检验人员常常希望证明备择假是正确的,但他却不能直接证明备择假设的正确性,而是从备择假设对立的虚无假设出发,以虚无假设为条件,采集样本数据确定抽样分布,计算检验统计量,考察检验统计量取值的概率如果发现这是一个小概率事件,那就依据小概率事件原理推翻虚无假设当然在此过程中,研究者必须保证在整个过程中除所作虚无假设之外的一切工作都是严密的、科学的所谓带有概率值保证是指上述的反证的方法作的统计假设检验,最终推翻虚无假设是由于所求检验统计量的取值为一小概率事件,而根据小概率事件原理推翻虚无假设的我们知道,根据小概率事件原理作决策推断是一种科学正确的决策思想方法,但并不保证每次的决策都是正确的换句话说,这一推翻虚无假设的决策也是可能犯错误的,只是犯错误的概率比较小而决策正确的概率比较大,而且这个决策正确的概率是由我们控制的,是可以计算的这就是假设检验“带有概率值保证”的含义
8.2.如何根据不同条件进行平均数差异的显著性检验平均数差异显著性检验实际上是要检验两个总体的平均数是否相等,或要检验是否一个大于或小于另一个而且我们还要在没有总体数据的情况下,用样本数据对总体平均数的大小关系作假设检验,并且要研究抽样分布因此根据这些任务,作统计假设检验必须考虑下列四个因素1总体是否相关;2总体分布是否正态;3两总体方差是否已知以及是否相等;4抽样样本容量大小根据上述四个因素,将平均数差异显著性检验归纳为四种情况分别对待Ⅰ总体方差已知的两独立正态总体的平均数差异显著性检验;Ⅱ总体方差相等但未知数值的两独立正态总体平均数差异显著性检验;Ⅲ两独立总体大样本平均数差异显著性检验,即样本容量大于30的独立非正态总体;Ⅳ两相关总体平均数差异显著性检验各种情况都有不同的统计检验量在平均数差异显著性检验中,首先看两总体是否相关,如果相关,按第Ⅳ种情况对待如果两总体不相关,即两独立总体,再看抽样分布是否服从正态分布,若不服从正态分布,样本容量又较大大于30,按第Ⅲ种情况处理若两总体不相关即独立,又服从正态分布,也就是两独立正态总.体,此时若总体方差已知按第I种情况处理,总体方差未知时,若方差值相等按第Ⅱ种情况处理
10.1.单向方差分析的原理方差分析是一种统计方法,它把实验数据总变异方差分解为若干个不同来源的分量,单向方差分析是方差分析最基本内容,其功能是比较一个方向上多个总体平均数间的差异其原理可以通过图解形式说明对于三个代表不同总体的样本,若它们的平均数相同,方差相等,合并为一个大样本后方差和平均数都不变,如图若将三个样本平均数不等而方差相等合并后,大样本的方差会发生较大的变化,如图由此可以看出,平均数有较大差异的样本合成后,大样本的方差大大增加,而平均数相等的样本合成的大样本方差却没有变化,因此,只要确定合成样本方差与子样本平均方差之间达到多大差异时,能表明样本代表的总体之间存在平均数的明显差异,我们便能达到平均数差异检验的目的单向方差分析把合成样本数据的离均差平方和记为ss总,记各子样本数据离均差平方和之和为SS内,这两部分的差是各子样平均数的离均差平均和的n倍,如果能确定这部分平方和是随机误差,那么就可以确定合成样本方差实质上并不大于各子样平均方差;如果能够证明这部分平方和包含实质性的差异,那我们就可以断定合成样本方差真正大于各子样平均方差,从而进一步推断出各平均数差有显著差异由于平均数抽样分布的抽样标准误等于原总体标准差σ的分之一,即平方和除以自由度所得的样本方差可以作为总体方差的无偏估计,我们可以得到总体方差的两个无偏估计MS间和MS内,它们的比服从F分布,即;F=MS间/MS内,通过F检验,可以达到总体平均数差异检验的目的
10.2.方差分析的前提条件1总离均差平方和的可分解性在方差分析过程中,我们要用到ss总=ss内+ss间它是将总离均差平方和分解成两部分组内离均差平方和和组间离均差平方和因此,总离均差的可分解性是方差分析方法得以发展的理论基础2总体正态性只有符合总体正态性的条件,在各总体均数无差异的虚无假设之下,合成样本的总体才会服从正态分布;在推理方差分析公式时,用到平均数抽样分布理论,而得到这一理论的前提就是原总体正态分布,为此总体的正态性也就成了方差分析的条件之一3样本随机性样本随机性是统计的基本要求,因为统计假设检验的数学模型都是抽样分布,抽样分布的理论都是建立在随机样本的基础上,如果样本的随机性得不到保证,那么抽样分布的理论就失去了基础,从而也就不能保证假设检验结论的正确性4方差齐性在方差分析原理中,估计总体方差的第二种办法是用各样本方差的加权平均作估计值,能够这样做的前提条件就是各子样本的总体方差齐性如果各子样本的总体方差不相等,我们选择哪一个子样本方差作总体方差的估计值就关系到F值的大小,因为我们是把它当作总体方差的标准估计值放在F比值的分母上的如果用了一个大的样本方差,F比值就越小,就可能夸大各总体均数间的差异只有在各总体方差齐性的条件下应用各样本方差的加权平均,才能保证方差分析的可靠性。