还剩18页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
最新XX开放大学电大本科《社会统计学》期末标准题库及答案(试卷号1318)最新国家开放大学电大本科《社会统计学》期末标准题库及答案(___号1318)考试说明本人汇总了历年来该科所有的试题及答案,形成了一个完整的标准考试题库,对考生的复习和考试起着非常重要的作用,会给您节省大量的时间内容包含单项选择题、名词解释题、简答题、计算题做考题时,利用本文档中的查找工具Ctrl+F,把考题中的关键字输到查找工具的查找内容框内,就可迅速查找到该题答案本文库还有其他网核、机考及教学考一体化___,敬请查看
一、单项选择题1.某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后,在前十名学生中随机抽出成绩为第3名的学生,后面以10为间隔依次选出第
13、
23、
33、
43、
53、
63、
73、
83、93九名同学进行调查这种调查方法属于A.简单随机抽样B.整群抽样C.分层抽样D.系统抽样2.以下关于因变量与自变量的表述不正确的是A.自变量是引起其他变量变化的变量B.因变量是由于其他变量的变化而导致自身发生变化的变量C.自变量的变化是以因变量的变化为前提D.因变量的变化不以自变量的变化为前提3.某地区xx-xx年人口总量(单位万人)分别为98,102,103,106,108,109,110,111,___,115,下列哪种图形最适合描述这些数据?A.茎叶图B.环形图C.饼图D.线图4.以下关于条形图的表述,不正确的是A.条形图中条形的宽度是固定的B.条形图中条形的长度(或高度)表示各类别频数的多少C.条形图的矩形通常是紧密排列的D.条形图通常是适用于所有类型数据5.某校期末考试,全校语文平均成绩为80分,标准差为3分,数学平均成绩为87分,标准差为5分某学生语文得了83分,数学得了97分,从相对名次的角度看,该生的成绩考得更好A.数学B.语文c.两门课程一样D.无法判断6.有甲、乙两人同时打靶,各打10靶,甲平均每靶为8环,标准差为2;乙平均每靶9环,标准差为3,以下关于甲、乙两人打靶的稳定性水平表述正确的是A.甲的离散程度小,稳定性水平低B.甲的离散程度小,稳定性水平高C.乙的离散程度小,稳定性水平低D.乙的离散程度大,稳定性水平高7.下表是某单位工作人员年龄分布表,该组数据的中位数出现在第组A.第3组B.第4组C.第5组D.第6组8.对于线性回归,在因变量的总离差平方和中,如果残差平方和所占比例越大,那么两个变量之间A.相关程度越大B.相关程度越小C.完全相关D.完全不相关9.回归平方和SSR反映了y的总变差中A.由于x与y之间的线性关系引起的y的变化部分B.除了x对y的现有影响之外的其他因素对y变差的影响C.由于x与y之间的非线性关系引起的y的变化部分D.由于x与y之间的函数关系引起的y的变化部分10.下列哪种情况不适合用方差分析?A.性别对收入的影响B.专业对收入的影响C.年龄对收入的影响D.行业对收入的影响
11.某班级有100名学生为了解学生消费水平将所有学生按照学习成绩排序后在前十名学生中随机抽出成绩为第3名的学生后面依次选出第
13、
23、
33、
43、
53、
63、
73、
83、93九名同学进行调查这种抽样方法属于A.简单随机抽样B.整群抽样C.分层抽样D.系统抽样
12.以下关于因变量与自变量的表述不正确的是A.自变量是引起其他变量变化的变量B.因变量是由于其他变量的变化而导致自身发生变化的变量C.自变量的变化是以因变量的变化为前提D.因变量的变化不以自变量的变化为前提
13.某地区xx-xx年人口总量单位:万人分别为98102103106108109110111___115'下列哪种图形最适合描述这些数据A.茎叶图B.环形图C.饼图D.折线图
14.以下关于条形图的表述不正确的是A.条形图中条形的宽度是固定的B.条形图中条形的长度或高度表示各类别频数的多少C.条形图的矩形通常是紧密排列的D.条形图通常是适用于所有类型数15.某校期末考试,全校语文平均成绩为80分,标准差为3分;数学平均成绩为87分,标准差为5分某学生语文得了83分,数学得了97分,从相对名次的角度看,该生的成绩考得更好A.数学B.语文C.两门课程一样D.无法判断16.有甲、乙两人同时打靶,各打10靶,甲平均每靶为8环,标准差为2;乙平均每靶9环,标准差为3,以下甲、乙两人打靶的稳定性水平表述正确的是A.甲的离散程度小,稳定性水平低B.甲的离散程度小,稳定性水平高C.乙的离散程度小,稳定性水平低D.乙的离散程度大,稳定性水平高17.下表是某单位工作人员年龄分布表,该组数据的中位数出现在第组A.第3组B.第4组C.第5组D.第6组18.对于线性回归,在因变量的总离差平方和中,如果残差平方和所占比例越大,那么两个变量之间A.相关程度越大B.相关程度越小C.完全相关D.完全不相关19.回归平方和SSR反映了y的总变差中A.由于x与y之间的线性关系引起的y的变化部分B.除了x对y的现有影响之外的其他因素对y变差的影响C.由于x与y之间的非线性关系引起的y的变化部分D.由于x与y之间的函数关系引起的y的变化部分20.下列哪种情况不适合用方差分析?A.性别对收入的影响B.专业对收入的影响C.年龄对收入的影响D.行业对收入的影响21.以下关于因变量与自变量的表述不正确的是A.自变量的变化是以因变量的变化为前提B.因变量是由于其他变量的变化而导致自身发生变化的变量C.自变量是引起其他变量变化的变量D.因变量的变化不以自变量的变化为前提22.某班级学生平均每天上网时间可以分为以下六组11小时及以下;21-2小时;32-3小时;43-4小时;54-5小时;65小时及以上,则5小时及以上这一组的组中值近似为A.5小时B.6小时C.
5.5小时D.
6.5小时23.以下关于条形图的表述,不正确的是A.条形图中条形的宽度是固定的B.条形图的矩形通常是紧密排列的C.条形图中条形的长度(或高度)表示各类别频数的多少D.条形图通常是适用于所有类型数24.下表是某单位工作人员年龄分布表,该组数据的中位数出现在第.组A.第3组B.第4组C.第5组D.第6组25.某校期末考试,全校语文平均成绩为80分,标准差为3分;数学平均成绩为87分,标准差为5分某学生语文得了83分,数学得了97分,从相对名次的角度看,该生的成绩考得更好A.数学B.语文C.两门课程一样D.无法判断散26.在假设检验中,不拒绝虚无假设意味着A.虚无假设是肯定正确的B.虚无假设肯定是错误的C.没有证据证明虚无假设是正确的D.没有证据证明虚无假设是错误的27.根据一个样本均值求出的90%的置信区间表明A.总体均值一定落人该区间内B.总体均值有90%的概率不会落入该区间内C.总体均值有90%的概率会落人该区间内D.总体均值有10%的概率会落入该区间内28.在回归方程中,若回归系数等于0,这表明A.因变量y对自变量x的影响是不显著的B.自变量x对因变量y的影响是不显著的C.因变量y对自变量x的影响是显著的D.自变量x对因变量y的影响是显著的
29.中心极限定理认为不论总体分布是否服从正态分布从均值为μ、方差为σ的总体中抽取容量为n的随机样本当n充分大时通常要求n≥30样本均值的抽样分布近似服从均值为、方差为的正态分布A.μσ2B.μ/nσ2/nC.μo2/nD.μ/no
30.下列哪种情况不适合使用方差分析A.性别对收人的影响B.年龄对收人的影响C.专业对收人的影响D.行业对收人的影响
31.为了解某地区的消费从该地区随机抽取8000户进行调查其中80%回答他们的月消费在3000元以上20%回答他们每月用于通讯、网络的费用在300元以上此处8000户是A.样本B.总体C.变量D.统计量
32.某地区家庭年均收人可以分为以下六组:11500元及以下;21500一2500元;325003500元;43500-4500元;54500-5500元;65500元及以上则该分组的组距近似为A.500元B.1500元C.1250元D.1000元
33.先将总体按某种特征或标志分为不同的类别或层次然后在各个类别中采用简单随机抽样或系统抽样的方式抽取子样本最后将所有子样本合起来作为总样本这样的抽样方式称为A.简单随机抽样B.系统抽样C.整群抽样D.分层抽样
34.正态分布中σ值越小则A.离散趋势越小B.离散趋势越大C.曲线越低平D.变量值越分散
35.对于左偏分布平均数、中位数和众数之间的关系是A.平均数中位数众数B.中位数平均数众数C.众数中位数平均数D.众数平均数中位数
36.有甲、乙两人同时打靶各打10靶甲平均每靶为8环,标准差为2;乙平均每靶9环,标准差为3以下甲、乙两人打靶的稳定性水平表述正确的是A.甲的离散程度小稳定性水平低B.甲的离散程度小稳定性水平高.C.乙的离散程度小,稳定性水平低D.乙的离散程度大稳定性水平高37.下列哪种情况不适合用方差分析?A.性别对收入的影响B.专业对收入的影响C.年龄对收入的影响D.行业对收入的影响
38.某单位认为该厂第一___车间残品率估计高于13%而该车间主任认为该比例偏高如果要检验该说法是否正确则假设形式应该为A.Ho:r≥
0.13;H:x
0.13C.Ho:r=
0.13;H:π≠
0.13D.Ho:r
0.13;H:π≤
0.
13.
39.残差平方和SSE反映了y的总变差中A.由于x与y之间的线性关系引起的y的变化部分B.除了x对y的现有影响之外的其他因索对y变差的影响C.由于x与y之间的非线性关系引起的y的变化部分D.由于x与y之间的函数关系引起的y的变化部分
40.从两个总体___选取了8个观察值得到组间平方和为432组内平方和为426则组间均方和组内均方分别为A.
432.71B.
216.71C.
432.426D.
216.426
二、名词解释题1.非概率抽样根据主观意愿、实际情况等进行抽样,而不依据随机原则进行抽样,这些不符合概率抽样要求的抽样都称为非概率抽样2.二维表二维表就是行列交叉的表格,将两个变量一个分行排放,一个分列排放,行列交叉处就是同属于两个变量的不同类的数据,也称为列联表3.置信水平置信水平就是将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例4.卡方检验卡方检验是对样本的频数分布所的总体分布是否服从某种理论分布或某种假设分布所作的假设检验,即根据样本的频数分布来推断总体的分布5.非概率抽样根据主观意愿、实际情况等进行抽样,而不依据随机原则进行抽样,这些不符合概率抽样要求的抽样都称为非概率抽样6.二维表二维表就是行列交叉的表格,(1分)将两个变量一个分行排放,一个分列排放,(1分)行列交叉处就是同属于两个变量的不同类的数据,也称为列联表7.置信水平置信水平就是将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例8.卡方检验卡方检验是对样本的频数分布所的总体分布是否服从某种理论分布或某种假设分布所作的假设检验,即根据样本的频数分布来推断总体的分布9.整群抽样先将总体按照某种标志或特征划分为一些子群体,然后从总体中随机抽取一些子群体,再将这些抽出的若干小群体内的所有元素构成总体样本的方法10.Z值Z值:Z值又称为标准分数它是以平均数为参照点以标准差为单位的描述原始数据在总体中相对位置的量数通过计算Z值将一般正态分布转换为标准正态分布Z值的计算公式为:Z=X-μ/σ11.二维表二维表就是行列交叉的表格,(1分)将两个变量一个分行排放,一个分列排放,(1分)行列交叉处就是同属于两个变量的不同类的数据,也称为列联表12.误差减少比例在预测变量Y的值时,知道变量x的值时所减少的误差E.-Ez与总误差E,的比值称为误差减少比例,简称PRE13.散点图在坐标系中,用X轴表示自变量x,用Y轴表示因变量y,而变量组x,y则用坐标系中的点表示,不同的变量组在坐标系中形成不同的散点,用坐标系及其坐标系中的散点形成的二维图就是散点图14.中心极限定理中心极限定理具体内容为不论总体分布是否服从正态分布,从均值为肛、方差为-2的总体中,抽取容量为n的随机样本,当n充分大时通常要求n≥30,样本均值的抽样分布近似服从均值为队方差为aZ/n的正态分布15.置信水平置信水平就是将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例16.离散系数离散系数是一组数据的标准差与该数据均值之比,也称为变异系数
三、简答题
1.等距分组和不等距分组有什么区别?请举例说明答1定类变量当变量值的含义仅表示个体的不同类别,而___明个体的大小、程度等其它特征时,这种变量称为定类变量例如性别
0.5分2定序变量当变量值的含义不仅表示个体的不同类别,还可以区分个体之间大小、程度等序次差异时,这种变量称为定序变量例如学历
0.5分3定距变量当变量值不仅可以将个体区分为不同类型并进行排序,而且可以确定不同类别之间的数量差别和间隔差距时,这样的变量称为定距变量例如智商
0.5分4定比变量除了上述三种变量的全部特征外,还可以计算两个变量值之间的比值时,这样的变量称为定比变量例如收入
0.5分2.简述相关系数的取值与意义答相关系数的取值在一1~1之间;相关系数的正负号表示两个变量相关关系的方向,“十”表示正相关“一”表示负相关;相关系数的绝对值表示相关关系的程度绝对值越大相关程度越大即r越接近1;反之绝对值越小及r越接近0相关程度越弱;相关系数r=0时,只能说变量之间不存在线性相关而___它们之间不相关3.简述什么是回归分析?其作用是什么?答1回归分析是通过--定的数学表达式将变量间的关系进行描述确定-一个变量或几个变量的变化对另一个特定变量的影响是进行估计或预测的一种方法侧重于考察变量之间的数量伴随关系2回归分析的作用包括:
①从已知数据出发确定变量之间的数学关系式;
②对变量间的关系式进行统计检验并从影响某一变量的多个变量中找出影响显著的变量;
③利用所求出的关系式根据一个变量或多个变量的取值估计或预测另一个特定变量的取值
4.简述按照测量水平区分的四类变量,并举例说明答1定类变量当变量值的含义仅表示个体的不同类别,而___明个体的大小、程度等其它特征时,这种变量称为定类变量例如性别
0.5分2定序变量当变量值的含义不仅表示个体的不同类别,还可以区分个体之间大小、程度等序次差异时,这种变量称为定序变量例如学历
0.5分3定距变量当变量值不仅可以将个体区分为不同类型并进行排序,而且可以确定不同类别之间的数量差别和间隔差距时这样的变量称为定距变量例如:智商
0.5分4定比变量:除了上述三种变量的全部特征外还可以计算两个变量值之间的比值时这样的变量称为定比变量例如:收入
0.5分
5.简述相关系数的取值与意义答相关系数的取值在一1~1之间;相关系数的正负号表示两个变量相关关系的方向“+”表示正相关“-”表示负相关;相关系数的绝对值表示相关关系的程度绝对值越大相关程度越大即r越接近1;反之绝对值越小及r越接近0相关程度越弱;相关系数r=0时只能说变量之间不存在线性相关而___它们之间不相关6.简述什么是简单回归分析?其作用是什么?答1回归分析是通过一定的数学表达式将变量间的关系进行描述确定-个变量或几个变量的变化对另一个特定变量的影响是进行估计或预测的一种方法侧重于考察变量之间的数量伴随关系2回归分析的作用包括:
①从已知数据出发确定变量之间的数学关系式;
②对变量间的关系式进行统计检验并从影响某一变量的多个变量中找出影响显著的变量;
③利用所求出的关系式根据一个变量或多个变量的取值估计或预测另一个特定变量的取值
7.判断以下随机变量是定性变量还是定量变量如果是定量变量确定是离散变量还是连续变量1网络供应商的姓名;2每月的网络服务费;3每月上网时间;
4.上网的目的;
5.上月网购次数答1网络供应商的姓名定性2每月的网络服务费定量、连续变量3每月上网时间定量、连续变量4_上网的目的:定性
5.上月网购次数:定量、离散变量
8.简述什么是简单回归分析其作用是什么答1回归分析是通过一定的数学表达式将变量间的关系进行描述确定-一个变量或几个变量的变化对另一个特定变量的影响是进行估计或预测的一-种方法侧重于考察变量之间的数量伴随关系2回归分析的作用包括:
①从已知数据出发确定变量之间的数学关系式;
②对变量间的关系式进行统计检验并从影响某一变量的多个变量中找出影响显著的变量;
③利用所求出的关系式根据-一个变量或多个变量的取值估计或预测另一个特定变量的取值
9.如何对配对样本进行t检验答配对样本检验主要是判断不同的处理或试验结果是否有差异配对样本的t检验用于检验两个相关的样本是否具有相同均值的总体在对配对样本进行t检验时首先计算两个样本中每个对应变量之间的差值;然后再检验其差值的均值是否为零如果差值的均值接近零在给定的置信区间内说明两个总体均值在给定的置信水平上没有差异,如果差值的均值在置信区间外,则说明两个总体均值在给定的置信水平上有差异10.简述按照测量水平区分的四类变量,并举例说明答1定类变量当变量值的含义仅表示个体的不同类别,而___明个体的大小、程度等其它特征时,这种变量称为定类变量例如性别
0.5分2定序变量当变量值的含义不仅表示个体的不同类别,还可以区分个体之间大小、程度等序次差异时,这种变量称为定序变量例如学历
0.5分3定距变量当变量值不仅可以将个体区分为不同类型并进行排序,而且可以确定不同类别之间的数量差别和间隔差距时,这样的变量称为定距变量例如智商
0.5分4定比变量除了上述三种变量的全部特征外,还可以计算两个变量值之间的比值时,这样的变量称为定比变量例如收入
0.5分11.简述相关系数的取值与意义答相关系数的取值在-1~1之间;相关系数的正负号表示两个变量相关关系的方向,“+”表示正相关,“一”表示负相关;相关系数的绝对值表示相关关系的程度,绝对值越大,相关程度越大,即r越接近1;反之,绝对值越小,及r越接近O,相关程度越弱;相关系数r-0时,只能说变量之间不存在线性相关,而___它们之间不相关12.简要举例说明在分析双变量的关系时,t检验和卡方检验的主要区别答分析双变量关系时,t检验和卡方检验都是主要用于检验这两个变量之间是否存在显著关系(2分)t检验主要用于对一个为数值型变量、另一个为分类变量且只有两个类别的变量的双变量关系的统计显著性检验卡方检验主要用于对两个分类变量之间的相关性进行统计检验,判断变量之间是否存在显著关系例如,我们想考察收入与性别是否存在关系,或者两性的收入是否存在显著差异,可以用两___样本t检验如果我们想考察职业与性别是否存在关系,而职业和性别都是分类变量,那么可以用卡方检验考察不同性别之间职业是否存在显著差异
四、计算题
18.一项关于大学生体重状况的研究发现,男生的平均体重为60千克,标准差为5千克;女生的平均体重为50千克,标准差为5千克请问;1是男生体重差异大还是女生体重差异大?___?2男生中有多少比重的人体重在55千克-65千克之间?答答
18.一项关于大学生体重状况的研究发现,男生的平均体重为60千克,标准差为5千克;女生的平均体重为50千克,标准差为5千克请问1是男生体重差异大还是女生体重差异大?___?2男生中有多少比重的人体重在55千克-65千克之间?3女生中有多少比重的人体重在40千克-60千克之间?答答
18.为估计每个网络用户每天上网的平均时间是多少抽取了225个网络用户的简单随机样本得到样本均值为
6.5个小时样本标准差为
2.5个小时1试用95%的置信水平计算网络用户每天平均上网时间的置信区间2在所调查的225个网络用户中年龄在20岁以下的用户为90个以95%的置信水平计算年龄在20岁以下的网络用户比例的置信区间注:Zo.025=
1.96答19.某农科院使用4种方法培育稻米,为确定哪种方法生产效率最高,随机划出40块试验田,并指定每块试验田使用其中的一种方法通过对每块试验田的产量进行分析得到下面的方差分析表要求计算上面方差分析表中A、B、C、D、E、F处的值答1对xx年销售额按由低到高进行排序,求出众数、中位数和平均数2如果按照规定,销售额在125万元以上的为先进企业,115万-125万之间的为良好企业,105万-115万之间的为一般企业,105万以下的为___企业,请按先进企业、良好企业、一般企业、___企业进行分组,编制频数分布表,并计算累积频数和累积频率答
19.某汽车生产商欲了解___费用(万元)对销售量(辆)的影响收集了过去12年的有关数据,通过分析得到方程的截距为363,回归系数为
1.42,回归平方和SSR-1600,残差平方和SSE-450要求1写出销售量y与___费用x之间的线性回归方程2假如明年计划投入___费用为50万,根据回归方程估计明年汽车销售量3计算判定系数R2,并解释它的意义答模板内容仅供参考。