还剩12页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
第一章统计案例章末检测试卷一时间120分钟 满分150分
一、选择题本大题共12小题,每小题5分,共60分1.对有线性相关关系的两个变量建立的线性回归方程=+x中,回归系数 A.可以小于0B.大于0C.能等于0D.只能小于0考点 线性回归分析题点 回归直线的概念答案 A解析 ∵=0时,则r=0,这时不具有线性相关关系,但可以大于0也可以小于
0.2.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为y=
7.19x+
73.
93.用这个模型预测这个孩子10岁时的身高,则正确的叙述是 A.身高一定是
145.83cmB.身高在
145.83cm以上C.身高在
145.83cm以下D.身高在
145.83cm左右考点 线性回归分析题点 回归直线的应用答案 D解析 根据回归模型,估计值是
145.83cm左右.3.下表显示出样本中变量y随变量x变化的一组数据,由此判断它最可能是 A.线性函数模型B.二次函数模型C.指数函数模型D.对数函数模型考点 回归分析题点 建立回归模型的基本步骤答案 A解析 画出散点图图略可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函数模型.4.为了探究患慢性气管炎与吸烟有无关系,调查了339名50岁以上的人,结果如下表所示,则认为50岁以上的人患慢性气管炎与吸烟习惯有关系的把握大约为 A.98%B.
99.5%C.99%D.90%考点 独立性检验思想的应用题点 独立性检验在分类变量中的应用答案 C解析 设患慢性气管炎与吸烟无关.a=43,b=162,c=13,d=121,a+b=205,c+d=134,a+c=56,b+d=283,n=
339.所以K2的观测值为k=≈
7.
469.因此k
6.635,故有99%的把握认为患慢性气管炎与吸烟有关.5.下表是性别与是否喜欢足球的统计列联表,依据表中的数据,可得到 A.观测值k=
9.564B.观测值k=
3.564C.观测值k
2.706D.观测值k
3.841考点 分类变量与列联表题点 求观测值答案 D解析 由题意可得K2的观测值k==≈
4.
7223.841,故选D.6.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取60名高中生做问卷调查,得到以下数据 则下列说法正确的是 A.在样本数据中没有发现足够证据支持结论“作文成绩优秀与课外阅读量大有关”B.在犯错误的概率不超过
0.001的前提下认为“作文成绩优秀与课外阅读量大有关”C.在犯错误的概率不超过
0.05的前提下认为“作文成绩优秀与课外阅读量大有关”D.在犯错误的概率不超过
0.005的前提下认为“作文成绩优秀与课外阅读量大有关”考点 独立性检验思想的应用题点 独立性检验在分类变量中的应用答案 D解析 由题意可得K2的观测值k==≈
9.
6437.879,故在犯错误的概率不超过
0.005的前提下认为作文成绩优秀与课外阅读量大有关.故选D.7.某个服装店经营某种服装,在某周内获纯利y元,与该周每天销售这种服装件数x之间的一组数据关系见表已知=280,=45309,iyi=3487,纯利y与每天销售件数x之间线性相关,则线性回归方程为 A.=
4.75x+
51.36B.=
4.57x-
52.08C.=
4.57x+
52.08D.=
4.57x-
5.08考点 线性回归方程题点 求线性回归方程答案 A解析 据题意,得==6,=≈
79.
86.因为y与x有线性相关关系,设线性回归方程为=x+,则===
4.75,=
79.86-6×
4.75=
51.
36.所以线性回归方程为=
4.75x+
51.36,故选A.8.根据如下样本数据得到的回归方程为=x+,则 A.0,0B.0,0C.0,0D.0,0考点 线性回归分析题点 线性回归方程的应用答案 B解析 作出散点图如下观察图象可知,回归直线=x+的斜率0,当x=0时,=
0.故0,
0.9.假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其中2×2列联表为对同一样本,以下数据能说明X与Y有关的可能性最大的一组是 A.a=5,b=4,c=3,d=2B.a=5,b=3,c=4,d=2C.a=2,b=3,c=4,d=5D.a=3,b=2,c=4,d=5考点 分类变量与列联表题点 求列联表中的数据答案 D解析 对于同一样本,|ad-bc|越小,说明x与y相关性越弱,而|ad-bc|越大,说明x与y相关性越强,通过计算知,对于A,B,C都有|ad-bc|=|10-12|=
2.对于选项D,有|ad-bc|=|15-8|=7,显然
72.10.高三某班学生每周用于数学学习的时间x单位小时与数学成绩y单位分之间有如下数据根据上表可得回归方程的系数≈
3.
53.若某学生每周用于数学学习的时间为18小时,则可预测该学生的数学成绩结果保留整数是 A.71分B.80分C.74分D.77分考点 线性回归分析题点 线性回归方程的应用答案 D解析 学生每周用于数学学习的时间的平均值==
17.4小时,数学成绩的平均值==
74.9分,所以=-=
74.9-
3.53×
17.4=
13.
478.当x=18时,=
3.53×18+
13.478=
77.018≈77,所以预测该学生的数学成绩为77分.11.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是 表1表2表3表4A.成绩B.视力C.智商D.阅读量考点 独立性检验及其基本思想题点 独立性检验的方法答案 D解析 结合各列联表中数据,得K2的观测值分别为k1,k2,k3,k
4.因为k1==,k2==,k3==,k4==,则k4k2k3k1,所以阅读量与性别有关联的可能性最大.
12.设x1,y1,x2,y2,…,xn,yn是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的回归直线如图所示,以下结论中正确的是 A.x和y的相关系数为直线l的斜率B.x和y的相关系数在0到1之间C.当n为偶数时,分布在l两侧的样本点的个数一定相同D.直线l过点,考点 线性回归分析题点 线性回归方程的应用答案 D解析 两个变量的相关系数不是直线的斜率,有专门的计算公式,所以A错误;两个变量的相关系数在-1到0之间,所以B错误;C中n为偶数时,分布在l两侧的样本点的个数可以不相同,所以C错误;根据线性回归方程一定经过样本点中心可知D正确.
二、填空题本大题共4小题,每小题5分,共20分13.调查了某地若干户家庭的年收入x单位万元和年饮食支出y单位万元,调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的线性回归方程为=
0.254x+
0.
321.由线性回归方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.考点 线性回归分析题点 回归直线的应用答案
0.254解析 线性回归方程=x+中字母的意义为随着自变量增加或减少1个单位的函数值的变化量,即函数的平均变化率.本题中年收入每增加1万元,年饮食支出平均增加
0.254万元.14.统计推断,当________时,有95%的把握认为事件A与B有关;当________时,认为没有充分的证据显示事件A与B是有关的.考点 分类变量与列联表题点 求观测值答案 k
3.841 k≤
2.706解析 当k
3.841时,就有95%的把握认为事件A与B有关,当k≤
2.706时认为没有充分的证据显示事件A与B是有关的.15.若一组观测值x1,y1,x2,y2,…,xn,yn之间满足yi=bxi+a+eii=12,…,n.若ei恒为0,则R2为________.考点 残差分析与相关指数题点 残差及相关指数的运算答案 1解析 ei恒为0,说明随机误差对yi贡献为
0.16.已知x,y之间的一组数据如下表对于表中数据,现给出如下拟合直线
①y=x+1;
②y=2x-1;
③y=x-;
④y=x.其中拟和效果最好的是________.考点 两个模型拟合效果的比较题点 两个模型拟合效果的比较答案
④解析 根据最小二乘法得变量x与y间的线性回归方程必过点,,则==4,==6,拟合直线
①②不过点46.对于
③,y=x-,当x=4时,y=6,当x=6时,y=
9.2,对于
④,y=x,当x=4时,y=6,当x=6时,y=
9.综上可知,拟合效果最好的直线是
④.
三、解答题本大题共6小题,共70分17.10分为了调查某大学学生在某天上网的时间,随机对100名男生和100名女生进行了不记名的问卷调查,得到了如下的统计结果表1男生上网时间与频数分布表表2女生上网时间与频数分布表1若该大学共有女生750人,试估计其中上网时间不少于60分钟的人数;2完成下面的2×2列联表,并回答能否有90%的把握认为“大学生上网时间与性别有关”.附K2=,其中n=a+b+c+d为样本容量.考点 独立性检验及其基本思想题点 独立性检验的方法解 1设上网时间不少于60分钟的人数为x,依题意有=,解得x=225,所以估计其中上网时间不少于60分钟的人数是
225.22×2列联表如下由表中数据可得到K2=≈
2.
202.706,故没有90%的把握认为“大学生上网时间与性别有关”.18.12分一机器可以按不同的速度运转,其生产物件有一些会有缺点,每小时生产有缺点物件的多少,随机器运转速度而变化,用x表示转速单位转/秒,用y表示每小时生产的有缺点物件的个数,现观测得到x,y的四组观测值为85,128,149,1611.若实际生产中所允许的每小时有缺点的物件数不超过10,则机器的速度每秒不得超过多少转?考点 线性相关系数题点 线性相关系数的应用解 由于=8+12+14+16=
12.5,=5+8+9+11=
8.25,xi-yi-=
25.5,xi-2=35,yi-2=
18.75,那么r=≈
0.
9950.75,因此,y与x之间具有很强的线性相关关系.于是由公式,得=
0.729,=-
0.863,那么y与x之间的线性回归方程为=
0.729x-
0.863,由=
0.729x-
0.863≤10,得x≤
14.901≈15,即每小时有缺点的物件数不超过10时,机器的速度每秒不得超过15转.19.12分有人发现了一个有趣的现象,中国人的邮箱名称里含有数字的比较多,而外国人的邮箱名称里含有数字的比较少.为了研究国籍和邮箱名称里是否含有数字的关系,他收集了124个邮箱名称,其中中国人的70个,外国人的54个,中国人的邮箱中有43个含数字,外国人的邮箱中有21个含数字.1根据以上数据建立一个2×2列联表;2他发现在这组数据中,外国人的邮箱名称里含数字的也不少,他不能断定国籍和邮箱名称里含有数字是否有关,你能帮他判断一下吗?考点 独立性检验及其基本思想题点 独立性检验的方法解 12×2列联表如下2假设“国籍和邮箱名称里是否含有数字无关”.由表中数据得k=≈
6.201,因为k
5.024,所以有理由认为假设“国籍和邮箱名称里是否含有数字无关”是不合理的,即有
97.5%的把握认为“国籍和邮箱名称里是否含有数字有关”.20.12分针对时下的“韩剧热”,某校团委对“学生性别和是否喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的,男生喜欢韩剧的人数占男生人数的,女生喜欢韩剧的人数占女生人数的.1若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有多少人;2若没有充分的证据显示是否喜欢韩剧和性别有关,则男生至多有多少人.考点 独立性检验及其基本思想题点 独立性检验的方法解 设男生人数为x,依题意可得列联表如下1若有95%的把握认为是否喜欢韩剧和性别有关,则k
3.841,由K2==
3.841,解得x
10.24,∵,为正整数,∴若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有12人.2若没有充分的证据显示是否喜欢韩剧和性别有关,则k≤
2.706,由K2==≤
2.706,解得x≤
7.216,∵,为正整数,∴若没有充分的证据显示是否喜欢韩剧和性别有关,则男生至多有6人.21.12分关于某设备的使用年限x和所支出的维修费用y万元有如下的统计资料1试用最小二乘法求出y关于x的线性回归方程;2求相关指数R2,并说明使用年限对维修费用的影响占百分之几?考点 残差分析与相关指数题点 残差及相关指数的应用解 1=,=,=30,iyi=19,==,=-=-×=-.∴线性回归方程为=x-,2依据题意,得R2=1-=1-≈
0.914,故使用年限对维修费用的影响占
91.4%.22.12分为了解中学生课余观看热门综艺节目“爸爸去哪儿”是否与性别有关,某中学一研究性学习小组从该校学生中随机抽取了n人进行问卷调查.调查结果表明女生中喜欢观看该节目的占女生总人数的,男生喜欢看该节目的占男生总人数的.随后,该小组采用分层抽样的方法从这n份问卷中继续抽取了5份进行重点分析,知道其中喜欢看该节目的有3人.1现从重点分析的5人中随机抽取了2人进行现场调查,求这两人都喜欢看该节目的概率;2若有99%的把握认为“爱看该节目与性别有关”,则参与调查的总人数n至少为多少?参考数据K2=,其中n=a+b+c+d.考点 独立性检验思想的应用题点 分类变量与统计、概率的综合性问题解 1记重点分析的5人中喜欢看该节目的为a,b,c,不喜欢看的为d,e,从5人中随机抽取2人,所有可能的结果有a,b,a,c,a,d,a,e,b,c,b,d,b,e,c,d,c,e,d,e,共10种,则这两人都喜欢看该节目的有3种,∴P=,即这两人都喜欢看该节目的概率为.2∵进行重点分析的5份中,喜欢看该节目的有3人,故喜欢看该节目的总人数为n,不喜欢看该节目的总人数为n.设这次调查问卷中女生总人数为a,男生总人数为b,a,b∈N*,则由题意可得2×2列联表如下解得a=n,b=n,∴正整数n是25的倍数,设n=25k,k∈N*,则a=12k,a=4k,b=3k,b=6k,则K2==k.由题意得k≥
6.635,解得k≥
1.59,∵k∈N*,∴k=2,故n=
50.x45678910y14181920232528患慢性气管炎未患慢性气管炎总计吸烟43162205不吸烟13121134总计56283339喜欢足球不喜欢足球总计男402868女51217总计454085作文成绩优秀作文成绩一般总计课外阅读量较大221032课外阅读量一般82028总计303060x件3456789y元66697381899091x345678y
4.
02.5-
0.
50.5-
2.0-
3.0y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+dx24152319161120161713y92799789644783687159 成绩性别不及格及格总计男61420女102232总计163652 视力性别好差总计男41620女122032总计163652 智商性别偏高正常总计男81220女82432总计163652 阅读量性别丰富不丰富总计男14620女23032总计163652x23456y34689上网时间分[3040[4050[5060[6070
[7080]人数525302515上网时间分[3040[4050[5060[6070
[7080]人数1020402010上网时间少于60分钟上网时间不少于60分钟总计男生女生总计PK2≥k
00.
500.
400.
250.
150.10k
00.
4550.
7081.
3232.
0722.706PK2≥k
00.
050.
0250.
0100.
0050.001k
03.
8415.
0246.
6357.
87910.828上网时间少于60分钟上网时间不少于60分钟总计男生6040100女生7030100总计13070200中国人外国人总计有数字432164无数字273360总计7054124喜欢韩剧不喜欢韩剧总计男生x女生总计xx1234y
0.
511.53yi
0.
511.53i
0.
31.
11.
92.7i
0.2-
0.1-
0.
40.3PK2≥k
00.
0500.
0250.
0100.
0050.001k
03.
8415.
0246.
6357.
87910.828喜欢看该节目的人数不喜欢看该节目的人数总计女生aaa男生bbb总计nnn。