还剩7页未读,继续阅读
文本内容:
第三章统计案例注意事项1.答题前,先将自己的姓名、准考证号填写在试题卷和答题卡上,并将准考证号条形码粘贴在答题卡上的指定位置2.选择题的作答每小题选出答案后,用2B铅笔把答题卡上对应题目的答案标号涂黑,写在试题卷、草稿纸和答题卡上的非答题区域均无效3.非选择题的作答用签字笔直接答在答题卡上对应的答题区域内写在试题卷、草稿纸和答题卡上的非答题区域均无效4.考试结束后,请将本试题卷和答题卡一并上交
一、选择题本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的1.下列关于等高条形图的叙述正确的是()A.从等高条形图中可以精确地判断两个分类变量是否有关系B.从等高条例形图中可以看出两个变量频数的相对大小C.从等高条形图可以粗略地看出两个分类变量是否有关系D.以上说法都不对2.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为.用这个模型预测这个孩子10岁时的身高,则正确的叙述是()A.身高一定是B.身高在以上C.身高在以下D.身高在左右3.设产品产量与产品质量之间的线性相关系数为,这说明二者存在着()A.高度相关B.中度相关C.弱度相关D.极弱相关4.某市政府调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了3000人,计算发现,则根据这一数据查阅下表,市政府断言市民收入增减与旅游愿望有关系的可信程度是()A.B.C.D.5.在两个学习基础相当的班级实行某种教学措施的实验,测试结果见下表,则实验效果与教学措施() 实验效果教学措施 优、良、中差总计实验班48250对比班381250总计8614100A.有关B.无关C.关系不明确D.以上都不正确6.四名同学根据各自的样本数据研究变量,之间的相关关系,并求得回归直线方程,分别得到以下四个结论
①与负相关且;
②与负相关且;
③与正相关且;
④与正相关且.其中一定不正确的结论的序号是()、A.
①②B.
②③C.
③④D.
①④7.如下图所示,4个散点图中,不适合用线性回归模型拟合其中两个变量的是()8.预报变量的值与下列的哪些因素有关()A.受解释变量的影响,与随机误差无关B.受随机误差的影响,与解释变量无关C.与总偏差平方和有关,与残差无关D.与解释变量和随机误差的总效应有关9.已知与之间的一组数据01231357则与的线性回归方程必过()A.点B.点C.点D.点10.下面是调查某地区男女中学生是否喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从下图可以看出()A.性别与是否喜欢理科无关B.女生中喜欢理科的比为C.男生比女生喜欢理科的可能性大些D.男生中喜欢理科的比为11.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表男女合计爱好402060不爱好203050总计6050110附表参照附表,得到的正确的结论是()A.在犯错误的概率不超过的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过的前提下,认为“爱好该项运动与性别无关”C.有以上的把握认为“爱好该项运动与性别有关”D.有以上的把握认为“爱好该项运动与性别无关”12.以下关于线性回归的判断,正确的个数是()
①若散点图中所有点都在一条直线附近,则这条直线为回归直线;
②散点图中的绝大多数都线性相关,个别特殊点不影响线性回归,如图中的A,B,C点;
③已知直线方程为,则时,的估计值为;
④回归直线方程的意义是它反映了样本整体的变化趋势.A.0B.1C.2D.3
二、填空题(本大题共4个小题,每小题5分,共20分,把正确答案填在题中横线上)13.给出下列实际问题
①一种药物对某种病的治愈率;
②两种药物治疗同一种病是否有关系;
③吸烟者得肺病的概率;
④吸烟人群是否与性别有关系;
⑤上网与青少年的犯罪率是否有关系.其中,用独立性检验可以解决的问题有________.14.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果冷漠不冷漠总计多看电视6842110少看电视203858总计8880168则在犯错误的概率不超过________的前提下认为多看电视与人变冷漠有关系.15.在2013年春节期间,某市物价部门,对本市五个商场销售的某商品一天的销售量及其价格进行调查,五个商场的售价元和销售量件之间的一组数据如下表所示价格91011销售量1110865通过分析,发现销售量对商品的价格具有线性相关关系,则销售量对商品的价格的回归直线方程为________.16.某小卖部为了了解热茶销售量杯与气温()之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温,并制作了对照表气温181310-1杯数24343864由表中数据算得线性回归方程中的,预测当气温为时,热茶销售量为________杯.
三、解答题本大题共6个大题,共70分,解答应写出文字说明,证明过程或演算步骤17.(10分)考察黄烟经过培养液处理与是否跟发生青花病的关系.调查了457株黄烟,得到下表中数据,请根据数据作统计分析.培养液处理未处理合计青花病25210235无青花病80142222合计105352457附.18.(12分)某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系,从该部门内随机抽选了10个企业为样本,有如下资料产量千件生产费用千元40150421404816055170651507916288185100165120190140185
(1)计算与的相关系数;
(2)对这两个变量之间是否线性相关进行检验;
(3)设回归方程为,求回归系数.19.(12分)某高校共有15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据单位小时.
(1)应收集多少位女生的样本数据?
(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图如图所示,其中样本数据的分组区间为[0,2],2,4],4,6],6,8],8,10],10,12].估计该校学生每周平均体育运动时间超过4个小时的概率.
(3)在样本数据中,有60位女生的每周平均体育运动时间超过4个小时.请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.附PK2≥k
00.
100.
050.
0100.005k
02.
7063.
8416.
6357.87920.(12分)在一段时间内,某种商品的价格x元和需求量y件之间的一组数据为求出y对x的回归直线方程,并说明拟合效果的好坏.价格x1416182022需求量y121075321.(12分)电视传媒公司为了解某地区观众对某体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名,下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.
(1)根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?非体育迷体育迷合计男女合计
(2)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.附PK2≥k
0.
050.01k
3.
8416.63522.(12分)为了解某市市民对政府出台楼市限购令的态度,在该市随机抽取了50名市民进行调查,他们月收入单位百元的频数分布及对楼市限购令的赞成人数如下表月收入[15,25[25,35[35,45[45,55[55,65[65,75频数510151055赞成人数488521将月收入不低于55的人群称为“高收入族”,月收入低于55的人群称为“非高收人族”.
(1)根据已知条件完成下面的2×2列联表,有多大的把握认为赞不赞成楼市限购令与收入高低有关?已知,当K
22.706时,没有充分的证据判定赞不赞成楼市限购令与收入高低有关;当K
22.706时,有90%的把握判定赞不赞成楼市限购令与收入高低有关;当K
23.841时,有95%的把握判定赞不赞成楼市限购令与收入高低有关;当K
26.635时,有99%的把握判定赞不赞成楼市限购令与收入高低有关.非高收入族高收入族总计赞成不赞成总计
(2)现从月收入在[55,65的人群中随机抽取两人,求所抽取的两人中至少一人赞成楼市限购令的概率.2018-2019学年选修2-3第三章训练卷统计案例
(一)答案
一、选择题.1.【答案】C【解析】在等高条形图中仅能粗略判断两个分类变量的关系,故A错.在等高条形图中仅能找出频率,无法找出频数,故B错.故选C.2.【答案】D【解析】线性回归方程只能近似描述,不是准确值.故选D.3.【答案】A【解析】∵,与1接近,二者存在高度相关.故选A.4.【答案】C【解析】∵,故其可信度为.故选C.5.【答案】A【解析】由公式计算得,则认为“实验效果与教学措施有关”的概率为
0.99.故选A.6.【答案】D【解析】与正(或负)相关时,线性回归直线方程中,的系数(或),故
①④错.故选D.7.【答案】A【解析】题图A中的点不成线性排列,故两个变量不适合线性回归模型.故选A.8.【答案】D【解析】预报变量既受解释变量的影响,又受随机误差的影响.故选D.9.【答案】D【解析】计算得,,由于回归直线一定过点,∴必过点.10.【答案】C【解析】从图中可以看出,男生喜欢理科的比例为,而女生比例为仅为,这两个比例差别较大,说明性别与是否喜欢理科是有关系的,男生比女生喜欢理科的可能性更大一些.故选C.11.【答案】C【解析】由,得.故选C.12.【答案】D【解析】能使所有数据点都在它附近的直线不止一条,而据回归直线的定义知,只有按最小二乘法求得回归系数,得到的直线才是回归直线,∴
①不对;
②正确;将代入,得,∴
③正确;
④正确,故选D.
二、填空题.13.【答案】
②④⑤【解析】独立性检验主要是对两个分类变量是否有关系进行检验,主要涉及两种变量对同一种事情的影响,或者是两种变量在同一问题上体现的区别等.14.【答案】【解析】可计算的观测值.15.【答案】【解析】,,,,代入公式,得,∴,故回归直线方程为.16.【答案】70【解析】根据表格中的数据可求得,.∴,∴,当时,.
三、解答题.17.【答案】见解析.【解析】根据公式,由于,说明有的把握认为黄烟经过培养液处理与是否跟发生青花病是有关系的.18.【答案】
(1);
(2)与之间具有线性相关关系;
(3),.【解析】
(1)根据数据可得,,,,,∴,即与之间的相关系数;
(2)∵,∴可认为与之间具有线性相关关系;
(3),.19.【答案】
(1)90;
(2)
0.75;
(3)有95%的把握认为“该校学生的每周平均体育运动时间与性别有关.【解析】
(1)300×=90,∴应收集90位女生的样本数据.
(2)由频率分布直方图得1-2×
0.100+
0.025=
0.75,∴该校学生每周平均体育运动时间超过4小时的概率的估计值为
0.75.
(3)由
(2)知,300位学生中有300×
0.75=225人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时,又∵样本数据中有210份是关于男生的,90份是关于女生的,∴每周平均体育运动时间与性别列联表如下男生女生总计每周平均体育运动时间不超过4小时453075每周平均体育运动时间超过4小时16560225总计21090300综合列联表可算得K2==≈
4.
7623.841.∴有95%的把握认为“该校学生的每周平均体育运动时间与性别有关.”20.【答案】见解析.【解析】=14+16+18+20+22=18,=×12+10+7+5+3=
7.4,=142+162+182+202+222=1660,=122+102+72+52+32=327,=14×12+16×10+18×7+20×5+22×3=620,∴.∴.∴回归直线方程为.列出残差表为yi-i
00.3-
0.4-
0.
10.2yi-
4.
62.6-
0.4-
2.4-
4.4∴,,.∴R2=
0.994,因而拟合效果较好.21.【答案】
(1)见解析;
(2).【解析】
(1)由频率分布直方图可知,在抽取的100人中,“体育迷”为25人,从而完成2×2列联表如下非体育迷体育迷合计男301545女451055合计7525100将2×2列联表中的数据代入公式计算,得==≈3.030.∵
3.
0303.841,∴我们没有理由认为“体育迷”与性别有关.
(2)由频率分布直方图可知,“超级体育迷”为5人,从而一切可能结果所组成的集合为,其中表示男性,i=1,2,3,表示女性,j=1,2.Ω由10个基本事件组成,而且这些基本事件的出现是等可能的.用A表示“任选2人中,至少有1人是女性”这一事件,则,事件A由7个基本事件组成,因而PA=.22.【答案】
(1)有90%的把握认为楼市限购令与收入高低有关;
(2).【解析】
(1)非高收入族高收入族总计赞成25328不赞成15722总计401050K2=≈
3.43,故有90%的把握认为楼市限购令与收入高低有关.
(2)设月收入在[55,65的5人的编号为,b,c,d,e,其中a,b为赞成楼市限购令的人,从5人中抽取两人的方法数有b,c,d,e,bc,bd,be,cd,ce,de共10种,其中b,c,d,e,bc,bd,be为有利事件数,因此所求概率P=.。