还剩8页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
考点规范练52 变量间的相关关系、统计案例
一、基础巩固
1.根据如下样本数据:得到的回归方程为x+则 A.00B.00C.00D.00答案B解析由表中数据画出散点图如图由散点图可知00故选B.
2.在吸烟与患肺病这两个分类变量的计算中下列说法正确的是 A.若K2的观测值为
6.635则在犯错误的概率不超过
0.01的前提下认为吸烟与患肺病有关系因此在100个吸烟的人中必有99个患有肺病B.由独立性检验知在犯错误的概率不超过
0.01的前提下认为吸烟与患肺病有关系时我们说某人吸烟则他有99%的可能患肺病C.若在统计量中求出在犯错误的概率不超过
0.05的前提下认为吸烟与患肺病有关系是指有5%的可能性使得推断出现错误D.以上三种说法都不正确答案C解析独立性检验只表明两个分类变量的相关程度而不是事件是否发生的概率估计.
3.两个随机变量xy的取值如下表:若xy具有线性相关关系且x+
2.6则下列四个结论错误的是 A.x与y是正相关B.当x=6时y的估计值为
8.3C.x每增加一个单位y大约增加
0.95个单位D.样本点
34.8的残差为
0.56答案D解析由表格中的数据可知选项A正确;∵0+1+3+4=
22.2+
4.3+
4.8+
6.7=
4.5∴
4.5=2+
2.6即=
0.95∴=
0.95x+
2.
6.当x=6时=
0.95×6+
2.6=
8.3故选项B正确;由=
0.95+
2.6可知选项C正确;当x=3时=
0.95×3+
2.6=
5.45残差是
5.45-
4.8=
0.65故选项D错误.
4.“厉行节约反对浪费”之风悄然吹开某市通过随机询问100名性别不同的居民是否能做到“光盘”行动得到如下的列联表:则下面的正确结论是 A.在犯错误的概率不超过
0.1的前提下认为“该市居民能否做到‘光盘’与性别有关”B.在犯错误的概率不超过
0.01的前提下认为“该市居民能否做到‘光盘’与性别无关”C.在犯错误的概率不超过
0.01的前提下认为“该市居民能否做到‘光盘’与性别有关”D.在犯错误的概率不超过
0.1的前提下认为“该市居民能否做到‘光盘’与性别无关”答案A解析由2×2列联表得到a=45b=10c=30d=15则a+b=55c+d=45a+c=75b+d=25ad=675bc=300n=100计算得K2的观测值k=≈
3.
030.因为
2.
7063.030所以在犯错误的概率不超过
0.1的前提下认为“该市居民能否做到‘光盘’与性别有关”故选A.
5.若两个分类变量X和Y的2×2列联表如下:则在犯错误的概率不超过 的前提下认为X与Y之间有关系. 答案
0.001解析K2的观测值k=≈
18.
82210.828所以在犯错误的概率不超过
0.001的前提下认为X与Y之间有关系.
6.某车间为了规定工时定额需要确定加工零件所花费的时间为此进行了5次试验根据收集到的数据如下表由最小二乘法求得回归方程=
0.67x+
54.9现发现表中有一个数据看不清请你推断出该数据的值为 . 答案68解析由题意得=30代入回归直线方程=
0.67x+
54.9得=
0.67×30+
54.9解得a=
68.
7.从某居民区随机抽取10个家庭获得第i个家庭的月收入xi单位:千元与月储蓄yi单位:千元的数据资料算得xi=80yi=20xiyi=184=
720.1求家庭的月储蓄对月收入x的线性回归方程x+;2判断变量x与y之间是正相关还是负相关;3若该居民区某家庭月收入为7千元预测该家庭的月储蓄.解1由题意知n=10xi==8yi==2又-10=720-10×82=80xiyi-10=184-10×8×2=24由此得=
0.3=2-
0.3×8=-
0.4故所求线性回归方程为=
0.3x-
0.
4.2由于变量y的值随x值的增加而增加=
0.30因此x与y之间是正相关.3将x=7代入回归方程可以预测该家庭的月储蓄为=
0.3×7-
0.4=
1.7千元.
二、能力提升
8.某青少年成长关爱机构为了调研所在地区青少年的年龄与身高状况随机抽取6岁、9岁、12岁、15岁、18岁的青少年身高数据各1000个根据各年龄段平均身高作出如图所示的散点图和回归直线l.根据图中数据下列对该样本描述错误的是 A.根据样本数据估计该地区青少年身高与年龄成正相关B.所抽取数据中5000名青少年平均身高约为145cmC.直线l的斜率的值近似等于样本中青少年平均身高每年的增量D.从这5种年龄的青少年中各取一人的身高数据由这5人的平均年龄和平均身高数据作出的点一定在直线l上答案D解析在给定范围内随着年龄的增加年龄越大身高越高该地区青少年身高与年龄成正相关故A正确;用样本数据估计总体可得平均身高约是145cm故B正确;根据直线斜率的意义可知斜率的值近似等于样本中青少年平均身高每年的增量故C正确;各取一人具有随机性根据数据作出的点只能在直线附近不一定在直线上故D错误故选D.
9.已知x与y之间的几组数据如下表:假设根据上表数据所得线性回归直线方程x+若某同学根据上表中的前两组数据10和22求得的直线方程为y=bx+a则以下结论正确的是 A.baB.baC.baD.ba答案C解析由题意可知b=2a=-
2.=-则ba故选C.
10.有甲、乙两个班级进行数学考试按照大于等于85分为优秀85分以下为非优秀统计成绩得到如下的列联表:已知在全部105人中随机抽取1人成绩优秀的概率为则下列说法正确的是 .填序号
①列联表中c的值为30b的值为35
②列联表中c的值为15b的值为50
③根据列联表中的数据若在犯错误的概率不超过
0.025的前提下能认为“成绩与班级有关系”
④根据列联表中的数据若在犯错误的概率不超过
0.025的前提下不能认为“成绩与班级有关系”答案
③解析由题意知成绩优秀的学生人数是30成绩非优秀的学生人数是75所以c=20b=45
①②错误.根据列联表中的数据得到K2=≈
6.
65.024因此在犯错误的概率不超过
0.025的前提下认为“成绩与班级有关系”.故
③正确
④错误.
三、高考预测
11.国内某知名大学有男生14000人女生10000人.该校体育学院想了解本校学生的运动状况根据性别采取分层抽样的方法从全校学生中抽取120人统计他们平均每天运动的时间如下表.平均每天运动的时间单位:h该校学生平均每天运动的时间范围是
[03]男生平均每天运动的时间分布情况:女生平均每天运动的时间分布情况:1请根据样本估算该校男生平均每天运动的时间结果精确到
0.1;2若规定平均每天运动的时间不少于2h的学生为“运动达人”低于2h的学生为“非运动达人”.
①请根据样本估算该校“运动达人”的数量;
②请根据上述表格中的统计数据填写下面2×2列联表并通过计算判断能否在犯错误的概率不超过
0.05的前提下认为“运动达人”与性别有关参考公式:K2=其中n=a+b+c+d.参考数据:解1由分层抽样可知抽取的男生人数为120×=70抽取的女生人数为120-70=50故x=5y=
2.则该校男生平均每天运动的时间为≈
1.5h故该校男生平均每天运动的时间约为
1.5h.2
①样本中“运动达人”所占比例是故估计该校“运动达人”有×14000+10000=4000人.
②由表格可知:故K2的观测值k==≈
2.
7433.
841.故在犯错误的概率不超过
0.05的前提下不能认为“运动达人”与性别有关.x345678y
4.
02.5-
0.
50.5-
2.0-
3.0x0134y
2.
24.
34.
86.7做不到“光盘”能做到“光盘”男4510女3015y1y2合计x151520x2401050合计452570零件数x/个1020304050加工时间y/min62758189x123456y021334优秀非优秀总计甲班10b乙班c30总计平均每天运动的时间[
00.5[
0.51[
11.5[
1.52[
22.5[
2.53]人 数212231810x平均每天运动的时间[
00.5[
0.51[
11.5[
1.52[
22.5[
2.53]人 数51218103y运动达人非运动达人总计男生女生总计PK2≥k
00.
100.
050.
0250.
0100.
0050.001k
02.
7063.
8415.
0246.
6357.
87910.828运动达人非运动达人总计男生155570女生54550总计20100120。