还剩3页未读,继续阅读
文本内容:
课时作业58 变量间的相关关系与统计案例[基础达标]
一、选择题1.[2019·石家庄模拟]下列说法错误的是 A.回归直线过样本点的中心,B.两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1C.对分类变量X与Y,随机变量K2的观测值k越大,则判断“X与Y有关系”的把握程度越小D.在回归直线方程=
0.2x+
0.8中,当解释变量x每增加1个单位时,预报变量平均增加
0.2个单位解析本题考查命题真假的判断.根据相关定义分析知A,B,D正确;C中对分类变量X与Y的随机变量K2的观测值k来说,k越大,判断“X与Y有关系”的把握程度越大,故C错误,故选C.答案C2.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表收入x万元
8.
28.
610.
011.
311.9支出y万元
6.
27.
58.
08.
59.8根据上表可得回归直线方程=x+,其中=
0.76,=-.据此估计,该社区一户年收入为15万元家庭的年支出为 A.
11.4万元B.
11.8万元C.
12.0万元D.
12.2万元解析∵=
10.0,=
8.0,=
0.76,∴=8-
0.76×10=
0.4,∴回归方程为=
0.76x+
0.4,把x=15代入上式得,=
0.76×15+
0.4=
11.8万元.答案B3.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表男女合计爱好402060不爱好203050合计6050110由K2=,算得K2=≈
7.
8.附表PK2≥k
00.
0500.
0100.001k
03.
8416.
63510.828参照附表,得到的正确结论是 A.在犯错误的概率不超过
0.1%的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过
0.1%的前提下,认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动与性别有关”D.有99%以上的把握认为“爱好该项运动与性别无关”解析根据独立性检验的定义,由K2≈
7.
86.635,可知我们在犯错误的概率不超过
0.01的前提下,即有99%以上的把握认为“爱好该项运动与性别有关”,故选C.答案C4.[2017·山东卷]为了研究某班学生的脚长x单位厘米和身高y单位厘米的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系.设其回归直线方程为=x+.已知i=225,i=1600,=
4.该班某学生的脚长为24,据此估计其身高为 A.160B.163C.166D.170解析∵i=225,∴=i=
22.
5.∵i=1600,∴=i=
160.又=4,∴=-=160-4×
22.5=
70.∴回归直线方程为=4x+
70.将x=24代入上式得=4×24+70=
166.故选C.答案C5.[2019·河南安阳模拟]已知变量x与y的取值如下表所示,且
2.5nm
6.5,则由该数据算得的线性回归方程可能是 x2345y
6.5mn
2.5A.=
0.8x+
2.3B.=2x+
0.4C.=-
1.5x+8D.=-
1.6x+10解析由
2.5nm
6.5,可得为负相关,排除A,B,由题意,知=
3.5,=×
6.5+m+n+
2.5∈
3.
55.5,分别代入选项C,D,可得D满足.故选D.答案D
二、填空题6.为了研究某种细菌在特定环境下随时间变化的繁殖规律,得如下实验数据,计算得回归直线方程为=
0.85x-
0.
25.由以上信息,得到下表中c的值为________.天数x/天34567繁殖个数y/千个
2.
5344.5c解析==5,==,代入回归直线方程中得=
0.85×5-
0.25,解得c=
6.答案67.某校某次数学考试规定80分以上含80分为优分,在1000名考生中随机抽取的100名学生中,“男生组”中的优分有15人,“女生组”中的优分有15人,据此可得2×2列联表如下优分非优分总计男生154560女生152540总计3070100为了研究数学成绩与性别是否有关,采用独立检验的方法进行数据处理,则正确的结论是________.附表及公式PK2≥k
00.
1000.
0500.
0100.001k
02.
7063.
8416.
63510.828K2=.解析K2=≈
1.79,因为
1.79<
2.706,所以没有90%以上的把握认为“数学成绩与性别有关”.答案没有90%以上的把握认为“数学成绩与性别有关”8.[教材习题改编]已知x,y的取值如下表,从散点图可以看出y与x线性相关,且回归方程为=
0.95x+,则=________.x0134y
2.
24.
34.
86.7解析∵回归直线必过样本点的中心,,又=2,=
4.5,代入回归方程,得=
2.
6.答案
2.6
三、解答题9.[2019·合肥检测]某校计划面向高一年级1200名学生开设校本选修课程,为确保工作的顺利实施,先按性别进行分层抽样,抽取了180名学生对社会科学类、自然科学类这两大类校本选修课程进行选课意向调查,其中男生有105人.在这180名学生中选择社会科学类的男生、女生均为45人.1分别计算抽取的样本中男生、女生选择社会科学类的频率,并以统计的频率作为概率,估计实际选课中选择社会科学类的学生人数;2依据抽取的180名学生的调查结果,完成以下2×2列联表.并判断能否在犯错误的概率不超过
0.025的前提下认为科类的选择与性别有关?选择自然科学类选择社会科学类合计男生女生合计附K2=,其中n=a+b+c+d.PK2≥k
00.
5000.
4000.
2500.
1500.
1000.
0500.
0250.
0100.
0050.001k
00.
4550.
7081.
3232.
0722.
7063.
8415.
0246.
6357.
87910.828解析1由条件知,抽取的男生有105人,女生有180-105=75人.男生选择社会科学类的频率为=,女生选择社会科学类的频率为=.由题意,男生总数为1200×=700人,女生总数为1200×=500人,所以估计选择社会科学类的人数为700×+500×=600人.2根据统计数据,可得列联表如下选择自然科学类选择社会科学类合计男生6045105女生304575合计9090180则K2==≈
5.
14295.024,所以在犯错误的概率不超过
0.025的前提下能认为科类的选择与性别有关.10.[2019·成都检测]某项科研活动共进行了5次试验,其数据如下表所示特征量第1次第2次第3次第4次第5次x555559551563552y6016055975995981从特征量y的5次试验数据中随机地抽取两个数据,求至少有一个大于600的概率;2求特征量y关于x的线性回归方程=x+,并预测当特征量x为570时特征量y的值.附回归直线=x+的斜率和截距的最小二乘估计分别为=,=-解析1记“至少有一个大于600”为事件A,则PA=1-=.2由题中表格可知,==556,==
600.∴===
0.3,=-=600-
0.3×556=
433.2,∴线性回归方程为=
0.3x+
433.
2.当x=570时,=
0.3×570+
433.2=
604.2,故特征量x为570时,特征量y的估计值为
604.
2.[能力挑战]11.[2018·全国卷Ⅲ]某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间单位min绘制了如下茎叶图1根据茎叶图判断哪种生产方式的效率更高?并说明理由;2求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表超过m不超过m第一种生产方式第二种生产方式3根据2中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附K2=,PK2≥k
0.050
0.010
0.001k
3.
8416.635
10.
828.解析1第二种生产方式的效率更高.理由如下ⅰ由茎叶图可知用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.ⅱ由茎叶图可知用第一种生产方式的工人完成生产任务所需时间的中位数为
85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为
73.5分钟.因此第二种生产方式的效率更高.ⅲ由茎叶图可知用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟.因此第二种生产方式的效率更高.ⅳ由茎叶图可知用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分.2由茎叶图知m==
80.列联表如下超过m不超过m第一种生产方式155第二种生产方式5153由于K2==
106.635,所以有99%的把握认为两种生产方式的效率有差异.。