还剩5页未读,继续阅读
文本内容:
3.2 回归分析课时目标
1.理解建立回归模型的步骤.
2.会利用相关系数判断两个变量线性相关的程度.
3.利用回归模型可以对变量的值进行估计.1.线性回归模型对于一组具有线性相关关系的数据x1,y1,x2,y2,…,xn,yn,我们知道其回归直线=x+的斜率和截距的最小二乘估计分别为==,=________________,其中=____________,=____________,____________称为样本点的中心.2.相关性检验相关系数r具有以下性质|r|____1,并且|r|越接近于1,线性相关程度______;|r|越接近于0,线性相关程度________.3.临界值|r|________,表明有95%的把握认为两个变量之间具有线性相关关系.
一、选择题1.下列说法正确的是 A.y=2x2+1中的x、y是具有相关关系的两个变量B.正四面体的体积与其棱长具有相关关系C.电脑的销售量与电脑的价格之间是一种确定性的关系D.传染病医院感染甲型H1N1流感的医务人员数与医院收治的甲型流感人数是具有相关关系的两个变量2.两个变量成负相关关系时,散点图的特征是 A.点散布特征为从左下角到右上角区域B.点散布在某带形区域内C.点散布在某圆形区域内D.点散布特征为从左上角到右下角区域内3.已知x与y之间的一组数据如下表则y关于x的回归直线方程必过 A.22点B.
1.50点C.12点D.
1.54点4.工人月工资元依劳动生产率千元变化的回归方程为=50+80x,下列判断正确的是 A.劳动生产率为1000元时,工资为130元B.劳动生产率提高1000元,则平均工资提高80元C.劳动生产率提高1000元,则平均工资提高130元D.当某人的月工资为210元时,其劳动生产率为2000元5.某医学科研所对人体脂肪含量与年龄这两个变量研究得到一组随机样本数据,运用Excel软件计算得=
0.577x-
0.448x为人的年龄,y为人体脂肪含量.对年龄为37岁的人来说,下面说法正确的是 A.年龄为37岁的人体内脂肪含量都为
20.90%B.年龄为37岁的人体内脂肪含量为
21.01%C.年龄为37岁的人群中的大部分人的体内脂肪含量为
20.90%D.年龄为37岁的人群中的大部分人的体内脂肪含量为
31.5%
二、填空题6.已知两个变量x和y之间具有线性相关关系,5次试验的观测数据如下那么变量y关于x的回归直线方程是__________.7.如图所示,有5组数据A13,B24,C45,D3,10,E1012,去掉________组数据后剩下的4组数据的线性相关系数最大.8.已知回归直线方程为=
0.50x-
0.81,则x=25时,y的估计值为________.
三、解答题9.某企业上半年产品产量与单位成本资料如下1求出回归直线方程;2指出产量每增加1000件时,单位成本平均变动多少?3假定产量为6000件时,单位成本为多少元?10.某医院用光电比色计检验尿汞时,得尿汞含量毫克/升与消光系数如下表1对变量y与x进行相关性检验;2如果y与x之间具有线性相关关系,求回归直线方程.能力提升11.对变量x,y有观测数据xi,yii=12,…,10,得散点图1;对变量u,v,有观测数据ui,vii=12,…,10,得散点图2,由这两个散点图可以判断 1 2A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关12.某工业部门进行了一项研究,分析该部门的产量与生产费用之间的关系,从这个工业部门内随机提选了10个企业作样本,有如下资料完成下列要求1计算x与Y的相关系数;2对这两个变量之间是否线性相关进行相关性检验;3设回归直线方程为=x+,求,.1.1求回归直线方程的步骤为
①作出散点图;
②利用公式计算回归系数及的值;
③写出回归直线方程.2一般地,我们可以利用回归直线方程进行预测,这里所得到的值是预测值,但不是精确值.2.相关性检验计算r,|r|越大,线性相关程度越强.3.2 回归分析答案知识梳理
1.- xi yi ,2.≤ 越强 越弱3.r
0.05作业设计1.D [感染的医务人员数不仅受医院收治的病人数的影响,还受防护措施等其他因素的影响.]2.D [散点图的主要作用是直观判断两个变量之间的相关关系.一般地说,当散点图中的点是呈“由左下角到右上角”的趋势时,则两个变量之间具有正相关关系;而当散点图中的点是呈“由左上角到右下角”的趋势时,则两个变量之间具有负相关关系.]3.D [在本题中,样本点的中心为
1.54,所以回归直线方程过
1.54点.]4.B [由回归系数b的意义知,b0时,自变量和因变量按同向变化;b0时,自变量和因变量按反向变化.b=80,可知B正确.]5.C [当x=37时,=
0.577×37-
0.448=
20.901≈
20.90,由此估计年龄为37岁的人群中的大部分人的体内脂肪含量为
20.90%.]
6.=
0.575x-
14.97.D解析 各组数据所表示的点越集中靠在同一条直线上,相关系数越大,观察图象可知应去掉D组数据.8.
11.69解析 y的估计值就是当x=25时的函数值,即
0.50×25-
0.81=
11.
69.9.解 1n=6,xi=21,yi=426,=
3.5,=71,x=79,xiyi=1481,==≈-
1.
82.=-=71+
1.82×
3.5=
77.
37.所以回归直线方程为=+x=
77.37-
1.82x.2因为单位成本平均变动=-
1.820,且产量x的计量单位是千件,所以根据回归系数的意义有产量每增加一个单位即1000件时,单位成本平均减少
1.82元.3当产量为6000件时,即x=6,代入回归直线方程=
77.37-
1.82×6=
66.45元当产量为6000件时,单位成本为
66.45元.10.解 1=2+4+…+10=6,=64+138+…+360=
210.4,x-52=22+42+…+102-5×62=
40.xiyi-5=2×64+4×138+…+10×360-5×6×
210.4=1478,y-52=642+1382+…+3602-5×
210.42=
54649.2,所以r=≈
0.9997,由小概率
0.05与n-2=3在附表中查得r
0.05=
0.878,由|r|r
0.05得,有95%的把握认为y与x之间具有线性相关关系.2回归系数==
36.95,=
210.4-
36.95×6=-
11.3,所以所求回归直线方程为=
36.95x-
11.
3.11.C [图1中的数据随着x的增大而y减小,因此变量x与变量y负相关;图2中的数据随着u的增大,v也增大,因此u与v正相关.]12.解 1根据题意制表如下r=≈
0.808,即x与Y的相关系数为
0.
808.2由小概率
0.05与n-2=8在附表中查得r
0.05=
0.632,因为rr
0.05,所以有95%的把握认为x与Y之间具有线性相关关系.3=≈
0.398,=
165.7-
0.398×
77.7≈
134.
8.x0123y1357x100120140160180y4554627592月份产量千件单位成本元127323723471437354696568尿汞含量x毫克/升246810消光系数y64138205285360产量千件x40424855657988100120140生产费用千元Y150140160170150162185165190185i12345678910合计xi40424855657988100120140777yi1501401601701501621851651901851657x160017642304302542256241774410000144001960070903y22500196002560028900225002624434225272253610034225277119xiyi600058807680935097501279816280165002280025900132938=
77.7,=
165.7;∑x=70903;∑y=277119;∑xiyi=132938。