还剩16页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
2019-2020年人教版高中数学必修三教案2-3变量间的相关关系项目内容课题
2.3变量间的相关关系(共2课时)修改与创新教学目标
1.通过收集现实问题中两个有关联变量的数据认识变量间的相关关系.
2.明确事物间的相互联系.认识现实生活中变量间除了存在确定的关系外仍存在大量的非确定性的相关关系并利用散点图直观体会这种相关关系.
3.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想能根据给出的线性回归方程的系数公式建立线性回归方程.教学重、难点教学重点通过收集现实问题中两个有关联变量的数据直观认识变量间的相关关系;利用散点图直观认识两个变量之间的线性关系;根据给出的线性回归方程的系数公式建立线性回归方程.教学难点变量之间相关关系的理解;作散点图和理解两个变量的正相关和负相关;理解最小二乘法的思想.教学准备多媒体课件教学过程第1课时导入新课在学校里老师对学生经常这样说“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系.这种说法有没有根据呢请同学们如实填写下表(在空格中打“√”):好中差你的数学成绩你的物理成绩学生讨论我们可以发现自己的数学成绩和物理成绩存在某种关系.(似乎就是数学好的物理也好;数学差的物理也差但又不全对.)物理成绩和数学成绩是两个变量从经验看由于物理学习要用到比较多的数学知识和数学方法.数学成绩的高低对物理成绩的高低是有一定影响的.但决非唯一因素还有其他因素如是否喜欢物理用在物理学习上的时间等等.(总结不能通过一个人的数学成绩是多少就准确地断定他的物理成绩能达到多少.但这两个变量是有一定关系的它们之间是一种不确定性的关系.如何通过数学成绩的结果对物理成绩进行合理估计有非常重要的现实意义.)为很好地说明上述问题我们开始学习变量之间的相关关系和两个变量的线性相关.教师板书课题推进新课新知探究提出问题
(1)粮食产量与施肥量有关系吗?“名师出高徒”可以解释为教师的水平越高学生的水平也越高.教师的水平与学生的水平有什么关系?你能举出更多的描述生活中两个变量的相关关系的成语吗?
(2)两个变量间的相关关系是什么?有几种?
(3)两个变量间的相关关系的判断.讨论结果
(1)粮食产量与施肥量有关系一般是在标准范围内施肥越多粮食产量越高;教师的水平与学生的水平是相关的如水滴石穿三人行必有我师等.我们还可以举出现实生活中存在的许多相关关系的问题.例如:商品销售收入与广告支出经费之间的关系.商品销售收入与广告支出经费有着密切的联系但商品销售收入不仅与广告支出多少有关还与商品质量、居民收入等因素有关.粮食产量与施肥量之间的关系.在一定范围内施肥量越大粮食产量就越高.但是施肥量并不是决定粮食产量的唯一因素.因为粮食产量还要受到土壤质量、降雨量、田间管理水平等因素的影响.人体内的脂肪含量与年龄之间的关系.在一定年龄段内随着年龄的增长人体内的脂肪含量会增加但人体内的脂肪含量还与饮食习惯、体育锻炼等有关可能还与个人的先天体质有关.应当说对于上述各种问题中的两个变量之间的相关关系我们都可以根据自己的生活、学习经验作出相应的判断因为“经验当中有规律”.但是不管你的经验多么丰富如果只凭经验办事还是很容易出错的.因此在分析两个变量之间的相关关系时我们需要一些有说服力的方法.在寻找变量之间相关关系的过程中统计同样发挥着非常重要的作用.因为上面提到的这种关系并不像匀速直线运动中时间与路程的关系那样是完全确定的而是带有不确定性.这就需要通过收集大量的数据有时通过调查有时通过实验在对数据进行统计分析的基础上发现其中的规律才能对它们之间的关系作出判断.2相关关系的概念自变量取值一定时因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.两个变量之间的关系分两类
①确定性的函数关系例如我们以前学习过的一次函数、二次函数等;
②带有随机性的变量间的相关关系例如“身高者体重也重”我们就说身高与体重这两个变量具有相关关系.相关关系是一种非确定性关系.如商品销售收入与广告支出经费之间的关系.(还与商品质量、居民收入、生活环境等有关)3两个变量间的相关关系的判断
①散点图.
②根据散点图中变量的对应点的离散程度可以准确地判断两个变量是否具有相关关系.
③正相关、负相关的概念.
①教学散点图出示例题在一次对人体脂肪含量和年龄关系的研究中研究人员获得了一组样本数据年龄23273841454950脂肪
9.
517.
821.
225.
927.
526.
328.2年龄53545657586061脂肪
29.
630.
231.
430.
833.
535.
234.6分析数据大体上来看随着年龄的增加人体中脂肪的百分比也在增加.我们可以作散点图来进一步分析.
②散点图的概念将各数据在平面直角坐标系中的对应点画出来得到表示两个变量的一组数据的图形这样的图形叫做散点图,如下图.从散点图我们可以看出,年龄越大,体内脂肪含量越高.图中点的趋势表明两个变量之间确实存在一定的关系这个图支持了我们从数据表中得出的结论.(a.如果所有的样本点都落在某一函数曲线上就用该函数来描述变量之间的关系即变量之间具有函数关系.b.如果所有的样本点都落在某一函数曲线附近变量之间就有相关关系.c.如果所有的样本点都落在某一直线附近变量之间就有线性相关关系)
③正相关与负相关的概念如果散点图中的点散布在从左下角到右上角的区域内称为正相关.如果散点图中的点散布在从左上角到右下角的区域内称为负相关.(注散点图的点如果几乎没有什么规则则这两个变量之间不具有相关关系)应用示例例1下列关系中带有随机性相关关系的是_____________.
①正方形的边长与面积之间的关系
②水稻产量与施肥量之间的关系
③人的身高与年龄之间的关系
④降雪量与交通事故的发生率之间的关系解析两变量之间的关系有两种函数关系与带有随机性的相关关系.
①正方形的边长与面积之间的关系是函数关系.
②水稻产量与施肥量之间的关系不是严格的函数关系但是具有相关性因而是相关关系.
③人的身高与年龄之间的关系既不是函数关系也不是相关关系因为人的年龄达到一定时期身高就不发生明显变化了因而他们不具备相关关系.
④降雪量与交通事故的发生率之间具有相关关系因此填
②④.答案
②④例2有关法律规定香烟盒上必须印上“吸烟有害健康”的警示语.吸烟是否一定会引起健康问题你认为“健康问题不一定是由吸烟引起的所以可以吸烟”的说法对吗分析学生思考然后讨论交流教师及时评价.解从已经掌握的知识来看吸烟会损害身体的健康但是除了吸烟之外还有许多其他的随机因素影响身体健康人体健康是很多因素共同作用的结果.我们可以找到长寿的吸烟者也更容易发现由于吸烟而引发的患病者所以吸烟不一定引起健康问题.但吸烟引起健康问题的可能性大.因此“健康问题不一定是由吸烟引起的所以可以吸烟”的说法是不对的.点评在探究研究的过程中如果能够从两个变量的观察数据之间发现相关关系是极为有意义的由此可以进一步研究二者之间是否蕴涵因果关系从而发现引起这种相关关系的本质原因是什么.本题的意义在于引导学生重视对统计结果的解释从中发现进一步研究的问题.知能训练一个车间为了规定工时定额需要确定加工零件所花费的时间为此进行了10次试验收集数据如下零件数x(个)102030405060708090100加工时间ymin626875818995102108115122画出散点图;关于加工零件的个数与加工时间你能得出什么结论?答案
(1)散点图如下
(2)加工零件的个数与所花费的时间呈正线性相关关系.拓展提升以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据房屋面积(m2)11511080135105销售价格(万元)
24.
821.
618.
429.222
(1)画出数据对应的散点图;
(2)指出是正相关还是负相关;
(3)关于销售价格y和房屋的面积x你能得出什么结论?解
(1)数据对应的散点图如下图所示
(2)散点图中的点散分布在从左下角到右上角的区域内所以是正相关.
(3)关于销售价格y和房屋的面积x房屋的面积越大价格越高它们呈正线性相关的关系.课堂小结通过收集现实问题中两个有关联变量的数据作出散点图并利用散点图直观认识变量间的相关关系.作业习题
2.3A组
3、
41.第2课时导入新课某小卖部为了了解热茶销售量与气温之间的关系随机统计并制作了某6天卖出热茶的杯数与当天气温的对照表气温/℃261813104-1杯数202434385064如果某天的气温是-5℃你能根据这些数据预测这天小卖部卖出热茶的杯数吗?为解决这个问题我们接着学习两个变量的线性相关——回归直线及其方程.推进新课新知探究提出问题
(1)作散点图的步骤和方法?
(2)正、负相关的概念?
(3)什么是线性相关?
(4)看人体的脂肪百分比和年龄的散点图当人的年龄增加时体内脂肪含量到底是以什么方式增加的呢?
(5)什么叫做回归直线?
(6)如何求回归直线的方程?什么是最小二乘法?它有什么样的思想?
(7)利用计算机如何求回归直线的方程?
(8)利用计算器如何求回归直线的方程?活动学生回顾再思考或讨论教师及时提示指导.讨论结果
(1)建立相应的平面直角坐标系将各数据在平面直角坐标中的对应点画出来得到表示两个变量的一组数据的图形这样的图形叫做散点图.(a.如果所有的样本点都落在某一函数曲线上就用该函数来描述变量之间的关系即变量之间具有函数关系.b.如果所有的样本点都落在某一函数曲线附近变量之间就有相关关系.c.如果所有的样本点都落在某一直线附近变量之间就有线性相关关系)
(2)如果散点图中的点散布在从左下角到右上角的区域内称为正相关.如果散点图中的点散布在从左上角到右下角的区域内称为负相关.
(3)如果所有的样本点都落在某一直线附近变量之间就有线性相关的关系.
(4)大体上来看随着年龄的增加人体中脂肪的百分比也在增加呈正相关的趋势我们可以从散点图上来进一步分析.
(5)如下图从散点图上可以看出这些点大致分布在通过散点图中心的一条直线附近.如果散点图中点的分布从整体上看大致在一条直线附近我们就称这两个变量之间具有线性相关关系这条直线叫做回归直线regressionline.如果能够求出这条回归直线的方程简称回归方程那么我们就可以比较清楚地了解年龄与体内脂肪含量的相关性.就像平均数可以作为一个变量的数据的代表一样这条直线可以作为两个变量具有线性相关关系的代表.
(6)从散点图上可以发现人体的脂肪百分比和年龄的散点图大致分布在通过散点图中心的一条直线.那么我们应当如何具体求出这个回归方程呢有的同学可能会想我可以采用测量的方法先画出一条直线测量出各点与它的距离然后移动直线到达一个使距离的和最小的位置测量出此时的斜率和截距就可得到回归方程了.但是这样做可靠吗有的同学可能还会想在图中选择这样的两点画直线使得直线两侧的点的个数基本相同.同样地这样做能保证各点与此直线在整体上是最接近的吗还有的同学会想在散点图中多取几组点确定出几条直线的方程再分别求出各条直线的斜率、截距的平均数将这两个平均数当成回归方程的斜率和截距.同学们不妨去实践一下看看这些方法是不是真的可行(学生讨论
1.选择能反映直线变化的两个点.
2.在图中放上一根细绳使得上面和下面点的个数相同或基本相同.
3.多取几组点对确定几条直线方程.再分别算出各个直线方程斜率、截距的算术平均值作为所求直线的斜率、截距.)教师分别分析各方法的可靠性.如下图上面这些方法虽然有一定的道理但总让人感到可靠性不强.实际上求回归方程的关键是如何用数学的方法来刻画“从整体上看各点与此直线的距离最小”.人们经过长期的实践与研究已经得出了计算回归方程的斜率与截距的一般公式其中,b是回归方程的斜率,a是截距.推导公式
①的计算比较复杂,这里不作推导.但是我们可以解释一下得出它的原理.假设我们已经得到两个具有线性相关关系的变量的一组数据x1y1x2y2…xnyn,且所求回归方程是=bx+a其中a、b是待定参数.当变量x取xii=12…n时可以得到=bxi+ai=12…n它与实际收集到的yi之间的偏差是yi-=yi-bxi+ai=12…n.这样,用这n个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的.由于(yi-)可正可负,为了避免相互抵消,可以考虑用来代替,但由于它含有绝对值,运算不太方便,所以改用Q=y1-bx1-a2+y2-bx2-a2+…+yn-bxn-a2
②来刻画n个点与回归直线在整体上的偏差.这样,问题就归结为:当ab取什么值时Q最小,即总体偏差最小.经过数学上求最小值的运算,ab的值由公式
①给出.通过求
②式的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫做最小二乘法(methodofleastsquare).
(7)利用计算机求回归直线的方程.根据最小二乘法的思想和公式
①,利用计算器或计算机,可以方便地求出回归方程.以Excel软件为例用散点图来建立表示人体的脂肪含量与年龄的相关关系的线性回归方程具体步骤如下
①在Excel中选定表示人体的脂肪含量与年龄的相关关系的散点图(如下图)在菜单中选定“图表”中的“添加趋势线”选项弹出“添加趋势线”对话框.
②单击“类型”标签选定“趋势预测/回归分析类型”中的“线性”选项单击“确定”按钮得到回归直线.
③双击回归直线弹出“趋势线格式”对话框.单击“选项”标签选定“显示公式”最后单击“确定”按钮得到回归直线的回归方程=
0.577x-
0.
448.
(8)利用计算器求回归直线的方程.用计算器求这个回归方程的过程如下所以回归方程为=
0.577x-
0.
448.正像本节开头所说的,我们从人体脂肪含量与年龄这两个变量的一组随机样本数据中,找到了它们之间关系的一个规律,这个规律是由回归直线来反映的.直线回归方程的应用:
①描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系.
②利用回归方程进行预测;把预报因子(即自变量x)代入回归方程对预报量(即因变量Y)进行估计即可得到个体Y值的容许区间.
③利用回归方程进行统计控制规定Y值的变化通过控制x的范围来实现统计控制的目标.如已经得到了空气中NO2的浓度和汽车流量间的回归方程即可通过控制汽车流量来控制空气中NO2的浓度.应用示例例1有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表摄氏温度/℃-504712151923273136热饮杯数15615013212813011610489937654
(1)画出散点图;
(2)从散点图中发现气温与热饮销售杯数之间关系的一般规律;
(3)求回归方程;
(4)如果某天的气温是2℃,预测这天卖出的热饮杯数.解
(1)散点图如下图所示
(2)从上图看到,各点散布在从左上角到右下角的区域里,因此,气温与热饮销售杯数之间呈负相关,即气温越高,卖出去的热饮杯数越少.
(3)从散点图可以看出,这些点大致分布在一条直线的附近,因此,可用公式
①求出回归方程的系数.利用计算器容易求得回归方程=-
2.352x+
147.
767.4当x=2时,=
143.
063.因此,某天的气温为2℃时,这天大约可以卖出143杯热饮.思考气温为2℃时,小卖部一定能够卖出143杯左右热饮吗?为什么?这里的答案是小卖部不一定能够卖出143杯左右热饮,原因如下
1.线性回归方程中的截距和斜率都是通过样本估计出来的,存在随机误差,这种误差可以导致预测结果的偏差.
2.即使截距和斜率的估计没有误差,也不可能百分之百地保证对应于x的预报值,能够与实际值y很接近.我们不能保证点(xy)落在回归直线上,甚至不能百分之百地保证它落在回归直线的附近,事实上,y=bx+a+e=+e.这里e是随机变量,预报值与实际值y的接近程度由随机变量e的标准差所决定.一些学生可能会提出问题既然不一定能够卖出143杯左右热饮,那么为什么我们还以“这天大约可以卖出143杯热饮”作为结论呢?这是因为这个结论出现的可能性最大.具体地说,假如我们规定可以选择连续的3个非负整数作为可能的预测结果,则我们选择142,143和144能够保证预测成功(即实际卖出的杯数是这3个数之一)的概率最大.例2下表为某地近几年机动车辆数与交通事故数的统计资料.机动车辆数x/千台95110112120129135150180交通事故数y/千件
6.
27.
57.
78.
58.
79.
810.2131请判断机动车辆数与交通事故数之间是否有线性相关关系如果不具有线性相关关系说明理由;2如果具有线性相关关系求出线性回归方程.解
(1)在直角坐标系中画出数据的散点图如下图.直观判断散点在一条直线附近故具有线性相关关系.2计算相应的数据之和=1031,=
71.6=137835,=
9611.
7.将它们代入公式计算得b≈
0.0774a=-
1.0241所以所求线性回归方程为=
0.0774x-
1.
0241.知能训练
1.下列两个变量之间的关系哪个不是函数关系()A.角度和它的余弦值B.正方形边长和面积C.正n边形的边数和它的内角和D.人的年龄和身高答案D2.三点3107201124的线性回归方程是()A.=
5.75-
1.75xB.=
1.75+
5.75xC.=
1.75-
5.75xD.=
5.75+
1.75x答案D3.已知关于某设备的使用年限x与所支出的维修费用y(万元)有如下统计资料使用年限x23456维修费用y2.23.85.56.57.0设y对x呈线性相关关系.试求
(1)线性回归方程=bx+a的回归系数ab;
(2)估计使用年限为10年时维修费用是多少?答案
(1)b=
1.23a=
0.08;
(2)
12.
38.4.我们考虑两个表示变量x与y之间的关系的模型δ为误差项模型如下模型1y=6+4x;模型2y=6+4x+e.
(1)如果x=3e=1分别求两个模型中y的值;
(2)分别说明以上两个模型是确定性模型还是随机模型.解
(1)模型1y=6+4x=6+4×3=18;模型2y=6+4x+e=6+4×3+1=
19.
(2)模型1中相同的x值一定得到相同的y值所以是确定性模型;模型2中相同的x值因δ的不同所得y值不一定相同且δ为误差项是随机的所以模型2是随机性模型.5.以下是收集到的新房屋销售价格y与房屋大小x的数据房屋大小x(m2)80105110115135销售价格y(万元)
18.
42221.
624.
829.2
(1)画出数据的散点图;
(2)用最小二乘法估计求线性回归方程.解
(1)散点图如下图.
(2)n=5=545=109=116=
23.2=60952=12952b=≈
0.199a=
23.2-
0.199×109≈
1.509所以线性回归方程为y=
0.199x+
1.509.拓展提升某调查者从调查中获知某公司近年来科研费用支出(Xi)与公司所获得利润(Yi)的统计资料如下表科研费用支出(Xi)与利润(Yi)统计表单位万元年份科研费用支出利润1998199920002001200220035114532314030342520合计30180要求估计利润(Yi)对科研费用支出(Xi)的线性回归模型.解设线性回归模型直线方程为因为=5=30根据资料列表计算如下表年份XiYiXiYiXi2Xi-Yi-Xi-2Xi-Yi-199819992000200120022003511453231403034252015544012017075402512116259406-10-2-311004-5-100361049060001030合计3018010002000050100现求解参数β
0、β1的估计值方法一=2=30-2×5=
20.方法二=2,=30-2×5=
20.方法三=2,=30-2×5=
20.所以利润(Yi)对科研费用支出(Xi)的线性回归模型直线方程为=20+2Xi.课堂小结1.求线性回归方程的步骤
(1)计算平均数;2计算xi与yi的积,求∑xiyi;3计算∑xi2∑yi2,4将上述有关结果代入公式求ba写出回归直线方程.
2.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想能根据给出的线性回归方程系数公式建立线性回归方程.作业习题
2.3A组
3、4B组
1、
2.板书设计教学反思本节课学习了变量之间的相关关系和两个变量的线性相关的部分内容通过身边的具体实例说明了两个变量的相关关系并学会了利用散点图及其分布来说明两个变量的相关关系的种类在此基础上利用实例分析了散点图的分布规律推导出了线性回归直线的方程的求法并利用回归直线的方程估计可能的结果本节课讲得较为详细实例较多便于同学们分析比较.另外本节课通过选取一些学生特别关心的身边事例对学生进行思想情操教育、意志教育和增强学生的自信心养成良好的学习态度和学习方法树立时间观培养勤奋、刻苦耐劳的精神.。