还剩17页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
第2讲 统计案例
1.2018·全国Ⅱ卷理18如图是某地区2000年至2016年环境基础设施投资额y单位:亿元的折线图.为了预测该地区2018年的环境基础设施投资额建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据时间变量t的值依次为12…17建立模型
①:=-
30.4+
13.5t;根据2010年至2016年的数据时间变量t的值依次为12…7建立模型
②:=99+
17.5t.1分别利用这两个模型求该地区2018年的环境基础设施投资额的预测值;2你认为用哪个模型得到的预测值更可靠并说明理由.解:1利用模型
①可得该地区2018年的环境基础设施投资额的预测值为=-
30.4+
13.5×19=
226.1亿元.利用模型
②可得该地区2018年的环境基础设施投资额的预测值为=99+
17.5×9=
256.5亿元.2利用模型
②得到的预测值更可靠.理由如下:
①从折线图可以看出2000年至2016年的数据对应的点没有随机散布在直线y=-
30.4+
13.5t上下这说明利用2000年至2016年的数据建立的线性模型
①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加2010年至2016年的数据对应的点位于一条直线的附近这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势利用2010年至2016年的数据建立的线性模型=99+
17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势因此利用模型
②得到的预测值更可靠.
②从计算结果看相对于2016年的环境基础设施投资额220亿元由模型
①得到的预测值
226.1亿元的增幅明显偏低而利用模型
②得到的预测值的增幅比较合理说明利用模型
②得到的预测值更可靠.
2.2016·全国Ⅲ卷理18如图是我国2008年至2014年生活垃圾无害化处理量单位:亿吨的折线图.1由折线图看出可用线性回归模型拟合y与t的关系请用相关系数加以说明;2建立y关于t的回归方程系数精确到
0.01预测2016年我国生活垃圾无害化处理量.参考数据:yi=
9.32tiyi=
40.17=
0.55≈
2.
646.参考公式:相关系数r=回归方程=+t中斜率和截距的最小二乘估计公式分别为==-.解:1由已知条件知=4ti-2=28=
0.55ti-yi-=tiyi-yi=
40.17-4×
9.32=
2.89r≈≈
0.
99.因为y与t的相关系数近似为
0.99说明y与t的线性相关程度相当大从而可以用线性回归模型拟合y与t的关系.2由=≈
1.331及1得==≈
0.
103.=-≈
1.331-
0.103×4≈
0.
92.所以y关于t的回归方程为=
0.92+
0.10t.将2016年对应的t=9代入回归方程得=
0.92+
0.10×9=
1.
82.所以预测2016年我国生活垃圾无害化处理量约为
1.82亿吨.
3.2017·全国Ⅰ卷理19为了监控某种零件的一条生产线的生产过程检验员每天从该生产线上随机抽取16个零件并测量其尺寸单位:cm.根据长期生产经验可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布Nμσ
2.1假设生产状态正常记X表示一天内抽取的16个零件中其尺寸在μ-3σμ+3σ之外的零件数求PX≥1及X的数学期望;2一天内抽检零件中如果出现了尺寸在μ-3σμ+3σ之外的零件就认为这条生产线在这一天的生产过程可能出现了异常情况需对当天的生产过程进行检查.
①试说明上述监控生产过程方法的合理性;
②下面是检验员在一天内抽取的16个零件的尺寸:
9.
9510.
129.
969.
9610.
019.
929.
9810.
0410.
269.
9110.
1310.
029.
2210.
0410.
059.95经计算得=xi=
9.97s==≈
0.212其中xi为抽取的第i个零件的尺寸i=12…
16.用样本平均数作为μ的估计值用样本标准差s作为σ的估计值利用估计值判断是否需对当天的生产过程进行检查剔除-3+3之外的数据用剩下的数据估计μ和σ精确到
0.
01.附:若随机变量Z服从正态分布Nμσ2则Pμ-3σZμ+3σ=
0.
99740.997416≈
0.9592≈
0.
09.解:1抽取的一个零件的尺寸在μ-3σμ+3σ之内的概率为
0.9974从而零件的尺寸在μ-3σμ+3σ之外的概率为
0.0026故X~B
160.
0026.因此PX≥1=1-PX=0=1-
0.997416≈
0.
0408.X的数学期望为EX=16×
0.0026=
0.
0416.2
①如果生产状态正常一个零件尺寸在μ-3σμ+3σ之外的概率只有
0.0026一天内抽取的16个零件中出现尺寸在μ-3σμ+3σ之外的零件的概率只有
0.0408发生的概率很小因此一旦发生这种情况就有理由认为这条生产线在这一天的生产过程可能出现了异常情况需对当天的生产过程进行检查可见上述监控生产过程的方法是合理的.
②由=
9.97s≈
0.212得μ的估计值为=
9.97σ的估计值为=
0.212由样本数据可以看出有一个零件的尺寸在-3+3之外因此需对当天的生产过程进行检查剔除-3+3之外的数据
9.22剩下数据的平均数为16×
9.97-
9.22=
10.02因此μ的估计值为
10.
02.=16×
0.2122+16×
9.972≈
1591.
134.剔除-3+3之外的数据
9.22剩下数据的样本方差为
1591.134-
9.222-15×
10.022≈
0.008因此σ的估计值为≈
0.
09.
1.考查角度常以贴近考生、贴近生活的实际问题为背景以统计图、表为依据考查独立性检验、线性回归方程并由回归方程估计预测有时还需将非线性回归模型转化为线性回归模型解决.
2.题型及难易度解答题难度中低档.对应学生用书第57~60页 线性回归分析考向1 线性回归方程【例1】2018·湖南省湘东五校联考某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系他们分别到气象局与某医院抄录了1月份至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数得到如下数据:日期1月10日2月10日3月10日4月10日5月10日6月10日昼夜温差x/℃1011131286就诊人数y/个222529261612该兴趣小组确定的研究方案是:先从这6组数据中选取2组用剩下的4组数据求线性回归方程再用被选取的2组数据进行检验.1求选取的2组数据恰好是相邻两个月的概率;2若选取的是1月份与6月份的两组数据请根据2月份至5月份的数据求出y关于x的线性回归方程=x+;3若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2则认为得到的线性回归方程是理想的试问该小组所得线性回归方程是否理想参考公式:==-.参考数据:11×25+13×29+12×26+8×16=1092112+132+122+82=
498.解:1设选到相邻两个月的数据为事件A.因为从6组数据中选取2组数据共有15种情况且每种情况都是等可能的其中选到相邻两个月的数据的情况有5种所以PA==.2由表中2月份至5月份的数据可得=11=24xiyi=1092=498所以==则=-=-所以y关于x的线性回归方程为=x-.3当x=10时=-222;当x=6时=-
122.所以该小组所得线性回归方程是理想的.考向2 相关系数【例2】2018·广州市调研某基地蔬菜大棚采用无土栽培方式种植各类蔬菜.过去50周的资料显示该基地周光照量X单位:小时都在30小时以上其中不足50小时的有5周不低于50小时且不超过70小时的有35周超过70小时的有10周.根据统计该基地的西红柿增加量y单位:千克与使用某种液体肥料的质量x单位:千克之间的对应数据如图所示.1依据图中数据计算相关系数r精确到
0.01并据此判断是否可用线性回归模型拟合y与x的关系.若|r|
0.75则线性相关程度很高可用线性回归模型拟合2蔬菜大棚对光照要求较高某光照控制仪商家为该基地提供了部分光照控制仪但每周光照控制仪运行台数受周光照量X限制并有如下关系:周光照量X/小时30X5050≤X≤70X70光照控制仪运行台数321对商家来说若某台光照控制仪运行则该台光照控制仪产生的周利润为3000元;若某台光照控制仪未运行则该台光照控制仪周亏损1000元.若商家安装了3台光照控制仪求商家在过去50周的周总利润的平均值.相关系数公式:r=参考数据:≈
0.55≈
0.
95.解:1由已知数据可得==5==
4.因为xi-yi-=-3×-1+0+0+0+3×1=6==2==所以相关系数r===≈
0.
95.因为|r|
0.75所以可用线性回归模型拟合y与x的关系.2由条件可得在过去50周里当X70时共有10周此时只有1台光照控制仪运行每周的周总利润为1×3000-2×1000=1000元.当50≤X≤70时共有35周此时有2台光照控制仪运行每周的周总利润为2×3000-1×1000=5000元.当30X50时共有5周此时3台光照控制仪都运行每周的周总利润为3×3000=9000元.所以过去50周的周总利润的平均值为=4600元所以商家在过去50周的周总利润的平均值为4600元.1求线性回归方程的步骤
①计算;
②计算xiyi;
③计算===-[回归直线必过样本点的中心].
④写出回归方程=x+.2利用回归直线方程进行预测估计时代入相应的数值后求得的结果是估计值并非准确值.3相关系数r=当r0时表明两个变量正相关;当r0时表明两个变量负相关.r的绝对值越接近于1表明两个变量的线性相关性越强r的绝对值越接近于0表明两个变量之间几乎不存在线性相关关系通常|r|大于
0.75时认为两个变量有很强的线性相关性.热点训练1:2018·聊城一模为促进农业发展加快农村建设某地政府扶持兴建了一批“超级蔬菜大棚”.为了解大棚的面积与年利润之间的关系随机抽取了其中的7个大棚并对当年的利润进行统计整理后得到了如下数据对比表:大棚面积亩x
4.
55.
05.
56.
06.
57.
07.5年利润万元y
677.
48.
18.
99.
611.1由所给数据的散点图可以看出各样本点都分布在一条直线附近并且y与x有很强的线性相关关系.1求y关于x的线性回归方程;2小明家的“超级蔬菜大棚”面积为
8.0亩估计小明家的大棚当年的利润为多少;3另外调查了近5年的不同蔬菜亩平均利润单位:万元其中无丝豆为
1.
51.
72.
12.
22.5;彩椒为
1.
81.
91.
92.
22.2请分析种植哪种蔬菜比较好参考数据:xiyi=
359.6xi-2=7参考公式:==-.解:1根据题意=6=
8.3则7=
348.6===≈
1.571=-≈
8.3-
1.571×6=-
1.126那么回归方程为=
1.571x-
1.
126.2将x=
8.0代入方程得=
1.571×
8.0-
1.126=
11.442即小明家的“超级大棚”当年的利润大约为
11.442万元.3近5年来无丝豆亩平均利润的平均数为m==2方差=[
1.5-22+
1.7-22+
2.1-22+
2.2-22+
2.5-22]=
0.128彩椒亩平均利润的平均数为n==2方差为=[
1.8-22+
1.9-22+
1.9-22+
2.2-22+
2.2-22]=
0.028因为m=n所以种植彩椒比较好.独立性检验【例3】2018·江西九校联考进入高三同学们的学习越来越紧张学生休息和锻炼的时间也减少了.学校为了提高学生的学习效率鼓励学生加强体育锻炼.某中学高三3班有学生50人.现调查该班学生每周平均体育锻炼时间的情况得到如下频率分布直方图.其中数据的分组区间为:
[02]24]46]68]810]1012].1求学生周平均体育锻炼时间的中位数保留3位有效数字;2从每周平均体育锻炼时间在
[04]的学生中随机抽取2人进行调查求此2人的每周平均体育锻炼时间都超过2小时的概率;3现全班学生中有40%是女生其中3个女生的每周平均体育锻炼时间不超过4小时.若每周平均体育锻炼时间超过4小时称为经常锻炼问:有没有90%的把握说明是否经常锻炼与性别有关附:K2=PK2≥k
00.
1000.
0500.
0100.001k
02.
7063.
8416.
63510.828解:1设中位数为a因为前三组的频率和为
0.02+
0.03+
0.11×2=
0.
320.5第四组的频率为
0.14×2=
0.28所以a-6×
0.14=
0.5-
0.32所以a=≈
7.
29.所以学生周平均体育锻炼时间的中位数是
7.
29.2由已知锻炼时间在
[02]和24]中的人数分别是50×
0.02×2=2人50×
0.03×2=3人分别记在
[02]的2人为a1a224]的3人为b1b2b3则随机抽取2人调查的所有基本事件列举为a1a2a1b1a1b2a1b3a2b1a2b2a2b3b1b2b1b3b2b3共10个基本事件其中体育锻炼时间都超过2小时包含3个基本事件所以p=.3由已知可知不超过4小时的人数为50×
0.05×2=5人其中女生有3人所以男生有2人因此经常锻炼的女生有50×40%-3=17人男生有30-2=28人所以2×2列联表为男生女生小计经常锻炼281745不经常锻炼235小计302050所以K2==
2.
706.所以没有90%的把握说明是否经常锻炼与性别有关.解独立性检验问题的步骤:1根据样本数据列2×2列联表;2根据公式K2=计算K2的值.3比较K2与临界值的大小关系作出判断.热点训练2:2018·梅州二模某学校共有1500名学生为调查该校学生每周使用手机上网时间的情况采用分层抽样的方法收集100名学生每周上网时间的样本数据单位:小时.根据这100个样本数据得到学生每周上网时间的频率分布直方图如图所示其中样本数据的分组区间为
[02]24]46]68]810]1012].1估计该校学生每周平均使用手机上网时间每组数据以组中值为代表;2估计该校学生每周使用手机上网时间超过4个小时的概率;3将每周使用手机上网时间在412]内的定义为“长时间使用手机上网”;每周使用手机上网时间在04]内的定义为“不长时间使用手机上网”.在样本数据中有25名学生不近视.请完成每周使用手机上网的时间与近视程度的2×2列联表并判断是否有95%的把握认为“该校学生的每周使用手机上网时间与近视程度有关”.近视不近视合计长时间使用手机不长时间使用手机15合计25附:K2=.PK2≥k
00.
10.
050.
0100.005k
02.
7063.
8416.
6357.879解:1根据频率分布直方图计算=1×
0.025×2+3×
0.100×2+5×
0.150×2+7×
0.125×2+9×
0.075×2+11×
0.025×2=
5.8;估计该校学生每周平均使用手机上网时间为
5.8小时.2由频率分布直方图得1-2×
0.100+
0.025=
0.75估计该校学生每周使用手机上网时间超过4个小时的概率为
0.
75.3根据题意填写2×2列联表如下:近视不近视合计长时间使用手机651075不长时间使用手机101525合计7525100由表中数据计算K2==≈
21.
783.
841.所以有95%的把握认为“该校学生的每周使用手机上网时间与近视程度有关”.可线性化的非线性回归分析【例4】某品牌汽车旗下的4S店以“四位一体”整车销售、零配件销售、售后服务、信息反馈为核心的模式经营4S店为了了解该品牌的ABC三种车型的质量问题从出售时间5年以上的该三种车型的汽车中各随机抽取100辆进行跟踪调查发现各车型在一年内需要维修的车辆如表1所示.1该4S店从所有的跟踪服务的ABC三种车型的汽车中用分层抽样的方法抽取10个样本做进一步调查求分别抽取的ABC三种车型的汽车辆数;2该品牌汽车研发中心针对ABC三种车型在维修中反映的主要问题研发了一种辅助产品4S店需要对研发中心研发的辅助产品进行合理定价该产品在试营时的数据如散点图和表2所示.根据散点图判断y与x和z与x哪一对具有的线性相关性较强给出判断即可不必说明理由并根据你的判断结果及数据求y关于x的回归方程方程中的系数均保留两位小数.表1车型ABC维修频数204040表2定价x/百元/件102030405060年销量y/件115064342426216586z=2lny
14.
112.
912.
111.
110.
28.9参考数据:xi-yi-=-34580xi-zi-=-
175.5yi-2=776840yi-zi-=
3465.
2.参考公式:对于一组数据x1y1x2y2x3y3…xnyn其回归方程=x+的斜率和截距的最小二乘估计分别为===-.解:1抽取的A车型的汽车辆数为×10=2抽取的B车型的汽车辆数为×10=4抽取的C车型的汽车辆数为×10=4故抽取的ABC三种车型的汽车辆数分别为
244.2由散点图可知z与x具有的线性相关性较强.由题设知==35==
11.55==-≈-
0.10所以=-≈
15.05所以=x+=
15.05-
0.10x.又z=2lny所以y关于x的回归方程为=.解非线性回归分析问题首先观察散点图挑出与散点图拟合得最好的函数然后采用适当的变量置换把问题转化为线性回归分析问题.热点训练3:2018广州综合测试某地1~10岁男童年龄xi单位:岁与身高的中位数yi单位:cmi=12…10如表:x/岁12345y/cm
76.
588.
596.
8104.
1111.3x/岁678910y/cm
117.
7124.
0130.
0135.
4140.2对上表的数据作初步处理得到下面的散点图及一些统计量的值.xi-2yi-2xi-yi-
5.
5112.
4582.
503947.
71566.851求y关于x的线性回归方程回归方程系数精确到
0.01;2某同学认为y=px2+qx+r更适宜作为y关于x的回归方程模型他求得的回归方程是=-
0.30x2+
10.17x+
68.
07.经调查该地11岁男童身高的中位数为
145.3cm.与1中的线性回归方程比较哪个回归方程的拟合效果更好附:回归方程=+x中的斜率和截距的最小二乘估计分别为==-.解:1==≈
6.87=-=
112.45-
6.87×
5.5≈
74.67所以y关于x的线性回归方程为=
6.87x+
74.672若回归方程为=
6.87x+
74.67则当x=11时=
150.
24.若回归方程为=-
0.30x2+
10.17x+
68.07则当x=11时=
143.
64.|
143.64-
145.3|=
1.66|
150.24-
145.3|=
4.94所以回归方程=-
0.30x2+
10.17x+
68.07的拟合效果更好. 【例1】2018·山西八校联考某网店与某生产企业联合研发了一种新产品该产品在该网店试销一个阶段后得到销售单价x单位:元和销售量y单位:万件之间的一组数据如表所示:销售单价x/元
99.
51010.511销售量y/万件11108651根据表中数据建立y关于x的回归方程;2从反馈的信息看消费者对该产品的心理价单位:元/件在
[79]内已知该产品的成本是a元/件a2那么在消费者对该产品的心理价的范围内销售单价定为多少时网店才能获得最大利润注:利润=销售收入-成本参考数据:xiyi=392=
502.
5.参考公式:回归方程=x+其中==-.解:1因为=×9+
9.5+10+
10.5+11=10=×11+10+8+6+5=8所以==-
3.2则=8--
3.2×10=
40.所以y关于x的回归方程为=-
3.2x+
40.2由已知得利润L=x-a-
3.2x+40=-
3.2x2+40+
3.2ax-40ax∈
[79]该二次函数图象的对称轴方程为x==.因为a2所以.当9即a时函数在区间
[79]上单调递增所以当x=9时L取得最大值;当≤9即2a≤时函数在7上单调递增在9上单调递减所以当x=时L取得最大值.综上当a时该产品的销售单价为9元时网店能获得最大利润;当2a≤时该产品的销售单价定为元时网店能获得最大利润.【例2】2018济南市模拟2018年2月22日上午山东省委、省政府在济南召开山东省全面展开新旧动能转换重大工程动员大会会议动员各方力量迅速全面展开新旧动能转换重大工程.某企业响应号召对现有设备进行改造为了分析设备改造前后的效果现从设备改造前后生产的大量产品中各抽取了200件产品作为样本检测一项质量指标值若该项质量指标值落在[2040内的产品视为合格品否则为不合格品.设备改造前的样本的频率分布直方图和设备改造后的样本的频率分布表如下所示.设备改造后样本的频率分布表质量指标值[1520[2025[2530频数43696质量指标值[3035[3540
[4045]频数283241完成下面的2×2列联表并判断是否有99%的把握认为该企业生产的这种产品的质量指标值与设备改造有关;设备改造前设备改造后合计合格品不合格品合计2根据上述数据试从产品合格率的角度对改造前后设备的优劣进行比较;3根据市场调查设备改造后每生产一件合格品企业可获利180元一件不合格品亏损100元用频率估计概率则生产1000件产品企业大约能获利多少元附:PK2≥k
00.
1500.
1000.
0500.
0250.010k
02.
0722.
7063.
8415.
0246.635K2=.解:1根据题中图和表得到2×2列联表:设备改造前设备改造后合计合格品172192364不合格品28836合计200200400将2×2列联表中的数据代入公式计算得K2=≈
12.
21.因为
12.
216.635所以有99%的把握认为该企业生产的这种产品的质量指标值与设备改造有关.2根据题中图和表可知设备改造后产品的合格率约为=设备改造前产品的合格率约为=即设备改造后产品的合格率更高因此设备改造后性能更好.3用频率估计概率1000件产品中大约有960件合格品40件不合格品则180×960-100×40=168800所以该企业大约获利168800元.【例3】2018·新余二模“一带一路”是“丝绸之路经济带”和“21世纪海上丝绸之路”的简称某市为了了解人们对“一带一路”的认知程度对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛满分100分90分及以上为认知程度高现从参赛者中抽取了x人按年龄分成5组第一组:[2025第二组:[2530第三组:[3035第四组:[3540第五组:
[4045]得到如图所示的频率分布直方图已知第一组有6人.1求x;2求抽取的x人的年龄的中位数结果保留整数;3从该市大学生、军人、医务人员、工人、个体户五种人中用分层抽样的方法依次抽取6人42人36人24人12人分别记1~5组从这5个按年龄分的组和5个按职业分的组中每组各选派1人参加知识竞赛代表相应的成绩年龄组中1~5组的成绩分别为9396979490职业组中1~5组的成绩分别为
9398949590.
①分别求5个年龄组和5个职业组成绩的平均数和方差;
②以上述数据为依据评价5个年龄组和5个职业组对“一带一路”的认知程度并谈谈你的感想.解:1根据频率分布直方图得第一组频率为
0.01×5=
0.05所以=
0.05所以x=
120.2设中位数为a则
0.01×5+
0.07×5+a-30×
0.06=
0.5解得a=≈32所以中位数为
32.3
①5个年龄组的平均数为=93+96+97+94+90=94方差为=[-12+22+32+02+-42]=65个职业组的平均数为=93+98+94+95+90=94方差为=[-12+42+02+12+-42]=
6.
8.
②评价:从平均数来看两组的认知程度相同从方差来看年龄组的认知程度更好.感想:“一带一路”是指“丝绸之路经济带”和“21世纪海上丝绸之路”的简称.它将充分依靠中国与有关国家既有的双多边机制借助既有的、行之有效的区域合作平台“一带一路”战略目标是要建立一个政治互信、经济融合、文化包容的利益共同体、命运共同体和责任共同体是包括欧亚大陆在内的世界各国构建一个互惠互利的利益、命运和责任共同体.对应学生用书第61页 【典例】2018·全国Ⅲ卷理1812分某工厂为提高生产效率开展技术创新活动提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率选取40名工人将他们随机分成两组每组20人.第一组工人用第一种生产方式第二组工人用第二种生产方式.根据工人完成生产任务的工作时间单位:min绘制了如下茎叶图1根据茎叶图判断哪种生产方式的效率更高并说明理由;2求40名工人完成生产任务所需时间的中位数m并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:超过m不超过m第一种生产方式第二种生产方式3根据2中的列联表能否有99%的把握认为两种生产方式的效率有差异附:K2=PK2≥k
0.
0500.
0100.001k
3.
8416.
63510.
828.评分细则:解:1第二种生产方式的效率更高.1分理由如下写出一种合理即可:
①由茎叶图可知用第一种生产方式的工人中有75%的工人完成生产任务所需时间至少80分钟用第二种生产方式的工人中有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.
②由茎叶图可知用第一种生产方式的工人完成生产任务所需时间的中位数为
85.5分钟用第二种生产方式的工人完成生产任务所需时间的中位数为
73.5分钟.因此第二种生产方式的效率更高.
③由茎叶图可知用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟因此第二种生产方式的效率更高.
④由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多关于茎7大致呈对称分布又用两种生产方式的工人完成生产任务所需时间分布的区间相同故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.4分由上给出了4种理由考生答出其中任意一种或其他合理理由均可得分.2由茎叶图知m==
80.6分2×2列联表如下:超过m不超过m第一种生产方式155第二种生产方式5158分3由于K2==
106.63511分所以有99%的把握认为两种生产方式的效率有差异.12分注:第1问得分说明:
①判断出效率更高的生产方式得1分;
②根据茎叶图中的数据分布分析出效率更高生产方式的任意一种合理理由均得3分.第2问得分说明:
①由茎叶图中的数据及中位数定义求出中位数得2分;
②列出2×2列联表得2分第3问得分说明:
①用独立性检验公式求出K2的值并与
6.635比较得3分;
②得出结论得1分.【答题启示】1统计中涉及的图形较多常见的有条形图、扇形图、折线图、茎叶图、频率分布直方图等要熟练掌握这些图的特点并能根据图直观进行一些判断或计算.本题常不能根据茎叶图的数据分布特点进行判断、计算而失分.2常因概念中位数不清而失分.3常因计算马虎而失分.。