还剩9页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
学案57 用样本估计总体导学目标
1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.
2.理解样本数据标准差的意义和作用,会计算数据标准差.
3.能从样本数据中提取基本的数字特征如平均数、标准差,并给出合理的解释.
4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.
5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.自主梳理1.在频率分布直方图中,纵轴表示__________________,数据落在各小组内的频率用________________表示,所有长方形面积之和________.2.作频率分布直方图的步骤1求极差即一组数据中________与________的差;2决定________与________;3将数据________;4列________________;5画________________.3.频率分布折线图和总体密度曲线1频率分布折线图连接频率分布直方图中各小长方形上端的________,就得频率分布折线图.2总体密度曲线随着__________的增加,作图时____________增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.4.当样本数据较少时,茎叶图表示数据的效果较好,一是统计图上没有原始数据丢失,二是方便记录与表示,但茎叶图一般只便于表示两位有效数字的数据.5.众数、中位数、平均数1在一组数据中,出现次数________的数据叫做这组数据的众数.2将一组数据按大小依次排列,把处在________位置的一个数据或中间两个数据的平均数叫做这组数据的中位数.3如果有n个数x1,x2,……,xn,那么=____________叫做这n个数的平均数.6.标准差和方差1标准差是样本数据到平均数的一种____________.2标准差s=________________________.3方差s2=________________________________xn是样本数据,n是样本容量,是样本平均数.自我检测1.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b是其中的一组,抽查出的个体在该组上的频率为m,该组在频率分布直方图的高为h,则|a-b|等于 A.hmB.C.D.h+m2.2010·福建若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是 A.
91.5和
91.5B.
91.5和92C.91和
91.5D.92和923.2011·滨州模拟在样本的频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形的面积和的,且样本容量为160,则中间一组的频数为 A.32B.
0.2C.40D.
0.254.2010·山东样本中共有五个个体,其值分别为a
0123.若该样本的平均值为1,则样本方差为 A.B.C.D.25.2010·江苏某棉纺厂为了解一批棉花的质量,从中随机抽测了100根棉花纤维的长度棉花纤维的长度是棉花质量的重要指标,所得数据均在区间
[540]中,其频率分布直方图如图所示,则在抽测的100根中,有______根棉花纤维的长度小于20mm.探究点一 频率分布直方图例1 2011·福州调研如图是某市有关部门根据该市干部的月收入情况,作抽样调查后画出的样本频率分布直方图,已知图中第一组的频数为4000,请根据该图提供的信息解答下列问题图中每组包括左端点,不包括右端点,如第一组表示收入在[100015001求样本中月收入在[25003500的人数;2为了分析干部的收入与年龄、职业等方面的关系,必须从样本的各组中按月收入再用分层抽样方法抽出100人作进一步分析,则月收入在[15002000的这段应抽多少人?3试估计样本数据的中位数.变式迁移1 为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道前4组频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在
4.6到
5.0之间的学生数为b,则a,b值分别为 A.
0.2778B.
0.2783C.
2.778D.
2.783探究点二 用样本数字特征估计总体数字特征例2 甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如表所示甲的成绩环数78910频数5555乙的成绩环数78910频数6446丙的成绩环数78910频数4664s
1、s
2、s3分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有 A.s3s1s2B.s2s1s3C.s1s2s3D.s2s3s1变式迁移2 甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表单位环甲108999乙1010799如果甲、乙两人中只有1人入选,则入选的最佳人选应是________.探究点三 用茎叶图分析数据例3 随机抽取某中学甲、乙两班各10名同学,测量他们的身高单位cm,获得身高数据的茎叶图如图.1根据茎叶图判断哪个班的平均身高较高;2计算甲班的样本方差;3现从乙班这10名同学中随机抽取两名身高不低于173cm的同学,求身高为176cm的同学被抽中的概率.变式迁移3 2011·汉沽模拟某班甲、乙两学生的高考备考成绩如下甲512 554 528 549 536 556 534 541 522 538乙515 558 521 543 532 559 536 548 527 5311用茎叶图表示两学生的成绩;2分别求两学生成绩的中位数和平均分.1.几种表示频率分布的方法的优点与不足1频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便.2频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式.但从直方图本身得不出原始的数据内容,也就是说,把数据表示成直方图后,原有的具体数据信息就被抹掉了.3频率分布折线图的优点是它反映了数据的变化趋势,如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体分布的密度曲线.4用茎叶图优点是原有信息不会抹掉,能够展示数据的分布情况,但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了.2.标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,标准差、方差越小,数据的离散程度越小,因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.满分75分
一、选择题每小题5分,共25分1.2010·陕西如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为A和B,样本标准差分别为sA和sB,则 A.AB,sAsBB.AB,sAsBC.AB,sAsBD.AB,sAsB2.2011·宁波期末10名工人某天生产同一种零件,生产的件数分别是15171410151717161412,设其平均数为a,中位数为b,众数为c,则有 A.abcB.bcaC.cabD.cba3.2011·金华十校模拟为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道后五组频数和为62,设视力在
4.6到
4.8之间的学生数为a,最大频率为
0.32,则a的值为 A.64B.54C.48D.274.下图是某学校举行的运动会上,七位评委为某体操项目打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为 A.
844.84B.
841.6C.
851.6D.8545.2011·四川有一个容量为66的样本,数据的分组及各组的频数如下[
11.
515.5 2 [
15.
519.5 4 [
19.
523.5 9[
23.
527.5 18 [
27.
531.5 11 [
31.
535.5 12[
35.
539.5 7 [
39.
543.5 3根据样本的频率分布估计,数据落在[
31.
543.5的概率约是 A.B.C.D.
二、填空题每小题4分,共12分6.2010·天津甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两人日加工零件的平均数分别为______和_________________________.7.2010·福建将容量为n的样本中的数据分成6组,绘制频率分布直方图,若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n等于________.8.2011·江苏某老师从星期一到星期五收到的信件数分别为106856,则该组数据的方差s2=________.
三、解答题共38分9.12分甲、乙两人参加某体育项目训练,近期的五次测试成绩得分情况如图所示.1分别求出两人得分的平均数与方差;2根据图和上面算得的结果,对两人的训练成绩作出评价.10.12分2010·湖北为了了解一个小水库中养殖的鱼的有关情况,从这个水库中多个不同位置捕捞出100条鱼,称得每条鱼的质量单位kg,并将所得数据分组,画出频率分布直方图如图所示.1在下面表格中填写相应的频率;分组频率2估计数据落在中的概率为多少;3将上面捕捞的100条鱼分别作一记号后再放回水库.几天后再从水库的多处不同位置捕捞出120条鱼,其中带有记号的鱼有6条.请根据这一情况来估计该水库中鱼的总条数.11.14分2010·安徽某市2010年4月1日-4月30日对空气污染指数的监测数据如下主要污染物为可吸入颗粒物61767056819192917581886710110395,
917786818382826479868575714945.1完成频率分布表.2作出频率分布直方图.3根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.学案57 用样本估计总体自主梳理1.频率与组距的比值 小长方形的面积 等于1
2.1最大值 最小值 2组距 组数 3分组 4频率分布表 5频率分布直方图
3.1中点 2样本容量 所分的组数
5.1最多 2中间 3
6.1平均距离23[x1-2+x2-2+…+xn-2]自我检测1.C
2.A
3.A
4.D5.30课堂活动区例1 解题导引 1解关于图形信息题的关键是正确理解各种统计图表中各个量的含义,灵活运用这些信息和数据去发现结论.2在频率分布直方图中,最高矩形的中点对应值是众数;而中位数的左右两边的直方图面积相等;平均数是直方图的“重心”.解 1∵月收入在[10001500的概率为
0.0008×500=
0.4,且有4000人,∴样本的容量n==10000;月收入在[15002000的频率为
0.0004×500=
0.2;月收入在[20002500的频率为
0.0003×500=
0.15;月收入在[35004000的频率为
0.0001×500=
0.
05.∴月收入在[25003500的频率为1-
0.4+
0.2+
0.15+
0.05=
0.
2.∴样本中月收入在[25003500的人数为0.2×10000=
2000.2∵月收入在[15002000的人数为
0.2×10000=2000,∴再从10000人中用分层抽样方法抽出100人,则月收入在[15002000的这段应抽取100×=20人.3由1知月收入在[10002000的频率为
0.4+
0.2=
0.
60.5,∴样本数据的中位数为1500+=1500+250=1750元.变式迁移1 A [由频率分布直方图知组距为
0.
1.4.3~
4.4间的频数为100×
0.1×
0.1=
1.4.4~
4.5间的频数为100×
0.1×
0.3=
3.又前4组的频数成等比数列,∴公比为
3.从而
4.6~
4.7间的频数最大,且为1×33=
27.∴a=
0.
27.根据后6组频数成等差数列,且共有100-13=87人.设公差为d,则6×27+d=
87.∴d=-5,从而b=4×27+×-5=
78.]例2 B [由已知可得甲、乙、丙的平均成绩均为
8.
5.方法一 ∵s=[x1-2+x2-2+…+xn-2],∴s1==.同理s2=,s3=,∴s2s1s
3.方法二 ∵s=x+x+…+x-2,∴s=5×72+5×82+5×92+5×102-
8.52=
73.5-
72.25=
1.25=,∴s1=.同理s2=,s3=,∴s2s1s
3.]变式迁移2 甲解析 甲=乙=9,s=[9-102+9-82+9-92+9-92+9-92]=,s=[9-102+9-102+9-72+9-92+9-92]=s,故甲更稳定,故选甲.例3 解题导引 茎叶图在样本数据较少,较为集中且位数不多时比较适用.由于它较好地保留了原始数据,所以可以帮助我们分析样本数据的大致频率分布,还可以用来分析样本数据的一些数字特征.但当样本数据较多时,茎叶图就显得不太方便了.因为数据较多时,枝叶就会很长,需要占据较多的空间.解 1由茎叶图可知甲班身高集中于160~179之间,而乙班身高集中于170~180之间.因此乙班平均身高高于甲班.2==170,甲班的样本方差为[158-1702+162-1702+163-1702+168-1702+168-1702+170-1702+171-1702+179-1702+179-1702+182-1702]=
57.
2.3设身高为176cm的同学被抽中的事件为A,从乙班10名同学中抽中两名身高不低于173cm的同学有181173,181176,181178,181179,179173,179176,179178,178173,178176,176173共10个基本事件,而事件A含有4个基本事件,∴PA==.变式迁移3 解 1两学生成绩的茎叶图如图所示.2将甲、乙两学生的成绩从小到大排列为甲512 522 528 534 536 538 541 549 554 556乙515 521 527 531 532 536 543 548 558 559从以上排列可知甲学生成绩的中位数为=
537.乙学生成绩的中位数为=
534.甲学生成绩的平均分为500+=537,乙学生成绩的平均分为500+=
537.课后练习区1.B [A中的数据都不大于B中的数据,所以AB,但A中的数据比B中的数据波动幅度大,所以sAsB.]2.D [平均数a=15+17+14+10+15+17+17+16+14+12=
14.
7.中位数b=15,众数c=
17.∴cba.]3.B [前两组中的频数为100×
0.05+
0.11=
16.∵后五组频数和为62,∴前三组为
38.∴第三组为
22.又最大频率为
0.32的最大频数为
0.32×100=32,∴a=22+32=
54.]4.C [去掉最高分93,最低分79,平均数为84+84+86+84+87=85,方差s2=[84-852+84-852+86-852+84-852+87-852]==
1.
6.]5.B [由条件可知,落在[
31.
543.5的数据有12+7+3=22个,故所求概率约为=.]6.24 23解析 甲=10×2+20×5+30×3+17+6+7=24,乙=10×3+20×4+30×3+17+11+2=
23.7.60解析 ∵第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,∴前三组频数为·n=27,故n=
60.8.
3.2解析 ==7,∴s2=[10-72+6-72+8-72+5-72+6-72]==
3.
2.9.解 1甲、乙两人五次测试的成绩分别为甲 10分 13分 12分 14分 16分乙 13分 14分 12分 12分 14分甲、乙两人的平均成绩甲=乙,都是13分,4分s=[10-132+13-132+12-132+14-132+16-132]=4,s=[13-132+14-132+12-132+12-132+14-132]=
0.
8.8分2由ss,可知乙的成绩较稳定.从折线图看,甲的成绩基本上呈上升状态,而乙的成绩在平均线上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.12分10.解 1根据频率分布直方图可知,频率=组距×频率/组距,故可得下表分组频率
0.
050.
200.
280.
300.
150.026分2因为
0.30+
0.15+
0.02=
0.47,所以数据落在[
1.
151.30中的概率约为
0.
47.9分3因为=2000,所以水库中鱼的总条数约为
2000.12分11.解 1频率分布表分组频数频率[41512[51611[61714[71816[819110[911015[10111125分2频率分布直方图如图所示.10分3答对下述两条中的一条即可
①该市有一个月中空气污染指数有2天处于优的水平,占当月天数的;有26天处于良的水平,占当月天数的;处于优或良的天数为28,占当月天数的.说明该市空气质量基本良好.
②轻微污染有2天,占当月天数的;污染指数在80以上的接近轻微污染的天数15,加上处于轻微污染的天数2,占当月天数的,超过50%;说明该市空气质量有待进一步改善.14分。