还剩14页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
全国通用版2019版高考数学大一轮复习第十章算法初步统计统计案例第55讲用样本估计总体优选学案考纲要求考情分析命题趋势
1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征如平均数、标准差,并做出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.xx·全国卷Ⅰ,12xx·山东卷,8xx·北京卷,17xx·四川卷,16xx·江苏卷,4 根据样本数据求基本的数字特征,利用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题.分值5~12分1.频率分布直方图和茎叶图1作频率分布直方图的步骤
①求极差即一组数据中__最大值__与__最小值__的差;
②决定__组距__与__组数__;
③将数据__分组__;
④列__频率分布表__;
⑤画__频率分布直方图__.2频率分布折线图和总体密度曲线
①频率分布折线图连接频率分布直方图中各小长方形上端的__中点__,就得到频率分布折线图.
②总体密度曲线随着样本容量的增加,作图时__所分的组数__增加,__组距__减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.3茎叶图的优点茎叶图的优点是可以__保留__原始数据,而且可以__随时__记录,这对数据的记录和表示都能带来方便.2.样本的数字特征1众数、中位数、平均数数字特征定义与求法优点与缺点众数一组数据中重复出现次数__最多__的数众数通常用于描述变量的值出现次数最多的数,但显然它对其他数据信息的忽视使得无法客观地反映总体特征中位数把一组数据按__从小到大的__顺序排列,处在__中间__位置的一个数据或两个数据的平均数中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点平均数如果有n个数据x1,x2,…,xn,那么这n个数的平均数=__ __平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低2标准差、方差
①标准差样本数据到平均数的一种平均距离,一般用s表示,s=__ __.
②方差标准差的平方s2=__ [x1-2+x2-2+…+xn-2] __,其中xii=123,…,n是__样本数据__,n是__样本容量__,是__样本平均数__.3平均数、方差公式的推广若数据x1,x2,…,xn的平均数为,方差为s2,则数据mx1+a,mx2+a,…,mxn+a的平均数为m+a,方差为m2s
2.1.思维辨析在括号内打“√”或“”.1在频率分布直方图中,小矩形的高表示频率. × 2茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次. × 3在频率分布直方图中,最高的小长方形底边中点的横坐标是众数. √ 4在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的. × 5一组数据的方差越大,说明这组数据的波动越大. √ 解析 1错误.在频率分布直方图中,小矩形的高为频率/组距.2错误.茎叶图中,相同的数据要重复记,故错误.3正确.由众数概念知结论正确.4错误.在频率分布直方图中,中位数左边和右边的小长方形面积和相等,故错误.5正确.由方差定义知结论正确.2.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是 A 8979316402A.
91.5和
91.5 B.
91.5和92C.91和
91.5 D.92和92解析 将这组数据从小到大排列,得
8789909192939496.故中位数为=
91.5,平均数为==
91.
5.3.如图是100位居民月均用水量的频率分布直方图,则月均用水量为[
22.5范围内的居民数有__25__人.解析 由图可知,在[
22.5范围内的居民人数有100×
0.5×
2.5-2=
25.4.一个容量为200的样本的频率分布直方图如图所示,则样本数据落在[59内的频率和频数分别为__
0.240__.解析 由图可知,落在[59内的频率为
0.05×9-5=
0.2,频数为200×
0.2=
40.5.某赛季甲、乙两名篮球运动员每场比赛得分记录用茎叶图表示,从茎叶图的分布情况看,__乙__运动员的发挥更稳定.甲乙806431258632459833116679449150解析 由茎叶图可知,乙运动员的得分大部分集中在30~40之间,而甲运动员的得分相对比较分散且在低分区的较多,故乙比赛得分更稳定.一 频率分布直方图及其应用1已知频率分布直方图中的部分数据,求其他数据.可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可求出其他数据.2已知频率分布直方图,求某种范围内的数据,可利用图形及已知范围结合求解.【例1】xx·河北衡水一中测试某市为了制定合理的节电方案,对居民用电情况进行了调查,通过抽样,获得了某年200户居民每户的月均用电量单位百千瓦·时,将数据按[01,[12,[23,[34,[45,[56,[67,[78,
[89]分成9组,制成了如图所示的频率分布直方图.1求直方图中m的值;2设该市有100万户居民,估计全市每户居民中月均用电量不低于6百千瓦·时的户数及每户居民月均用电量的中位数;3政府计划对月均用电量在4百千瓦·时以下的用户进行奖励,月均用电量在[01内的用户奖励20元/月,月均用电量在[12内的用户奖励10元/月,月均用电量在[24内的用户奖励2元/月.若该市共有400万户居民,试估计政府执行此计划的年度预算.解析 1由题得1-1×
0.04+
0.08+
0.21+
0.25+
0.06+
0.04+
0.02=2m,所以m=
0.
15.2200户居民中月均用电量不低于6百千瓦·时的频率为
0.06+
0.04+
0.02=
0.12100万户居民中月均用电量不低于6百千瓦·时的户数有1000000×
0.12=
120000.设中位数是x百千瓦·时,因为前5组的频率之和
0.04+
0.08+
0.15+
0.21+
0.25=
0.
730.5,而前4组的频率之和
0.04+
0.08+
0.15+
0.21=
0.
480.5,所以4x
5.由x-4=,解得x=
4.
08.3该市月均用电量在[01,[12,[24内的用户数分别为20000×820000×1620000×72,所以每月预算为20000×8×20+16×10+72×2=20000×464元,故估计政府执行此计划的年度预算为20000×464×12=11136万元.二 茎叶图及其应用由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失;第二点是茎叶图便于记录和表示;其缺点是当样本容量较大时,作图较繁琐.【例2】某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分评分越高表明市民的评价越高,绘制茎叶图如下. 甲部门乙部门35944044897512245667778997665332110601123468898877766555554443332100700113449665520081233456322209011456100001分别估计该市的市民对甲、乙两部门评分的中位数;2分别估计该市的市民对甲、乙两部门的评分高于90的概率;3根据茎叶图分析该市的市民对甲、乙两部门的评价.解析 1由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第2526位的是7575,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是
75.50位市民对乙部门的评分由小到大排序,排在第2526位的是6668,故样本中位数为=67,所以该市的市民对乙部门评分的中位数的估计值是
67.2由所给茎叶图知,50位市民对甲、乙部门的评分高于90的频率分别为=
0.1,=
0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为
0.
10.
16.3由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.三 样本的数字特征及其应用平均数和方差都是重要的数字特征,是对总体的一种简明的阐述.平均数、中位数、众数描述总体的集中趋势,方差和标准差描述波动大小.【例3】甲、乙两名战士在相同条件下各射靶10次,每次命中的环数分别是甲86786591047;乙
6778678795.1分别计算两组数据的平均数;2分别计算两组数据的方差;3根据计算结果,估计一下两名战士的射击水平谁更好一些.解析 1甲=8+6+7+8+6+5+9+10+4+7=7,乙=6+7+7+8+6+7+8+7+9+5=
7.2由方差公式s2=[x1-2+x2-2+…+xn-2]可求得s=
3.0,s=
1.
2.3由甲=乙,说明甲、乙两战士的平均水平相当.又∵s>s,说明甲战士射击情况波动大,因此乙战士比甲战士射击情况稳定.1.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩单位分.甲组乙组909x215y87424已知甲组数据的中位数为15,乙组数据的平均数为
16.8,则x,y的值分别为 C A.25 B.55 C.58 D.88解析 由茎叶图及已知得x=5,又乙组数据的平均数为
16.8,即=
16.8,解得y=
8.2.某电子商务公司对10000名网络购物者xx年度的消费情况进行统计,发现消费金额单位万元都在区间[
0.3,
0.9],其频率分布直方图如图所示.1直方图中的a=__3__;2在这些购物者中,消费金额在区间[
0.
50.9]内的购物者的人数为__6_000__.解析 由频率分布直方图及频率和等于1可得
0.2+
0.8+
1.5+2+
2.5+a×
0.1=1,解得a=
3.于是消费金额在区间[
0.
50.9]内的频率为3+2+
0.8+
0.2×
0.1=
0.6,所以消费金额在区间[
0.
50.9]内的购物者的人数为
0.6×10000=6000,故应填
36000.3.1为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据单位℃制成如图所示的茎叶图.考虑以下结论甲乙986289113012
①甲地该月14时的平均气温低于乙地该月14时的平均气温;
②甲地该月14时的平均气温高于乙地该月14时的平均气温;
③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;
④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的编号为 B A.
①③ B.
①④ C.
②③ D.
②④2由正整数组成的一组数据x1,x2,x3,x4,其平均数和中位数都是2,且标准差等于1,则这组数据为__1133__从小到大排列.解析 1由茎叶图中的数据通过计算求得甲=29,乙=30,s甲=,s乙=,∴甲<乙,s甲>s乙,故
①④正确.故选B.2不妨设x1≤x2≤x3≤x4,x1,x2,x3,x4∈N*,依题意得x1+x2+x3+x4=8,s==1,即x1-22+x2-22+x3-22+x4-22=4,所以x4≤3,结合x1+x2+x3+x4=8及中位数都是2,可得x1=x2=1,x3=x4=3,则这组数据为
1133.4.xx·北京卷某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组[2030,[3040,…,
[8090],并整理得到如下频率分布直方图.1从总体的400名学生中随机抽取一人,估计其分数小于70的概率;2已知样本中分数小于40的学生有5人,试估计总体中分数在区间[4050内的人数;3已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.解析 1根据频率分布直方图可知,样本中分数不小于70的频率为
0.02+
0.04×10=
0.6,所以样本中分数小于70的概率为1-
0.6=
0.
4.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为
0.
4.2根据题意,样本中分数不小于50的概率为
0.01+
0.02+
0.04+
0.02×10=
0.9,分数在区间[4050内的人数为100-100×
0.9-5=
5.所以总体中分数在区间[4050内的人数估计为400×=
20.3由题意可知,样本中分数不小于70的学生人数为
0.02+
0.04×10×100=60,所以样本中分数不小于70的男生人数为60×=
30.所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶
2.所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶
2.错因分析
①不会计算中位数;
②对平均数、中位数、众数等数字特征的实际意义理解不透.【例1】从高三年级中抽出50名学生参加竞赛,由成绩得到如下的频率分布直方图.利用频率分布直方图估计1这50名学生的众数P与中位数M;2这50名学生的平均成绩A;3这50名学生60分以上所占的百分比是多少?解析 1根据频率分布直方图,得这50名学生的众数是P==
75.∵
0.004+
0.006+
0.02+
0.03×10=
0.6,∴中位数应位于第四个小矩形中,设其底边为x,高为
0.03,则
0.03x=
0.2,∴x=,∴中位数M=.2这50名学生的平均成绩是45×
0.004+55×
0.006+65×
0.02+75×
0.03+85×
0.024+95×
0.016×10=
76.
2.3这50名学生中60分以上的百分比是1-
0.004+
0.006×10=
0.9=90%.【跟踪训练1】1xx·全国卷Ⅰ为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量单位kg分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是 B A.x1,x2,…,xn的平均数 B.x1,x2,…,xn的标准差C.x1,x2,…,xn的最大值 D.x1,x2,…,xn的中位数2xx·四川成都双流中学月考若样本平均数为,总体平均数为μ,则 D A.=μ B.与μ无关C.μ是的估计值 D.是μ的估计值3xx·福建三明一中期中已知一组数据m4253的平均数为n,且m,n是方程x2-4x+3=0的两根,则这组数据的方差为 B A. B.2 C. D.10解析 1标准差能反映一组数据的稳定程度.故选B.2样本平均数为,总体平均数为μ,在统计学中利用样本数据估计总体数据,所以样本平均数是总体平均数μ的估计值.故选D.3根据题意,可得×m+4+2+5+3=n,化简可得m=5n-14,
①因为m,n是方程x2-4x+3=0的两根,所以m+n=4,
②联立
①②解得所以s2=×[1-32+4-32+2-32+5-32+3-32]=
2.故选B.课时达标 第55讲[解密考纲]用样本估计总体在高考中三种题型均有可能考查,作为解答题时,题目较简单,属于不能失分的题目.
一、选择题1.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[2040,[4060,[6080,
[80100].若低于60分的人数是15,则该班的学生人数是 B A.45 B.50 C.55 D.60解析 根据频率分布直方图,低于60分的同学所占频率为
0.005+
0.01×20=
0.3,故该班的学生人数为=
50.故选B.2.xx·山东卷如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据单位件.若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为 A A.35 B.55 C.37 D.57解析 根据两组数据的中位数相等可得65=60+y,解得y=5,又因为它们的平均值相等,所以=,解得x=
3.故选A.3.如图是某工厂对一批新产品长度单位mm检测结果的频率分布直方图,估计这批产品的中位数为 C A.20 B.25 C.
22.5 D.
22.75解析 产品的中位数出现在概率是
0.5的地方.自左至右各小矩形面积依次为
0.
10.
20.
40.
150.15,设中位数是x,则由
0.1+
0.2+
0.08·x-20=
0.5,得x=
22.
5.故选C.4.10名工人某天生产同一零件,生产的件数是15171410151717161412,设其平均数为a,中位数为b,众数为c,则有 D A.abc B.bca C.cab D.cba解析 平均数a=×15+17+14+10+15+17+17+16+14+12=
14.7,中位数b=15,众数c=17,∴cba.5.如图是根据某班学生在一次数学考试中的成绩画出的频率分布直方图,若80分以上为优秀,根据图形信息可知,这次考试的优秀率为 B A.25% B.30% C.35% D.40%解析 80分以上的频率为
0.025+
0.005×10=
0.
3.6.下面左图是某学习小组学生数学考试成绩的茎叶图,1号到16号同学的成绩依次为A1,A2,…,A16,右图是统计茎叶图中成绩在一定范围内的学生人数的算法流程图,那么该算法流程图输出的结果是 B A.6 B.10 C.91 D.92解析 由算法流程图可知,其统计的是数学成绩大于等于90的人数,所以由茎叶图知,数学成绩大于等于90的人数为10,因此输出结果为
10.故选B.
二、填空题7.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长单位cm,所得数据均在区间
[80130]上,其频率分布直方图如图所示,则在60株树木中底部周长小于100cm的株数为__24__.解析 由题意,在抽测的60株树木中,底部周长小于100cm的株数为
0.015+
0.025×10×60=
24.8.如图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为__
6.8__.解析 ∵==11,∴s2==
6.
8.9.为了调查某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为__10__.解析 设5个班级的人数分别为x1,x2,x3,x4,x5,则=7,=4,即5个整数平方和为20,最大的数比7大但与7的差值不能大于或等于4,否则方差大于4,故最大值为10,最小值为
4.
三、解答题10.随机观测生产某种零件的某工厂25名工人的日加工零件数单位件,获得数据如下
30424136444037372545294331364934334338423234463936.根据上述数据得到样本的频率分布表如下.分组频数频率
[2530]
30.123035]
50.203540]
80.324045]n1f14550]n2f21确定样本频率分布表中n1,n2,f1和f2的值;2根据上述频率分布表,画出样本频率分布直方图和频率分布折线图.解析 1由所给数据知,落在区间4045]内的有7个,落在4550]内的有2个,故n1=7,n2=2,所以f1===
0.28,f2===
0.
08.2样本频率分布直方图和频率分布折线图如图所示.11.某校高一某班的某次数学测试成绩满分为100分的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题1求分数在
[5060]内的频率及全班人数;2求分数在
[8090]之间的频数,并计算频率分布直方图中
[8090]间的矩形的高.解析 1分数在
[5060]的频率为
0.008×10=
0.
08.由茎叶图知,分数在
[5060]之间的频数为2,所以全班人数为=
25.2分数在
[8090]之间的频数为25-2-7-10-2=4,频率分布直方图中
[8090]间的矩形的高为÷10=
0.
016.12.xx·安徽合肥三中入学考试为参加学校的“我爱古诗词”知识竞赛,小王所在班级组织了一次古诗词知识测试,并将全班同学的分数得分取正整数,满分为100分进行统计,以下是根据这次测试成绩制作的不完整的频率分布表和频率分布直方图.频率分布表组别分组频数频率150≤x<
6090.18260≤x<70a370≤x<
80200.40480≤x<
900.08590≤x≤1002b合计1请根据以上频率分布表和频率分布直方图,回答下列问题1求出a,b,c,d的值;2老师说“小王的测试成绩是全班同学成绩的中位数”,那么小王的测试成绩在什么范围内?3若要从小明、小敏等五位成绩优秀的同学中随机选取两位参加竞赛,请用列表法或树状图求出小明、小敏同时被选中的概率注五位同学请用A,B,C,D表示,其中小明为A,小敏为B.解析 19÷
0.18=5050×
0.08=4,所以a=50-9-20-4-2=15,b=2÷50=
0.04,c=15÷50÷10=
0.03,d=
0.04÷10=
0.
004.2小王的测试成绩在70≤x80范围内.3画树状图为共有20种等可能的结果数,其中小明、小敏同时被选中的结果数为2,所以小明、小敏同时被选中的概率P==.。