还剩5页未读,继续阅读
文本内容:
用样本估计总体【考点梳理】1.频率分布直方图1频率分布表的画法第一步求极差,决定组数和组距,组距=;第二步分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步登记频数,计算频率,列出频率分布表.2频率分布直方图反映样本频率分布的直方图如图.横轴表示样本数据,纵轴表示,每个小矩形的面积表示样本落在该组内的频率.2.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数.3.样本的数字特征数字特征定义众数在一组数据中,出现次数最多的数据叫做这组数据的众数中位数将一组数据按大小依次排列,把处在最中间位置的一个数据或最中间两个数据的平均数叫做这组数据的中位数.在频率分布直方图中,中位数左边和右边的直方图的面积相等平均数样本数据的算术平均数,即=方差s2=[x1-2+x2-2+…+xn-2],其中s为标准差【考点突破】考点
一、茎叶图及其应用【例1】某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分评分越高表明市民的评价越高,绘制茎叶图如下1分别估计该市的市民对甲、乙两部门评分的中位数;2分别估计该市的市民对甲、乙两部门的评分高于90的概率;3根据茎叶图分析该市的市民对甲、乙两部门的评价.[解析]1由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是
75.50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为=67,所以该市的市民对乙部门评分的中位数的估计值是
67.2由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为=
0.1,=
0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为
0.1,
0.
16.3由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.【类题通法】1.茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况.2.1作样本的茎叶图时先要根据数据特点确定茎、叶,再作茎叶图;作“叶”时,要做到不重不漏,一般由内向外,从小到大排列,便于数据的处理.2根据茎叶图中数据数字特征进行分析判断考查识图能力,判断推理能力和创新应用意识;解题的关键是抓住“叶”的分布特征,准确提炼信息.【对点训练】以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩单位分已知甲组数据的中位数为15,乙组数据的平均数为
16.8,则x+y的值为______.[答案]13[解析]由茎叶图及已知得x=5,又乙组数据的平均数为
16.8,即=
16.8,解得y=8,因此x+y=
13.考点
二、频率分布直方图【例2】我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量单位吨,将数据按照[0,
0.5,[
0.5,1,……,[4,
4.5]分成9组,制成了如图所示的频率分布直方图.1求直方图中a的值;2设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;3估计居民月均用水量的中位数.[解析]1由频率分布直方图可知月均用水量在[0,
0.5内的频率为
0.08×
0.5=
0.
04.同理,在[
0.5,1,[
1.5,2,[2,
2.5,[3,
3.5,[
3.5,4,[4,
4.5]等组的频率分别为
0.08,
0.21,
0.25,
0.06,
0.04,
0.
02.由1-
0.04+
0.08+
0.21+
0.25+
0.06+
0.04+
0.02=
0.5×a+
0.5×a,解得a=
0.
30.2由1知,该市100位居民中月均用水量不低于3吨的频率为
0.06+
0.04+
0.02=
0.
12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300000×
0.12=
36000.3设中位数为x吨.因为前5组的频率之和为
0.04+
0.08+
0.15+
0.21+
0.25=
0.
730.
5.又前4组的频率之和为
0.04+
0.08+
0.15+
0.21=
0.
480.
5.所以2≤x
2.
5.由
0.50×x-2=
0.5-
0.48,解得x=
2.
04.故可估计居民月均用水量的中位数为
2.04吨.【类题通法】1.准确理解频率分布直方图的数据特点,频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率和条形图混淆.2.抓住频率分布直方图中各小长方形的面积之和为1,这是解题的关键,并利用频率分布直方图可以估计总体分布.【对点训练】某城市100户居民的月平均用电量单位度,以[160,180,[180,200,[200,220,[220,240,[240,260,[260,280,[280,300]分组的频率分布直方图如图.1求直方图中x的值;2求月平均用电量的众数和中位数;3在月平均用电量为[220,240,[240,260,[260,280,[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则从月平均用电量在[220,240内的用户中应抽取多少户?[解析]1由
0.002+
0.0095+
0.011+
0.0125+x+
0.005+
0.0025×20=1,得x=
0.0075,∴直方图中x的值为
0.
0075.2月平均用电量的众数是=
230.∵
0.002+
0.0095+
0.011×20=
0.
450.5,∴月平均用电量的中位数在[220,240内,设中位数为a,则
0.002+
0.0095+
0.011×20+
0.0125×a-220=
0.5,解得a=224,即中位数为
224.3月平均用电量在[220,240内的用户有
0.0125×20×100=25户,同理可求月平均用电量为[240,260,[260,280,[280,300]的用户分别有15户、10户、5户,故抽样比为=.∴从月平均用电量在[220,240内的用户中应抽取25×=5户.考点
三、样本的数字特征【例3】为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位h).试验的观测结果如下服用A药的20位患者日平均增加的睡眠时间
0.
61.
22.
71.
52.
81.
82.
22.
33.
23.
52.
52.
61.
22.
71.
52.
93.
03.
12.
32.4服用B药的20位患者日平均增加的睡眠时间
3.
21.
71.
90.
80.
92.
41.
22.
61.
31.
41.
60.
51.
80.
62.
11.
12.
51.
22.
70.51分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?2根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?[解析]1设A药观测数据的平均数为,B药观测数据的平均数为,又观测结果可得,,由以上计算结果可得,因此可看出A药的疗效更好.2由观测结果可绘制如下茎叶图A药B药60.55689855221.12234678998776543322.1456752103.2从以上茎叶图可以看出,A药疗效的试验结果有的叶集中在茎2,3上,而B药疗效的试验结果有的叶集中在茎0,1上,由此可看出A药的疗效更好.【类题通法】1.平均数反映了数据的中心,是平均水平,而方差和标准差反映的是数据围绕平均数的波动大小.进行平均数与方差的计算,关键是正确运用公式.2.平均数与方差所反映的情况有着重要的实际意义,一般可以通过比较甲、乙两组样本数据的平均数和方差的差异,对甲、乙两品种可以做出评价或选择.【对点训练】某车间20名工人年龄数据如下表1求这20名工人年龄的众数与极差;2以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;3求这20名工人年龄的方差.[解析]1这20名工人年龄的众数为30;这20名工人年龄的极差为40-19=
21.2以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图如下3这20名工人年龄的平均数为19+28×3+29×3+30×5+31×4+32×3+40÷20=30;所以这20名工人年龄的方差为30-192+30-282+30-292+30-302+30-312+30-322+30-402=
12.
6.A药B药
0.
1.
2.
3.。