还剩8页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
统计第1讲 随机抽样和样本估计总体 1.2011江西为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分十分制如图K15-1-1所示,假设得分值的中位数为me,众数为m0,平均值为, 则 图K15-1-1A.me=m0= B.me=m0C.mem0D.m0me2.某地区有300家商店,其中大型商店有30家,中型商店有75家,小型商店有195家.为了掌握各商店的营业情况,要从中抽取一个容量为20的样本.若采用分层抽样的方法,抽取的中型商店数是 A.2B.3C.5D.133.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为
17.5—18岁的男生体重kg,得到频率分布直方图如图K15-1-
2.图K15-1-2根据上图可得这100名学生中体重在[
56.
564.5]的学生人数是 A.20B.30C.40D.504.高三1班共有56人,学号依次为123,…,56,现用系统抽样的办法抽取一个容量为4的样本,已知学号为63448的同学在样本中,那么还有一个同学的学号应为 A.18 B.19 C.20 D.215.已知样本容量为30,在样本频率分布直方图如图K15-1-3中,各小长方形的高的比从左到右依次为2∶4∶3∶1,则第2组的频率和频数分别为 图K15-1-3A.
0.412 B.
0.616 C.
0.416 D.
0.6126.一个总体分为A、B两层,用分层抽样方法从总体中抽取一个容量为10的样本.已知B层中每个个体被抽到的概率都为,则总体中的个体数为________.7.如图K15-1-4是样本容量为200的频率分布直方图.根据样本的频率分布直方图估计,样本数据落在
[610]内的频数为________,数据落在210内的概率约为________.图K15-1-48.2010浙江在如图K15-1-5所示的茎叶图中,甲、乙两组数据的中位数分别是____________.图K15-1-59.2010年湖南为了对某课题进行研究,用分层抽样方法从三所高校A,B,C的相关人员中,抽取若干人组成研究小组,有关数据见下表单位人.高校相关人数抽取人数A18xB362C54y1求x,y;2若从高校B、C抽取的人中选2人作专题发言,求这二人都来自高校C的概率.10.为了让学生了解环保知识,增强环保意识,某中学__了一次“环保知识竞赛”,共有900名学生参加了这次竞赛.为了解本次竞赛成绩情况,从中抽取了部分学生的成绩得分均为整数,满分为100分进行统计.请你根据尚未完成并有局部污损的频率分布表和频数分布直方图如图K15-1-6,解答下列问题1填充频率分布表的空格将答案直接填在表格内;2补全频数条形图;3若成绩在
75.5~
85.5分的学生为二等奖,问获得二等奖的学生约为多少人?图K15-1-6分组频数频率
50.5~
60.
540.
0860.5~
70.
50.
1670.5~
80.
51080.5~
90.
5160.
3290.5~
100.5合计5011.随机抽取某中学甲、乙两班各10名同学,测量他们的身高单位cm,获得身高数据的茎叶图如图K15-1-
7.图K15-1-71根据茎叶图判断哪个班的平均身高较高;2计算甲班的样本方差;3现从乙班这10名同学中随机抽取两名身高不低于173cm的同学,求身高为176cm的同学被抽中的概率.第2讲 变量的相关性 1.某工厂某产品产量x千件与单位成本y元满足回归直线方程=
77.36-
1.82x,则以下说法中正确的是 A.产量每增加1000件,单位成本下降
1.82元B.产量每增加1000件,单位成本上升
1.82元C.产量每减少1000件,单位成本上升
1.82元D.产量每减少1000件,单位成本下降
1.82元2.2011年陕西设x1,y1,x2,y2,…,xn,yn是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线如图K15-2-1,以下结论正确的是 图K15-2-1A.直线l过点,B.x和y的相关系数为直线l的斜率C.x和y的相关系数在0到1之间D.当n为偶数时,分布在l两侧的样本点的个数一定相同3.统计中用相关系数r来衡量两个变量之间线性关系的强弱.对于变量x,y,计算r=-
0.01,则x,y的相关关系的强弱为 A.相关性很强B.相关性很弱C.相关性一般D.不相关4.2011年山东某产品的__费用x与销售额y的统计数据如下表__费用x万元4235销售额y万元49263954根据上表可得回归方程=x+中的为
9.4,据此模型预报__费用为6万元时销售额为 A.
63.6万元 B.
65.5万元 C.
67.7万元 D.
72.0万元5.2010湖南某商品销售量y件与销售__x元/件负相关,则其回归方程可能是 A.=-10x+200 B.=10x+200C.=-10x-200D.=10x-2006.已知x,y的取值如下表所示x0134y
2.
24.
34.
86.7从散点图分析,y与x线性相关,且=
0.95x+a,则a=__________.7.甲、乙两同学各自__地考察两个变量x,y的线性相关关系时,发现两人对x的观察数据的平均值相等,都是s,对y的观察数据的平均值也相等,都是t,各自求出的回归直线分别是l1,l2,则直线l1与l2必经过同一点____________________________________.8.2010广东文改编某市居民2005—2009年家庭年平均收入单位万元与年平均支出单位万元的统计资料如下表所示年份20052006200720082009收入x
11.
512.
11313.315支出y
6.
88.
89.81012根据统计资料,居民家庭年平均收入的中位数是_________________________________,家庭年平均收入与年平均支出有线性相关关系,其线性回归方程为__________.9.已知三点310,720,1124的横坐标x与纵坐标y具有线性关系,则其线性回归方程是________________.10.某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1—6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下资料日 期1月10日2月10日3月10日4月10日5月10日6月10日昼夜温差x℃1011131286就诊人数y人222529261612该兴趣小组确定的研究方案是先从这六组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验.1求选取的2组数据恰好是相邻两个月的概率;2若选取的是1月与6月的两组数据,请根据2—5月份的数据,求出y关于x的线性回归方程;3若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?11.2011年安徽某地最近十年粮食需求量逐年上升,下表是部分统计数据年份20022004200620082010需求量万吨2362462572762861利用所给数据求年需求量与年份之间的回归直线方程=x+;2利用1中所求出的直线方程预测该地2012年的粮食需求量.12.2010年广东惠州调研为了对2006年佛山市中考成绩进行分析,在60分以上的全体同学中随机抽出8位,他们的数学已折算为百分制、物理、化学分数对应如下表学生编号12345678数学分数x6065707580859095物理分数y7277808488909395化学分数z67727680848790921若规定85分包括85分以上为优秀,求这8位同学中数学和化学分数均为优秀的概率;2用变量y与x,z与x的相关系数说明物理与数学、化学与数学的相关程度;3求y与x,z与x的线性回归方程系数精确到
0.01,并用相关指数比较所求回归模型的效果.参考数据=
77.5,=85,=81,xi-2≈1050,yi-2≈456,zi-2≈550,xi-yi-≈688,xi-zi-≈755,yi-i2≈7,zi-i2≈94,≈
32.4,≈
21.4,≈
23.
5.第3讲 回归分析与__性检验 1.考察黄烟经过培养液处理是否跟发生青花病有关系,调查了457株黄烟,得到下表中数据培养液处理未处理合计青花病25210235无青花病80142222合计105352457根据表中数据可知K2= A.
40.682 B.
31.64 C.
45.331 D.
41.612.两个变量y和x进行回归分析,得到一组样本数据x1,y1,x2,y2,…,xn,yn.则下列说法中不正确的是 A.由样本数据得到的回归方程=x+必过样本中心,B.线性相关系数r越大,两个变量的线性相关性越强;反之,线性相关性越弱C.用相关指数R2来刻画回归效果,R2越大,说明模型的拟合效果越好D.若变量y和x之间的相关系数为r=-
0.9362,则变量y和x之间具有线性相关关系3.__性检验中,假设H0变量X与变量Y没有关系.则在H0成立的情况下,估算概率PK2≥
6.635≈
0.01表示的意义是 A.变量X与变量Y有关系的概率为1%B.变量X与变量Y有关系的概率为99%C.变量X与变量Y没有关系的概率为99%D.变量X与变量Y没有关系的概率为
99.9%4.2010年宁夏银川下表是某厂1—4月份用水量单位百吨的一组数据月份x1234用水量y
4.
5432.5由散点图可知,用水量与月份之间有较好的线性相关关系,其线性回归方程式=-
0.7x+a,则a等于 A.
10.5B.
5.15 C.
5.2 D.
5.255.利用__性检验来考虑两个分类变量X和Y是否有关系时,通过查阅下表来确定断言“X和Y有关系”的可信度.如果K2=
6.23,那么就有把握认为“X和Y有关系”的百分比为 PK2k
0.
500.
400.
250.
150.
100.
050.
0250.
0100.
0050.001k
0.
4550.
7081.
3232.
0722.
7063.
845.
0246.
6357.
87910.83A.90%B.
95.5%C.
97.5%D.99%6.为了了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机选取了60名高中生,通过问卷调查,得到以下数据作文成绩优秀作文成绩一般合计课外阅读量较大221032课外阅读量一般82028合计303060由以上数据,计算得出K2A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有
0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有
99.5%的把握认为课外阅读量大与作文成绩优秀有关D.有
99.9%的把握认为课外阅读量大与作文成绩优秀有关7.在求两个变量x和y的线性回归方程过程中,计算得i=25,i=250,=145,xiyi=1380,则该回归方程是__________________________.参考公式=.8.2011年广东珠海综合测试调查某养殖场某段时间内幼崽出生的时间与性别的关系,得到下面的数据表晚上白天雄性2010雌性921从中可以得出幼崽出生的时间与性别有关系的把握有____.参考公式K2=,其中n=a+b+c+d.PK2≥k
00.
250.
150.
100.
050.
0250.010k
01.
3232.
0722.
7063.
8415.
0246.
6359.某服装商场为了了解毛衣的月销售量y件与月平均气__℃之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表月平均气__℃171382月销售量y件24334055由表中数据算出线性回归方程=bx+a中的b≈-
2.气象部门预测下个月的平均气温约为6℃,据此估计,该商场下个月毛衣的销售量约为_________件.参考公式b=,a=-b.10.某电脑公司有6名产品推销员,其工作年限与年推销金额的数据如下表推销员编号12345工作年限x/年35679推销金额y/万元233451以工作年限为自变量x,推销金额为因变量y,作出散点图;2求年推销金额y关于工作年限x的线性回归方程;3若第6名推销员的工作年限为11年,试估计他的推销金额.11.某企业有两个分厂生产某种零件,按规定内径尺寸单位mm的值落在
29.
9430.06的零件为__品.从两个分厂生产的零件中各抽出500件,量其内径尺寸,结果如下表甲厂分组[
29.86,29.90[
29.90,29.94[
29.94,29.98[
29.98,30.02[
30.02,30.06[
30.06,30.10[
30.10,30.14频数12638618292614乙厂分组[
29.86,29.90[
29.90,29.94[
29.94,29.98[
29.98,30.02[
30.02,30.06[
30.06,30.10[
30.10,30.14频数2971851597662181试分别估计两个分厂生产的零件的__品率;2由以上统计数据填下面2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”.甲厂乙厂合计__品非__品合计附K2=12.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示又发作过心脏病未发作过心脏病合计心脏搭桥手术39157196血管清障手术29167196合计68324392试利用__性检验判断这两种手术对病人是否发作心脏病有关,有多大把握认为两者有关?。