还剩38页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
附录三部分习题参考解答第一章(15-16)
一、判断题
1.答错统计学和数学具有不同的性质特点数学撇开具体的对象,以最一般的形式研究数量的联系和空间形式;而统计学的数据则总是与客观的对象联系在一起特别是统计学中的应用统计学与各不同领域的实质性学科有着非常密切的联系,是有具体对象的方法论
2.答对
3.答错实质性科学研究该领域现象的本质关系和变化规律;而统计学则是为研究认识这些关系和规律提供合适的方法,特别是数量分析的方法
4.答对
5.答错描述统计不仅仅使用文字和图表来描述,更重要的是要利用有关统计指标反映客观事物的数量特征
6.答错有限总体全部统计成本太高,经常采用抽样调查,因此也必须使用推断技术
7.答错不少社会经济的统计问题属于无限总体例如要研究消费者的消费倾向,消费者不仅包括现在的消费者而且还包括未来的消费者,因而实际上是一个无限总体
8.答对
二、单项选择题
1.A;
2.A;
3.A;
4.B
三、分析问答题
1.答定类尺度的数学特征是“=”或“”,所以只可用来分类,民族可以区分为汉、藏、回等,但没有顺序和优劣之分,所以是定类尺度数据;定序尺度的数学特征是“”或“”,所以它不但可以分类,还可以反映各类的优劣和顺序,教育程度可划分为大学、中学和小学,属于定序尺度数据;定距尺度的主要数学特征是“+”或“-”,它不但可以排序,还可以用确切的数值反映现象在两方面的差异,人口数、信教人数、进出口总额都是定距尺度数据;定比尺度的主要数学特征是“”或“”,它通常都是相对数或平均数,所以经济增长率是定比尺度数据
2.答某学生的年龄和性别,分别为20和女,是数量标志和品质标志;而全校学生资料汇总以后,发现男生1056,女生802人,其中平均年龄、男生女生之比都是质量指标,而年龄合计是数量指标数量指标是个绝对数指标,而质量指标是指相对指标和平均指标品质标志是不能用数字表示的标志,数量标志是直接可以用数字表示的标志
3.答如考察全国居民人均住房情况,全国所有居民构成统计总体,每一户居民是总体单位,抽查其中5000户,这被调查的5000户居民构成样本第二章(45-46)
一、单项选择题
1.C;
2.A;
3.A
二、多项选择题
三、简答题
1.答这种说法不对从理论上分析,统计上的误差可分为登记性误差、代表性误差和推算误差无论是全面调查还是抽样调查都会存在登记误差而代表性误差和推算误差则是抽样调查所固有的这样从表面来看,似乎全面调查的准确性一定会高于统计估算但是,在全面调查的登记误差特别是其中的系统误差相当大,而抽样调查实现了科学化和规范化的场合,后者的误差也有可能小于前者我国农产量调查中,利用抽样调查资料估算的粮食产量数字的可信程度大于全面报表的可信程度,就是一个很有说服力的事例
2.答统计报表的日常维持需要大量的人力、物力、财力;而且统计报表的统计指标、指标体系不容易调整,对现代社会经济调查来说很不合适
3.答这种分组方法不合适统计分组应该遵循“互斥性原则”,本题所示的分组方式违反了“互斥性原则”,例如,一观众是少女,若按以上分组,她既可被分在女组,又可被分在少组
4.答
四、计算题解
(1)次(频)数分布和频率分布数列居民户月消费品支出额(元)次(频)数频率(%)800以下800-850850-900900-950950-10001000-10501050-11001100以上141218841228243616824合计
50100.00
(2)主要操作步骤
①将下表数据输入到Excel组限向上累计向下累计750050800149850545900173395035151000437105047311004821150500
②选定所输入的数据,并进入图表向导,在向导第1步中选定“无数据点平滑线散点图”类型,单击“完成”,即可绘制出累计曲线图
(3)绘制直方图、折线图、曲线图和向上、向下累计图
(4)主要操作步骤
①次数和频率分布数列输入到Excel
②选定分布数列所在区域,并进入图表向导,在向导第1步中选定“簇状柱形图”类型,单击“完成”,即可绘制出次数和频率的柱形图
③将频率柱形图绘制在次坐标轴上,并将其改成折线图主要操作步骤在“直方图和折线图”基础上,将频率折线图改为“平滑线散点图”即可第三章(74-76)
1、单项选择题
1.D;
2.A;
3.B;
4.B;
5.A
6.C
二、判断分析题
1.答均值呈右偏分布由于存在极大值,使均值高于中位数和众数,而只有较少的数据高于均值2.任意一个变量数列都可以计算算术平均数和中位数,但可能无法计算众数,同样,算术平均数和中位数可以衡量变量集中趋势,但是众数有时则不能因为有时有两个众数有时又没有众数3.答可计算出总体标准差为10,总体方差为100,于是峰度系数K=34800/10000=
3.48,可以认为总体呈现非正态分布峰度系数,属于尖顶分布
4.答股票A平均收益的标准差系数为
2.71/
5.63=
0.48135,股票B平均收益的标准差系数为
4.65/
6.94=
0.670029,股票C平均收益的标准差系数为
9.07/
8.23=
1.
1020665.答为了了解房屋价格变化的走势,宜选择住房价格的中位数来观察,因为均值受极端值影响;如果为了确定交易税率,估计相应税收总额,应利用均值,因为均值才能推算总体有关的总量
6.答
(1)均值、中位数、众数分别增加200元;
(2)不变;
(3)不变;
(4)不同
三、计算题
1.解基期总平均成本==660报告期总平均成本==640总平均成本下降的原因是该公司产品的生产结构发生了变化,即成本较低的甲企业产量占比上升而成本较高的乙企业产量占比相应下降所致 基期报告期总成本 单位成本(元)产量(吨)单位成本(元)产量(吨)基期报告期甲企业600120060024007200001440000乙企业7001800700160012600001120000合计——3000——400019800002560000总平均成本6606402.甲班乙班甲班 乙班 全部6091平均
72.704平均
76.018平均
74.3917974标准误差
1.998标准误差
1.905标准误差
1.3824862中位数
74.5中位数
78.5中位数
76.57672众数78众数60众数786790(样本)标准差
14.681标准差
14.257标准差
14.4965894(样本)方差
215.533方差
203.254方差
210.1306576峰度
1.664峰度-
0.305峰度
0.6857883偏度-
0.830偏度-
0.5905偏度-
0.7006492区域74区域58区域747585最小值25最小值41最小值257694最大值99最大值99最大值997883求和3926求和4257求和81838477观测数54观测数56观测数1104882总体方差
211.
542199.625
208.222584组内方差平均数
205.475 9060组间方差
2.745 98607051全班7760成绩人数f组中值xxf离差平方和787840以下
235703273.14687840-
504451803709.917748050-
607553852928.719957060-
70226514302404.545859370-
80337524756.818182688480-
90238519552095.661808190以上
199518057258.4719281合计110——
830021677.278882全班平均成绩方差标准差
738575.
455197.
06614.03865787280成绩人数f组中值xxf离差平方和747240以下
235703273.14996440-
50245901854.959694150-
603551651255.165727560-
7013658451420.868747870-
80197514253.92562856180-
90885680728.9256674290以上
7956652674.1743353合计54——
394011211.169492甲班平均成绩方差标准差
577572.
963207.
61414.4096081乙班平均成绩方差标准差
618177.
857186.
89513.67178628388成绩人数f组中值xxf离差平方和667940以下03500779840-
50245901854.959829550-
604552201673.554946060-
70965585983.678557170-
80147510502.893769980-
90158512751366.736755390以上
129511404584.2988054合计56——
436010466.
12619060933.解根据总体方差的计算公式可得;全部学生成绩的方差=
2.745总体方差(
208.2199)=组内方差平均数(
205.4749)+组间方差(
2.745)4.
5.解水果等级收购单价(元/千克)收购金额(元)收购数量甲
2.00127006350乙
1.601664010400丙
1.3083206400平均价格合计——
37660231501.62678196.均值=164;标准差=4;总人数=1200身高分布通常为钟形分布,按经验法则近似估计规格身高分布范围比重数量(套)小号160以下
0.
15865190.38中号160-168均值±1*标准差
0.
6827819.24大号168以上
0.
15865190.38合计
12007.解用1代表“是”即具有某种特征,0代表“非”(即不具有某种特征)设总次数为N,1出现次数为N1,频率(N1/N)记为P由加权公式来不难得出是非变量的均值=P;方差=P1-P;标准差=计算题2废品率%废品数量产品数量
1.
5251666.
66672.5301200545900合计
1003766.667平均废品率%
2.654878品种平均产量(kg/公顷)标准差(kg/公顷)标准差系数均值-2*标准差均值+2*标准差均值-2*标准差均值+2*标准差A
90003000.03338400960081009900B
96006000.0625840010800780011400计算题9投资收益率%
3.
6103.6几何平均数
102.
024231.
9101.9平均收益率%
2.
0242334.
3104.3年总收益率(%)
1.0834612-
1.
698.4年总收益(万元)
0.834612第四章
1、判断分析题
1.答
(1);
(2);
(3);
(4);
(5);
(6);
(7)
2.答
3.答表示没有次品;表示次品不超过一件
二、计算题
1.解设A、B、C分别表示炸弹炸中第一军火库、第二军火库、第三军火库这三个事件于是,P(A)=
0.025P(B)=
0.1P(C)=
0.1又以D表示军火库爆炸这一事件,则有,D=A+B+C其中A、B、C是互不相容事件(一个炸弹不会同时炸中两个或两个以上军火库)∴P(D)=P(A)+P(B)+P(C)=
0.025+
0.1+
0.1=
0.
2252.解
3.解设A表示这种动物活到20岁、B表示这种动物活到25岁∵BA∴B=AB∴P(B|A)====
0.
55.解设B1={第一台车床的产品};B2={第二台车床的产品};A={合格品}则P(B1)=P(B2)=P(A|B1)=1-
0.03=
0.97P(A|B2)=1-
0.02=
0.98由全概率公式得P(A)=P(B1)*P(A|B1)+P(B2)*P(A|B2)=*
0.97+*
0.98=
0.
9737.解设B1={第一台车床的产品};B2={第二台车床的产品};A={废品}则P(B1)=P(B2)=P(A|B1)=
0.03P(A|B2)=
0.02P(B2|A)====
0.
259.解
(1)一次投篮投中次数的概率分布表X=xi01P(X=xi)
0.
70.3
(2)重复投篮5次,投中次数的概率分布表X=xi012345P(X=xi)
0.
168070.
360150.
308700.
132300.
028350.
0024310.解
11.解P(1400X1600)=Φ()-Φ()=Φ(-
0.4255)-Φ(-
1.1348)=
0.2044P(1600X1800)=Φ()-Φ()=Φ(
0.2837)-Φ(-
0.4255)=
0.2767P(2000X)=Φ(∞)-Φ()=Φ(∞)-Φ(
0.9929)=
0.
161113.解当f1=
4、f2=5时P(X11)=
0.01;当f1=
5、f2=6时P(X5)=1-
0.05=
0.
9515.解X=xi23456789101112P(X=xi)E(X)==2*+3*+4*+5*+6*+7*+8*+9*+10*+11*+12*==7V(X)==*+*+*+*+*+*+*+*+*+*+*==
5.
83317.解+=
0.0769+
0.2025=
0.2794
三、证明题
1.证因于是
3.证第五章
一、单项选择题
(1)BC;
(3)A;
(5)AC
二、计算题
1.解样本平均数=425S2n-1=
72.049S14=
8.488==
2.1448===
2.1448×
2.1916=
4.7005所求μ的置信区间为425-
4.70μ425+
4.70,即(
420.30,
429.70)
2.解样本平均数=
12.09S2n-1=
0.005S15=
0.0707==
0.7007/sqrt15=
0.01825t
150.025=
2.
13112.09-
0.
03812.09+
0.
0383.解n=600p=
0.1,nP=60≥5,可以认为n充分大,α=
0.05,因此,一次投掷中发生1点的概率的置信区间为
0.1-
0.
0240.1+
0.024,即(
0.076,
0.124)
5.解根据已知条件可以计算得估计量=*14820=494(分钟)估计量的估计方差=**=
1743.1653其中===
53017.93S=
230.
266.已知:N=400n=80p=
0.1=
0.05Z/2=Z
0.025=
1.96△x
7.解,,置信度为
0.95的置信区间为=
9.解应抽取242户进行调查第六章
一、单项选择题某种电子元件的使用者要求,一批元件的废品率不能超过2‰,否则拒收1.使用者在决定是否接收而进行抽样检验时,提出的原假设是A.H0P≥2‰B.H0P≤2‰C.H0P=2‰D.其他2.对上述检验问题,标准正态检验统计量的取值区域分成拒绝域和接受域两部分拒绝域位于接受域之A.左侧B.右侧C两侧D.前三种可能性都存在3.在上述检验中,0.05显著性水平对应的标准正态分布临界值是A.
1.645B.±
1.96C.-
1.645D.±
1.6454.若算得检验统计量的样本值为
1.50,电子元件的实际废品率是
3.5‰,则会出现A.接受了正确的假设B.拒绝了错误的假设C.弃真错误D.取伪错误5.使用者偏重于担心出现取伪错误而造成的损失那么他宁可把显著性水平定得A.大B.小C.大或小都可以D.先决条件不足,无法决定
二、问答题
1.某县要了解该县小学六年级学生语文理解程度是否达到及格水平60分为此,从全体六年级学生中用简单随机放还抽样方法抽取了400人进行测试,得到平均成绩
61.6分,标准差
14.4分要根据样本数据对总体参数的论断值语文理解程度的期望值60分作显著性检验,显著水平先后按α=
0.05和α=
0.01考虑请就上面的工作任务回答下列问题1指出由样本数据观测到何种差异;2指出出现这种差异的两种可能的原因;3针对这两种可能的原因提出相应的两种假设原假设和备择假设,指出所提出的假设对应着单侧检验还是双侧检验,说明为什么要用单侧检验或者双侧检验;4仿照式
6.7构造检验统计量如在那里说明过的这个检验统计量服从t分布不过,由于我们在这里所使用的是一个400人的足够大的样本,因而可以用标准正态分布作为t分布的近似;5计算检验统计量的样本值;6根据上述样本值查表确定观测到的显著性水平;7用观测到的显著性水平与检验所用的显著性水平标准比较注意如果是单侧检验,这个标准用α值,如果是双侧检验,这个标准用α/2值,并说明,通过比较,你是否认为得到了足以反对“观测到的差异纯属机会变异”这一论断或是足以反对原假设的足够的证据为什么8根据提出的显著性水平建立检验规则,然后用检验统计量的样本值与检验规则比较,重新回答7中的问题;9根据上面所做的工作,针对本题的研究任务给出结论性的表述答双侧检验;检验统计量的样本值
2.22;观察到的显著性水平
0.0132;显著性水平为
0.05时,,拒绝原假设;显著性水平为
0.01时,,不能拒绝原假设2.是否α+β=1这里的α是犯弃真错误的概率,β是犯取伪错误的概率请说明为什么是或为什么不是答不是α大则β小,α小则β大,因为具有随机性,但其和并不一定为
13.据一个汽车制造厂家称,某种新型小汽车耗用每加仑汽油至少能行驶25公里,一个消费者研究小组对此感兴趣并进行检验检验时的前提条件是已知生产此种小汽车的单位燃料行驶里程技术性能指标服从正态分布,总体方差为4试回答下列问题1对于由16辆小汽车所组成的一个简单随机样本,取显著性水平为
0.01,则检验中根据X来确定是否拒绝制造厂家的宣称时,其依据是什么即检验规则是什么2按上述检验规则,当样本均值为每加仑
23、
24、25.5公里时,犯第一类错误的概率是多少答
(1)拒绝域;
(2)样本均值为23,24,
25.5时,犯第一类错误的概率都是
0.01
三、计算题1.一台自动机床加工零件的直径X服从正态分布,加工要求为EX=5cm现从一天的产品中抽取50个,分别测量直径后算得=
4.8cm,标准差
0.6cm试在显著性水平
0.05的要求下检验这天的产品直径平均值是否处在控制状态用临界值规则解
(1)提出假设H0μ=5H1μ5
(2)构造检验统计量并计算样本观测值在H0μ=5成立条件下Z===-
2.3570
(3)确定临界值和拒绝域Z
0.025=
1.96∴拒绝域为
(4)做出检验决策∵=
2.3570Z
0.025=
1.96检验统计量的样本观测值落在拒绝域∴拒绝原假设H0,接受H1假设,认为生产控制水平不正常2.已知初婚年龄服从正态分布根据9个人的调查结果,样本均值=
23.5岁,样本标准差以9-1作为分母计算S=3岁问是否可以认为该地区初婚年龄数学期望值已经超过20岁α=
0.05,用临界值规则解α=
0.05时
(1)提出假设H0μ=60H1μ60
(2)构造检验统计量并计算样本观测值在H0μ=60成立条件下Z===
2.222
(3)确定临界值和拒绝域Z
0.025=
1.96∴拒绝域为
(4)做出检验决策∵Z=
2.222Z
0.025=
1.96检验统计量的样本观测值落在拒绝域∴拒绝原假设H0,接受H1假设,认为该县六年级男生体重的数学期望不等于60公斤α=
0.01时
(1)提出假设H0μ=60H1μ60
(2)构造检验统计量并计算样本观测值在H0μ=60成立条件下Z===
2.222
(3)确定临界值和拒绝域Z
0.005=
2.575∴拒绝域为
(4)做出检验决策∵Z=
2.222Z
0.005=
2.575检验统计量的样本观测值落在接受域∴不能拒绝H0,即没有显著证据表明该县六年级男生体重的数学期望不等于60公斤4.某公司负责人发现开出去的发票有大量笔误,而且断定这些发票中,有笔误的发票占20%以上随机抽取400张发票,检查后发现其中有笔误的占18%,这是否可以证明负责人的判断正确α=
0.05,用临界值规则5.从某地区劳动者有限总体中用简单随机放回的方式抽取一个4900人的样本,其中具有大学毕业文化程度的为600人我们猜测,在该地区劳动者随机试验中任意一人具有大学毕业文化程度的概率是11%要求检验上述猜测α=
0.05,用临界值规则解
(1)提出假设H0=11%H111%
(2)构造检验统计量并计算样本观测值在H0=11%成立条件下样本比例=%Z===
2.68
(3)确定临界值和拒绝域Z
0.025=
1.96∴拒绝域为
(4)做出检验决策∵Z=
2.68Z
0.025=
1.96检验统计量的样本观测值落在拒绝域∴拒绝原假设H0,接受H1假设,即能够推翻所作的猜测6.从某市已办理购房贷款的全体居民中用简单随机不放回方式抽取了342户,其中,月收入5000元以下的有137户,户均借款额
7.4635万元,各户借款额之间的方差
24.999;月收入5000元及以上的有205户,户借款额
8.9756万元,各户借款额之间的方差
28.541可见,在申请贷款的居民中,收入较高者,申请数额也较大试问,收入水平不同的居民之间申请贷款水平的这种差别是一种必然规律,还是纯属偶然α=
0.05,用P-值规则和临界值规则
7.用不放回简单随机抽样方法分别从甲、乙两地各抽取200名六年级学生进行数学测试,平均成绩分别为62分、67分,标准差分别为25分、20分,试以
0.05的显著水平检验两地六年级数学教学水平是否显著地有差异解
(1)提出假设H0μ1=μ2H1μ1μ2
(2)构造检验统计量并计算样本观测值在H0成立条件下Z===
2.209
(3)确定临界值和拒绝域Z
0.025=
1.96∴拒绝域为
(4)做出检验决策∵Z=
2.209Z
0.025=
1.96检验统计量的样本观测值落在拒绝域∴拒绝原假设H0,接受H1假设,即两地的教育水平有差异8.从成年居民有限总体中简单随机不放回地抽取228人,经调查登记知其中男性100人,女性128人就企业的促销活动如折扣销售、抽奖销售、买几赠几等等是否会激发本人购买欲望这一问题请他她们发表意见男性中有40%的人、女性中有43%的人回答说促销活动对自己影响不大或没有影响试问,促销活动对不同性别的人购买欲望的影响是否有差别α=
0.10,用临界值规则9.从甲、乙两地区居民中用不放回简单随机抽样方法以户为单位从甲地抽取400户,从乙地抽取600户居民,询问对某电视节目的态度询问结果,表示喜欢的分别为40户、30户试以单侧
0.05双侧
0.10的显著水平检验甲、乙两地区居民对该电视节目的偏好是否显著地有差异用临界值规则解
(1)提出假设H01=2H112
(2)构造检验统计量并计算样本观测值在H0成立条件下p=(n1p1+n2p2)/(n1+n2)=(400*
0.1+600*
0.05)/(400+600)=
0.07Z===-
3.036
(3)确定临界值和拒绝域Z
0.05=
1.645∴拒绝域为
(4)做出检验决策∵=
3.036Z
0.05=
1.645检验统计量的样本观测值落在拒绝域∴拒绝原假设H0,接受H1假设,即甲乙两地居民对该电视节目的偏好有差异10.某企业为了扩大市场占有率,为开展产品促销活动,拟研究三种广告宣传形式即街头标牌广告、公交车广告和随报刊邮递广告对促销的效果,为此选择了三个人口规模和经济发展水平以及该企业产品过去的销售量类似的地区,然后随机地将三种广告宣传形式分别安排在其中一个地区进行试验,共试验了6周,各周销售量如下表各种广告宣传方式的效果是否显著地有差异α=
0.05,用P值规则和临界值规则三种广告宣传方式的销售量单位箱观测序号周地区和广告方式l23456甲地区街头标牌广告535266625158乙地区公交车广告6l4655495456丙地区随报刊邮递广告50404555404211.从本市高考考生中简单随机抽取50人,登记个人的考试成绩、性别、父母文化程度按父母中较高者,文化程度记作A-大专以上,B-高中,C-初中,D-小学以下数据如下500,女,A498,男,A540,男,A530,女,A450,女,A400,女,A560,男,A460,男,A510,男,A520,女,A524,男,A450,男,B490,女,B430,男,B520,男,B540,女,B410,男,B390,男,B580,女,B320,男,B430,男,B400,女,B550,女,B370,女,B380,男,B470,男,B570,女,C320,女,C350,女,C420,男,C450,男,C480,女,C530,女,C540,男,C390,男,C410,女,C310,女,C300,男,C540,女,D560,女,D290,女,D310,男,D300,男,D340,男,D490,男,D280,男,D310,女,D320,女,D405,女,D410,男,D1试检验学生的性别是否显著地影响考试成绩显著性水平
0.05,用P-值规则和临界值规则;2试检验家长的文化程度是否显著地影响学生的考试成绩显著性水平
0.05,用P-值规则和临界值规则解
(一)
(1)提出假设H0μ1=μ2H1μ1μ2
(2)计算离差平方和性别i成绩j男410430380490498430390470420540300280410540560524520450390300460450320340女450490350530310290405400520400580550570540310530540370320480410560320m=2n1=26n2=24n=50=11122=10725=21847=4930980=5008425=9939405组间变差SSR=-n=26*+24*-50*=
9550383.76-
9545828.18=
4555.58组内变差SSE=-=9939405-
9550383.76=
389021.24
(3)构造检验统计量并计算样本观测值F===
0.5621
(4)确定临界值和拒绝域F
0.05
(148)=
4.048∴拒绝域为
(5)做出检验决策临界值规则:∵F=
0.5621F
0.05
(148)=
4.048检验统计量的样本观测值落在接受域∴不能拒绝H0,即没有显著证据表明性别对成绩有影响P-值规则根据算得的检验统计量的样本值(F值)算出P-值=
0.457075由于P-值=
0.457075显著水平标准,所以不能拒绝,即没有得到足以表明性别对成绩有影响的显著证据
(二)
(1)提出假设H0μ1=μ2=μ3=μ4H1μ
1、μ
2、μ
3、μ4不全相等
(2)计算离差平方和m=4n1=11n2=15n3=12n4=12n=50=5492=6730=5070=4555=21847=2763280=3098100=2237900=1840125=9939405组间变差SSR=-n=11*+15*+12*+12*-50*=
9632609.568-
9545828.18=
86781.388组内变差SSE=-=9939405-
9632609.568=
306795.432
(3)构造检验统计量并计算样本观测值F===
4.3372
(4)确定临界值和拒绝域F
0.05
(346)=
2.816∴拒绝域为
(5)做出检验决策临界值规则:∵F=
4.3372F
0.05
(346)=
2.816检验统计量的样本观测值落在拒绝域∴拒绝原假设H0,接受H1假设,即父母文化程度对孩子的学习成绩有影响P-值规则根据算得的检验统计量的样本值(F值)算出P-值=
0.008973由于P-值=
0.008973小于显著水平标准,所以拒绝,接受H1,即得到足以表明父母文化程度对孩子的学习成绩有影响的显著证据12.某金属材料生产过程中,为提高其强度,需要进行热处理热处理的温度和时间是影响该材料强度的两个主要因素现取三个温度水平和四个时间水平,各个不同水平的每一组合都进行了二次实验,测得该材料在各种热处理方式下的强度数据如下表试分析温度、时间两个因素各自以及两个因素的交互作用对材料强度是否显著地有影响e=
0.01,用P值规则和临界值规则某金属材料热处理后的强度时间BB1B2B3B4温度AA15356697163645659A27168777869705859A37576727168665658第七章相关与回归分析思考与练习
一、判断题
1.产品的单位成本随着产量增加而下降,这种现象属于函数关系答错应是相关关系单位成本与产量间不存在确定的数值对应关系
2.相关系数为0表明两个变量之间不存在任何关系答.错相关系数为零,只表明两个变量之间不存在线性关系,并不意味着两者间不存在其他类型的关系
3.单纯依靠相关与回归分析,无法判断事物之间存在的因果关系答对,因果关系的判断还有赖于实质性科学的理论分析
4.圆的直径越大,其周长也越大,两者之间的关系属于正相关关系答错两者是精确的函数关系
5.总体回归函数中的回归系数是常数,样本回归函数中的回归系数的估计量是随机变量答对
6.当抽取的样本不同时,对同一总体回归模型估计的结果也有所不同答对因为,估计量属于随机变量,抽取的样本不同,具体的观察值也不同,尽管使用的公式相同,估计的结果仍然不一样
二、选择题
1.变量之间的关系按相关程度分可分为b、c、da.正相关;b.不相关;c.完全相关;d.不完全相关;
2.复相关系数的取值区间为aa.;b.;c.;d.
3.修正自由度的决定系数a、b、da.;b.有时小于0;c.;d.比更适合作为衡量回归方程拟合程度的指标
4.回归预测误差的大小与下列因素有关a、b、c、da样本容量;b自变量预测值与自变量样本平均数的离差c自变量预测误差;d随机误差项的方差
三、问答题1.请举一实例说明什么是单相关和偏相关?以及它们之间的差别答例如夏季冷饮店冰激凌与汽水的消费量,简单地就两者之间的相关关系进行考察,就是一种单相关,考察的结果很可能存在正相关关系,即冰激凌消费越多,汽水消费也越多然而,如果我们仔细观察,可以发现一般来说,消费者会在两者中选择一种消费,也就是两者之间事实上应该是负相关两者之间的单相关关系出现正相关是因为背后还有天气等因素的影响,天气越热,两种冷饮的消费量都越多如果设法将天气等因素固定不变,单纯考察冰激凌与汽水的消费量,则可能出现负相关关系像这种假定其他影响因素不变专门考察其中两个因素之间的关系就成为偏相关2.讨论以下几种场合回归方程中回归系数的经济意义和应取的符号
(1)Yt为商业利润率;X2t为人均销售额;X3t为流通费用率
(2)Yt为粮食销售量;X2t为人口数;X3t为人均收入
(3)Yt为工业总产值;X2t为占用的固定资产;X3t为职工人数
(4)Yt为国内生产总值;X2t为工业总产值;X3t为农业总产值答
(1),人均销售额越大,企业利润越高,故此商业利润率越高,从而商业利润率与人均销售额呈正相关关系;而流通费用率越高,反映商业企业的经营成本越高,其商业利润率就越低
(2),人口数量越多,对粮食的消费量就越大;人均收入越多,对粮食的购买力就越强,故此这两个变量皆与粮食销售量呈正相关关系
(3),固定资产和职工人数是两大生产要素,数量越多,说明生产要素越密集,工业总产值就越高,所以它们与工业总产值的关系为正相关
(4),,因为国内生产总值包括三次产业,所以工业总产值、农业总产值和全部的国内生产总值为正相关关系,同时即便某些特殊地区没有工业和农业,仍然有国内生产总值,所以,
四、计算题1.设销售收入X为自变量,销售成本Y为因变量现根据某百货公司12个月的有关资料计算出以下数据(单位万元) =
425053.73;=
647.88;=
262855.25;=
549.8;=
334229.091拟合简单线性回归方程,并对方程中回归系数的经济意义做出解释2计算决定系数和回归估计的标准误差3对β2进行显著水平为5%的显著性检验4假定明年1月销售收入为800万元,利用拟合的回归方程预测相应的销售成本,并给出置信度为95%的预测区间 解
(1)
(2)
(3)t值远大于临界值
2.228,故拒绝零假设,说明在5%的显著性水平下通过了显著性检验
(4)(万元)所以,Yf的置信度为95%的预测区间为所以,区间预测为
2.对9位青少年的身高Y与体重X进行观测,并已得出以下数据:要求
(1)以身高为因变量,体重为自变量,建立线性回归方程;
(2)计算残差平方和决定系数;
(4)对回归系数进行显著性检验解
(1)
(2)决定系数残差平方和
(3)身高与体重的相关系数检验统计量F值远大于临界值
2.365,故拒绝零假设,说明回归方程在5%的显著性水平下通过了显著性检验
(4)t值远大于临界值
2.365,故拒绝零假设,说明在5%的显著性水平下通过了显著性检验3.我国2004年部分副省级大中城市的有关资料如下表城市人均消费支出Y(元/人)人均可支配收入X1(元/人)人均储蓄X2(元/人)沈阳
7213892422470.93大连
86721037826185.59哈尔滨
6896894013402.76南京
83501160224994.58武汉
7793956419175.46济南
84711079815298.77青岛
90021108916495.77杭州
112131456529083.99宁波
112831588223257.83武汉
7793956419175.46广州
131211688459786.52厦门
107391444338261.19资料来源厦门市统计局网站,其中人均储蓄根据储蓄额与人口数推算试根据该表的资料,1拟合以下形式的消费函数Yt=β1+β2X1t+β3X2t+Ut2计算随机误差项的标准差估计值、修正自由度的决定系数,并对整个回归方程进行显著性检验3假设某一居民家庭人均可支配收入为12,000元,人均储蓄为40000元,试预测其人均消费支出,并给出置信度为95%的预测区间解
(1)回归分析的EXCEL操作步骤为步骤一首先将数据粘贴导入EXCEL数据表中步骤二进行回归分析选择“工具”→“数据分析”→“回归”,在该窗口中选定自变量和因变量的数据区域,最后点击“确定”完成操作。