还剩21页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
统计学考试复习资料简答题12题选5个
1、统计数据的类型有哪些?
1、按计量层次分类a.分类数据只能归于某一类别的非数字型数据;对事物进行分类的结果数据表现为类别,用文字来表述,例如人口按性别分为男、女两类b.依次数据只能归于某一有序类别的非数字型数据;对事物类别依次的测度,数据表现为类别,用文字来表述,例如产品分为一等品、二等品、三等品、次品等c.数值型数据按数字尺度测量的视察值,结果表现为具体的数值,对事物的精确测度例如身高为175cm、168cm、183cm.按收集方法分类a.观测的数据通过调查或观测而收集到的数据在没有对事物人为限制的条件下而得到的有关社会经济现象的统计数据几乎都是观测数据b.试验的数据在试验中限制试验对象而收集到的数据,比如,对一种新药疗效的试验,对一种新的农作物品种的试验等自然科学领域的数据大多数都为试验数据.按时间状况分类a.截面数据在相同或近似相同的时间点上收集的数据描述现象在某一时刻的变更状况,比如,2023年我国各地区的国内生产总数
(2)加权指数分为加权综合指数和加权平均指数,拉氏指数和帕氏指数就是加权综合指数中的两种指数
(3)拉氏指数计算公式(基期加权指数)作为权数的同度量指数固定在基期拉氏质量指数Lp=卒回Zp°q°拉氏数量指数4=毕业Z/Po帕氏指数计算公式(报告期加权指数)作为权数的同度量指数固定在报告期帕氏质量指数帕氏数量指数Pq=A^
(4)以2023年考试的题目作为例题来讲解一下某厂三种产品的产量状况如下:试计算出厂价格和产量的拉氏指数和派氏指数,并分析其对总产值的影响大小解析A.拉氏质量指数=卒=
8.5*13500+11*11000+5*4000/8*13500+10*11000+6*4000=255750/242000=
1.0568Zp必—Ep°q°=
8.5*13500+11*11000+5*4000-8*13500+10*11000+6*4000=255750-242000=13750元拉氏数量指数L=孕,=15000*8+10200*10+4800*6/工qoPo13500*8+10200*10+4800*6=250800/242000=
1.0363=8・5^13500+11*11000+5*4000-8*13500+10*11000+6*4000=250800-242000=8800元B.帕氏质量指数R=
8.5*15000+11*10200+5*4800/8*15000+10*10200+6*4800=263700/250800=
1.0514=
8.5*15000+11*10200+5*4800-8*15000+10*10200+6*4800=263700-250800=12900元帕氏数量指数〃=孕,|=15000*
8.5+10200*11+4800*5/二%Pi13500*
8.5+11000*11+4000*5=263700/255750=
1.0310Eq、—£q°p\=15000*
8.5+10200*11+4800*5-13500*
8.5+11000*11+4000*5=263700-255750=7950元C.依据拉氏质量指数由于价格上涨
5.68%使得总产值增长了13750元,依据拉氏数量指数由于产量上升了
3.63%使得总产值增长8800元依据帕氏质量指数由于价格上涨
5.14%使得总产值增长了12900元,依据帕氏数量指数由于产量上升了
3.10%使得总产值增长7950元总结:
2、回来方程的计算一元线性回来.张老师说今年可能涉及的是.消费量及居民收入水平之间关系⑵销售额及广告费用支出之间关系鉴于2023年涉及的题目是
(2)今年出消费量及居民水平之间关系可能性较大.2023年的线性回来大题是
4、下表是某企业的广告投入和销售额之间的关系(万元),
(1)这两个变量是否有近似的线性关系?
(2)检验它们是否有真正的线性关系(a=
0.053您(4尸
0.7407)
(3)求出他们的回归方程
(4)当广告投入为15万元时,企业的销售额是多少?,考察的内容分别是
(1)散点图绘制,视察是否具有正相关性
(2)相关系数r计算及显著性检验
(3)回来方程系数的计算
(4)已知估计的方程,点估计.无论是哪种类型考题,计算思路和方法都是大同小异,就以去年的考题为例,给大家看一下解题过程
(1)依据常识可知,广告投入可以影响销售额,因此判定广告投入是自变量,销售额是因变量,作出广告投入(x)及销售额(y)的散点图销售额70「60-50-40-30-20-10-0-0(考试时大家还是带上绘图工具吧),视察发觉二者之间具有正相关关系全部的点可以近似的落在一条直线上,因此,二者具有近似的线性关系
(2)相关系数r的计算-Z•团2y2-Z22Ex=
37.2Ey=
270.9^x=
1383.84Ey-=
73386.81n=6Ex2=
297.742Ly2=
14316.11=
2024.52于是求得r=
2069.64/
2244.21=
0.92r^l说明两者具有较好的相关性将r=
0.92带入算得t=
4.6949在显著性水平为a=
0.05(题上已知)t=
4.6969t
0.025
(4)=
0.7407说明销售量及广告费之间存在着显著的正线性相关关系
(3)估计的回来方程形式为依据最小二乘法计算出来的前面已经算过Ex=
37.2Zy=
270.9X)
11383.84£J=
297.74x=
6.25/=
45.15不难算出夕二
5.14尺二
13.28即:估计的回来方程为$二13・28+
5.14x
(4)点估计,将x=15带入上述估计方程即可得V=
13.28+
5.14*15=
90.38J(x=15)(万元)样本容量的确定分为估计总体均值时的确定和估计总体比例时的确定总体均值的置信区间是由样本均值京和估计误差两部分组成的,在重复抽样或无限总体抽样条件下,估计误差为后的值和样本量n共同确定了估计误差的大小一旦确定了置信水平「JZs的值就确定了令E代表所希望打到的估计误差,即由此可推导出确定样本量得公式如下n=f2样本容量的圆整法则当计算出的样本容量不是整数时,将小数点后面的数值一律进位成整数,如
24.68取
2524.32也取25等等拥有工商管理学士学位的高校毕业生年薪的标准差大约为2000元,假定想要估计年薪的95%的置信区间,希望估计误差为400元,应抽取多大的样本量?解已知0=2000E=400z«/2=l.96代入公式,得Z%n=E2=
96.04~97即应抽取97人作为样本由此,接着推导估计两个总体均值之差时样本容量的确定设~和%为来自两个总体的样本,并假定111m2依据均值之差的区间估计公式可得两个样本的容量n为其中E二a/
2、吊
二、估计总体比例时样本容量的确定在重复抽样或无限总体抽样条件下,估计总体比例置信区间的估计误差为,Zs的值、总体比例n和样本量n共同确定了估计误差的大小一旦确定了置信水平1-,Zs的值就确定了由于总体比例的值是固定的,所以估计误差由样本量来确定,样本量越大,估计误差就越小,估计得精度就越好因此,对于给定的3的值,就可以确定任一希望的估计误差所须要的样本量令E代表所希望达到的估计误差,即*7k1—口4/21-E=5/n由此可推导出重复抽样或无限总体抽样条件下确定样本量的公式如下111-1n=E2式中的估计误差E必需是运用者事先确定的,大多数状况下,一般取E的值小于
0.10,〃的值可干脆由区间估计中所用到的置信水平确定假如能够求出■的具体值,就可以用上面的公式计算所需的样本量在实际应用中,假如门的值不知道,可以用类似的样本比例来代替;也可以用试验调查的方法,选择一个初始样本,以该样本的比例作为江的估计值当n值无法知道时,通常取使次l-n最大时的
0.5例依据以往的生产统计,某种产品的合格率约为90%现在求估计误差为5肌在95%的置信区间下,应抽取多少个产品作为样本?解已知口=90%E=5%Zcl.96代入公式,得Z^/3Jwinn=-F=1383^139即应抽取139个产品作为样本由此,接着推导两个总体比例之差时样本容量的确定设叫和叼为来自两个总体的样本,并假定由二%依据比例之差的区间估计公式可得两个样本的容量n为111=112=Itp2—it11—n+it21—112其中E=G
4、离散系数的计算
一、简要介绍.标准差及其相应的均值之比.对数据相对离散程度的测度.消退了数据水平凹凸和计量单位的影响.用于对不同组别数据离散程度的比较SV=——
5.计算公式为元
二、具体说明.离散系数的意义及公式说明:!身水箸器案是嚣淖警程度的绝对值,其数值的大小一方面受原变量值自」就也j变量的平均数大小有关,变量值绝对水平居的.离散程度的;:黑黑:鳖;绝对水平低的离散程度的测度值自然也就小;值量单位相同,采用不同计量单位计量的变量值,其离散程度的测度值就,同°因此对于平均水平不同或计量单位不同的不同组别的变量值是不能对标/佳差宜接比较其离散程度的为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数离散系数也称为变异系数coe伍cientofvariation它是一组数据的标准差与其相应的平均数之比其计算公式为
4.20离散系数是测度数据离散程度的相对统计量,主要是用于比较不同样本数据的离散程度离散系数大,说明数据的离散程度也大;离散系数小,说明数据的离散程度也小
①鬻懵I〃例
4.14图1-1注要计算离散系数就要知道平均数又称均值和标准差如何计算.平均数也称为均值的计算方法:1简洁平均数的算法设一组数据为xlx2…,xn总体数据xNn苞+々+.・・+当_普A——nnN玉+工2+..・+工2M——总体平均数NN2加权平均数的算法:设各组的组中值为MlM2…,Mk相应的频数为flf2…,fkA——…+人nkMJ/MJ2+…+Mkfk工——工+力+…+/N
(3)几何平均数的算法.标准差的计算方法
3.方差和标准差方差(variance)是各变量值与其平均数离差平方的平均数它在数学处理、是通过平方的办法消去离差的正3号,然后再进行平均.方差的平方根称为标准差(standarddeviation)o方差(或标准差)能较好地反映出数据的离散程度,是实际中在用最广的离散程度测度值设样本方差为52根据未分组数据和分组数据计算样本方差的公式
①分别为.2(^1—x)2未分组数据”2=0一—
4.15)X如果能得到总体数据,对于未分组的原始数据,总体方差/的计算公式为N/二-「N时于分组数据,总体方差的计算公式为,-;L’巴JN开平方后即得到总体的标准差.图2-1值数据b.时间序列数据在不同时间上收集到的数据描述现象随时间变更的状况比如,2000年至2023年国内生产总值数据
2、简述数据误差的来源?⑴抽样误差由于抽样的随机性带来的误差,全部样本可能的结果及总体真值之间的平均性差异,影响抽样误差的大小的因素为样本量的大小和总体的变异性⑵非抽样误差相对抽样误差而言,除抽样误差之外的,由于其他缘由造成的样本视察结果及总体真值之间的差异存在及全部的调查之中概率抽样、非概率抽样、全面性调查有抽样框误差、回答误差、无回答误差、调查员误差、测量误差
3、衡量数据离散程度的指标有哪些?衡量数据离散程度的指标有
(1).异众比率,用于测度分类数据的离散程度,衡量众数对一组数据的代表程度;
(2).四分位差,用于测量依次数据的离散程度,衡量中位数对一组数据的代表程度;
(3).方差和标准差用于测度数据离散程度的最常用测度值,衡量均值对一组数据的代表程度
4、为什么说正态分布是客观现象中最主要的分布?正态分布有极其广泛的实际背景,生产及科学试验中许多随机变量的概率分布都可以近似地用正态分布来描述一般来说,假如一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分£m-/2f分组数据I=^样本方差是用样本数据个数减1后去除离差平方和,其中样本数据个数减1即〃-1称为自由度degreeoffreedom
①方差开方后即得到标准差与方差不同的是,标准差是具有量纲的,它与变量值的计量单位相同,其实际意义要比方差清楚因此,在对实际问题进行分析时更多地使用标准差标准差的计算公式分别为,图2-2
三、例题某管理局抽查了所属的8家企业,其产品销售数据如表试比较产品销售额及销售利润的离散程度第一步计算产品销售额的离散系数:170+220+390+430+480+650+950+1000842二[170-
536.252+220-
536.252+390-
536.252+430-
536.252+480-
536.252+650-
536.252+950-
536.252+1000-
536.252]78-1=
95598.214294=V
95598.21429=
309.19万元
309.19匕二——-=
0.
577536.25其次步:计算销售利润的离散系数:
8.1+
12.5+
18.0+
22.0+
26.5+
40.0+
64.0+
69.
0.2二[
8.1-
32.52152+
12.5-
32.52152+
18.0-
32.52152+
22.0-
32.52152+
26.5-
32.52152+
40.0-
32.52152+
64.0-
32.52152+
69.0-
32.52152]78-1=
533.2298214邑=J
533.2298214=
23.09万元第三步比较产品销售额及销售利润的离散程度大小v]v2第四步:得出结论计算结果表明,水物说明产品销售额的离散程度小于销售利润的离散程度布从理论上看,正态分布具有许多良好的性质,许多概率分布可以用它来近似;还有一些常用的概率分布是由它干脆导出的,例如对数正态分布、t分布、F分布等
5、请你说明小概率原理的含义?在概率论中,我们将发生概率很小一般来说不超过百分之五的事务称为小概率事务,小概率原理指的是在假设检验中,我们提出一个假设,用小概率事务去检验,假如小概率事务发生了,证明我们的假设有问题
6、评价估计量的标准有哪些?并说明他们的含义在实际工作中,总体参数往往是未知的,须要运用样本统计量来估计总体参数衡量估计量优劣的标准一般有以下三个⑴无偏性无偏性不是要求估计量及总体参数不得有偏差,因为这是不行能的,既然是抽样,必定存在抽样误差,不行能及总体完全相同无偏性指的是假如对这同一个总体反复多次抽样,则要求各个样本所得出的估计量(统计量)的平均值等于总体参数符合这种要求的估计量被称为无偏估计量
(2)有效性估计量及总体之间必定存在着确定的误差,衡量这个误差大小的一个指标就是方差,方差越小,估计量对总体的估计也就越精确,这个估计量也就越有效⑶一样性一样性指的是当样本量慢慢增加时,样本的估计量(统计量)能够慢慢靠近总体参数
7、假设检验的理论基础和推理方法是什么?假设检验理论基础是小概率原理所谓小概率原理,就是认为小概率事务在一次试验中是几乎不行能发生的也就是说,对总体的某个假设是真实的,那么不利于或不能支持这一假设的事务A在一次试验中是几乎不行能发一的;要是在一次试验中事务A竟然发生了,我们就有理由怀疑这一假设的真实性,拒绝这一假设推理方法为显著性检验有时,依据确定的理论或阅历,认为某一假设hO成立,例如,通常有理由认为特定的一群人的身高听从正态分布当收集了确定数据后,可以评价实际数据及理论假设hO之间的偏离,假如偏离达到了“显著”的程度就拒绝hO这样的检验方法称为显著性检验偏离达到显著的程度通常是指定一个很小的正数a如
0.
050.01使当hO正确时,它被拒绝的概率不超过a称a为显著性水平这种假设检验问题的特点是不考虑备择假设,考虑试验数据及理论之间拟合的程度如何,故此时又称为拟合优度检验拟合优度检验是一类重要的显著性检验
8、请你说明拉氏指数及派氏指数的区分及联系?首先,由于拉氏指数和帕氏指数选取的同度量因素不同,即使利用同样的的资料编制指数,两者给出的计算结果一般会存在着差异其次,拉氏指数和帕氏指数的同度量因素水平和计算结果的不同,表明他们具有不完全相同的经济意义拉氏指数将同度量因素固定在基期,可以消退权数变动对指数的影响,从而使不现时期的指数具有可比性拉氏数量指标指数是假定在价格不变的条件下报告期销售量综合变动,它不仅可以单纯地反映出销售量的综合变动水平,也符合计算销售量综合变动,它不仅可以单纯地反映出销售量的综合变动水平,也符合计算销售量指数的实际要求帕氏指数将权数固定在报告期,不能消退权数变动对指数的影响,因而不同时期的指数缺乏可比性但帕氏指数可以同时反映价格和消费量结构的变动,具有较明显的经济意义
9、我国消费者价格指数和上海综合指数分别是用什么方法计算出来的?消费者价格指数.选择代表规格品,代表规格品的选择是在商品分类基础上进行的,每年可适当更换,但更换数量的比例有限制.选择调查市县和调查点选择的方法是划类选点地区的选择既要考虑代表性,也有留意合理性和稳定性调查市县和调查点的抽取都是接受按有关标记排队、等距抽取的方法确定的.价格的调查及计算代表规格品的平均价接受简洁算术平均法计算.权数的确定居民消费价格指数的权数由全国样本的10多万个城乡居民家庭消费支出构成确定.指数计算,总指数计算接受加权平均方法IP二ZiW/EW上证综合指数该指数自1995年7月15日起正式发布,以1990年12月19日为基日,基日为100点,以现在全部上市股票为样本,以报告期股票发行量为权数进行编制,计算公式为今日股价指数二今日市价总值/基日市价总值X100%
10、时间序列可分解成哪几个因素?时间序列可分解成4钟因素趋势(T)、季节性或季节波动(S)、周期性或循环波动(C)、随机性或不规则波动(Doa趋势是时间序列在长期内呈现出来的某种持续上升或持续下降的变动,也称长期趋势时间序列中的趋势可以是线性的,也可以是非线性的b季节性或季节波动,它是时间序列在一年内重复出现的周期性波动含有季节成分的序列可能含有趋势,也可能不含趋势c周期性也称循环波动,它是时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动周期性通常是由商业和经济活动引起的,它不同于趋势变动,不是朝着单一方向的持续运动,而是涨落相间的交替波动;也不同于季节变动,季节变动有比较固定的规律,而变动周期大多为一年而循环波动无固定规律,变动周期多在一年以上,且周期长短不一周期性通常是由经济环境的变更引起的d时间序列中除去趋势、周期性和季节性之后的偶然性波动,称为随机性波动f时间序列可分为加法模型或乘法模型等乘法模型Yi=TiXSiXCiXli加法模型Yi=Ti+Si+Ci+IiP值及显著性水平a有何区分和联系?显著性水平a是指在假设检验中原假设为真时却被拒绝的概率或风险,即假设检验中的弃真概率,它是依据检验的要求人为确定的P值是指当原假设为真时所得到的样本视察结果出现的概率,被称为实测出的显著性水平因此,在显著性检验中p值小于等于显著性水平,那么就要拒绝原假设;大于显著性水平,就不拒绝原假设因为当p〉时,(以t检验为例),t统计量值落在接受域所以接受原假设;pa时,t统计量值落在拒绝域所以拒绝原假设
12、当我们给出两支股票近一个月的股价走势后,你用什么统计方法选择应当投资哪一支股票(稳健投资者)?依据给出的两只股票近一个月的股价走势利用回来分析法拟合出它们个自的趋势线,然后分别对其回来系数进行显著性检验再依据其回来系数的显著性,就可以得出其各自的线性趋势显著性的结论比较其二者的显著性趋势,选择更具有显著性的那一只股票论述题(二选一,要有层次感和相应的例子)
1、“统计使人豁达,使人睿智,使人哲理,你怎样理解这几句话?说统计使人豁达,是因为统计总是把着眼点放在宏观大势的把握上,对个体数据如何处理,也取决于怎样科学的得到对总体的相识久而久之统计的训练使人宏观意识得到强化,遇到问题习惯将之放在时空的大背景中去考虑比如统计专业讲的总量指标,平均指标等等,都是从大方面讲、从大的方面把握,遇到个案的时候,就会从大的背景和环境考虑问题,看的比较透彻,从而举重若轻,只是统计使人豁达的重要因素另外,统计比较务实,追求实事求是,统计是搞数据,搞数据不能为所欲为,推断和说明问题都要靠数据说话所以统计不仅强调宏观的方位感,还特别留意具体的分寸感,这个分寸感就是工作和学问要做的实,仅说个或许不行这样,久而久之,搞统计的不论是想问题还是谈问题,就习惯于脚踏实地,就不会离谱走板统计能使人在宏观上和微观上如此行事,统计就简洁更豁达,更睿智,更聪慧统计作用凸显,既促进了经济社会发展,也带动自身素养提高经过细致收集、整理、分析的统计数字、统计分析、统计报告等资料被不断供应应有关部门和领导,为经济和社会更好更快发展做出了主动有效的贡献,“统计使人睿智、使人豁达、使人哲理”它使我们远离浮躁,远离权势,远离奢华,更加醒悟、理性相识世界
2、统计不是万能的,没有统计是万万不能的,你怎么理解?统计是指在确定统计理论指导下,接受科学的方法,搜集、整理、分析统计资料的一系列活动过程的总称它是随着人类社会的发展、治国和管理的需要而产生和发展起来的,至今已有四五千年的历史统计不是万能的,体现在如下的两个方面一,由于客观世界的发展变更,人类科学技术力气的有限,样本的选取方式或者偶发的人为失误,统计分析很难做到完全符合客观状况二,即使统计结果完全符合客观状况,但是,统计分析的是大量数据所呈现的一种规律,具体的某一次行为或某一个样本呈现的数据往往充溢了偶然性,面对这样的状况,统计并不是万能的三,即使能够精确的对某一事务作出预料,但是统计所能够发挥的作用依靠于信息运用者的主观看法,假如信息运用者不情愿运用统计所得出的信息,它也不是万能的四,世界是丰富多彩的,各门学科都有其发挥作用的地方,试想一下文学家在写作的时候,假如纠结于统计学上那个词语更简洁被受众接受而忽视了本身的写作习惯即使统计结果确定无疑,信息运用者也情愿运用所得出的统计结果是不是照旧很荒谬呢说了这么多,并不是说统计不重要,恰恰相反,没有统计是万万不能的,人类社会发展到今日,经济和社会等各种关系变得特别纷繁困难,政府、企业和公民为了做出正确的决策,须要对这种纷繁困难的关系和基本状况有所了解,而没有统计想完成这一目标几乎是不行能的统计已经深化人类生活的方方面面,具体体现在一,统计有助于相识和反映社会现象的特征和规律,为党政领导、相关部门供应精确、完整、系统的统计信息二,统计是企业管理的重要工具,统计能够加强监督、进行市场预料、揭露生产、经营管理中存在的问题和各种奢侈现象比如六西格玛原理三,统计是进行科学探讨的工具自然科学、社会科学、经济科学的理论探讨都是建立在对客观现象进行调查、探讨和概括的基础上的四,为社会公众了解状况,参及社会经济活动供应资料比如国家公布的经济增长率,CPI指数等计算题计算指数中的拉氏指数和帕氏指数?1指数的分类依据计算形式的不同分为简洁指数和加权指数指数依据反应指标的不同又分为数量指标指数和质量指标指产品计量单位出厂价格(元)产量基期报告期基期报告期A件
88.51350015000B个10111100010200C公斤6540004800广龈入Q
163.2〃
5.9-
7.P
9.2-101销售额口9531353一5口
56359.2602X
1.
03.
25.
97.
19.
210.8y
9.
431.
853.
556.
959.
260.1某管理局所属8家企业的产品销售数据企业编号.产品销售额万元.Xi销售利润万元X
12341702203904308.
112.
518.
022.
05678480650950100026.
540.
064.
069.0。