还剩2页未读,继续阅读
文本内容:
1,总体总体是根据研究目的确定的同质的研究对象的全体更确切地说,是性质相同的所有观察单位某种变量值的__2,样本医学研究中实际观测或调查的一部分个体称为样本3,参数用来描述总体特征的指标叫做参数4,统计量5,抽样误差抽样误差是指由于随机抽样的偶然周素使样本各单位的结构对总体各单位结构的代表性差别,而引起的抽样指标和全及指标之间的绝对离差如抽样平均数与总体平均数的绝对离差,抽样成数与总体成数的绝对离差等等6,概率7,小概率__8,定量资料定量资料是以数字形式表现出来的研究资料9,定性资料定性资料是以文字、图形、录音、录象等非数字形式表现出来的研究资料定性资料有两个来源——实地源和文献源10,正态分布指变量的频数或频率呈中间最多,两端逐渐对称地减少,表现为钟形的一种概率分布11,正态曲线高峰位于__(均数所在处),两侧逐渐降低且左右对称,不与横轴相交的光滑曲线图
3.1
(3)这条曲线称为频数曲线或频率曲线,近似于数学上的正态分布12,医学参考值范围医学参考值范围是指绝大多数正常人的人体形态、功能和代谢产物等各种生理及生化指标的波动范围这里的“绝大多数”可以是90%、95%或99%等,最常用的是95%所谓“正常人”不是指完全健康的人,而是指排除了影响所研究指标的疾病和有关因素的同质人群对于服从正态分布的指标,其参考值范围可根据正态分布曲线下__分布规律确定;对于不服从正态分布的指标,可先进行变量变换使之服从正态分布或直接利用百分位数法制定医学参考值范围制定某指标的医学参考值范围时,应根据专业知识确定计算双侧参考值范围或单侧参考值范围若一个指标过大或过小均属异常,则相应的参考值范围既有上限,又有下限,是双侧参考值范围;若一个指标仅过大属于异常,则参考值范围仅有上限;若一个指标仅过小属于异常,参考值范围仅有下限,即所谓单侧参考值范围13,置信区间总体率的估计包括点估计和区间估计点估计是直接用样本率来估计总体率,没有考虑抽样误差区间估计则考虑到抽样误差,按一定的概率1-α(即置信度为1-α)估计总体率的可能范围,此范围称为总体率的置信区间14,率15,构成比16,相对比17,相关系数18,回归系数19,统计推断statisticalinferen__通过样本指标来说明总体特征,这种通过样本获取有关总体信息的过程称为统计推断nonparametricstatistics非参数检验,针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体分布函数式是未知的,只知道总体分布是连续型的或离散型的,用于解决这类问题需要一种不依赖总体分布的具体形式的统计分析方法由于该方法不受总体参数的限制,故称为非参数检验,或称为不拘分布的统计分析方法,又称为无分布形式假定的统计分析方法
46、方差varian__是用来描述一组数据平均离散程度的指标,由离均差的平方和除以样本个数得到标准正态分布均数为0,标准差为1的正态分布被称为标准正态分布standardnor__ldistribution,通常记为N
01266、检验效能poweroftest1-β称为检验效能,它是指当两总体确有差别,按照规定的检验水准α所能发现该差异的能力
1、总体根据研究目的确定的同质的观察单位其变量值的__
2、计量资料又称为定量资料,指构成其的变量值是定量的,其表现为数值大小,有单位
3、抽样误差由于抽样造成的统计量与参数之间的差别,特点是不能避免的,可用标准误描述其大小
4、总体均数的可信区间按一定的概率大小估计总体均数所在的范围(CI)常用的可信度为95%和99%,故常用95%和99%的可信区间
1.总体总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的__总体可分为有限总体和无限总体总体中的所有单位都能够标识者为有限总体,反之为无限总体样本从总体中随机抽取部分观察单位,其测量结果的__称为样本(sample)样本应具有代表性所谓有代表性的样本,是指用随机抽样方法获得的样本
2.随机抽样随机抽样(randomsampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程随机抽样是样本具有代表性的保证
3.变异在自然状态下,个体间测量结果的差异称为变异(variation)变异是生物医学研究领域普遍存在的现象严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐
4.计量资料对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurementdata)计量资料亦称定量资料、测量资料.其变量值是定量的,表现为数值大小,一般有度量衡单位如某一患者的身高(cm)、体重kg、红细胞计数1012/L、脉搏(次/分)、血压(KPa)等计数资料将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(countdata)计数资料亦称定性资料或分类资料其观察值是定性的,表现为互不相容的类别或属性如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O四种血型的人数等等级资料将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinaldata)等级资料又称有序变量如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等等级资料与计数资料不同属性分组有程度差别,各组按大小顺序排列等级资料与计量资料不同每个观察单位未确切定量,故亦称为半计量资料5.概率概率probability又称几率,是度量某一随机__A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A__发生的可能性越大0﹤P(A)﹤1频率在相同的条件下,__重复做n次试验,__A出现了m次,则比值m/n称为随机__A在n次试验中出现的频率freqency当试验重复很多次时P(A)=m/n
2.概率是描述随机__发生可能性大小的数值,常用P表示随机__概率的大小在0与1之间,P越接近1,表示某__发生的可能性越大;P越接近0,表示某__发生的可能性越小习惯上将P≤
0.05的__,称为小概率__,表示在一次实验或观察中该__发生的可能性很小,可视为不发生
6.随机误差随机误差(randomerror)又称偶然误差,是指排除了系统误差后尚存的差它受多种因素的影响,使观察值不按方向性和系统性而随机的变化误差变量一般服从正态分布随机误差可以通过统计处理来估计抽样误差(samplingerror)是指样本统计量与总体参数的差别在总体确定的情况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量7.系统误差系统误差syste__ticerror是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值系统误差可以通过实验设计和完善技术措施来消除或使之减少8.随机变量随机变量(randomvariable)是指取指不能事先确定的观察结果随机量的具体内容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲,每个变量的取值服从特定的概率分布9.参数参数(para__ter)是指总体的统计指标,如总体均数、总体率等总体参数是固定的常数多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数10.统计量统计量(statistic)是指样本的统计指标,如样本均数、样本率等样本统计量可用来估计总体参数总体参数是固定的常数,统计量是在总体参数附近波动的随机变量
11.频数表(frequencytable)用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2…个病人的天数对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数
12.算术均数(arithmeticmean)描述一组数据在数量上的平均水平总体均数用μ表示,样本均数用X表示
13.几何均数(geometricmean)用以描述对数正态分布或数据呈倍数变化资料的水平记为G
14.中位数(median)Md将一组观察值由小到大排列,n为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值反映一批观察值在位次上的平均水平
15.极差(range)亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差
16.百分位数(per__ntile)是将n个观察值从小到大依次排列,再把它们的位次依次转化为百分位百分位数的另一个重要用途是确定医学参考值范围
17.四分位数间距(inter-quartilerange)是由第3四分位数和第1四分位数相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,较极差稳定
18.方差(varian__)方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到
19.标准差(standarddeviation)是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用
20.变异系数(coefficientofvariation)用于观察指标单位不同或均数相差较大时两组资料变异程度的比较用CV表示计算标准差/均数*100%
21.统计推断通过样本指标来说明总体特征,这种从样本获取有关总体信息的过程称为统计推断(statisticalinferen__)
22.抽样误差由个体变异产生的,抽样造成的样本统计量与总体参数的差异,称为抽样误差(samplingerror)
23.标准误及Xs通常将样本统计量的标准差称为标准误许多样本均数的标准差Xs称为均数的标准误(standarderrorofmean,SEM),它反映了样本均数间的离散程度,也反映了样本均数与总体均数的差异,说明均数抽样误差的大小
24.可信区间按预先给定的概率确定的包含未知总体参数的可能范围该范围称为总体参数的可信区间(confiden__interval,CI)它的确切含义是可信区间包含总体参数的可能性是1-α,而不是总体参数落在该范围的可能性为1-α
25.参数估计指用样本指标值(统计量)估计总体指标值(参数)参数估计有两种方法点估计和区间估计
26.假设检验中P的含义指从H0规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率
27.I型和II型错误I型错误(typeIerror),指拒绝了实际上成立的H0,这类“弃真”的错误称为I型错误,其概率大小用α表示;II型错误(typeIIerror),指接受了实际上不成立的H0,这类“存伪”的误称为II型错误,其概率大小用β表示
28.检验效能1-β称为检验效能(poweroftest),它是指当两总体确有差别,按规定的检验水准a所能发现该差异的能力
29.检验水准是预先规定的,当假设检验结果拒绝H0,接受H1,下“有差别”的结论时犯错误的概率称为检验水准(levelofatest),记为α
30..率(rate)又称频率指标,说明一定时期内某现象发生的频率或强度计算公式为发生某现象的观察单位数/可能发生某现象的观察单位总数*100%,表示方式有百分率(%)、千分率(‰)等
31.构成比(proportion)又称构成指标,说明某一事物内部各组成部分所占的比重或分布计算公式为某一组成部分的观察单位数/同一事物各组成部分的观察单位总数*100%,表示方式有百分数等
32.比(ratio)又称相对比,是A、B两个有关指标之比,说明A是B的若干倍或百分之几计算公式为A/B,表示方式有倍数或分数等
33.非参数统计针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体分布的函数式是未知的,只知道总体分布是连续型的或离散型的,用于解决这类问题的一种不依赖总体分布的具体形式的统计分析方法由于这类方法不受总体参数的限制,故称非参数统计法(non-parametricstatistics),或称为不拘分布(distribution-freestatistics)的统计分析方法,又称为无分布型式假定(assumptionfreestatistics)的统计分析方法
34.参数统计通常要求样本来自总体分布型是已知的(如正态分布),在这种假设的基础上,对总体参数(如总体均数)进行估计和检验,称为参数统计parametricstatistics
35.秩次变量值按照从小到大顺序所编的秩序号称为秩次(rank)
36.秩和各组秩次的合计称为秩和(ranksum),是非参数检验的基本统计量
37.直线回归(linearregression)建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小直线回归是回归分析中最基本、最简单的一种,故又称简单回归(______regression)
38.回归系数(regressioncoefficient)即直线的斜率slope,在直线回归方程中用b表示,b的统计意义为X每增(减)一个单位时,Y平均改变b个单位
39.相关系数r用以描述两个随机变量之间线性相关关系的密切程度与相关方向的统计指标卫生统计学中的概念资料的类型、总体和样本、参数和统计量、概率和频率
(一)资料的类型
1.定量资料亦称计量资料,其变量值是定量的,表现为数值大小,一般有度量衡单位,如调查某年某地7岁女童的生长发育状况,以人为观察单位,女童的身高(cm)、体重(kg)、血红蛋白(g/L)等均属定量资料
2.定性资料亦称分类资料,其观察值是定性的,表现为互不相容的类别或属性,分为两种情况
(1)无序分类资料包括
①二项分类如调查吸毒者的HIV感染情况,结果分为阳性与阴性两类,表现为互不相容的两类属性
②多项分类如人类的AB0血型,以人为观察单位,结果分为A型、B型、AB型与O型,表现为互不相容的多个类别
(2)有序分类资料各类之间有程度的差别,给人以“半定量”的概念,亦称等级资料如测定某人群某血清学反应,以人为观察单位,结果可分“-”、“±”、“+”、“++”4级;又如观察某药治疗十二指肠溃疡的疗效,以每个患者为观察单位,治疗效果分为痊愈、显效、好转、无效4级
(二)总体和样本 总体就是所有同质观察单位某种观察值(即变量值)的__样本是总体中随机抽取部分观察单位的观测值的__
(三)参数和统计量 总体的数值特征称为参数,用希腊字母表示根据样本算得的某些数值特征称为统计量,用英文字母表示在抽样研究中,由个体变异产生,随机抽样引起的样本统计量与总体参数之间的差别称为抽样误差
(四)概率和频率 概率是描述随机__发生可能性大小的数值,常用P表示随机__概率的大小在0与1之间,P越接近1,表示某__发生的可能性越大;P越接近0,表示某__发生的可能性越小习惯上将P≤
0.05的__,称为小概率__,表示在一次实验或观察中该__发生的可能性很小,可视为不发生 在现实中,随机__的概率往往是未知的,因此,当观测单位足够多时,常用样本中__的实际发生率来估计总体概率,这种实际发生率称为频率设在相同条件下,__重复进行n次试验,__A出现t次,则__A出现的频率为t/n.如治疗200例患者,120名患者治愈,治愈率为60%,这就是一个频率当观测单位较少时,用频率估计概率是不可靠的。