医学统计学考试重点
医学统计学复习重点
整理分析和2.计描述4.(集合)。
1.抽样随机2.分组随机3.实验顺序随机。
称全距,用离散系数,为标准差与均数只比,常:CV=s/x究,1.抽样研究2.个体变异。
系统误差:指数据搜集和测量过程中由于仪器不准确、造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差由于一些非人真实性(validity):观察值与真值的接近程度,受系统误差的影响( (reliabiliy)——也称精密度(precision)或重复性(repeatability)是直接用样本统计量作为对应的总体参数最常用的是95%10095有5在描述两变量间的关系时,若散点图呈直线趋势或有直线相关关系,可进行直线回归分析。
参数:根根据样本的分布特征而计算得到的1、★医学统计学工作基本步骤:统计设计;收集资料.;整理资料;分析资料2、★统计分析包括:统计描述、统计推断3、频数分布的两个重要特征:集中趋势和离散趋势4、正态分布的两个参数:均数;标准差。
5、★频数表的用途:揭示计量资料的分布类型;揭示计量资料的分布特征;便于发现特大值和特小值;便于进一步进行统计分析★常见的统计资料的类型有:计量资料;计数资料;等级资料7、★t检验的应用条件是:①正态分布:当样本含量较小时,要求样本来自正态总体。
②方差齐性:两样本均数比较时,要求两总体方差相等。
U检验的应用条件是:①大样本(如n>50);②小样本,σ已知且样本来自正态总体。
8、★.描述分类变量常用的指标有率、构成比、相对数。
9、率是指某种现象在一定条件下,实际发生的观察单位数与可能发生该现象的总观察单位数之比,常用来描述某种现象发生的频率大小或强度构成比是指一事物内部某一组成部分的观察单位数与该事物各组成部分的观察单位总数之比,常用来描述某一事物内部各组成部分所占的比重或分布。
10、★四格表卡方专用公式应用条件n≥40,且Tmin≥5 研究事物或现象间的线性关系用相关分析,研究事物或现象间的线性数量依存关系用回归分析。
医学统计学考试重点资料
一、名解:1、定量资料:以定量值表达每个观察单位的某项观察指标2、定性资料:以定性方式表达每个观察单位的某项观察指标3、等级资料:以等级方式表达每个观察单位的某项观察指标4、总体:是指按研究目的所确定的研究对象中所有观察单位某项指标取值的集合。
5、样本:是指从研究总体中随机抽取具有代表性的部分观察单位某项指标取值的集合。
6、参数:描述某总体特征的指标称为总体参数。
7、统计量:描述某样本特征的指标称为样本统计量。
8、小概率事件:当某事件发生的概率小于或等于0.05时,统计学上称该事件为小概率事件9、小概率原理:其涵义为该事件发生的可能性很小,进而认为其在一次抽样中不可能发生,此即为小概率原理。
小概率原理是进行统计推断的依据。
(8&9常写在一起)10∙变异,是以具有同质性的观察单位为载体,某项观察指标在其单位之间显示的差别。
11标准化率:用统一的标准对内部构成不同的各组频率进行调整和对比,对比后的率为标准化率。
12参考值范围:又称正常值范围,大多数人正常人某观察指标所在的范围。
由于正常人的形态、功能、生化等各种指标的数据因人而异,而且同一个人的某些指标还会随着时间、机体内外环境的改变而变化,因此需要确定其波动范围,即正常值范围,简称正常值。
13、抽样误差:由抽样引起的样本统计量与总体参数间的差别。
14、中心极限定理:①从均数为U,标准差为。
的总体中独立随机抽样,当样本含量?增加时,样本均数的分布将趋于正态分布,均数为标准差为。
X②从非正态分布的总体中随机抽样,只要样本含量足够大,样本均数趋于正态分布。
15、统计推断:就是根据样本所提供的信息,以一定的概率推断总体的性质。
16、区间估计/参数估计/可信区间:包括点估计和区间估计,由样本信息估计总体参数。
按一定的概率或可信度(La)用一个区间估计总体参数所在范围。
这个范围称作可信度为l-α的可信区间(ConfidenCeinterval,Cl),又称置信区间。
医学统计学重点
医学统计学重点说明:本重点仅供参考:不能包括所有选择题考题,名词和简答可信度高,计算题熟练运算过程;同时自己要清楚各种检验方法的基本思想,重点程度与星号数量相关)一、名词解释1、★★★医学统计学:用概率论和数理统计方法研究医学事件的群体特征的一门方法。
2、★总体:根据研究目的确定的同质的研究对象的全体(集合)。
3、样本:从总体中随机抽取的部分研究对象。
4、随机:总体中每个个体有同等的机会进入样本。
5、系统误差:指数据搜集和测量过程中由于仪器不准确、标准不规范等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。
6、随机误差:由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的。
7、★★抽样误差:由于抽样原因造成的样本指标与总体指标之间的差,或者是样本指标与样本指标之间的差。
8、准确度(accuracy)或真实性(validity):观察值与真值的接近程度,受系统误差的影响(9、可靠度(reliabiliy)——也称精密度(precision)或重复性(repeatability):重复观察时观察值与其均值的接近程度,受随机误差的影响。
10、★★★小概率事件:一般常将p ≤ 0.05或p ≤ 0.01称为小概率事件,表示某事件发生的可能性很小。
通俗讲一次抽样是不可能发生的事件。
11、★★正态分布定:又称高斯分布,是一条中间高,两头低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。
12、★★医学参考值范围:指绝大多数正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。
最常用的是95%参考值范围。
13、★★标准误:用于反映均数抽样误差大小的指标,也叫样本均数的标准差,它反映了样本均数之间的离散程度。
14、★95%的可信区间:如果从同一总体中重复抽取100个独立样本,将可能有95个可信区间包括总体均数,有5个可信区间未包括总体均数。
二、填空题1、★医学统计学工作基本步骤:统计设计;收集资料.;整理资料;分析资料2、★统计分析包括:统计描述、统计推断3、频数分布的两个重要特征:集中趋势和离散趋势4、正态分布的两个参数:均数;标准差。
医学统计学重点重点知识总结
医学统计学重点选择1.几何均数:平均血清抗体滴度(如P9例2.4)2.正态分布:横轴为μ(界值、面积)2.5% I1.962.5%单侧双侧90%: 1.6495%: 1.64 1.9699%: 2.583.P值与α的关系,α是人为规定的,它们之间没有关系;P值f,Qt(X)4.方差分析自由度V的计算,V总=nT;V组间=组数(k)-1;V组间=V总-V组间5.理论秩和(n(n+1)∕2),实际秩和(通过平均秩次算)6.可信区间的正确应用:总体参数有95%的可能落在该区间内(X);有95%的总体参数在该区间内(X);该区间包含95%的总体参数(X);该区间有95%的可能包含总体参数。
(X);这个区间的可信度为95%(√);总体参数只有一个,要么在区间内,要么不在7.相关系数与回归系数:相关系数为0,两个变量之间没有相关关系(X);回归系数t,相关系数t(X);(要做假设检验)二、名解1.参考值范围:根据正常人的数据估计绝大多数的正常人所在的范围2.区间估计(可信区间):按一定的概率或可信度(bα)用一个区间估计总体参数所在范围。
这个范围称作可信度为1-a的可信区间,又称置信区间。
3.P值:拒绝HO时所冒的风险(或“作出拒绝HO而接受H1”结论时冒了P风险)4.a(第一类错误):HO真实时被拒绝(或HO真实时,拒绝H0,接受H1)5.β(第二类错误):HO不真实时不拒绝(或HO不真实时,不拒绝HO)1-β检验效能:对真实的H1做肯定结论之概率6.秩次:是指全部观察值按某种顺序排列的位序;7.秩和:同组秩次之和8.剩余标准差:扣除了X的影响后,Y方面的变异;引进回归方程后,Y方面的变异。
三、简答1.假设检验与可信区间的联系与区别分辨多个样本是否分别属于不同的总体,并对总体作出适当的结论。
分辨一个样本是否属于某特定总体等。
区间估计(可信区间):按一定的概率或可信度(1-a)用一个区间估计总体参数所在范围。
医学统计学重点官方版
一:基本概念:1.参数:反映总体的统计指标。
2. 统计量:反映样本的统计指标称为统计量。
3. 概率:描述随机事件发生的可能性的大小的一个量度4.小概率事件:把p小于等于0.05或小于等于0.01的随机事件。
资料类型:计量资料,计数资料,等级资料。
医学统计的基本步骤:研究设计,收集资料,整理资料,分析资料,结果报告与结论表达。
二:变量分布:1.正态分布:指变量的频数或频率呈中间最多,两端逐渐对称地减少,表现为钟形的一种概率分布。
特征:(1)正态分布曲线是单峰,对称,钟形曲线,X=μ时曲线达到最高峰。
(2)正态曲线有两个参数,总体均数μ和总体标准差σ,μ越大曲线右移,越小左移,故称位置参数,σ越小曲线越瘦高,越大曲线越矮胖,故称形状参数。
(3)正态分布曲线下的面积分布具有一定的规律。
P80页。
应用:(1)质量控制(2)是统计学的理论基础(3)制定医学参考值范围制定医学参考值范围:包括绝大多数正常人的人体形态功能和代谢反应等各种生理生化指标的波动范围,是作为判定某项指标正常与否的参考标准。
方法:确定正常人对象的范围,统一测量标准,确定分组,样本含量确定,确定参考值范围的但双侧,确定百分界值,医学参考值范围的估计。
2.二项分布特征:(1)二项分布的图形:当π=0.5时图形对称,π≠0.5时,图形呈偏态,且当n的含量增大时,图形趋于对称。
(2)二项分布的均数与标准差:μ=n π;σ²=nπ(1-π);σ=根号下nπ(1-π)(3)二项分布的正态近似:当n无限增大时越趋近于正态分布。
应用:对立性,独立性,重复性三:统计分析:㈠1.统计描述:图表和指标(1)图表:频数分布图分为正偏态和负偏态,长尾向右侧延伸为正偏态,向左侧延伸为负偏态。
频数分布的特点:集中趋势和离散趋势。
(2)指标:分为计数指标和计量指标。
计数指标:相对数。
应用相对数的注意事项:①计算相对数时分母不宜太小②观测单位数不等的几个率不能直接想加求其合计率③资料对比时注意可比性④资料分析时不能以构成比代替率⑤考虑存在抽样误差计量指标:1.集中趋势:①算数均数χ:适用于对称分布资料,特别是正态或近似正态分布的计量资料。
医学统计学复习重点
医学统计学复习重点统计设计:调查设计、实验设计第一章绪论1.基本概念:总体——根据研究目的确定,所有同质观察单位某种观察值的全体。
样本——总体中抽取的一部分具有代表性的个体组成的集合。
参数-—刻画总体特征的统计指标。
一般用希腊字母表示μ、σ、π统计量—-刻画样本特征的统计指标.抽取的样本不同,统计量会变化;一般用拉丁字母或英文字母表示、S、p抽样误差:个体变异所致,抽样研究中样本信息与总体特征间的差异。
抽样误差是不可避免的。
属于随机误差,无方向性,重复抽样可以呈现一定的规律性。
小概率事件P≤0。
052.*统计工作的四个步骤:设计、收集资料、整理资料、分析资料。
(用工作实例解释)第二章调查研究设计第三章实验研究设计1.调查研究(观察性研究):特点:无人为施加处理因素调查研究的分类:按调查涉及的对象划分:全面调查(普查)、抽样调查、典型调查注意:收集的资料要有可比性*随机抽样方法(做统计推断有意义):单纯随机抽样、系统抽样、分层抽样、整群抽样非随机抽样方法(不能做统计推断,可能有偏差):偶遇抽样、判断抽样、滚雪球抽样等2.实验研究特点:与调查研究最本质的区别:根据研究目的主动施加干预措施实验设计的三个基本要素:受试对象、处理因素、实验效应实验设计的基本原则:对照原则、随机化原则、重复原则第四章定量资料的统计描述第五章定性资料的统计描述1.定量资料(1)定量资料——*频数分布表、直方图、箱式图—-判断分布类型——(2)描述离散趋势的统计指标:✓极差R=最大值—最小值、✓四分位数间距Q:常用于描述*偏态分布资料的离散趋势、一端或两端无确切值的资料、分布不明确资料✓方差(总体、样本S2)&标准差(、S):*正态或近似正态分布✓变异系数(3)(4)正态分布及其应用:**制定医学参考值范围步骤:判断分布类型-—正态分布-—*双侧95%参考值范围:±1.96S、单侧95%参考值范围:下限为—1。
64S、上限为+1。
医学统计学重点简答题
一、平均水平常用的统计指标及其适用范围?常用统计指标包括算术均数,几何均数,中位数。
算术均数适用于对称分布,特别是正态分布的数据;几何均数适用于经对数变换后频数分布对称或呈等比级数的数据;中位数主要适用于三种情形:①非正态分布资料(对数正态分布除外)。
②频数分布的一端或两端无确切数据的资料。
③总体分布不清楚的资料。
二、应用相对数的注意事项1.计算相对数时应有足够的观察单位数。
例数太少会使相对数波动较大,这种情况下最好用绝对数表示。
2。
正确计算合计率. 计算观察单位不等的几个率的合计率(平均率)时,不能将几个率直接相加求其平均率,而应分别将分子分母合计,再求出合计率。
3不能以构成比代替率. 构成比说明事物内部各部分所占的比重,不能说明某现象发生的频率或强度.4.注意资料的可比性。
在比较相对数时,除了要比较的因素外,其余的因素应尽可能相同或相近。
5。
样本率或构成比的比较应做假设检验. 由于样本率或构成比也存在抽样误差,比较两个或多个率或构成比时,不能凭样本率或构成比的差别作出结论,而必须进行差别的假设检验。
三、正常值范围与置信区间的区别四、标准误与标准差的区别与联系.区别点标准误标准差含义样本均数的标准差,描述样本均数的抽样误差,即样本均数与总体均数的接近程度。
描述个体间的变异程度计算公式1k)xx(s2x--=∑---1n)xx(s2--=∑-用途总体均数的区间估计医学参考值范围估计相似点性质相似,都是用来说明变异程度五、简述四格表卡方检验统计方法的选择条件六、行×列表资料χ²检验的注意事项1。
行×列表资料中各格的理论频数T均不应小于1,并且1≤ T<5的格子数不宜超过格子总数的1/5,否则可能产生偏性。
处理的方法有三种:①增大样本含量,使理论频数增大;②根据专业知识,删去理论频数太小的行或列或将理论频数太小的行或列与性质相近的邻行或邻列合并。
③改用双向无序R×C表的Fisher确切概率法。
医学统计学重点
医学统计学重点医学统计学是医学领域中不可或缺的一门学科,它借助数理统计方法研究医学数据和临床试验的结果,为医学决策提供可靠的依据。
以下是医学统计学的几个重点内容。
一、描述统计学描述统计学是医学统计学的基础,主要研究如何分类、整理和描述医学数据。
其主要方法包括测量尺度、频率分布表、中心趋势测量和变异程度测量。
1. 测量尺度在医学统计学中,常见的测量尺度包括名目尺度、有序尺度和数值尺度。
名目尺度适用于无序分类的变量,有序尺度适用于有序分类的变量,而数值尺度适用于具有度量意义的变量。
2. 频率分布表频率分布表用来展示变量的分布情况,主要包括类别、频数和频率等内容。
通过频率分布表,可以直观地了解变量的分布状况。
3. 中心趋势测量中心趋势测量主要包括平均数、中位数和众数。
平均数是所有观测值的总和除以观测值的个数,中位数是将观测值按大小排列后的中间值,众数是出现次数最多的观测值。
4. 变异程度测量变异程度测量用来描述数据的分散程度,主要包括极差、方差和标准差。
极差是最大观测值与最小观测值之间的差异,方差是观测值与均值之间的差异的平方的平均数,标准差是方差的平方根。
二、推断统计学推断统计学是医学统计学的核心内容,主要研究如何通过样本数据推断总体参数,并对假设进行检验。
其中包括参数估计、假设检验和置信区间等方法。
1. 参数估计参数估计是利用样本数据估计总体参数,常用的方法有点估计和区间估计。
点估计是通过样本数据得到一个单一的数值作为总体参数的估计值,区间估计是通过样本数据得到一个范围作为总体参数的估计区间。
2. 假设检验假设检验是用来检验某个陈述是否与观察数据相符的方法。
在医学研究中,研究者常常根据实验数据对研究假设进行检验,以确定是否有统计显著性。
3. 置信区间置信区间是对总体参数的一个范围估计。
置信区间的计算方法与区间估计相似,通过对样本数据进行分析计算得到。
三、生存分析生存分析是医学统计学中的一个重要分支,主要研究疾病患者的生存时间和生存率等问题。
(完整版)医学统计学复习要点
..第一章绪论1、数据/资料的分类:①、计量资料,又称定量资料或者数值变量;为观测每个观察单位某项治疗的大小而获得的资料。
②、计数资料,又称定性资料或者无序分类变量;为将观察单位按照某种属性或者类别分组计数,分组汇总各组观察单位数后而得到的资料。
③、等级资料,又称半定量资料或者有序分类变量。
为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。
2、统计学常用基本概念:①、统计学(statistics )是关于数据的科学与艺术,包括设计、搜集、整理、分析和表达等步骤,从数据中提炼新的有科学价值的信息。
②、总体(population )指的是根据研究目的而确定的同质观察单位的全体。
③、医学统计学(medical statistics ):用统计学的原理和方法处理医学资料中的同质性和变异性的科学和艺术,通过一定数量的观察、对比、分析,揭示那些困惑费解的医学问题背后的规律性。
④、样本(sample ):指的是从总体中随机抽取的部分观察单位。
⑤、变量(variable ):对观察单位某项特征进行测量或者观察,这种特征称为变量。
⑥、频率(frequency ):指的是样本的实际发生率。
⑦、概率(probability):指的是随机事件发生的可能性大小。
用大写的P 表示。
3、统计工作的基本步骤:①、统计设计:包括对资料的收集、整理和分析全过程的设想与安排;②、收集资料:采取措施取得准确可靠的原始数据;③、整理资料:将原始数据净化、系统化和条理化;④、分析资料:包括统计描述和统计推断两个方面。
第二章计量资料的统计描述1. 频数表的编制方法,频数分布的类型及频数表的用途①、求极差(range ):也称全距,即最大值和最小值之差,记作R ;②、确定组段数和组距,组段数通常取10-15组;③、根据组距写出组段,每个组段的下限为L ,上限为U ,变量X 值得归组统一定为L ≤X <U ,最后一组包括下限。
医学统计学重点
<<医学统计学>>重点1. 总体:根据研究的目的确定的同质研究对象中所有的观察单位变量值的集合。
2. 样本:按随机化原则从同质总体中随机抽取的部分观察单位某变量值的集合。
3. 同质:影响究指研标的主要因素易控制的因素基本上相同。
4. 抽样误差:在抽样研究中,由于变异的存在,即使在同一总体中抽取的几个样本,各样本统计量往往不等。
样本统计量与总体参数也不等,这种由于抽样研究所至样本之间和样本与总体之间的差异称为。
5. 变量:观察指标在统计学上统称为指标变量,它反应的是生物个体间的变异情况,根据其性质可分为定性变量(分类)和定量变量(连续)。
6. 截尾数据:生存时间观察过程被人为的截止称为截尾,又称删失或终检。
原因:失访/退出/终止(研究时限已到而终止观察)。
7. 卡方基本思想:X2分布是一种连续型分布,可用于检验资料的实际频数和按检验假设计算的理论频数是否相等等问题。
X2反应实现了实际频数与理论频数的吻合程度。
如果检验假设成立,则A-T一般不大,X2应很小,即出现大X2值概率很小。
即X2越大,P越小,若P≤a时,就怀疑假设的成立,拒绝H0。
若P>a则没有理由拒绝H0。
8. X2用途:(1)实际频数与拟合频数拟合优度:A推断两个或两个以上总体率或构成比有无差别(四格表/行x列表)。
B两变量之间有无相互关系。
C频数分布的拟合优度检验(判断次样本是否来自某种分布)。
(2)某些分布可用X2近似。
(3)间接应用:如t分布和F分布就是在X2分布基础上推导出来的。
9. 方差分析的基本思想:根据研究目的和设计类型,把总体变异中离均差平方和分解成两部分或更多部分,也把总变异中的自由度相应分成两部分或更多部分,然后再进行比较,评价由某种因素引起的变异是否具有统计学意义。
10. 假设检验中P,a,b(倍他)的关系及统计学意义:a:检验水准,即显著性检验,在此概率之下的认为是小概率事件,统计学上以为此事件“不可能发生”,以此判断是否不拒绝H0无效假设,在假设检验中,按a检验水准,拒绝了原来正确的H0,即犯了第1类错误,犯此错误的概率为a。
医学统计学大题重点知识总结
一、描述集中位置的指标应用适用范围【筒】平均数:算数均数、几何均数、中位数、百分位数。
1、算数平均数:适用于单峰对称分布或近似于单峰对称分布的资料2、几何均数:适用于对数变换后单峰对称的资料。
eg∙等比资料、滴度资料、对数正态分布资料3、中位数:理论上可用于任何分布资料•,但当资料适合计算均数或几何均数时,不宜用中位数。
Eg:偏态分布、分布不明资料、有不确定值的资料.4、百分位数:适用于任何分布的资料。
二、描述离散趋势的指标【简】变异度:极差、四分位数间距、标准差、方差、变异系数。
1、极差:又称全距,是一组数据中最大值和最小值之差。
极差大说明资料的离散度大。
优点:简单明了缺点:不灵敏和不稳定。
样本例数相差悬殊时,不适宜比较其极差。
2、四分位数间距:即中间一半观察值的极差。
四分位数间距较全距稳定,常与中位数一起,描述不对称分布资料的特征。
3、标准差:基本内容是离均差,它显示一组变量值与其均数的间距,故标准差直接地、总结地、平均地描述了变量值的离散程度。
在同质的前提下,标准差大,表示变量值的离散程度大,即变量值的分布分散、不整齐、波动较大;标准差小,表示变量值的离散程度小,即变量值的分布集中、整齐、波动较小。
4、方差:利用了所用的信息,与变异度和变量值的个数有关。
5、变异系数(CV):变异系数派生于标准差,其应用价值在于排除了平均水平的影响,并消除了单位。
三、正态分布特征1、单峰分布;高峰在均数处;2、以均数为中心,均数两侧完全对称。
3、正态分布有两个参数(Parameter),即位置参数_(均数)和变异度参数_(标准差)。
4、有些指标本身不服从正态分布,但经过变换之后可以服从正态分布。
5、正态曲线下的面积分布有一定的规律。
四、参考值范围(含义+原则)【简】1、含义:(1)又称正常值范围,是绝大多数正常人的某观察指标所在的范围。
绝大多数:90%,95%,99%等等。
(2)确定参考值范围的意义:用于判断正常与异常。
(完整版)医学统计学重点总结
1.简述总体和样本的定义,并且举例说明。
总体是研究目的确定的所有同质观察单位的全体。
样品是从研究总体中抽取部分有代表性的观察单位。
2.简述参数和统计量的定义,并且举例说明。
描述总体特征的指标称为参数,描述样本特征的指标称为统计量。
3.变量的类型有哪几种?举例说明各种类型变量有什么特点。
①定量数据:计量资料;定量的观测值是定量的,其特点是能够用数值的大小衡量其水平的高低。
②定性数据:计数资料;变量的观测值是定性的,表现为互不相容的类别或属性。
③有序数据:半定量数据/等级资料;变量的观测值是定性的,但各类别(属性)有程度或顺序上的差异。
4.请举例说明一种类型的变量如何变换为另一种类型的变量。
定量数据>有序数据>定性数据--------------->5.请简述什么是小概率事件?概率是描述事件发生可能性大小的度量,P 0.05事件称为小概率事件。
≤6.举例说明什么是配对设计。
配对设计是将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理。
①同源配对:同一受试对象或同一标本的两个部分,随机分配接受两种不同处理;②异源配对:为消除混杂因素的影响,将两个同质受试对象配对分别接受两种处理。
7.非参数假设检验适合什么类型数据进行分析?①总体分布类型未知或非正态分布数据;②定量或半定量数据;③数据两端无确定的数值。
8.简述P 25 P 50 P 75的统计学意义。
(条件:明显偏态且不能转化为正态或近似对称;一端或两端无确定数值;分布情况未知)用来描述资料的观测值序列在某百分位置的水平,四分位数间距可以作为说明个体差异的指标(说明个体在不同位置的变异情况)。
9.直条图、直方图、圆饼图的使用条件是什么?直条图:各自独立的统计指标的数值大小和他们之间的对比;直方图:连续变量频数分布情况;圆饼图:全体中各部分所占的比例。
10.统计分析包括哪两个方面的内容?为什么要进行统计推断?统计描述和统计分析;统计描述用来描述及总结一组数据的重要特征,其目的是使实验或观察得到的数据表达清楚并便于分析。
医学统计学期末考试重点
1. 用样本均数推论总体均数95%可信区间的公式是(总体标准差未知且样本量较小) A x v s t x ,05.0±2. 两个样本均数比较t 检验(α=0.05),当|t|>t 0.05,(ν)时: E 接受备择假设3. 两个样本均数比较t 检验(α=0.05),当|t|>t 0.05,(ν)时,统计结论为 CC 两总体均数不同 4. 两个样本均数比较t 检验,分别取以下检验水准,其中第二类错误最小的是 BA α=0.05B α=0.2C α=0.1D α=0.035.两个样本均数比较t 检验,无效假设是 DD 两总体均数相等6. 两个样本均数比较t 检验(α=0.05),当“拒绝H0,接受H1”时,P 值越小 EE 越有理由认为两总体均数不同7. 两个样本均数比较t 检验时,每个变量同时加上一个不为“0”的常后,其t 值 AA 变大 8. 检验效能是指A αB 1- αC βD 1-βE 以上都不对9. 第一类错误是指 A 拒绝实际上成立的H010. 第二类错误是指 D 接受实际不成立的H111. 要使两类错误同时减少的方法是 AA 增加样本量 12. 以下何种情况进行单侧检验 AA 已知A 药肯定优于B 药 13. 以下何种情况进行单侧检验 AA 已知21χχ> 14. 在进行t 检验时,P 值和α值的关系 EE α值是研究者事先确定的15. 在配对t 检验中 EE 当不拒绝H0时,差值的总体均数可信区间一定包含016.统计中所说的总体是指: AA 根据研究目的确定的同质的研究对象的全体17.概率P=0,则表示 BB 某事件必然不发生 18.抽签的方法属于 DD 单纯随机抽样 19.测量身高、体重等指标的原始资料叫:BB 计量资料 20.某种新疗法治疗某病患者41人,治疗结果如下:治疗结果 治愈 显效 好转 恶化 死亡治疗人数 8 23 6 3 1该资料的类型是: D 有序分类资料21.样本是总体的 C 有代表性的部分 22.将计量资料制作成频数表的过程,属于统计工作哪个基本步骤: C 整理资料23.统计工作的步骤正确的是 C 设计、收集资料、整理资料、分析资料24.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:BB 系统误差25.以下何者不是实验设计应遵循的原则 D 交叉的原则26.表示血清学滴度资料平均水平最常计算 B 几何均数27.某计量资料的分布性质未明,要计算集中趋势指标,宜选择 C M28.各观察值均加(或减)同一数后: B 均数改变,标准差不变29.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、10、2、24+(小时), 问该食物中毒的平均潜伏期为多少小时? C 630.比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是: D 变异系数31.下列哪个公式可用于估计医学95%正常值范围 A X±1.96S32.标准差越大的意义,下列认识中错误的是 B 观察个体之间变异越小33.正态分布是以 E 均数为中心的频数分布34.确定正常人的某项指标的正常范围时,调查对象是B排除影响研究指标的疾病和因素的人35.均数与标准差之间的关系是E标准差越小,均数代表性越大36.从一个总体中抽取样本,产生抽样误差的原因是A总体中个体之间存在变异37.两样本均数比较的t检验中,结果为P<0.05,有统计意义。
(完整word版)医学统计学考试重点(人卫第七版)
1、同质:是指观察单位或观察指标受共同因素制约的部分2、观察单位:亦称个体,是统计研究中最基本的单位3、变异:在同质的基础上个体间的差距4、总体:根据研究目的所确定的同质观察单位的全体,既是同质的所有观察单位某项观察值的集合5、有限总体:总体若受一定的时间和空间控制,其观察单位数是有限的,称为有限总体无限总体:理论上其观察单位数是无法穷尽的6、样本:是指从总体中随机抽取部分观察单位其某项指标实测值的集合7、抽样:从总体中抽取部分个体的过程称为抽样8、抽样必须遵循随机化原则,即总体中每一个体都有同等的机会被抽取到9、抽样研究的方法,利用样本的信息推论总体的特征来达到研究目的10、参数:描述总体特征的量11、统计量:根据样本个体值计算得到的描述样本特征的量12、总体参数是常数,而样本统计量可随样本不同而不同13、随机误差:指一类不恒定、随机变化的误差,有多种尚无法控制的因素所引起14、抽样误差:指抽样引起的样本统计量与总体参数之间的差异15、系统误差:在实际观测过程中,由于仪器未校正、观测者感官的某种倾向、研究者掌握的标准偏高或偏低等原因,使观察值不是随机分散在真值两侧,而是具有方向性、系统性或周期性的偏离真值,这类误差称为系统误差16、过失误差:指各种失误所导致的误差17、随机事件:在一定条件下某一现象可能发生也可能不发生的事件18、概率:反映某一随机事件发生可能性大小的量,用符号P表示19、小概率事件:统计学上一般把P≤0。
05的事件称为小概率事件,表示某事件发生的可能性很小20、变量:观察单位的某个特征21、变量值:变量的观察结果或测定值22、按变量值是定性的还是定量的,可将变量分为数值变量和分类变量23、数值变量又称定量变量,其变量值是用定量方法测得的,所的资料是计量资料24、分类变量又称定性变量,其变量值是用定性方法测得的25、分类变量根据类别是否有程度上的差别,可分为无序分类变量(构成的资料为计数资料)和有序分类变量(所得资料为等级资料)25、医学统计工作的基本步骤:一、设计;二、收集资料;三、整理资料;四、分析资料26、统计表和统计图是描述统计资料的重要工具27、统计表的结构:①标题位于统计表的上中方②标目用来说明表内各纵横数字的含义,注意标明指标的单位。
医学统计学考试重点归纳
χ2分布的特点:χ2分布是一种连续型分布,其形状依赖于自由度ν的大小:①当自由度ν≤2时,曲线呈L型;②随着ν的增加,曲线逐渐趋于对称;③当自由度ν→∞时,χ2分布趋向正态分布。
假设检验的基本思想:先提出假设(例:参数相等),在假设成立的前提下考察实际抽到的样本是否属于小概率事件,由此对提出的假设进行验证。
若属于小概率事件,则拒绝该假设;否则不拒绝该假设。
方差分析的基本思想:按照研究目的和设计类型,将观察值总变异的离均差平方和(SS)和自由度(γ)分别分解成若干个部分,并用每一部分的均方(MS=SS/γ)作为反映变异的指标。
其中一部分变异主要反映个体变异造成的抽样误差,其余每一部分变异反映某个处理因素不同水平间的变异。
假定各观测值均独立地来自同方差的正态分布总体,当所研究的处理因素各水平间总体均数相等(H0成立)时,则相应部分变异与误差部分变异的比值服从F( 1,2)分布,因此可根据检验统计量F值做出假设检验的推断结论。
χ2检验的基本思想:首先根据检验假设H0计算各格子的理论频数,用22()A TTχ-=∑反映各格实际频数与理论频数的吻合程度。
若H0成立,理论上实际频数与理论频数应相等,但由于抽样误差的存在,样本中的A与T不会完全相等,但应相差不大,即在一次抽样中得到较大χ2值的概率很小。
若由现有样本得到了较大的χ2值(大于界值χ2(α,ν)),则按α检验水准拒绝H0,接受H1;否则不拒绝H0。
多个样本率比较的χ2分割法的基本思想:利用χ2值的可加性原理,把2×k表分割成多个独立的四格表,这些四格表的自由度之和等于原2×k表的自由度,其χ2值之和近似等于原2×k表的χ2值。
当进行多个样本率的两两比较时,为了保证假设检验中犯Ⅰ性错误的概率不变,须重新规定检验水准α,因分析目的不同,k 个样本率两两比较的次数不同,故重新规定检验水准的估计方法亦不同。
等级相关的基本思想:对于不符合正态分布的资料或等级资料,将两个变量的原始观察值分别由小到大编秩,然后利用量变量的秩次之差计算相关系数。
医学统计学考试重点
考试题型:名词解释10个选择20个填空题 20个简答 4-5个讨论分析1-2题计算 1-2题绪论2选1总体:总体(population)指特定研究对象中所有观察单位的测量值。
可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
3选1小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。
p值是将观察结果认为有效即具有总体代表性的犯错概率。
一般结果≤0.05被认为是有统计学意义小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。
统计学中,一般认为等于或小于0.05或0.01的概率为小概率。
资料的类型(3选1)(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表现为数值大小,一般有度量衡单位。
如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。
(2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。
计数资料亦称定性资料或分类资料。
其观察值是定性的,表现为互不相容的类别或属性。
如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。
(3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。
等级资料又称有序变量。
如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为 +、++、+++等。
医学统计学大题重点知识总结
t1nν=-一、描述集中位置的指标应用适用范围【简】平均数:算数均数、几何均数、中位数、百分位数。
1、算数平均数:适用于单峰对称分布或近似于单峰对称分布的资料2、几何均数:适用于对数变换后单峰对称的资料。
eg.等比资料、滴度资料、对数正态分布资料3、中位数:理论上可用于任何分布资料,但当资料适合计算均数或几何均数时,不宜用中位数。
Eg:偏态分布、分布不明资料、有不确定值的资料.4、百分位数:适用于任何分布的资料。
二、描述离散趋势的指标【简】变异度:极差、四分位数间距、标准差、方差、变异系数。
1、极差:又称全距,是一组数据中最大值和最小值之差。
极差大说明资料的离散度大。
优点:简单明了缺点:不灵敏和不稳定。
样本例数相差悬殊时,不适宜比较其极差。
2、四分位数间距:即中间一半观察值的极差。
四分位数间距较全距稳定,常与中位数一起,描述不对称分布资料的特征。
3、标准差:基本内容是离均差,它显示一组变量值与其均数的间距,故标准差直接地、总结地、平均地描述了变量值的离散程度。
在同质的前提下,标准差大,表示变量值的离散程度大,即变量值的分布分散、不整齐、波动较大;标准差小,表示变量值的离散程度小,即变量值的分布集中、整齐、波动较小。
4、方差:利用了所用的信息,与变异度和变量值的个数有关。
5、变异系数(CV):变异系数派生于标准差,其应用价值在于排除了平均水平的影响,并消除了单位。
三、正态分布特征1、单峰分布;高峰在均数处;2、以均数为中心,均数两侧完全对称。
3、正态分布有两个参数(parameter),即位置参数 (均数)和变异度参数 (标准差)。
4、有些指标本身不服从正态分布,但经过变换之后可以服从正态分布。
5、正态曲线下的面积分布有一定的规律。
四、参考值范围(含义+原则)【简】1、含义:(1)又称正常值范围,是绝大多数正常人的某观察指标所在的范围。
绝大多数:90%,95%,99%等等。
(2)确定参考值范围的意义:用于判断正常与异常。
医学统计学重点
1.变异:同质事物之间的差别。
2.频数分布的两个特征:集中位置,离散趋势3.数据分布的类型:对称分布和非对称分布。
非对称分布又称偏态分布,包括正偏态和负偏态。
单峰分布,双峰分布,多峰分布。
4.统计描述:用统计表、统计图和统计指标等方法对资料的数量特征与分布规律进行描述。
5.集中位置的描述,集中位置指标又称平均数指标。
有哪些及适用条件?(1)算数平均数:最适用于单峰对称分布资料的平均水平的描述,特别是正态分布资料(2)几何平均数:适用于①等比资料②对数正态分布资料(3)中位数和百分位数:适用于①偏态分布的资料②开口资料③资料分布不明等6.离散趋势的描述(1)全距亦称极差,适用于单峰小样本资料(2)四分位数间距,适用于单峰小样本资料(3)方差和标准差,适用于对称分布尤其是正态分布资料(4)变异系数,常用于①比较度量衡单位不同的两组或多种资料的变异度②比较均数相差悬殊的两组或多组资料的变异度7.常用相对数(1)率,是二分类指标(2)构成比(3)比8.正确应用相对数应注意几个问题:(1)计算相对数的分母不宜过小(2)分析时不能以构成比代替率(3)对观察单位数不等的几个率,不能直接相加求其总率(4)计算率时要注意资料的同质性,对比分析时应注意资料的可比性(5)也有抽样误差,需要假设检验。
9.率的标准法(1)基本思想:采用统一的标准,以消除病情构成不同对治愈率比较的影响,使算得的标准化治愈率有可比性。
(2)目的:控制混杂因素对研究结果的影响。
10.正态分布(1)概念P16(2)标准正态分布,u变换:u=σμ-X,u是标准正态离差,μ是均数,σ是标准差。
u~N(0,1)(3)正态分布的特征:①是单峰分布,高峰位置在均数X=μ处。
②以均数为中心,左右完全对称。
③取决于两个参数,均数μ和标准差σ。
μ为位置参数,μ越大,则曲线沿横轴向右移动;μ越小,则曲线沿横轴向左移动。
σ为形态参数,表示数据的离散程度,若σ小,则曲线形态“瘦高”;σ大,则曲线形态“矮胖”。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
考试题型:名词解释10 个选择20 个填空题20 个简答4-5 个讨论分析1-2 题计算1-2 题绪论2 选1总体:总体(population)指特定研究对象中所有观察单位的测量值。
可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
3 选1 小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。
p值是将观察结果认为有效即具有总体代表性的犯错概率。
一般结果0.05被认为是有统计学意义小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。
统计学中,一般认为等于或小于0.05 或0.01 的概率为小概率。
资料的类型(3 选1)(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表现为数值大小,一般有度量衡单位。
如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa )等。
(2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。
计数资料亦称定性资料或分类资料。
其观察值是定性的,表现为互不相容的类别或属性。
如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB 、O 四种血型的人数等。
(3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。
等级资料又称有序变量。
如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。
等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。
等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。
2 选1抽样误差(sampling error )是指样本统计量与总体参数的差别。
在总体确定的情况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。
系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是偏大或总是偏小的误差,称为系统误差。
它带有规律性,经过校正和处理,通常可以减少或消除。
统计的步骤(考填空题,四个空)统计工作的步骤1.设计:设计容包括资料收集、整理和分析全过程总的设想和安排。
设计是整个研究中最关键的一环,是今后工作应遵循的依据。
2•收集资料:应采取措施使能取得准确可靠的原始数据。
3•整理资料:简化数据,使其系统化、条理化,便于进一步分析计算。
4•分析资料:计算有关指标,反映事物的综合特征,阐明事物的在联系和规律。
分析资料包括统计描述和统计推断。
实验设计的基本原则(考填空题,三个空)随机化原则、对照的原则(对照的类型,对照的设置)、重复的原则。
2选1参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。
总体参数是固定的常数。
多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。
统计量:统计量(statistic )是指样本的统计指标,如样本均数、样本率等。
样本统计量可用来估计总体参数。
总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。
第二章频数表的制作步骤以及频数分布表的用途(问答题)频数分布表的编制步骤:例:某市1982年50名7岁男童的身高(cm)资料如下,试编制频数表。
114.4117.2122.7124.0114.0110.8118.2116.7118.9118.1123.5118.3120.3116.2114.7119.7114.8119.6113.2120.119.8116.8119.8122.5119.7120.7114.3122.0117.0122.5119.7124.9126.1120.0124.6120.0121.5114.3124.1117.2120.2120.8126.6121.5126.1117.7124.1128.3121.8118.71、找出观察值中的最大值(largest value)、最小值(smallest value),求极差(range)。
极差等于最大值减最小值。
本例最大值=128.3,最小值=110.8,则极差=128.3-110.8=17.5(cm )2、确定分组数和组距 (class interval )o组数的多少是根据例数的多少来确定的,以能够反映出频数分布的特征为原则,一般分10—15组。
组距为相邻两组的间隔,组距=极差/组数。
本例拟分10组,则组距=17.5/10=1.75 ",为划记方便,可取稍大或稍小的数(当然本例组距也可取1.5)。
3、确定组段。
第一组段包括要最小值,取较最小值稍小且划分方便的数,本例取“10〜”最后组段包括最大值并写岀其上限值。
4、划记。
将各观察值以划正”字的方法,一笔代表一例,划在相应组段中。
例如第一个数l14.4应在组段“114”处划, 第二个数117.2应在“114”处划,以此类推。
5、统计各组段的频数。
全部数据划记完后,清点各组段的人数。
根据编制出的频数表即可了解该数值变量资料的频数分布特征。
频数分布表的用途1、描述资料的分布特征和分布类型。
频数分布有两个重要特征:集中趋势和离散趋势。
大部分观察值向某一数值集中的趋势称为集中趋势,常用平均数指标来表示,各观察值之间大小参差不齐。
频数由中央位置向两侧逐渐减少,称离散趋势,是个体差异所致,可用一系列的变异指标来反映。
2、便于进一步计算有关指标或进行统计分析。
当数据较多且需手工计算时,常先编制频数表,再进行统计计算。
3、发现特大、特小的可疑值。
如果频数表的一端或两端出现连续几个组段的频数为零后,又出现少数几个特大值或特小值,使人怀疑其是否准确,需进一步检查和核对并做相应处理。
4、据此绘制频数分布图。
描述数据分布集中趋势的指标和描述数据分布离散程度的指标(考选择或者填空)2.描述数据分布集中趋势的指标掌握其意义、用途及计算方法。
算术均数、几何均数、中位数。
3.描述数据分布离散程度的指标掌握其意义、用途及计算方法。
极差、四分位数间距、方差、标准差、变异系数。
正态分布的特征(考选择题u、b对图形的影响)服从正态分布的变量的频数分布由u 、b完全决定。
(1)u是正态分布的位置参数,描述正态分布的集中趋势位置。
正态分布以X = u为对称轴,左右完全对称。
正态分布的均数、中位数、众数相同,均等于u 。
(2)b描述正态分布资料数据分布的离散程度,b越大,数据分布越分散,b越小,数据分布越集中。
b也称为是正态分布的形状参数,b越大,曲线越扁平,反之,b越小,曲线越瘦高。
标准正态分布(填空)1 •标准正态分布是一种特殊的正态分布,标准正态分布的u 0,b2 1,通常用u (或Z)表示服从标准正态分布的变量,记为u〜N (0,12)。
正态分布的应用(简答)某些医学现象,如同质群体的身高、红细胞数、血红蛋白量,以及实验中的随机误差,呈现为正态或近似正态分布;有些指标(变量)虽服从偏态分布,但经数据转换后的新变量可服从正态或近似正态分布,可按正态分布规律处理。
其中经对数转换后服从正态分布的指标,被称为服从对数正态分布。
1. 估计频数分布一个服从正态分布的变量只要知道其均数与标准差就可根据公式(3-2 )估计任意取值(X1 ,X2 )围频数比例。
2. 制定参考值围(1 )正态分布法适用于服从正态(或近似正态)分布指标以及可以通过转换后服从正态分布的指标。
(2)百分位数法常用于偏态分布的指标。
表3-1 中两种方法的单双侧界值都应熟练掌握。
3. 质量控制:为了控制实验中的测量(或实验)误差,常以X 2S作为上、下警戒值,以X 3S作为上、下控制值。
这样做的依据是:正常情况下测量(或实验)误差服从正态分布。
4. 正态分布是许多统计方法的理论基础。
t检验、方差分析、相关和回归分析等多种统计方法均要求分析的指标服从正态分布。
许多统计方法虽然不要求分析指标服从正态分布,但相应的统计量在大样本时近似正态分布,因而大样本时这些统计推断方法也是以正态分布为理论基础的。
医学参考值围的制定(计算题)确定参考值围的单双侧:一般生理物质指标多为双侧、毒物指标则多为单侧。
907 = 1.645T-1.28S T+1.28S P厂生95£-1.64$X+IMS弓3 E Pg997 + 2,585无■ 2.33&7 + 2,335P、&第三章标准误的概念,计算公式。
标准误及b X :通常将样本统计量的标准差称为标准误。
许多样本均数的标准差b X称为均数的标准误(standard error of mean, SEM),它反映了样本均数间的离散程度,也反映了样本均数与总体均数的差异,说明均数抽样误差的大小。
t分布的图形特征及其与正态分布的区别1. 以0为中心,左右对称的单峰分布;2. t分布是一簇曲线,其形态变化与n (确切地说与自由度V大小有关。
自由度v越小,t分布曲线越低平;自由度v越大,t分布曲线越接近标准正态分布(U分布)曲线。
t分布对应于每一个自由度V,就有一条t分布曲线,每条曲线都有其曲线下统计量t的分布规律,计算较复杂。
t分布与正态分布t分布与标准正态分布相比有以下特点:①都是单峰、对称分布;② t分布峰值较低,而尾部较高;③随自由度增大,t分布趋近与标准正态分布;当n ? Y时,t分布的极限分布是标准正态分布。
置信区间和参数估计(名解2选1)置信区间,定义:是指由样本统计量所构造的总体参数的估计区间。
1、对于具有特定的发生概率的随机变量,其特定的价值区间------一个确定的数值围(一个区间”2、在一定置信水平时,以测量结果为中心,包括总体均值在的可信围。
3、该区间包含了参数B真值的可信程度。
4、参数的置信区间可以通过点估计量构造,也可以通过假设检验构造。
参数估计:指用样本指标值(统计量)估计总体指标值(参数)。
参数估计有两种方法:点估计和区间估计。
可信区间与参考值围的不同点(简答)t 检验的应用条件和类型(填空)t 检验的应用条件:要求各样本来自相互独立的正态总体且各总体方差齐。