医学统计学期末重点总结
《医学统计学》复习重点总结

计量数据比较的统计公式
X 0 t Sx
样本均数与标准值的比较 *配对数据的比较(不做方 差齐性检验 *两样本均数的比较,例数 较小时(做方差齐性检验)
d d t Sd
X1 X 2 t S x1 x2
t检验与可信区间公式小结
X1 X 2 t , SX1X 2
两独立样本均数的t n1 n2 2 检验公式
病变性质
肿瘤
恶性
1.层次不清,结构混乱,难于理解 2.线条过多,不符要求
修改后:
表 10 病变性质 良性肿瘤 恶性肿瘤﹡ 囊肿 瘤样病变 合 计
口腔颌面部不同病变构成情况 例 数 674 558 192 168 1592 构成比(%) 42.34 35.05 12.06 10.55 100.00
﹡包括癌437例,肉瘤101例,果用统计表表达。
统计表类型:
简单表和组合表
统计图: 要求掌握图形选择. 如线图、直条图、直方图、构成图
例: 简单表格式
某地1980年男女HBsAg阳性率的比较 性别 调查例数 男 4234 女 4530 合计 8764 阳性数 303 181 484 阳性率% 7.16 4.00 5.52
第14章基于秩次的统计方法
掌握概念: 1)何为非参数统计? 2) 什么样数据适合采用秩和检验,以及秩和 检验的优缺点。 3)秩和检验有那几种检验方法?
注意:结果(y)数据为等级时,两组比较采 用秩和检验效率高于χ2检验,应首选秩和检验.
表 某病两组疗效的比较 比较组 无效 有效 显效 痊愈 合计 试验组 18( 31.6) 18 (31.6) 15(26.3) 6 (10.5) 57 对照组 21 (46.7) 15( 33.3) 8(17.8) 1( 2.2) 45 Total 39 33 23 7 102
医学统计学重点总结

(1) 单个样本均数 H0:μ=μ0t= ν=n-1 (小样本)
(已知样本——均数) H1:μ≠μ0
α=u= 或u= (大样本)(2)配对:H0:μ=μ0
H1:μ≠μ0t= ν=对子数-1
α=
(3) 两独立样本均数H0:μ=μ0t= ν=n1+n2-2
(4)(已知样本——样本) H1:μ≠μ0
9.对任何参数μ和σ的正态分布,都可以通过一个简单的变量变换成标准正态分布,即μ=X-μ
σ
9
标准正态分布
正态分布
面积或概率
-1~1
μ σ
%
~
μ σ
%
·
μ σ
%
10.医学参考值范围(reference value range)传统上称作正常值范围,指正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。习惯上是包含95%的参照总体的范围。
实际工作中标准差 σ往往未知,因而通常用样本标准差S代替σ,求得样本均数 准误估计值S ,计算公式为 S = (当n→无穷,S→σ,S →0)
3 95%的可信区间的计算:x (μ,σ ) 1) σ已知,可信区间= σ
2)σ未知,n为小样本: t 3)σ未知,n为大样本:
T变换
μ变换
N (0,1)
3、t分布曲线的形态变化与自由度v=n-1有关。
2.四格表专用公式(
3对于四格表资料,通常规定为:(1)当n≥40且所有的T ≥ 5时,用检验的基本公式或四格表的专用公式;(2)当n ≥ 40 但有1≤T<5时,用四格表资料的校正公式;(3)当n<40,或T<1时,用四格表资料的Fisher确切 概率法。
4 行×列表资料的χ 检验: 自由度:ν=(行数-1)(列数-1)
医学统计学考试重点整理

一、基本概念1.总体与样本总体:所有同质观察单位某种观察值(即变量值)的全体样本:是总体中抽取部分观察单位的观察值的集合2.普查与抽样调查普查:就是全面调查,即调查目标总体中全部观察对象抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查3.参数与统计量参数:总体的某些数值特征统计量:根据样本算得的某些数值特征4.Ⅰ型与Ⅱ型错误假设检验的结论真实情况拒绝H0不拒绝H0H0正确Ⅰ型错误(ɑ)推断正确(1−ɑ)H0不正确推断正确(1−β) Ⅱ型错误(β)Ⅰ型错误(ɑ错误):H0为真时却被拒绝,弃真错误Ⅱ型错误(β错误): H0为假时却被接受,取伪错误5.随机化原则与安慰剂对照随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。
(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上)安慰剂对照:是一种常用的对照方法。
安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。
(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。
安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应)6.误差与标准误(区分率与均数)㈠均数抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。
标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n㈡样本率率的抽样误差:样本率p和总体率π的差异率的标准误:样本率的标准差,公式为σp=√π(1-π)/n7。
方差分析方差分析:又称F检验,是通过对数据变异按设计类型的不同,分解成两个或多个样本均数所代表总体均数是否有差别的一种统计学方法。
医学统计学重点总结

综合练习
三类资料
(1) 定量资料(quantitative data) 以定量值表达每个观察单位的某项观察指标, 如血脂、心率等。 特点:
① 各观察单位间只有量的差别; ② 数据间有连续性。
三类资料
(2) 定性资料(qualitative data) 以定性方式表达每个观察单位的某项观察指标, 如血型、性别等。 特点:
举例 血型(A、B、O、AB) 人群中某病发生与否(发生、不发生)
描述指标: 相对数
率 构成比 相对比
常用相对数(1)
率(rate),又称频率指标,说明某现 象发生的频率和强度。(强度相对数)
率 = 可 实 能 际 发 发 生 生 某 某 现 现 象 象 的 的 观 观 察 察 单 单 位 位 总 数 数 比 例 基 数
比 A B
四格表(fourfold table)的概念
a
b
c
d
这四个格子的频数是整个表的基本数据,其 余数据都是从这四个基本数据推算出来的,这 种资料称为四格表资料。
2检验的基本思想
如果H0假设成立,则实际频数( actual
frequency)与理论频数应该比较接近。
如果实际频数与理论频数相差较大,超出了
区别
r 没有单位,b有单位;所以,相关系数与单位无 关,回归系数与单位有关;
相关表示相互关系;回归表示依存关系; 对资料的要求不同:
当X和Y都是随机的,可以进行相关和回归分析; 当Y是随机的(X是控制的),理论上只能作回归而不能作相关分析
;
实验研究的基本要素
处理因素:作用于受试对象,要求在实验过 程中观察其处理的因素
两样本比较的秩和检验(基本原理) Wilcoxon符号秩和检验(基本原理)
医学统计学重点重点知识总结

医学统计学重点选择1.几何均数:平均血清抗体滴度(如P9例2.4)2.正态分布:横轴为μ(界值、面积)2.5% I1.962.5%单侧双侧90%: 1.6495%: 1.64 1.9699%: 2.583.P值与α的关系,α是人为规定的,它们之间没有关系;P值f,Qt(X)4.方差分析自由度V的计算,V总=nT;V组间=组数(k)-1;V组间=V总-V组间5.理论秩和(n(n+1)∕2),实际秩和(通过平均秩次算)6.可信区间的正确应用:总体参数有95%的可能落在该区间内(X);有95%的总体参数在该区间内(X);该区间包含95%的总体参数(X);该区间有95%的可能包含总体参数。
(X);这个区间的可信度为95%(√);总体参数只有一个,要么在区间内,要么不在7.相关系数与回归系数:相关系数为0,两个变量之间没有相关关系(X);回归系数t,相关系数t(X);(要做假设检验)二、名解1.参考值范围:根据正常人的数据估计绝大多数的正常人所在的范围2.区间估计(可信区间):按一定的概率或可信度(bα)用一个区间估计总体参数所在范围。
这个范围称作可信度为1-a的可信区间,又称置信区间。
3.P值:拒绝HO时所冒的风险(或“作出拒绝HO而接受H1”结论时冒了P风险)4.a(第一类错误):HO真实时被拒绝(或HO真实时,拒绝H0,接受H1)5.β(第二类错误):HO不真实时不拒绝(或HO不真实时,不拒绝HO)1-β检验效能:对真实的H1做肯定结论之概率6.秩次:是指全部观察值按某种顺序排列的位序;7.秩和:同组秩次之和8.剩余标准差:扣除了X的影响后,Y方面的变异;引进回归方程后,Y方面的变异。
三、简答1.假设检验与可信区间的联系与区别分辨多个样本是否分别属于不同的总体,并对总体作出适当的结论。
分辨一个样本是否属于某特定总体等。
区间估计(可信区间):按一定的概率或可信度(1-a)用一个区间估计总体参数所在范围。
(完整版)医学统计学重点总结

1.简述总体和样本的定义,并且举例说明。
总体是研究目的确定的所有同质观察单位的全体。
样品是从研究总体中抽取部分有代表性的观察单位。
2.简述参数和统计量的定义,并且举例说明。
描述总体特征的指标称为参数,描述样本特征的指标称为统计量。
3.变量的类型有哪几种?举例说明各种类型变量有什么特点。
①定量数据:计量资料;定量的观测值是定量的,其特点是能够用数值的大小衡量其水平的高低。
②定性数据:计数资料;变量的观测值是定性的,表现为互不相容的类别或属性。
③有序数据:半定量数据/等级资料;变量的观测值是定性的,但各类别(属性)有程度或顺序上的差异。
4.请举例说明一种类型的变量如何变换为另一种类型的变量。
定量数据>有序数据>定性数据--------------->5.请简述什么是小概率事件?概率是描述事件发生可能性大小的度量,P 0.05事件称为小概率事件。
≤6.举例说明什么是配对设计。
配对设计是将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理。
①同源配对:同一受试对象或同一标本的两个部分,随机分配接受两种不同处理;②异源配对:为消除混杂因素的影响,将两个同质受试对象配对分别接受两种处理。
7.非参数假设检验适合什么类型数据进行分析?①总体分布类型未知或非正态分布数据;②定量或半定量数据;③数据两端无确定的数值。
8.简述P 25 P 50 P 75的统计学意义。
(条件:明显偏态且不能转化为正态或近似对称;一端或两端无确定数值;分布情况未知)用来描述资料的观测值序列在某百分位置的水平,四分位数间距可以作为说明个体差异的指标(说明个体在不同位置的变异情况)。
9.直条图、直方图、圆饼图的使用条件是什么?直条图:各自独立的统计指标的数值大小和他们之间的对比;直方图:连续变量频数分布情况;圆饼图:全体中各部分所占的比例。
10.统计分析包括哪两个方面的内容?为什么要进行统计推断?统计描述和统计分析;统计描述用来描述及总结一组数据的重要特征,其目的是使实验或观察得到的数据表达清楚并便于分析。
医学统计学期末复习总结

医学统计学期末复习总结医学统计学期末复习总结名词解释1.参数Patameter:是指总体的统计指标,如总体均数、标准差,,采用希腊字母分别记为μ、σ。
是固定的常数。
多数情况下,总体参数是不易知道的,但可以通过随机抽样抽取具有代表性的样本,用算得的样本统计量估计未知的总体参数。
2.统计量statistic:样本的统计指标,如样本均数、标准差,采用拉丁字母分别记为X、S。
样本统计量是在总体参数附近波动的随机变量,可用来估计总体参数。
3.系统误差systematic error:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是克制的或可能掌握的。
(受确定因素影响,大小变化有方向性)4随机误差random error:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。
(影响因素众多,变化无方向性,不可避免,但可用统计方法进行分析)5 I型错误type I error:拒绝了实际上成立的H0,这类“弃真”的错误称为I型错误,其概率大小用α来表示。
(1-a)即可信度:重复抽样时,样本区间包含总体参数(m)的百分数。
6 II型错误type II error:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误,其概率大小用β来表示。
(1-β)即把握度(或检验效能):两总体确有差别,被检出有差别的能力。
7 P值P-value:在H0成立的前提下,用样本数据获得的样本统计量,及比样本统计量总计更极端的曲线下的面积。
8 置信区间confidence bound / confidence interval, CI:按预先给定的概率(1-α)所确定的包含未知总体参数的一个范围。
9 多重共线性Multicollinearity:是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。
10哑变量dummy variable:用以反映质的属性的一个人工变量,是量化了的自变量,通常取值为0或1。
(完整版)医学统计学复习要点

(完整版)医学统计学复习要点第⼀章绪论1、数据/资料的分类:①、计量资料,⼜称定量资料或者数值变量;为观测每个观察单位某项治疗的⼤⼩⽽获得的资料。
②、计数资料,⼜称定性资料或者⽆序分类变量;为将观察单位按照某种属性或者类别分组计数,分组汇总各组观察单位数后⽽得到的资料。
③、等级资料,⼜称半定量资料或者有序分类变量。
为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后⽽得到的资料。
2、统计学常⽤基本概念:①、统计学(statistics)是关于数据的科学与艺术,包括设计、搜集、整理、分析和表达等步骤,从数据中提炼新的有科学价值的信息。
②、总体(population)指的是根据研究⽬的⽽确定的同质观察单位的全体。
③、医学统计学(medical statistics):⽤统计学的原理和⽅法处理医学资料中的同质性和变异性的科学和艺术,通过⼀定数量的观察、对⽐、分析,揭⽰那些困惑费解的医学问题背后的规律性。
④、样本(sample):指的是从总体中随机抽取的部分观察单位。
⑤、变量(variable):对观察单位某项特征进⾏测量或者观察,这种特征称为变量。
⑥、频率(frequency):指的是样本的实际发⽣率。
⑦、概率(probability):指的是随机事件发⽣的可能性⼤⼩。
⽤⼤写的P表⽰。
3、统计⼯作的基本步骤:①、统计设计:包括对资料的收集、整理和分析全过程的设想与安排;②、收集资料:采取措施取得准确可靠的原始数据;③、整理资料:将原始数据净化、系统化和条理化;④、分析资料:包括统计描述和统计推断两个⽅⾯。
第⼆章计量资料的统计描述1. 频数表的编制⽅法,频数分布的类型及频数表的⽤途①、求极差(range):也称全距,即最⼤值和最⼩值之差,记作R;②、确定组段数和组距,组段数通常取10-15组;③、根据组距写出组段,每个组段的下限为L,上限为U,变量X值得归组统⼀定为L≤X<U,最后⼀组包括下限。
医学统计学重点整理汇总

医学统计学重点第一章绪论1.基本概念:总体:根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。
样本:从总体中随机抽取部分个体的某个变量值的集合。
总体参数:刻画总体特征的指标,简称参数。
是固定不变的常数,一般未知。
统计量:刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。
抽样误差:由随机抽样造成的样本统计量与相应的总体参数之间的差异。
频率:若事件A在n次独立重复试验中发生了m次,则称m为频数。
称m/n为事件A在n次试验中出现的频率或相对频率。
概率:频率所稳定的常数称为概率。
统计描述:选用合适统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律进行刻画和描述。
统计推断:包括参数估计和假设检验。
用样本统计指标(统计量)来推断总体相应指标(参数),称为参数估计。
用样本差别或样本与总体差别推断总体之间是否可能存在差别,称为假设检验。
2.样本特点:足够的样本含量、可靠性、代表性。
3.资料类型:(1)定量资料:又称计量资料、数值变量或尺度资料。
是对观察对象测量指标的数值大小所得的资料,观察指标是定量的,表现为数值大小。
每个个体都能观察到一个观察指标的数值,有度量衡单位。
(2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料)①计数资料:是将观察单位按某种属性或类别分组,清点各组观察单位的个数(频数),由各分组标志及其频数构成。
包括二分类资料和多分类资料。
二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。
多分类:将观察对象按多种互斥的属性分类②等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单位的个数所得的资料。
4.统计工作基本步骤:统计设计、资料收集、资料整理、统计分析。
第二章实验研究的三要素1.实验设计三要素:被试因素、受试对象、实验效应2.误差分类:随机误差(抽样误差、随机测量误差)、系统误差、过失误差。
3.实验设计的三个基本原则:对照原则、随机化分组原则、重复原则。
医学统计学重点总结

第一章绪论一、名词解释1.设计(design):根据研究的问题与目的,从统计学的角度对各步提前做出的周密计划和安排。
2.收集资料(data collection):获得研究所需要的原始数据的过程。
3.整理资料(data storing):对收集到的原始资料进行归类整理汇总的过程。
4.分析资料(data analysis):对整理的资料进行统计分析,获取资料中有关信息的过程。
5.总体(population):根据研究目的确定的,所有同质研究对象某一(组)指标值的集合6.样本(sample):从总体中随机抽取的,数量足够的能代表总体特征的部分研究对象某一(组)指标值的集合。
7.参数(parameter):描述总体特征的指标称为参数。
8.变异(variation):对同质研究对象某指标值得波动性称为变异。
9.误差(error):观测值与真实值之差。
10.变量(variable):描述研究对象某种特征的指标。
11.资料(data):变量全部或部分测量值构成资料12.计量资料(measurement data):每个研究对象的变量值为一数值,表现出有量的大小,由这样一组研究对象定量观测值所构成的资料为计量资料。
13.计数资料(enumeration data):每个研究对象的变量值为互不相同的属性之一,由这样一组研究对象定性变量值组成的资料为技术资料。
14.等级资料(ranked data):每个研究对象变量值为互不相容的属性之一,且这些属性间有程度的递进或递减关系,有这样一组研究对象变量值组成的资料为等级资料。
15.过失误差:由科研工作者的失误或过错造成的误差。
16.系统误差(systematic error):在收集资料的过程中,由于研究者或被研究者、仪器设备、检测用材料、检测方法、环境条件等原因,造成观测结果偏大或偏小,称作系统误差。
17.随机误差(random error):在没有过失误差和系统误差的条件下仍存在大量偶然无法消除的不确定因素所引起的误差为随机误差。
医学统计学总结

医学统计学总结第一篇:医学统计学总结医学统计学总结一、两组或多组计量资料的比较1.两组资料:1)大样本资料或服从正态分布的小样本资料(1)若方差齐性,则作成组t检验(2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验 2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验2.多组资料:1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。
如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。
2)如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的统计检验。
如果Kruskal Wallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。
二、分类资料的统计分析1.单样本资料与总体比较1)二分类资料:(1)小样本时:用二项分布进行确切概率法检验;(2)大样本时:用U检验。
2)多分类资料:用Pearson c2检验(又称拟合优度检验)。
2.四格表资料1)n>40并且所以理论数大于5,则用Pearson c2 2)n>40并且所以理论数大于1并且至少存在一个理论数<5,则用校正c2或用Fisher’s 确切概率法检验 3)n£40或存在理论数<1,则用Fisher’s 检验3.2×C表资料的统计分析 1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分的CMH c2或成组的Wilcoxon 秩和检验2)列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势c2检验 3)行变量和列变量均为无序分类变量(1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson c2(2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验4.R×C表资料的统计分析 1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH c2或Kruskal Wallis的秩和检验2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作none zero correlation analysis的CMH c23)列变量和行变量均为有序多分类变量,可以作Spearman相关分析4)列变量和行变量均为无序多分类变量,(1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson c2(2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验三、Poisson分布资料1.单样本资料与总体比较:1)观察值较小时:用确切概率法进行检验。
医学统计学 重点知识总结

名词解释1、一类错误:拒绝了实际上成立的H。
,这类“弃真”的错误称为I型错误或第一类错误。
2、参数和统计量:这些总体的统计指标或特征值称为参数。
由样本所算出的统计指标或特征值称为统计量。
3、变异系数:亦称离散系数,为标准差与均数之比,常用百分数表示。
4、P值:即概率,反映某一事件发生的可能性大小。
5、检验效能:B称为检验效能或把握度,即两总体却有差别,按α水准能发现它们有差别的能力。
简答题1、描述数值变量资料(统计资料)的集中程度有哪些指标,有何运用条件?算数均数:单峰对称分布的资料几何均数:对数变换后的单峰对称的资料中位数:偏态分布,分布不明资料,有不确定值的资料。
百分位数:当样本含量较少时不宜用靠近俩端的百分位数来估计频数分布范围。
2、实验研究的基本要素和基本原则是什么?基本要素:处理因素、受试对象和实验效应。
基本原则:对照原则、随机化原则和重狂原则大题1、(1)变量资料(2)成组t检验对立性正态性方差齐性(3)H0ιμ1=μ2,新药与常规药物的疗效相同H1rμ1≠μ2,新药与常规药物的疗效不同α=0.05T=1.0195V=n1+n2-2=18(2)t<t0.05z18,p>0.05,按a=0.05水准,不拒绝H0,差别无统计学意义。
结论:t检验结果表明,故尚不能认为新药与常规药物的疗效相同。
2、(1)T=13×17/47=4.7(2)x2检验(3)X2>X2(0.05,1),p<0.05,按a=0.05水准,拒绝H0,接受HQ差别有统计学意义。
结论:x2检验结果表明,乙疗法比甲疗法好。
3、(1)成组设计两样本比较的秩和检验(2)实验组秩次:13、I15、8.5、14、15.5、15.5、17、18对照组秩次:1、2、4、3、5、6、8.5、7、10、11.5(3)H0:两组局部温热的疗效总体分布相同H1:两组局部温热的疗效总体分布不同4(1)Ho:P=O,即母体内时间与体重无线性相关关系H1:P≠0,即母体内时间与体重有线性相关关系a=0.05F>5.23,拒绝HO,接受HI,相关系数有统计学意义。
医学统计学考试重点归纳

标准正态分布与正态分布的关系:对正态分布的(X-μ)/σ进行u 的变换,u=(X-μ)/σ,则正态分布变换为μ=0,σ=1的标准正态分布,亦称u 分布。
正态分布的特征:(1)正态曲线在横轴上方均数处最高。
(2)正态分布以均数为中心,左右对称。
(3)正态分布有2个参数,即均数μ和标准差σ。
μ是位置参数,当σ固定不变时,μ越大,曲线沿横轴越向右移动;反之,μ越小,则曲线沿横轴越向左移动。
σ是形状参数(亦称变异度参数),当μ固定不变时,σ越大,曲线越平阔;σ越小,曲线越尖峭。
通常用N(μ,σ2)表示均数为μ,方差为σ的正态分布。
(4)正态分布在μ±σ处各有一个拐点。
(5)正态曲线下面积的分布有一定规律。
t 分布:将x 看成变量值,那么可将正态变量进行u 变换(u=x -μ/σ)后,也可将N (μ,σ2x)变换成标准正态分布N (0,1)。
常用s 作为σ的估计值,统计量为t ,此分布为t 分布。
统计量: t=xs x μ-t 分布特征为:1.以0为中心,左右对称的单峰分布。
2.t 分布曲线形态变化与自由度的大小有关。
自由度越小, t 值越分散,曲线越低平;自由度逐渐增大时,则 t 分布逐渐逼近 标准正态分布。
t 分布即为u 分布。
二项分布:对于二项分类变量,若某结果发生的概率为π,其对立结果发生的概率为(1-π),且各次试验相互独立时,这种试验在统计学上称为贝努里试验,二项分布概率函数的公式:P (x )=C n xπx(1-π)n-x性质:μ=n πσ=π)π(-1n若用相对数表示,即样本率的均数和标准差分别为,则 μp=πσp=n /1π)π(-π未知时,用样本率P 作为π的估计值,则 Sp=n p p /)1(-二项分布的特点1、当 π=0.5时,无论n 大小,其图形均呈对称分布;2、当π≠0.5,且n 小时呈偏态分布;随n 不断增大,逐渐趋于对称分布;当n →∞时,逼近正态分布。
医学统计学期末考试重点

1. 用样本均数推论总体均数95%可信区间的公式是(总体标准差未知且样本量较小) A x v s t x ,05.0±2. 两个样本均数比较t 检验(α=0.05),当|t|>t 0.05,(ν)时: E 接受备择假设3. 两个样本均数比较t 检验(α=0.05),当|t|>t 0.05,(ν)时,统计结论为 CC 两总体均数不同 4. 两个样本均数比较t 检验,分别取以下检验水准,其中第二类错误最小的是 BA α=0.05B α=0.2C α=0.1D α=0.035.两个样本均数比较t 检验,无效假设是 DD 两总体均数相等6. 两个样本均数比较t 检验(α=0.05),当“拒绝H0,接受H1”时,P 值越小 EE 越有理由认为两总体均数不同7. 两个样本均数比较t 检验时,每个变量同时加上一个不为“0”的常后,其t 值 AA 变大 8. 检验效能是指A αB 1- αC βD 1-βE 以上都不对9. 第一类错误是指 A 拒绝实际上成立的H010. 第二类错误是指 D 接受实际不成立的H111. 要使两类错误同时减少的方法是 AA 增加样本量 12. 以下何种情况进行单侧检验 AA 已知A 药肯定优于B 药 13. 以下何种情况进行单侧检验 AA 已知21χχ> 14. 在进行t 检验时,P 值和α值的关系 EE α值是研究者事先确定的15. 在配对t 检验中 EE 当不拒绝H0时,差值的总体均数可信区间一定包含016.统计中所说的总体是指: AA 根据研究目的确定的同质的研究对象的全体17.概率P=0,则表示 BB 某事件必然不发生 18.抽签的方法属于 DD 单纯随机抽样 19.测量身高、体重等指标的原始资料叫:BB 计量资料 20.某种新疗法治疗某病患者41人,治疗结果如下:治疗结果 治愈 显效 好转 恶化 死亡治疗人数 8 23 6 3 1该资料的类型是: D 有序分类资料21.样本是总体的 C 有代表性的部分 22.将计量资料制作成频数表的过程,属于统计工作哪个基本步骤: C 整理资料23.统计工作的步骤正确的是 C 设计、收集资料、整理资料、分析资料24.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:BB 系统误差25.以下何者不是实验设计应遵循的原则 D 交叉的原则26.表示血清学滴度资料平均水平最常计算 B 几何均数27.某计量资料的分布性质未明,要计算集中趋势指标,宜选择 C M28.各观察值均加(或减)同一数后: B 均数改变,标准差不变29.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、10、2、24+(小时),问该食物中毒的平均潜伏期为多少小时? C 630.比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是: D 变异系数31.下列哪个公式可用于估计医学95%正常值围 A X±1.96S32.标准差越大的意义,下列认识中错误的是B观察个体之间变异越小33.正态分布是以E均数为中心的频数分布34.确定正常人的某项指标的正常围时,调查对象是B排除影响研究指标的疾病和因素的人35.均数与标准差之间的关系是E标准差越小,均数代表性越大36.从一个总体中抽取样本,产生抽样误差的原因是A总体中个体之间存在变异37.两样本均数比较的t检验中,结果为P<0.05,有统计意义。
医学统计学_总结_重点_笔记_复习资料[精选]
![医学统计学_总结_重点_笔记_复习资料[精选]](https://img.taocdn.com/s3/m/0b8ac7e80408763231126edb6f1aff00bed57032.png)
医学统计学_总结_重点_笔记_复习资料[精选]第一篇:医学统计学_总结_重点_笔记_复习资料[精选]第一章2选1 总体:总体(population)是根据研究目的确定的同质观察单位(研究对象)的全体,实际上是某一变量值的集合。
可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
总体population根据研究目的而确定的同质观察单位的全体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
样本sample从总体中随机抽得的部分观察单位,其实测值的集合。
3选1 小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件。
P值:P 值即概率,反映某一事件发生的可能性大小。
统计学根据显著性检验方法所得到的P 值反应结果真实程度,一般以P ≤ 0.05 认为有统计学意义,P ≤0.01 认为有高度统计学意义,其含义是样本间的差异由抽样误差所致的概率等于或小于0.05 或0.01。
P值是:1)一种概率,一种在原假设为真的前提下出现观察样本以及更极端情况的概率。
2)拒绝原假设的最小显著性水平。
3)观察到的(实例的)显著性水平。
4)表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法。
小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实际实验中是不会发生的,数学上称之小概率原理,也称为小概率的实际不可能性原理。
统计学中,一般认为等于或小于0.05或0.01的概率为小概率。
资料的类型(3选1)(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表现为数值大小,一般有度量衡单位。
如某一患者的身高(cm)、体重(kg)、红细胞计数(10/L)、脉搏(次/分)、血压(KPa)等。
医学统计学期末考试重点

一、总体:是根据研究目的确定的同质观测单位的集合。
样本:是从统计总体中随机抽取的、具有代表性的部分观测单位的集合。
同质:即构成总体的各个观测单位在某一方面或几方面的性质相同或基本相同。
变异:是指在同质基础上各观测单位之间的差异。
离散型变量:指只能取可数的或有限个数的变量。
特点只是取顺序整数值连续性变量:指可以取各整数区间的一切实数值的变量。
特点是在两个连续的整数值之间还可以用小数或分数连接起来的非整数值。
二、统计的含义1.统计工作:指搜集、整理、分析和研究统计数据的工作,是统计数据与统计理论的基础和源泉。
2.统计数据:指统计工作研究的主体及成果。
3.统计学:是对研究对象的数据进行搜集、整理、分析和研究,以揭示其总体特征和规律性的方法论科学。
三、统计学的主要内容1.研究设计:是按照研究目的和统计学要求制定具有针对性、具体性、专业性的工作方案。
2.统计描述:用统计指标、统计图、统计表等方法描述样本资料的数据特征及其分布规律,是整个统计学的基础。
3.统计推断:用样本信息推论总体特征的归纳过程,它有两个重要领域。
四、误差及其分类误差指实际观测值与真值之差或样本指标与总体指标之差。
误差分为非随机误差和随机误差,非随机误差:粗差-粗心大意,无规律性,可以避免;系统误差-仪器、方法、等条件的差异,感官、理论和实验方法的差异。
随机误差:测量误差-由一系列实验或观测条件的随机波动造成的实测值与真值之差;抽样误差-随机抽样引起的统计量与参数之间的差异。
五、统计工作的基本步骤研究设计、搜集资料、整理资料、分析资料中医统计资料的搜集与整理一、中医统计资料的类型1.计量资料:是由数值变量产生的资料,即对每个观察单位用计量方法测得某项标志数值大小所得资料,变量值大多有度量衡单位;2.计数资料:是由分类变量产生的资料,即对每个观察单位按某种属性分组计数得到的资料,变量值变现为互不相容的属性或类别,无度量衡单位。
统计描述一、频数分布:是指观测值按大小分组,各个组段内观测值个数的分布,它是了解数据分布形态特征与规律的基础。
医学统计学重点知识总结

医学统计学第一章 绪言研究设计、资料分析、结论定量资料:以定量值表达每个观察单位的某项观察指标,如血脂心率等。
定性资料:以定性方式表达每个观察单位的某项观察指标,如血型性别等。
等级资料:以等级方式表达每个观察单位的某项观察指标,如疗效分级等。
总体:是指按研究目的所确定的研究对象中所有观察单位某项指标取值的集合。
样本:是指从研究总体中随机抽取具有代表性的部分观察单位某项指标取值的集合。
(以上均可能考名解)描述某总体特征的指标称为总体参数,简称参数;描述某样本特征的指标称为样本统计量,简称统计量。
概率是随机事件发生可能性大小的一个度量,概率小于或等于0.05时,统计学通常称该事件为小概率事件,其涵义为该事件发生的可能性很小,进而认为其在一次抽样中不可能发生,此即为小概率原理。
定量资料的统计指标(大题):算术均数,几何均数,中位数和百分位数。
同质性与异质性:同质是指观察单位具有相同的性质,是构成研究总体的必备条件;异质性是指性质不同,研究内容不同,对同质性的要求不同。
第二章 个体变异与变量分布变异(名解):是以具有同质性的观察单位为载体,某项观察指标在观察单位之间显示的差别。
【在同质的基础上各观察单位(或个体)之间的差异】 正偏态与负偏态【2.3节为重点,尤其是统计指标与图的关系】几何均数应用于比值数据,中位数适用于偏态分布离散趋势指标(重点简答):全距,四分位数间距,方差,标准差和变异系数,其中常用的是标准差和变异系数。
变异系数(名解):亦称离散系数,是标准差s 与均数x 之比,即XS CV X100%,变异系数常用于比较度量衡单位不同的两组或多组资料的变异度、比较均数相差悬殊的两组或多组资料的变异度。
如何正确使用相对数(选择或简答):1,计算相对数的分母不宜过小。
2,分析时不能以构成比代替率。
3,对观察单位数不等的几个率,不能直接相加求其平均率(或称总率)。
4,计算率时要注意资料的同质性,对比分析时应注意资料的可比性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
误差:观测值与真实值、样本计量与总体参数之间的差别。
相对数:两个有关的绝对数之比,也可以是两个有关联统计指标之比。
相对比:相对比是A、B两个有关联指标值之比,用以描述两者的对比水平,说明A是B 的若干倍或百分之几。
统计描述:描述及总结一组数据的重要特征,目的是使实验或观察得到的数据表达清楚并便于分析。
统计推断:指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。
同质:指根据研究目的所确定的观察单位其性质应大致相同。
变量:反映实验或观察对象生理、生化、解剖等特征的指标,变量的观测值称为数据。
定量数据:也称计量资料。
变量的观测值是定量的,其特点是能够用数值大小衡量其水平的高低,一般有计量单位。
根据变量的取值特征可分为连续型数据和离散型数据。
有序数据:也称半定量数据或等级资料。
变量的观测值是定性的,但各类别(属性)之间有程度或顺序上的差别。
总体:根据研究目的确定的所有同质观察单位的全体,它包括所有定义范围内的个体变量值。
样本:从研究总体中抽取部分有代表性的观察单位,对变量进行观测得到的数据。
参数:描述总体特征的指标称为参数。
统计量:描述样本特征的指标称为统计量。
概率:描述某事件发生可能性大小的度量。
小概率事件:习惯上将P≤0.05的事件称为小概率事件。
平均数:是描述一组观察值集中位置或平均水平的统计指标,常用的有算术均数、几何均数和中位数。
率:率表示在一定空间或时间范围内某现象的发生数与可能发生的总数之比。
构成比:表示某事物内部各组成部分在整体中所占的比重,常以百分数表示,计算公式为区间估计:是指按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。
线性相关的概念:研究两个变量之间是否具有直线相关关系。
相关系数:是说明具有线性相关关系的两个数值变量间相关的密切程度与相关方向的统计量。
研究对象:根据研究目的而确定的观察总体,也可称为受试对象或实验对象。
处理因素:根据研究目而欲施研究对象的干预措施。
处理水平:处理因素在实验中所处的状态称为因素的水平(level),亦称处理水平。
对照:指在实验中应设立对照组,其目的是通过与对照组效应对比鉴别出实验组的效应大小。
随机化:是指每个受试对象有相同的概率或机会被分配到不同的处理组。
重复:是指在相同实验条件下重复进行多次观察。
统计学的基本内容:统计设计,数据整理,统计描述,统计判断
数据类型:定量数据,定性数据,有序数据
误差的类型:系统误差,随机测量误差,抽样误差
配对样本t检验配对设计:同源配对,异源配对,自身配对
方差分析的基本思想:将全部观测值的总变异按影响因素分解为相应的若干部分变异,在此基础上,计算假设检验的统计量F 值,实现对总体均数是否有差别的推断。
非参数检验的适用范围:①总体分布类型未知或非正态分布数据;②有序或半定量资料;③数据两端无确定的数值。
标准差与标准误的区别与联系:区别:标准差:意义,描述个体观察值变异程度的大小,标准差越小,均数对一组观察值的代表性越好。
应用,与X拔结合,用以描述个体观察值的
分布范围,常用于医学参考值范围估计。
与N的关系,N越大,S越趋于稳定
标准误Sx拔:描述样本均数变异程度及抽样误差的大小,标准误越小,用样本均数推断总体均数可靠性好。
与X拔结合,用以估计总体的均数可能出现的范围,以及对总体的均数作假设检验。
N越大,Sx拔越小。
联系:标准差与标准误都是描述便宜程度的指标。
Sx拔与S成正比,N一定时,S越大,Sx拔越大
1类错误与2类错误区别联系:区别:依依不通过,1类错误为拒绝了实际上成立的H0,也称弃真错误,第2类错误为不拒绝实际上不成立的H0,也称存伪错误。
概率不同,1类错误的概率为α,是根据研究目的设定的,2类错误概率为β是未知的,β能通过α间接估计大小。
联系:当样本含量一定时,α越大,β越小,α越小,β越大。
要同时减少1、2类错误,可增加样本含量
怎样正确选择用单侧检验和双侧检验:对于假设中的单侧检验和双侧检验的选择,要根据研究目的和专业知识而定。
若目的在于判断两总体均数,是否不等,或者有无差别,则应选择双侧检验,若从专业知识认为不会出现M<M0或M>M0,而检验目的是用以说明M>M0或M<M0时,则应选择单侧检验,在对专业知识不明确时,一般选择双侧检验单侧检验易获得p<α的结论,应慎重使用
线性回归与相关的关系:对同一资料做相关回归分析,相关系数r与回归系数b的正负符号相同,对同一资料做相关与回归分析,相关系数的t检验与回归系数的t检验相同,即t=tb,相关与回归可以相互解释,即r的平方=SS回归/SS总
计量资料的检验方法有哪些:t检验(样本均数总体均数的比较,两个样本的均数的比较,配对资料的t检验)μ检验:大样本均数与总体均数的比较,两个大样本均数的比较。
F检验:完全随机设计单因素方差分析,随机区组设计方差分析,拉丁方设计的f方差分析
描述计量资料离散趋势常用的指标有哪些,其适用条件:指标有:极差,四分位数,方差,标准差,变异系数。
适用条件:极差和四分位数适用于偏态分布资料用以描述其离散程度或变异度。
方差标准差适用于对称分布或正态分布资料用以描述其离散程度或变异度。
变异系数适用于度量衡单位不同,或均数相差比较悬殊的两组资料,比较其离散程度,或变异度描述计量资料集中趋势的指标有哪些,其适用条件:指标:算数平均数,几何均数,中位数。
适用条件:算数平均数适用于对称分布或正态分布资料,几何均数适用于等比分布或对数正态分布资料
卡方资料的假设检验方法(四格表资料卡方检验,行x列资料,配对资料
描述计量资料的统计描述有:频数分布表和频数直方图,集中趋势的描述(常用平均数,算数平均数,几何均数,中位数)离散趋势的描述(极差,四分为间距,方差,标准差,变异系数)
描述方差分析的应用范围:完全随机设计的两个或两个以上的均数比较的方差分析,随机区组设计的方差分析,拉丁方设计的方差分析,回归分析中直线回归方程的假设检验,多个因素的交互作用分析
简述检验假设步骤:建立假设和确定检验水准,选择检验方法和计算检验统计,确定p值和做出统计推断结论
均数的可信区间与参考值范围有何不同:可信区间:是指按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。
计算:正态分布:δ未知
应用:总体均数的区间估计,评估未知总体均数所在的范围;参考值范围:正常人的解剖,生理,生化某项指标波动的范围,95%参考值范围指同质总体包含95%个体值的估计范围,说明个体的波动范围。
计算:
判断观察值的某项指标与否,评价个体指标是否正常。
线性回归分析的应用:1. 线性回归方程可应用于以下三个方面:①分析两个变量之间是否存在线性依存关系;②利用回归方程由自变量X 对应变量Y 进行估计,必要时可以作区间估计;③利用回归方程进行统计控制,即利用回归方程进行逆运算,通过控制自变量X 取值来限定应变量Y在一定范围内波动。
2. 作回归分析时,如果两个有内在联系的变量之间存在因果关系,那么应该以原因变量为X ,以结果变量为Y;如果变量之间因果关系难以确定,则应以易于测定或变异较小者为X。
3. 在回归分析中,自变量X 既可以是随机变量,也可以是给定的量。
如果Y不服从正态分布,在进行回归分析前,应先进行变量的变换以使应变量符合回归分析的要求。
4. 使用回归方程估计Y 值时,尽量不要把估计的范围扩大到建立方程时的自变量的取值范围之外,由于超出样本取值范围,其线性关系是否成立难以判断,外推要慎重。