常用医学统计学符号
医学统计学符号公式重点
医学统计学符号公式重点在医学统计学中,符号和公式起着至关重要的作用,用于表达和传递统计学概念、方法和结果。
了解这些符号和公式的含义和应用是医学研究和实践中必不可少的一部分。
本文将重点介绍一些常用的医学统计学符号和公式。
一、描述性统计符号1. 样本均值:用x表示,表示样本中各个观察值的平均数。
2. 总体均值:用μ表示,表示总体中各个观察值的平均数。
3. 样本标准差:用s表示,表示样本数据与其均值之间的离散程度。
4. 总体标准差:用σ表示,表示总体数据与其均值之间的离散程度。
5. 样本方差:用s^2表示,表示样本数据的离散程度。
6. 总体方差:用σ^2表示,表示总体数据的离散程度。
7. 样本协方差:用sxy表示,表示两个变量之间的关联程度。
8. 总体协方差:用σxy表示,表示两个变量之间的关联程度。
9. 样本相关系数:用r表示,表示两个变量之间的相关程度。
10. 总体相关系数:用ρ表示,表示两个变量之间的相关程度。
二、推断统计符号1. 样本容量:用n表示,表示样本中观察值的个数。
2. 总体容量:用N表示,表示总体中观察值的个数。
3. 统计量:用T表示,表示根据样本数据计算得出的用于推断总体特征的指标。
4. 标准误差:用SE表示,表示样本统计量与总体参数之间的估计误差。
5. 自由度:用df表示,表示样本数据中独立和能够随机变化的观察值的个数。
6. 置信区间:用CI表示,表示对总体参数的一个估计区间,给出了一个置信水平下的估计结果。
7. 假设检验:用H0和H1表示,分别表示原假设和备择假设。
8. 显著性水平:用α表示,表示拒绝原假设的临界点,通常设置为0.05。
9. P值:表示假设检验中拒绝原假设的概率,通常与显著性水平进行比较来进行判断。
三、统计学公式1. 样本均值的计算公式:x= (x1 + x2 + … + xn) / n2. 样本标准差的计算公式:s = sqrt((Σ(xi - x)^2) / (n - 1))3. Z分数的计算公式:Z = (x - μ) / σ4. 标准误差的计算公式:SE = s / sqrt(n)5. t分数的计算公式:t = (x - μ) / (s / sqrt(n))6. 置信区间的计算公式:CI = x ± (Z * (s / sqrt(n)))7. 相关系数的计算公式:r = Σ((xi - x) * (yi - ȳ)) / sqrt(Σ(xi - x)^2 * Σ(yi - ȳ)^2)以上是医学统计学中常用的一些符号和公式,它们在研究、分析和解释医学数据和结果时起到了重要的作用。
医学统计学符号-公式-重点
在偏态分布时,易受极值影响;
1. 当观察例数 n 为奇数时,中位
算术均数
数是按顺序排列在第(n+1)/2 项
算数均数(均数):线性尺度上的 n 为偶数时,中位
几何均数及应用
数是按顺序排列在第 n/2 和
几何均数:对数尺度上的平均水
(n/2)+1 项观察值的平均值;
几何均数
中位数
均数尺度 适用
线性 对称分布
对数
对数正态分布 (指数、等比分布)
顺序 偏态分布
单侧 95%=双侧 90%=1.645 μ±σ:68%
正态分布及应用
μ±1.96σ:95%
正态分布有两个参数 和 , 分别表示均数和标准差
μ±2.58σ:99% 二、医学参考值范围的制定方法
页脚内容7
医学统计学总结
平;
百分位数
1. 几何均数的对数等于各观察 百分位数 Px:指在一组数据中找
值对数的算术均数;
到这样一个数值,全部观察值的
页脚内容5
x%小于 Px ,其余(100-x)%大于 Px。
算术均数
几何均数
中位数
均数尺度 适用
线性
对数
对称分布
对数正态分布 (指数、等比分布)
顺序 偏态分布
医学统计学总结
定量:频数表/图
异
不同类型变异程度指标的比较
当μ=0,σ=1 时,称为标准正态
特点
极差
四分位数间距 方差和标准差
变异系数
特点
简单,粗略;不 稳定,受极端值
影响大
相对稳定;未使 用所有观察值
使用全部信息, 应用广泛
比较无量纲或多 组均数相差较大
数据
医学统计学-名词解释-精心整理(带英文)(7)
1.总体(p o p u l a t i o n):根据研究目的确定的同质观察单位的全体。
2.样本(s a mp l e):3.抽样(s a mp l i n g):从总体中抽取部分观察样本的过程。
4.计量资料(m e a s u r e m e n t d a t a):又称定量资料或数值变量。
观测每个观察单位某项指标大小而获得的资料。
变量值是定量的。
一般有度量单位,可分为连续型或离散型。
5.计数资料(e n u m e r a t i o n d a t a):又称定性资料或无序分类变量资料,名义变量资料。
观察单位按某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。
变量值是定性的,表现为互不兼容的属性或类别:●二分类:药物疗效:治愈未治愈;●多分类:人群血型分布,AB OA B互不兼容。
6.等级资料(r a n k e d d a t a):半定量资料或有序分类变量资料。
变量值具有半定量性质,表现为等级大小或属性程度。
7.同质(H o m o g e n e i t y):医学研究对象具有的某种共性。
8.变异(V a r i a t i o n):同质研究对象变量值之间的差异。
9.总体(P o p u l a t i o n):根据研究目的确定的所有同质的观察单位某项观测值的全体称为总体。
10.样本(S a m p l e):来自于总体的部分观察单位的观测值称为样本。
11.参数(P a r a m e t e r):由总体中全部观测值所计算出的反映总体特征的统计指标。
12.统计量(S t a t i s t i c):由样本观测值所计算出的反映样本特征的统计指标。
13.变量(V a r i a b l e):指观察单位的某项特征。
它能表现观察单位的变异性。
14.概率(P r o b a b i l i t y):是随机事件发生可能性大小,用P表示,其取值为[0,1]。
15.频率(F r e q u e n c y):在相同的条件下,独立地重复做n次试验,随机事件A出现m次,则比值m/n为随机事件A出现的频率。
医学统计学考试必会名词解释
,更确切地说,就是同质的所有观察单位某种观察值(变量值)的集合。
,观察单位数无限。
,其实测值的集合。
样本应具有代表性。
研究者则应对每个观察单位的某项特征进行测量与观察,这种特征称为变量。
,亦称为资料。
,可以控制的主要因素尽可能相同。
,就是对每个观察对象的观察指标用定量方法测定其数值大小所得的资料,一般用度量衡单位。
,就是先将观察对象的观察指标按性质或类别进行分组,然后计数各组该观察指标的数目所得的资料。
,常用P表示。
(用希腊字母代表),如总体均数μ,总体率л,总体标准差σ等。
,称为统计量。
(用拉丁字母代表)如相本均数x,样本率p,样本标准差s等。
(变量取值为一定范围内的任意值)的资料,其结果表达的限制因素就是测量仪器或方法的灵敏度。
,表示观察值在各组内出现的频繁程。
,即为频数分布表,简称频数表。
,左右两侧的频数基本对称。
,集中位置偏向一侧。
若集中位置偏向数值小的一侧(左侧),称为正偏态;若集中位置偏向数值大的一侧(右侧),,在医学领域中常用的平均数有算术均数、几何均数及中位数。
,描述一组同质计量资料的平均水平。
统计学中常用希腊字母μ表示总体均数,用x表演示样本均数。
,但经过对数变换后呈正态分布或近似正态分布的资料,如血清抗体滴度、细菌计数等,宜采用几何均数描,即全部观察值中最大值与最小值之差,用符号R表示。
极差大,说明变异程度大;反之,说明变异程度小。
x百分位置上的数值,用符号表示为P x。
简记为CV),亦称离散系数,为标准差与均数之比。
写成公式为:CV=S/X×100%,常用于(1)比较计量单位不同的几组资料的离散程;(2),也称正常值。
,生物医学数据并非常数,而就是在一定范围内波动。
,随机抽样引起的样本统计量与总体参数间的差异称为抽样误差。
样本均数的标准差称为标准误 ,其计算公式为。
,就是统计推断的一个重要方面。
,称为点值估计。
,指按预先给定的概率估计未知总体均数的可能范围。
,用α表示,就是预先规定的概率值,在实际工作中一般取α=0、05。
医学统计学计量资料的统计描述
正确应用集中趋势指标
• 算数均数:适用于单峰对称分布资料; • 几何均数:适用于变量值呈等比级数关系和呈对
数正态分布的资料; • 中位数和百分位数:适用于任何分布的资料,但
在样本含量较少时不稳定,越靠两端越不稳定; • 中位数在抗极端值的影响方面,比均数具有较好
• 计算公式: Q= QU - QL = P75 - P 25 • 意义: Q值越大,说明变异程度越大。
• 特点:包括了居于中间位置50%的变量值,该指
标比全距稍稳定,但仍未考虑每个观察值。
某传染性疾病的潜伏期(天)
平均偏差(mean difference)
• 定义:各观察值偏离平均数的绝对平均差距 • 计算公式:
差、标准差。
极差(range)
• 表示法:R • 定义:一组资料中最大值与最小值之差。
• 计算公式: R = max-min
• 意义:反映个体变异范围的大小。R越大,变异度(离
散程度)越大, R甲=188-142=46、R乙=166-158=8
• 优点:计算简便,概念清晰,如说明传染病、食物中毒 的最长、最短潜伏期等
125.5296
若应用算术均数为:
问题:
• 为什么表达该资料的平均水平宜用几何均 数?
• 几何均数适用条件是什么? • 何种情况不宜计算几何均数? • 利用频数表计算几何均数时应注意什么?
几何均数的应用
• 几何均数适用于变量值呈等比级数关系和呈对数 正态分布的资料;有些呈轻度偏态分布的资料经 过对数变换后呈对称分布的资料。
• 算术均数 • 几何平均数 • 中位数 • 众数
算术均数(mean)
《医学统计学》统计描述 (1)
2500 2500 2500 420
500 500 500
甲 乙丙
例4-9,etc
1.极差(Range) (全距)
符号:R 意义:反映全部变量值的
R X max X min
变动范围。
580
优点:简便,如说明传染病、
560 540
食物中毒的最长、最短潜 520
伏期等。
500
缺点:1. 只利用了两个 极端值
表2-2 115名正常成年女子血清转氨酶(mmol/L)含量分布
转氨酶含量
人数
12~
2
15~
9
18~
14
21~
23
24~
19
27~
14
30~
11
33~
9
36~
7
39~
4
42~45
3
人数
25
20 15
10 5
0
13.5 19.5 25.5 31.5 37.5 43.5. 血清转氨酶(mmol/L)
图2-2 115名正常成年女子血清转氨酶的频数分布
lg 表示以10为底的对数;
lg 1表示以10为底的反对数
X 0,为正值 (0,负数?)
几何均数的适用条件与实例
适用条件:呈倍数关系的等比资料或对数正态分 布(正偏态)资料;如抗体滴度资料
例 血清的抗体效价滴度的倒数分别为:10、
100、1000、10000、100000,求几何均数。
XG
lg1
图 2-3 101 名 正 常 人 血 清 肌 红 蛋 白 的 频 数 分 布
2. 描述计量资料的分布特征
①集中趋势(central tendency):变量值集中 位置。本例在组段“4.7~4.9”。
02-医学统计学定量数据的统计描述
X为组段的组中值。 X=(组段上限+组段下限)/2
【例】120名健康男性居民血清铁含量的频数分布表,试求 其算术均数。
组段 频数 组中值 6~ 1 7 8~ 3 9 10~ 6 11 12~ 8 13 14~ 12 15 16~ 20 17 fX 7 27 66 104 180 340 组段 频数 组中值 18~ 27 19 20~ 18 21 22~ 12 23 24~ 8 25 26~ 4 27 28~30 1 29 fX 513 378 276 200 108 29
概 述 平均数(average),是描述一组观察值集中位置或 平均水平的统计指标,常作为一组数据的代表值用于 分析和进行组间的比较。 常用的有算术均数、几何均数、中位数、百分位 数等。
算术均数 算术均数(arithmetic mean),等于一个变量所有观 察值的和除以观察值个数。 总体均数用希腊字母μ表示,样本均数用符号 X 表示。 算术均数适用于对称分布的资料,如分布均匀的小 样本数据或近似正态分布的大样本数据。 算术均数易受极端值的影响,并且受极大值的影响 大于受极小值的影响。
n为总频数。
【例】52例慢性肝炎患者的HBsAg滴度数据表,试求其 几何均数。
抗体滴度 1:16 1:32 1:64 1:128 1:256 1:512 合计 频数 2 7 11 13 12 7 52 滴度倒数 16 32 64 128 256 512 lgX 1.20412 1.50515 1.80618 2.10721 2.40824 2.70927 f (lgX) 2.40824 10.53605 19.86798 27.39373 28.89888 18.96489 108.06977
中位数 中位数(median,M),是在按大小顺序排列的变 量的所有观察值中,位于正中间的一个或两个数值。 当数据呈偏态分布、或频数分布两端无确定数值, 均宜采用中位数描述集中趋势。 中位数的确定取决于它在数据序列中的位置,因此 对极端值不敏感。
医学统计学名词解释
医学统计学1、Medical Statistics(医学统计学):是以医学理论为指导,借助统计学的原理和方法研究医学现象中的数据搜集、整理、分析和推断的一门综合性学科。
2、Variable(变量):是指观察个体的某个指标或特征,统计上习惯用大写拉丁字母表示。
3、Numerical/Quantitative/Measurement date/variable数值变量/定量变量/计量资料/定量资料:是以定量的方式来表示观察单位某项观察指标的大小,所得的资料称之为~,有度量单位。
4、Unordered categorical/Qualitative/Enumeration date/variable无序分类变量/定性变量/计数资料/定性资料:是以定性的方式来表示观察单位某项观察指标,所得的资料称之为~,无固有度量单位。
5、Ordinal categorical/Semi-quantitative/Ranked date/variable有序分类变量/半定量资料/等级资料:是以等级的方式来表示观察单位某项观察指标,所得的资料称之为~,为半定量的观察结果,有大小顺序。
6、Homogeneity(同质):是指事物的性质、影响条件或背景相同或相近。
7、Variation(变异):是指同质的个体之间的差异。
8、Population(总体):是根据研究目的所确定的同质观察单位的全体或集合,分为有限总体和无限总体。
9、Sample(样本):是从总体中随机抽取的一部分观察单位所组成的集合。
10、Random variable(随机变量):是指取值不能事先确定的观察结果。
11、Parameter(参数):是总体特征的统计指标,采用小写的希腊字母,为固定的常数。
12、Statistic(统计量):是样本特征的统计指标,采用拉丁字母表示,由样本信息推算而得,是参数附近波动的随机变量。
13、Random Sampling(随机抽样):为了保证样本的可靠性和代表性,需要采用随机的抽样方法,使总体中每个个体均有相同的机会被抽到。
医学统计学知识点
第一章绪论1、统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。
2、研究对象:具有不确定性结果的事物。
3、统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。
4、统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。
5、医学统计学基本内容:统计设计、数据整理、统计描述、统计推断。
6、医学统计学中的基本概念(1) 同质与变异同质,指根据研究目的所确定的观察单位其性质应大致相同。
变异,指总体内的个体间存在的、绝对的差异。
统计学通过对变异的研究来探索事物。
(2) 变量与数据类型变量,是反映实验或观察对象生理、生化、解剖等特征的指标。
变量的观测值,称为数据分为三种类型:定量数据,也称计量资料,指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。
(如身高、体重、血压、温度等)定性数据,也称计数资料,指将观察单位按某种属性分组计数的定性观察结果。
包括二分类、无序多分类。
(进一步分为二分类和多分类,如性别分为男和女,血型分为A、B、O、AB等)有序数据,也称半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果,具有半定量性质。
统计方法的选用与数据类型有密切的关系。
(3)总体与样本总体,指根据研究目的确定的所有同质观察单位的全体,包括所有定义范围内的个体变量值。
样本,是从研究总体中随机抽取部分有代表性的观察单位,对变量进行观测得到的数据。
抽样,是从研究总体中随机抽取部分有代表性的观察单位。
参数,指描述总体特征的指标。
统计量,指描述样本特征的指标。
(4)误差误差,指观测值与真实值、统计量与参数之间的差别。
可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误差的大小通常恒定,具有明确的方向性。
随机测量误差,是偶然机遇所致,误差没有固定的大小和方向。
抽样误差,是抽样引起的统计量与参数间的差异。
抽样误差主要来源于个体的变异。
医学统计学符号
医学统计学符号医学统计中的基本概念1、医学统计学是研究医学数据的收集、整理、分析、解释和呈现其结果的一门学科。
2、个体:研究的基本观察单位。
3、变量:用于观察研究对象的指标。
4、观察值:个体变量的数值。
5、资料:又称为数据,由变量的观察值构成。
¢ 变异:个体观察值之间具有的差异。
¢ 变异和同质是对统计学数据的要求!¢ 变异是统计学研究的真正对象!¢ 统计学是研究变异规律的科学!¢ 同质:个体观察值之间的变异在允许范围内。
¢ 异质:个体观察值之间的变异超出允许范围。
一、总体、抽样、样本、参数、统计量总体:同质的个体所构成的全体研究对象。
总体同时具有同质和变异两个特点。
有限总体:总体中的个体数量是有限的。
无限总体:总体中的个体数量是无限的。
¢ 样本:从总体中随机抽取的部分个体。
¢ 样本量:样本所包含的个体数目。
¢ 参数:刻画总体特征的指标。
¢ 统计量:刻画样本特征的指标。
抽样:从总体中随机抽取部分个体的过程。
抽样具有代表性、随机性、可靠性、可比性;原则:代表性:样本能充分反映总体特征。
随机性:保证总体中每个个体都有相同的几率被抽样。
随机性是代表性的保证;生活中随机性的例子(思考题);¢ 计量资料:由连续变量的观察值构成的资料。
对每个观察对象的观察指标用定量方法测定其数值大小所得的资料,一般有度量衡单位,例如年龄、身高、血糖。
¢ 计数资料:由离散变量的观察值构成的资料。
先将观察对象的观测指标按性质或类别进行分组,然后计数各组的数目所得的资料,例如性别、患病、血型。
¢ 等级分组资料:由等级变量的观测值构成的资料。
具有计数资料的特征,同时又具有半定量性质的资料,例如细菌培养阳性结果。
二、3种设计类型:完全随机设计;配对设计;配伍组设计。
三、抽样误差、概率和小概率事件¢ 抽样误差:由抽样引起的样本统计量与总体参数之间的差异。
医学统计学统计图和统计表
通过绘制置信区间,可以展示参数估计的精确度和可靠性。
效应量图
用于展示实验组和对照组之间的差异程度,如均值差、比例差等。
案例三
实验设计表
列出实验目的、实验对象、实验方法、实验指标 等关键信息,有助于规范实验操作和数据分析。
随机分组表
用于展示实验对象的随机分组情况,确保实验的 随机性和可比性。
用于比较两组均数是否有统计学 差异,常配合P值和95%置信区间
使用。
方差分析表
用于比较多组均数是否有统计学差 异,可展示各组均数、标准差、F 值、P值等。
卡方检验表
用于比较两个分类变量之间是否有 统计学关联,展示观察频数、期望 频数、卡方值、P值等。
实验设计相关表格
01
02
03
随机分组表
用于展示实验对象的随机 分组情况,确保各组基线 特征相似。
确保数据准确性和完整性,避免误导读者
01
核对数据源,确保数据的准确 性和完整性。
02
在处理数据时,要注意异常值 和缺失值的处理。
03
避免篡改数据或选择性展示数 据,以免误导读者。
注重图表美观度和易读性,提升视觉效果
选择合适的配色方案, 使图表更加美观和易 于阅读。
使用简洁明了的标注 和说明,帮助读者更 好地理解图表内容。
合理设置图表元素, 如标题、坐标轴、图 例等,提高图表的可 读性。
遵循学术规范和伦理要求,确保图表质量
01
遵守学术出版规范,如引用格式、图表尺寸等。
02
尊重原作者的知识产权,如需引用他人图表,应注明出处并获
得授权。
在涉及患者隐私或伦理问题时,应采取适当的措施保护相关人
03
员的权益。
医学统计学考试必会名词解释
P表示。
,如总体均数μ,总体率л,总体标准差σ等。
(用拉丁字母代表)如相本均数x,样本率p,样本标准差s等。
,称为正偏态;若集中位置偏向数值大的一侧(右μ表示总体均数,用x表演示样本均数。
对于原始观察值呈偏态分布,但经过对数变换后呈正态分布或近似正态分布的资料,如血清抗体滴度、细菌计数等,宜采用几何均R表示。
极差大,说明变异程度大;反之,说明变异程度小。
x百分位置上的数值,用符号表示为P x。
CV),亦称离散系数,为标准差与均数之比。
写成公式为:CV=S/X×100%,常用于(1)比较计量单位不同的几组资料的样本均数的标准差称为标准误,其计算公式为。
α表示,是预先规定的概率值,在实际工作中一般取α=0.05。
H0,即“弃真”的错误。
Ⅰ型错误的概率用а表示,若确立检验水准为а=0.05,则犯第一类错误的概率为H0,即“存伪”的错误。
Ⅱ型错误的概率用β表示。
H0所规定的总体中随机抽样,获得等于及大于(或等于及小于)现有样本统计量的概率。
N(u,б2),经变换后,u服从均数为0,标准差为1的正态分布,这种正态分布称为标准正态分布。
X,它的可能取值是0,1,……n,且相应的取值概率P 叫随机变量服从以n,л为参数的二项分布,记X,它的可能取值为0,1,……n,,且相应取值概率为称随机变量X服从μ为参……。
……。
本法M-Friedman在符号检验的基础上提出来的,常称为Friedman检验,又称M检验。
SS e表示。
反映组间变异。
…。
……。
b表示,b的统计意义为自变量x改变一个单位时,应变量y平均变化b个单位。
x对y的线性影响外,其它所有因素对y变异的影响,即在总平方和中无法用x与y的线性关系所能解释的部y的随机误差。
x,y间的相互关系。
Pearson积矩相关系数,说明具有直线关系的两变量间相关方向与密切程度。
以符号r表示样本相关系数,ρ表示总体相用r2表示,它反映应变量y的总变异中,可用回归关系解释的比例,其公式为r2= 。
医学统计学名词解释精心整理(带英文)
同质 (Homogeneity):医学研究对象具有的某种共性。
变异 (Variation) :同质研究对象变量值之间的差异。
总体 (Population):根据研究目的确定的所有同质的观察单位某项观测值的全体称为总体。
样本 (Sample):来自于总体的部分观察单位的观测值称为样本。
参数 (Parameter):由总体中全部观测值所计算出的反映总体特征的统计指标。
统计量 (Statistic):由样本观测值所计算出的反映样本特征的统计指标。
变量 (Variable) :指观察单位的某项特征。
它能表现观察单位的变异性。
概率 (Probability):是随机事件发生可能性大小,用P表示,其取值为[0,1]。
频率 (Frequency) :在相同的条件下,独立地重复做n次试验,随机事件A 出现m次,则比值m/n为随机事件A出现的频率。
随机误差 (Random error):是由于一系列实验或观察条件等因素的随机波动造成的测量值与真实值之间的差异。
随机误差是不可避免的,且大小和方向都不固定。
抽样误差 (Sampling error):由个体变异产生、随机抽样造成的若干个样本统计量之间以及样本统计量与总体参数之间的差异称为抽样误差。
系统误差 (Systematic error) :实际观测中,由于仪器未校正,测量者感官的某种偏差,医生掌握疗效标准偏高或偏低等,而使观测值有方向性、系统性或周期性地偏离真值。
四分位数间距 (Quartile range) :上四分位数与下四分位数的差值,用Q 表示。
通常用来描述偏态分布资料的离散趋势。
变异系数 (Coefficient of variation) CV :是标准差与均数之比,用于比较测量单位不同或均数相差较大的两组或以上数据的离散程度。
参考值范围 (Reference range) :绝大多数“正常人”的解剖、生理、生化等某项指标的波动范围。
构成比 (Proportion) :表示事物内部某一组成部分观察单位数与该事物各组成部分的观察单位总数之比,用以说明事物内部各组成部分所占的比重。
(完整word版)医学统计学考试重点(人卫第七版)
1、同质:是指观察单位或观察指标受共同因素制约的部分2、观察单位:亦称个体,是统计研究中最基本的单位3、变异:在同质的基础上个体间的差距4、总体:根据研究目的所确定的同质观察单位的全体,既是同质的所有观察单位某项观察值的集合5、有限总体:总体若受一定的时间和空间控制,其观察单位数是有限的,称为有限总体无限总体:理论上其观察单位数是无法穷尽的6、样本:是指从总体中随机抽取部分观察单位其某项指标实测值的集合7、抽样:从总体中抽取部分个体的过程称为抽样8、抽样必须遵循随机化原则,即总体中每一个体都有同等的机会被抽取到9、抽样研究的方法,利用样本的信息推论总体的特征来达到研究目的10、参数:描述总体特征的量11、统计量:根据样本个体值计算得到的描述样本特征的量12、总体参数是常数,而样本统计量可随样本不同而不同13、随机误差:指一类不恒定、随机变化的误差,有多种尚无法控制的因素所引起14、抽样误差:指抽样引起的样本统计量与总体参数之间的差异15、系统误差:在实际观测过程中,由于仪器未校正、观测者感官的某种倾向、研究者掌握的标准偏高或偏低等原因,使观察值不是随机分散在真值两侧,而是具有方向性、系统性或周期性的偏离真值,这类误差称为系统误差16、过失误差:指各种失误所导致的误差17、随机事件:在一定条件下某一现象可能发生也可能不发生的事件18、概率:反映某一随机事件发生可能性大小的量,用符号P表示19、小概率事件:统计学上一般把P≤0。
05的事件称为小概率事件,表示某事件发生的可能性很小20、变量:观察单位的某个特征21、变量值:变量的观察结果或测定值22、按变量值是定性的还是定量的,可将变量分为数值变量和分类变量23、数值变量又称定量变量,其变量值是用定量方法测得的,所的资料是计量资料24、分类变量又称定性变量,其变量值是用定性方法测得的25、分类变量根据类别是否有程度上的差别,可分为无序分类变量(构成的资料为计数资料)和有序分类变量(所得资料为等级资料)25、医学统计工作的基本步骤:一、设计;二、收集资料;三、整理资料;四、分析资料26、统计表和统计图是描述统计资料的重要工具27、统计表的结构:①标题位于统计表的上中方②标目用来说明表内各纵横数字的含义,注意标明指标的单位。
常用医学统计方法及科研论文写作
设计需考虑以下几方面: 1、研究的目的和假设是什么? 2、研究对象的选择范围是什么?如何确定? 3、研究方法是什么?技术路线如何? 4、具体的研究内容、观察项目与指标是什么? 5、研究对象的数量大小,如何抽样?怎样分组? 6、对观察指标如何进一步计算?具体采用哪些统计分 析方法? 7、有哪些可能存在的误差?如何避免与减少其影响? 8、时间、人员、经费方面的安排。
老少比 =
×
65岁及以上老年人口数 14岁及以下少年儿童人口数
100%
人口金字塔
人口金字塔是一种用几何图形来形象地表示 人口性别年龄构成的方法。其图形形如金字塔, 故称为人口金字塔 。
人口金字塔分型
增长型人口:人口金字 塔呈上尖下宽,多 为出生率大于死亡 率,表示人口不断 增长。 静止型人口:除高龄组 构成较小外,其它 各年龄组构成相近, 此类人口出生率基 本等于死亡率,人 口总数基本稳定。 缩减型人口:人口金字 塔呈现上下两头小, 中间大,一般多为 死亡率大于出生率, 人口总数不断减少。
解决方法
可避免 查明并去除原因
测量误差 (随机) 抽样误差 (随机)
测量变异
测值-真值
随机
不可避免 提高测量精度 不可避免 增加样本含量
个体变异
样本--总体 样本--样本
随机
4、概率和小概率事件
概率是反映某一事件发生的可能性的大小,常
用符号P表示。其值在0和1之间。概率等于1
的事件是必然事件(P=1),概率等于0的事
围生期死亡 新生儿 死亡
婴儿 死亡
新生儿死亡率 指某地某年平均每千名活产 数中未满28天的新生儿死亡数,其算式为:
同年未满28天的新生儿死亡数
新生儿死亡率=
某年活产总数
医学统计学——简答题一览
简答题(规则是:知道多少,写多少,不要空白,尽量多写)1. 频数表和频数图的用途答:1.描述频数分布的类型(1)对称分布 :若各组段频数的分布以频数最多的组段为中心左右两侧大体对称(总体则完全对称),就认为该资料是对称分布(2)偏态分布 :右偏态分布(正偏态分布):频数最多组段右侧的组段数多于左侧的组段数,高峰向左偏移,频数向右侧拖尾。
左偏态分布(负偏态分布):左侧的组段数多于右侧的组段数,频数向左侧拖尾。
2. 描述计量资料分布的集中趋势和离散趋势①集中趋势(central tendency):变量值集中位置。
——平均水平指标②离散趋势(tendency of dispersion):变量值围绕集中位置的分布情况。
离“中心”位置越远,频数越小;且围绕“中心”左右对称。
——变异水平指标3.便于发现一些特大或特小的可疑值;4.便于进一步做统计分析和处理。
2.计量资料集中趋势和离散趋势的描述答:集中趋势常用指标位算数均数、几何均数和中位数。
1.算数均数简称均数,适合描述对称分布或近似对称分布资料的集中趋势。
可以分为总体均数和样本均数。
(总体均数:是指根据研究目的所确定的全体研究对象的某项指标观察值的平均水平;样本均数:是指研究所收集到的研究对象的某项观察值的算数均数。
)注意计算方法:原始数据的样本均数计算方法 频数表资料的样本均数计算方法2.几何均数适用于对数对称分布(原始变量分布不对称,但是经过对数变换后近似呈对称分布)的资料,并且要求所有数据均大于0.典型代表——滴度。
原始资料的几何均数计算方法频数表资料的几何均数计算方法3.中位数 意义:中位数是将一批数据从小至大排列后位次居中的数据值,反映一批观察值在位次上的平均水平。
符号:Md适用条件:适合各种类型的资料。
尤其适合于①大样本偏态分布的资料; ②资料有不确定数值;③资料分布不明等。
离散趋势的常用描述指标是:方差标准差、全距、四分位数间距、变异系数。
医学统计学附录
附表1x2值表n'P0.995 0.990 0.975 0.950 0.900 0.750 0.500 0.250 0.100 0.050 0.025 0.010 0.0051 …………0.02 0.10 0.45 1.32 2.71 3.84 5.02 6.63 7.882 0.01 0.02 0.02 0.10 0.21 0.58 1.39 2.77 4.61 5.99 7.38 9.21 10.603 0.07 0.11 0.22 0.35 0.58 1.21 2.37 4.11 6.25 7.81 9.35 11.34 12.844 0.21 0.30 0.48 0.71 1.06 1.92 3.36 5.39 7.78 9.49 11.14 13.28 14.865 0.41 0.55 0.83 1.15 1.61 2.67 4.35 6.63 9.24 11.07 12.83 15.09 16.756 0.68 0.87 1.24 1.64 2.20 3.45 5.35 7.84 10.64 12.59 14.45 16.81 18.557 0.99 1.24 1.69 2.17 2.83 4.25 6.35 9.04 12.02 14.07 16.01 18.48 20.288 1.34 1.65 2.18 2.73 3.40 5.07 7.34 10.22 13.36 15.51 17.53 20.09 21.969 1.73 2.09 2.70 3.33 4.17 5.90 8.34 11.39 14.68 16.92 19.02 21.67 23.5910 2.16 2.56 3.25 3.94 4.87 6.74 9.34 12.55 15.99 18.31 20.48 23.21 25.1911 2.60 3.05 3.82 4.57 5.58 7.58 10.34 13.70 17.28 19.68 21.92 24.72 26.7612 3.07 3.57 4.40 5.23 6.30 8.44 11.34 14.85 18.55 21.03 23.34 26.22 28.3013 3.57 4.11 5.01 5.89 7.04 9.30 12.34 15.98 19.81 22.36 24.74 27.69 29.8214 4.07 4.66 5.63 6.57 7.79 10.17 13.34 17.12 21.06 23.68 26.12 29.14 31.3215 4.60 5.23 6.27 7.26 8.55 11.04 14.34 18.25 22.31 25.00 27.49 30.58 32.8016 5.14 5.81 6.91 7.96 9.31 11.91 15.34 19.37 23.54 26.30 28.85 32.00 34.2717 5.70 6.41 7.56 8.67 10.09 12.79 16.34 20.49 24.77 27.59 30.19 33.41 35.7218 6.26 7.01 8.23 9.39 10.86 13.68 17.34 21.60 25.99 28.87 31.53 34.81 37.1619 6.84 7.63 8.91 10.12 11.65 14.56 18.34 22.72 27.20 30.14 32.85 36.19 38.5820 7.43 8.26 9.59 10.85 12.44 15.45 19.34 23.83 28.41 31.41 34.17 37.57 40.0021 8.03 8.90 10.28 11.59 13.24 16.34 20.34 24.93 29.62 32.67 35.48 38.93 41.4022 8.64 9.54 10.98 12.34 14.04 17.24 21.34 26.04 30.81 33.92 36.78 40.29 42.8023 9.26 10.20 11.69 13.09 14.85 18.14 22.34 27.14 32.01 35.17 38.08 41.64 44.1824 9.89 10.86 12.40 13.85 15.66 19.04 23.34 28.24 33.20 36.42 39.36 42.98 45.5625 10.52 11.52 13.12 14.61 16.47 19.94 24.34 29.34 34.38 37.65 40.65 44.31 46.9326 11.16 12.20 13.84 15.38 17.29 20.84 25.34 30.43 35.56 38.89 41.92 45.64 48.2927 11.81 12.88 14.57 16.15 18.11 21.75 26.34 31.53 36.74 40.11 43.19 46.96 49.6428 12.46 13.56 15.31 16.93 18.94 22.66 27.34 32.62 37.92 41.34 44.46 48.28 50.9929 13.12 14.26 16.05 17.71 19.77 23.57 28.34 33.71 39.09 42.56 45.72 49.59 52.3430 13.79 14.95 16.79 18.49 20.60 24.48 29.34 34.80 40.26 43.77 46.98 50.89 53.67 40 20.71 22.16 24.43 26.51 29.05 33.66 39.34 45.62 51.80 55.76 59.34 63.69 66.77 50 27.99 29.71 32.36 34.76 37.69 42.94 49.33 56.33 63.17 67.50 71.42 76.15 79.4960 35.53 37.48 40.48 43.19 46.46 52.29 59.33 66.98 74.40 79.08 83.30 88.38 91.9570 43.28 45.44 48.76 51.74 55.33 61.70 69.33 77.58 85.53 90.53 95.02 100.42 104.2280 51.17 53.54 57.15 60.39 64.28 71.14 79.33 88.13 96.58 101.88 106.63 112.33 116.3290 59.20 61.75 65.65 69.13 73.29 80.62 89.33 98.64 107.56 113.14 118.14 124.12 128.30100 67.33 70.06 74.22 77.93 82.36 90.13 99.33 109.14 118.50 124.34 129.56 135.81 140.17注:自由度的符号本书统一用ν,但若沿用n’也不为错。