中医统计学复习
医学统计学总复习

总复习一、统计工作的基本步骤:四个步骤:设计(最关键的一步)、搜集资料(统计分析的前提)、整理资料、分析资料。
二、三种资料类型:1. 计量资料(定量资料)2. 计数资料(分类资料)3. 等级资料三、几个基本概念1. 总体与样本2. 概率四、计量资料的统计描述1. 集中趋势:X、G、M(Px):适用条件、计算2. 离散趋势:R、Q、S、CV:意义及适用条件五、集中趋势离散趋势指标的选择判断步骤:资料是抗体滴度 G、S否是偏态、开口 M、Q否X、S六、正态分布1.正态分布的特征2.正态曲线下分布面积的规律3.u变换(见下)七、抽样误差的概念1. 抽样误差(概念)2. 抽样误差的特点:⑴客观存在,可控制但不能消除;⑵它是反映抽样误差大小的指标:用Sx来说明均数的抽样误差大小;用Sp 来说明率的抽样误差大小;⑶均数抽样误差的大小与标准差成正比,与√n成反比;⑷减少抽样误差最切实可行的办法为:增加样本含量。
3. 总体均数的估计方法⑴点(值)估计:⑵区间估计:①95%可信区间:X±1.96Sx②99%可信区间:X±2.58Sx附:①正常参考值范围估计:①95%正常值范围:X±1.96S②99%正常值范围:X±2.58S②可信区间与正常值范围的区别4. u变换与t变换:X-μ X-μu变换: u=──── u=────σσxt变换: X-μt=────Sx八、假设检验的一般步骤:⑴建立假设①H0:无效假设;H1:备择假设②单双侧检验:根据专业知识来定。
⑵确定检验水准:α=0.05⑶选定检验方法并计算检验统计量⑷确定P值:直接计算、查表法⑸作出推断结论:统计结论:是否拒绝H0专业结论:谁高谁低?(有无效果)九、常用t检验(重点是掌握根据资料的性质、分析的目的来选择假设检验方法)1. t(u)检验的应用条件2. 假设检验方法:⑴ X与μ的比较的t检验(一般是单组原始数据)⑵配对设计资料的t检验(关键是掌握什么是配对资料)配对设计的三种情况:①同一对象治疗前后比较;②同一标本分别用两种方法处理;③将条件相同或相近的两个对象配成对子,然后随机分配到两个处理组中,观察两种处理有无差别。
《医学统计学》复习重点总结

计量数据比较的统计公式
X 0 t Sx
样本均数与标准值的比较 *配对数据的比较(不做方 差齐性检验 *两样本均数的比较,例数 较小时(做方差齐性检验)
d d t Sd
X1 X 2 t S x1 x2
t检验与可信区间公式小结
X1 X 2 t , SX1X 2
两独立样本均数的t n1 n2 2 检验公式
病变性质
肿瘤
恶性
1.层次不清,结构混乱,难于理解 2.线条过多,不符要求
修改后:
表 10 病变性质 良性肿瘤 恶性肿瘤﹡ 囊肿 瘤样病变 合 计
口腔颌面部不同病变构成情况 例 数 674 558 192 168 1592 构成比(%) 42.34 35.05 12.06 10.55 100.00
﹡包括癌437例,肉瘤101例,果用统计表表达。
统计表类型:
简单表和组合表
统计图: 要求掌握图形选择. 如线图、直条图、直方图、构成图
例: 简单表格式
某地1980年男女HBsAg阳性率的比较 性别 调查例数 男 4234 女 4530 合计 8764 阳性数 303 181 484 阳性率% 7.16 4.00 5.52
第14章基于秩次的统计方法
掌握概念: 1)何为非参数统计? 2) 什么样数据适合采用秩和检验,以及秩和 检验的优缺点。 3)秩和检验有那几种检验方法?
注意:结果(y)数据为等级时,两组比较采 用秩和检验效率高于χ2检验,应首选秩和检验.
表 某病两组疗效的比较 比较组 无效 有效 显效 痊愈 合计 试验组 18( 31.6) 18 (31.6) 15(26.3) 6 (10.5) 57 对照组 21 (46.7) 15( 33.3) 8(17.8) 1( 2.2) 45 Total 39 33 23 7 102
医学统计学复习重点和难点

一、医学统计的基本内容
• 1. 统计学:统计学是一门科学和艺术,专 门处理数据中的变异性。
如何处理:通过数据收集、整理、分析。 目的:得到可靠的结果。
• 2. 医学统计学:统计学应用于医药卫生领 域即称为医学统计学。
2020/12/9
• 3. 几个基本概念: • ⑴ 总体、样本、个体、随机抽样、
-1.96~1.96 -2.58~2.58
μ μ+σμ+1.96σ μ+2.58σ
0
1 1.96 2.58
正态分布 面积或概率
μ±σ
68.27%
μ±1.96σ 95.00%
μ±2.58σ 99.00%
5.参考值范围的制定及适用条件:(正态 、对数正态、百分位数法)
单侧下限---过低异常 单侧上限---过高异常 双侧---过高、过低均异常
2020/12/9
总变 组 异 内 组 变间 异 S总 S S组 S 间 S组 S内
总 组 间 组内
2020/12/9
方差分析的目的:是比较各组的总体 均数是否相同。 掌握完全随机设计及随机区组设计方 差分析变异及自由度的分解。 掌握完全随机设计方差分析的计算步 骤(方差分析表)。
2020/12/9
否
统计 描述 Md,Q
分类资料
统计 描述 率,比, 构成比
总体 均数 置信 区间
2020/12/9
t方 检差 验分
析
秩和 检验
总体 率的 置信 区间
2 检 验
五、直线相关与回归
1.直线相关与回归分析的意义和用途。 2.相关系数r、回归系数b、回归方程。 3.直线相关与回归的区别与联系及应用注 意事项。 4.等级相关的适用条件。
中医药统计学复习重点

某市 12 岁男童 110 人的身高 (cm) 如下:身高组段 124 — 128 — 132 — 136 — 140 — 144 — 148 — 152 — 156 — 160 — 164 频数(f ) 1 2 9 20 35 24 133 2 1(1) 求出这 110 名男童身高的均数、标准差。
(2) 写岀该市男童身高 95% 的参考值范围。
(1) 110 名男童身高的均数、标准差为:_ Z fx X = Z f、 f(x-x)2q z f -1(2) 该市男童身高 95%的参考值范围 =( 129.2,152.6 ) cm某市 12 岁男童 110 人的身高 (cm) 如下:身高组段 124 — 128 — 132 — 136 — 140 — 144 — 148 — 152 — 156 — 160 — 164 频数(f ) 1 2 9 20 35 24 133 2 11、 对该资料作正态性检验;2、求 这 110 名男童身高的均数、标准差、变异系数;3、写岀该市男童身高 95% 的参考值范围; 1、用 SAS/INSIGHT 建立如下形式的数据集: A B 124 1 128 2 156 2 160 12、 SAS 处理主要步骤:鼠标点击 Edit T Variables 宀 Other 宀将变量 A 移到 Y 框下,选 a+b*Y 后在 a:出键入 2, 点击 0K 形成组中值变量A-A 。
鼠标点击 Analyze T Distribution(Y), 将变量 A-A 移到 Y 框下,将 B 移到 Freq 框下 T 点击 Output, 选 Tests for Normality T OK. 3、 SAS 输出结果:正态性检验: p=0.0007,均数 Mean : 140.8727cm ,标准差 Std. Deviation : 5.99405cm该市男童身高 95%的参考值范围 ( p2.5,p97.5 ) = ( 128.5455,154.8000 ) cm=140.9cm=5.99cm百分位数法: (P 2 5, B7.5 ) =(128,156)cm正态分法: (x -1.96s , x 1.96s )=(140.9- 1.96 X 5.99,140.9+1.96 X某市12 岁男童110 人的身高(cm)如下:身高组段124 —128 —132 —136 —140 —144 —148 —152 —156 —160 —164 频数(f ) 1 2 9 20 35 24 13 3 2s ; _ 1.35522 — 22 ) 方差齐性检验1、 求出这 110 名男童身高的均数、标准差、变异系数2、写岀该市男童身高 95% 的参考值范围⑴均数 x 「 Jl42.87cm 送 f标准差 s 二fX"f=5.99cm2)该市男童身高 95% 的参考值范围(X -1.96s,X 1.96s) =(144.87 -1.965.99,144.87 1.965.99)=(133.13,156.61)cm 或用百分位数法( p 2.5, p 97.5)=( 131.50 ,156.50 )cm三、按随机设计,对功能性子宫岀血的实热型患者 12 例与虚寒型患者 10 例的血液皮质醇含量进行测定,数据如下 实热组 X 1 : 25.5 24.5 26.5 26.0 25.0 23.5 24.5 24.0 23.0 25.527.0 26.5虚寒组 X 2 : 12.5 10.5 14.5 15.0 13.5 13.0 12.5 11.512.0 13.5试比较两种类型患者的血液皮质醇含量有无差别?(假定资料满足正态性)1) 基本计算如下:=12 岳 = 25.125 & =1.2636n 2=10X 2 = 12.85s 2=1.355假设血:匚厂;、H 1 : ; r、=0.05= 1.15s21.2636 2查 F 界值表得F°.O5(9,11 )=3.59因为F> F0.05(9,11)所以P A 0.05按〉=0.05 水准,不拒绝H o,两总体方差相等。
医学统计学总复习练习题(含答案)

一、最佳选择题1.卫生统计工作的步骤为 CA.统计研究调查、搜集资料、整理资料、分析资料B.统计资料收集、整理资料、统计描述、统计推断C。
统计研究设计、搜集资料、整理资料、分析资料D.统计研究调查、统计描述、统计推断、统计图表E。
统计研究设计、统计描述、统计推断、统计图表2.统计分析的主要内容有 DA.统计描述和统计学检验B.区间估计与假设检验C。
统计图表和统计报告 D.统计描述和统计推断E。
统计描述和统计图表3.统计资料的类型包括EA。
频数分布资料和等级分类资料 B.多项分类资料和二项分类资料C.正态分布资料和频数分布资料 D。
数值变量资料和等级资料E.数值变量资料和分类变量资料4.抽样误差是指 BA。
不同样本指标之间的差别B.样本指标与总体指标之间由于抽样产生的差别C.样本中每个体之间的差别D。
由于抽样产生的观测值之间的差别E.测量误差与过失误差的总称5。
统计学中所说的总体是指 BA.任意想象的研究对象的全体B.根据研究目的确定的研究对象的全体 C。
根据地区划分的研究对象的全体 D.根据时间划分的研究对象的全体E。
根据人群划分的研究对象的全体6.描述一组偏态分布资料的变异度,宜用 DA.全距B.标准差C.变异系数D.四分位数间距E.方差7.用均数与标准差可全面描述其资料分布特点的是 CA.正偏态分布B.负偏态分布C。
正态分布和近似正态分布 D。
对称分布E。
任何分布8.比较身高和体重两组数据变异度大小宜采用 AA。
变异系数 B。
方差C.极差D.标准差E.四分位数间距9.频数分布的两个重要特征是 CA。
统计量与参数 B。
样本均数与总体均数C.集中趋势与离散趋势D.样本标准差与总体标准差E.样本与总体10.正态分布的特点有 BA。
算术均数=几何均数 B.算术均数=中位数C.几何均数=中位数 D。
算术均数=几何均数=中位数E.以上都没有11.正态分布曲线下右侧5%对应的分位点为 DA.μ+1。
96σB.μ—1。
《中医统计学》练习题

WENKU DESIGN
数据来源与分类
数据来源
数据可以来源于临床观察、病例报告、 流行病学调查等,确保数据的真实性 和可靠性。
数据分类
根据研究目的和研究问题,将数据分 为定量数据和定性数据,以便进行相 应的统计分析。
数据整理的方法与步骤
数据筛选
剔除异常值、缺失值和重复值 ,确保数据的质量和准确性。
数据标准化
将数据标准化为均值为0、标准差为1的分布,以便进行比较和分析。
PART 03
练习题三:描述性统计分 析
REPORTING
WENKU DESIGN
频数分布表与直方图
频数分布表
通过制ቤተ መጻሕፍቲ ባይዱ频数分布表,可以清晰地展 示各个分类变量在不同水平下的频数 分布情况,从而了解数据的分布特征 。
直方图
直方图是一种用图形表示频数分布的 图表,通过直方图的形状和变化趋势 ,可以直观地了解数据的分布情况。
PART 04
练习题四:推论性统计分 析
REPORTING
WENKU DESIGN
参数估计与假设检验
参数估计
根据样本数据,对总体参数进行估计,如总体均数、总体比例等。常用的方法有矩估计、 最大似然估计和贝叶斯估计等。
假设检验
通过样本数据对总体参数或分布形式进行假设检验,常用的方法有t检验、卡方检验、F 检验等。
方差分析
单因素方差分析
用于比较多个样本均数间的差异,判断各样 本均数是否来自同一总体。
多因素方差分析
用于分析两个或多个因素对观测变量的影响, 判断各组间是否有显著差异。
相关与回归分析
相关分析
用于研究两个或多个变量之间的关联程度, 常用的方法有线性相关、秩相关等。
中医统计试题及答案

中医统计试题及答案根据您的要求,我将按照自己判断的格式为您提供中医统计试题及答案。
具体内容如下:中医统计试题及答案[注意:本文仅为模拟试题及答案,题目及答案仅供参考。
]一、选择题1. 中医学的基础理论是:A. 四气学说B. 五行学说C. 望闻问切D. 阴阳学说答案:B2. 中医药的首要作用是:A. 疾病治愈B. 疾病预防C. 疼痛缓解D. 营养补充答案:B3. 中医诊断方法中,通过观察患者舌苔可以判断患者的:A. 脉搏状况B. 脏腑功能C. 疾病类型D. 病因答案:C二、判断题判断以下说法是否正确,正确的选项请写“对”,错误的选项请写“错”。
1. 中医治疗方法只包括药物治疗。
答案:错2. 中医强调“阴阳平衡”的概念。
答案:对3. 中医药只适用于传统疾病的治疗。
答案:错三、简答题1. 请简述中医中的“经络”概念及其功能。
答案:中医中的“经络”是指人体的经脉和络脉。
经脉是人体内部的主要通道,通过经脉可以使气血运行畅通,维持身体的正常功能。
络脉则是延伸在皮下的细小血管,起到营养皮肤和肌肉的作用。
经络的功能在中医诊断和治疗中具有重要的意义。
2. 中医中的“气血”概念是指什么?答案:中医中的“气血”是人体内的两种重要物质。
气是维持生命活动的动力,气的畅通与否决定了人体的健康状况。
血则是维持人体组织器官正常运转所必需的物质,血液的循环与供氧能力对身体健康至关重要。
四、分析题请根据以下病例,进行中医辨证论治。
病例:患者女性,30岁,面黄肌瘦,容易疲劳,月经不调,经量少、色淡,舌体淡红,苔薄白。
脉细弱。
1. 该患者的主要病症是什么?答案:该患者主要表现为气血不足。
2. 请列举简要的中医辨证,并给出治疗方案。
答案:中医辨证为“气血两亏”证。
治疗方案应包括补气养血的中药方剂,建议患者合理调整作息时间,增加营养摄入,同时结合适当的运动来改善气血循环。
以上为中医统计试题及答案,希望对您有所帮助。
这些题目和答案仅供参考,如有不正之处,敬请谅解。
医学统计学重点整理汇总

医学统计学重点第一章绪论1.基本概念:总体:根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。
样本:从总体中随机抽取部分个体的某个变量值的集合。
总体参数:刻画总体特征的指标,简称参数。
是固定不变的常数,一般未知。
统计量:刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。
抽样误差:由随机抽样造成的样本统计量与相应的总体参数之间的差异。
频率:若事件A在n次独立重复试验中发生了m次,则称m为频数。
称m/n为事件A在n次试验中出现的频率或相对频率。
概率:频率所稳定的常数称为概率。
统计描述:选用合适统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律进行刻画和描述。
统计推断:包括参数估计和假设检验。
用样本统计指标(统计量)来推断总体相应指标(参数),称为参数估计。
用样本差别或样本与总体差别推断总体之间是否可能存在差别,称为假设检验。
2.样本特点:足够的样本含量、可靠性、代表性。
3.资料类型:(1)定量资料:又称计量资料、数值变量或尺度资料。
是对观察对象测量指标的数值大小所得的资料,观察指标是定量的,表现为数值大小。
每个个体都能观察到一个观察指标的数值,有度量衡单位。
(2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料)①计数资料:是将观察单位按某种属性或类别分组,清点各组观察单位的个数(频数),由各分组标志及其频数构成。
包括二分类资料和多分类资料。
二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。
多分类:将观察对象按多种互斥的属性分类②等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单位的个数所得的资料。
4.统计工作基本步骤:统计设计、资料收集、资料整理、统计分析。
第二章实验研究的三要素1.实验设计三要素:被试因素、受试对象、实验效应2.误差分类:随机误差(抽样误差、随机测量误差)、系统误差、过失误差。
3.实验设计的三个基本原则:对照原则、随机化分组原则、重复原则。
中医统计学 复习

1.中医统计学:处理中医理论与实践中的同质性和变异性的科学与艺术.以概率论和数理统计原理为基础,以中医理论与实践为主体,通过对数据的搜集、整理、分析和推断,从而达到探讨中医理论与方法内在规律的目的.2.总体:根据研究目的确定的同质观测单位的集合. (无限总体和有限总体)3.样本:从统计总体中随机抽取的、具有代表性的部分观测单位的集合.4.同质:构成总体的各个观测单位在某一方面或某几方面的性质相同或基本相同.5.变异:在同质基础上各观察单位(或个体)之间的差异.6.事件:泛指事物发生的某种情况或在调查、观察和实验中获得的某种结果.(确定性事件和随机事件)8.频率:某种现象在重复随机试验中发生的比例.9.概率:某随机事件A发生的可能性大小,记为P(A).10.频数:指研究对象安某属性进行分组后,各组中观测值的个数.11.众数:一群数据中出现次数(频数)最多的值.12.随机:在抽样、分组、实验/试验顺序安排过程中,每个观测单位都不受研究者主观意愿驱使,具有同等的机会被抽中、分配或安排,目的是保证样本具有代表性.13.随机变量:随机事件各种不同的结果.(离散型变量和连续型变量)14.量值:随机事件各种具体的观测值.15.误差:实际观测值与真值之差个差或样本指标与总体指标之差.(非随机误差(粗差、系统误差)和随机误差(测量误差、抽样误差))16.分布:随机变量取值的变化及相应的频率变化的规律性.17.频数分布:指观测值按大小分组,各个组段内观测值个数(频数)的分布,是了解数据分布形态特征和规律的基础.18.正态分布:(高斯分布)一种常见的、最重要的连续型对称分布标准正态分布:期望值μ=0,标准差σ=1的正态分布19.医学参考值范围:为了减小变异的影响,提高参考值作为为判断正常或异常的可靠性所确定的绝大多数正常人医学参考值的波动范围.20.构成比:事物内部各组成部分所占整体的比重或分布,常用百分数表示.构成比=(某现象内部某一部分的个体数/某现象内部个体数之和)×100%21.相对比:描述两个有关指标的比例关系(通常以倍数或百分数表示).率:表示某现象发生的频率或强度,是频率指标.22.抽样误差:由个体差异和随机抽样造成的样本和总体、样本与样本相应统计指标之间的差异.23.区间估计:结合样本统计量和标准误确定一个具有较大可信度的包含总体参数的区间,该区间称为总体参数的1-α可信区间(CI)24.无效假设:记为 H0,表示差别由抽样误差引起,无统计学意义.备择假设: 记为 H1,表示差别为处理因素所致,有统计学意义.分为单侧和双侧两种形式25.检验水准:(显着性水准)符号为α,事先规定的对假设成立与否作出判断的依据,常取0.05或0.0126.P值:在检验假设所规定的总体中作随机抽样,获得等于及大于/小于现有样本统计量的概率,即各样本统计量的差异来自抽样误差的概率,是判断H0成立与否的依据.确定P值的方法有查表法和计算法27.I型错误:统计推断结果拒绝了实际上成立的H0,犯了”弃真”的错误.指组间差异实际上不存在,统计推断结果却错误地认为存在组间差异,故称为以假为真的错误为阳性错误,其概率用α表示II性错误:统计推断结果不拒绝实际上是不成立的H0,犯了”存伪”的错误. 指组间确实存在差异,统计推断结果却未检查出该差异,故称为以真为假的错误为阴性错误,其概率用β表示28.检验效能:(把握度)符号为1−β,当组间确实存在差异时,按所规定的α水平能发现组间差异的能力,或当H0不成立时拒绝H0的概率29.秩次:全部观测值按顺序排列的位序. 秩和:同组秩次之和秩和检验:用于总体为非正态或不易确定的分布资料、不能或未加精确测量资料等效率较高的非参数检验方法30.相关:指一个变量增大,另一个变量也随之增大或减少的共变现象相关关系:两个变量有共变现象直线相关:判断两个变量之间有无直线相关关系并回答相关的方向和相关程度如何的统计分析方法相关系数:符号为r,说明具有相关关系的两个变量间相关关系的密切程度与相关方向的指标. 31.直线回归:用直线回归方程或数学模型描述两个变量间线性依存关系的一种统计分析方法回归系数:回归方程中表示自变量x对因变量y影响大小的参数,在直线回归方程中ŷ=a+bx中x 每改变一个单位,y变动b个单位.32.无序资料:(名义资料)取值通常是具有某种特征或属性的个数,特点是可在非数字中取值,各类之间具有性质上的差异;有序资料:(等级资料或半定量资料),特点是各等级间有程度或量的差异,即可按数量的相对大小或程度的高低排出顺序.1.统计学的主要内容:研究设计(专业设计和统计学设计)、统计描述、统计推断(参数估计和假设检验)2.假设检验的步骤:1)建立检验假设、确定检验水准2)选择检验方法、计算统计量3)确定P值、做出推论3.专业设计的基本要素:受试对象、处理因素和试验效应4.统计设计的基本原则:对照(空白、实验、安慰剂、标准、历史、自身、相互和复合处理对照)、随机(单纯、系统、整群和分层随机抽样)、均衡、重复5.受试对象的选择需满足:对处理因素有较强的敏感性和特异性、对处理因素有较稳定的反应性、可行性6.数值变量的统计描述:1)集中趋势描述:描述一组观测值集中趋势的指标,是对同质基础上的样本或总体一般特征的指标.主要作用是①作为一组观测值的代表,表明该组观测值集中趋势的特征②便与同类研究对象进行对比分析.常用的平均数有算数平均数(总体均数μ、样本均数)、几何平均数G和中位数M;2)离散趋势描述:及变异性指标,描述一组同质观测值变异程度大小(即数据的均匀性)的综合指标.常用的变异性指标有极差R、四分位数间距Q、标准差s、变异R 系数CV、标准误SE.7.中医统计资料类型:1)计量资料:由数值变量产生的资料,即对每个观察单位用计量方法测得某项标志数值大小所获得的资料.特点是变量值大多有单位,其具体取值通常是正实数(零、正实数和小数); 2)计数资料:由分类变量产生的资料,即对每个观察单位按某种属性分组计数而得的资料.特点是变量值表现为互不相容的属性或类别,无度量衡单位.分为二分类资料(按互不相容的属性分类)和多分类资料(按不同类别分类(无序资料和有序资料))8.直线相关的注意事项:1)线性相关表示两个变量间的关系是双向的,当散点图出现直线趋势时再做分析2)相关系数的计算只适用于两个变量都服从正态分布的资料3)样本相关系数r是总体相关系数ρ的一个估计值,r与ρ间存在抽样误差,必须作假设检验4)相关分析是用相关系数来描述两个变量间相互关系的密切程度和方向,相关关系不一定是因果关系9.应用相对数的注意事项:1)计算时分母不宜太小,若观察单位数较小,宜直接用绝对数表示;2)观察单位数不等的几个率不能直接相加求其合计率;3)资料对比时应注意可比性;4)资料分析时不能已构成比代替10.直线回归注意的问题:1)作回归分析要有实际意义,不能把毫无关联的两种现象做回归分析.2)在进行直线回归分析前应先绘制散点图,观察点的分布有直线趋势时才适宜作直线回归分析,若呈曲线趋势宜直线化后再分析3)适用范围一般以自变量的取值范围为限,在此范围内求出的估计值称为内插,超过此范围的值称为外延,应避免外延.11.应用检验假设注意事项:1)事先进行严密的统计学设计:除对比的主要因素外,其他可能影响结果的因素在对比的组间应相同或相近2)单侧检验和双侧检验的选择:双侧检验的检验思路比单侧宽且无限制条件,较为常用,适用于对预试验结果分析,双侧的接受域位于某一特定分布的中部,拒绝域分布在两侧,而单侧检验的接受域和拒绝域各占某一特定分布的一侧,同一检验水准下单侧比双侧界值小、拒绝域大、更易得出拒绝H03)灵活确定α水准:根据实际工作中对不同分析目的和要求,选用的α往往有一定的灵活性4)选择正确地统计方法:应根据分析目的、不同的资料类型及分布、设计方案的种类、样本量的大小等选用适当的检验方法5)正确理解统计推断的意义:统计推断结论是依据现有的设计、研究方法与条件、资料及分析目的和要求所取的水准,采用的统计分析方法等做出具有相应概率的解释,不宜将结论的意义扩大或缩小6)假设检验的结论不能绝对化:统计学结论是具有概率性质的推论,不能使用”肯定”、”证明”、”一定”、”说明”等词,此外有统计学意义时不一定有专业意义.(假设检验是否具有统计学意义取决于被研究事物有无本质差异、抽样误差的大小、所选用的α高低及死单侧还是双侧)7)结合专业知识作出推论:假设检验可帮助研究者作出合理的推断,不能代替研究者做出专业结论8)CI与假设检验的区别与联系:CI推断参考值的范围(量的大小),假设检验判断各参数间有无质的不同12.统计表的结构:1)表号:位于顶线上方、标题的左侧,与标题之间的空2个字符,以阿拉伯数字表示2)标题:位于顶线上方、标号之后,简明扼要地说明表的内容;3)标目:横标目是统计表的主语,表示被说明事物的主要标志, 纵标目是统计表的谓语,说明主语的各项指标.对标目的要求是文字简明、层次清楚,一张表内不要安排过多标目;4)线条:一般只出现顶线、标目线和底线3条等长线;5)数字:一律采用阿拉伯数字,同一指标的小数位数应一致,位次对齐;6)备注:一般不列入表中,必要时可用’*’表示区别率构成比概念表示某现象发生的频率或强度表示事物内部各组成部分所占比重或分布特点某一分率的改变对其他无影响任一部分比重的增减都会影响其他部分意义反映事物的普遍性及严重程度事物按一个特征分类时,反映事物内部组成的结构特征事物按两个特征分类时,反映两个特征之间的关联关系合计各个率不能直接相加一定为100%标准差均数标准误意义描述个体观测值间的变异程度大小描述同一总体中随机抽出n相同的多个样本均属建德离散性公式s=√Σ(x−x̅ )/(n−1)S x̅= s/√n与n的关系随着n的增大逐渐趋于稳定随着n的增大逐渐减小,与n的平方根成反比用途表示观测值变异大小结合均数描述正态分布的特征在正态分布时做参考值范围的估计表示样本抽样误差的大小描述样本均数的可靠性结合均数估计总体均数的CI 进行均数间差别的假设检验计算变异系数和均数的标准误区别总体均数的可信区间参考值范围的区别涵义根据抽样分布原理,按预先规定的概率(1-α)给出被估计总体均数肯德数值范围.表示某总体均数的可能范围表示某项解剖、生理、生化等指标绝大多数个体观测值可能出现的范围计算α已知:(x̅−μα2⁄ σx−,x̅+μα2⁄ σx−α未知:(x̅−tα2⁄ ,S x−ν ,x̅+tα2⁄ ,S x−ν)正态分布: x̅±μα2⁄S(双侧)非正态分布:P x−P100−x(双侧)与n的关系n越大,CI越小;n无穷大,CI趋近0 n越大,参考值范围越稳定用途估计总体均数估计某项指标绝大多数观测单位的波动范围直线相关直线回归联系(1) 反映应变量y与自变量x的互依关系,双向变化的关系体现应变量y随自变量x变化的依存关系,单向的关系(2)对两个变量间的关系进行描述,看是否有关系、关系是否密切及关系的性质对两个变量做定量描述,研究两个变量的数量关系(3) 只适用x,y服从双变量正态分布资料既适用于x,y服从双变量正态分布资料,也适用于y服从双变量正态分布,x是可以精确测量和严格控制的变量(4) r无单位,r的绝对值越大,两变量的关系越密切,相关程度越高b有单位,b的绝对值越大,回归直线越陡,y的平均变化越大(5) 两事物或现象间存在相关关系,不一定是因果关系两事物或现象间存在因果关系,则必然相关区别(1) 同时计算r和b,r与b同正负,r为正说明两变量间的相互关系是同向变化的;b为正说明x增(减)一个单位,y平均增(减)b个单位(2) r和b的假设检验等价,即对同一样本两者的t值相等,故简单的r的假设检验可代替对b的假设检验(3) 相关回归可以互相解释,r2称为确定系数,其可以从回归的角度了解相关程度设计方案水平特点完全随机设计单因素,两水平、多水平,不考虑混杂因素简单方便,应用广泛,容易进行统计分析, 只能分析一个因素的作用,效率相对较低配对设计单因素,两水平,考虑混杂因素能缩小受试对象间的个体差异,从而减少实验误差,提高实验效率随机区组设计单因素,多水平,不考虑混杂因素各随机区组的受试对象数目相等,生物学特点较均衡,缩小了组间差别,实验效率较高SPSS电脑实验1.单样本t检验:1)用Explore正态性检验:选择Alnalyze→Descriptive statistics→Explore(Dependent:测量值, plots按钮:Normality plots with test)2)用One-Sample T Test单样本检测:选择Alnalyze→Compare Means→One-Sample T Test(右侧上面的Test框:测量值, 修改下面的Test框默认值(总体均数))2.配对t检验1)计算差值d: 选择Transform→Compute Variable(Target Variable:d,Numeric expession:方法一,单击运算键“-”,Numeric expession:法二)2)对差值d用Explore正态性检验: (Dependent:d,同上)3)配对t检验: 选择Alnalyze→Compare Means→Paired-Sample T Test(Paired Variable:方法一、方法二)3.方差齐性检验1)用Explore正态性检验,Spread vs.level with levene test→Untransformed4.独立样本t检验1)选择Alnalyze→Compare Means→Independent-Samples T Test(Test框:测量值d,grouping:组别,Define groups:1、2等)1.完全随机设计F检验:1)选择Alnalyze→General Linear Model→Univariate(Dependent:测量值,Fixed Factor(s) :组别,Option视窗中Estimated Marginal Means→Display Means for:组别,Display: Descriptive statistics和Homogeneity tests→Continue→OK) 2.随机区组设计F检验:1)选择Alnalyze→General Linear Model→Univariate(Dependent:测量值,Fixed Factor(s) :方法、药物;Model视窗中选择Custom→Model:方法、药物,Sum of Squares:Type III, →Include intercept in model→Continue;Post Hoc视窗中,Post Hoc Test for:方法,S-N-K →Continue ;Option视窗中Display Means for:组别,Display: Descriptive statistics→Continue→OK)1.成组设计四格表χ2检验:1)加权频数:Data→Weihgt cases→Weihgt case by(将频数变量选入框中返回)2) χ2检验: 选择Alnalyze→Descriptive statistics→Crosstabs→”组别→Row(s)”以及”结果→Column(s)”对话框→statistics→Chi-square→Continue→OK2.配对设计四格表χ2检验:1)加权频数:Data→Weihgt cases→Weihgt case by(将频数变量选入框中返回)2) χ2检验: 选择Alnalyze→Descriptive statistics→Crosstabs→”新法→Row(s)”以及”旧法→Column(s)”→statistics→McNemar→Continue→OK3.R×C表χ2检验:1)加权频数:Data→Weihgt cases→Weihgt case by(将频数变量选入框中返回)2) χ2检验: 选择Alnalyze→Descriptive statistics→Crosstabs→”组别→Row(s)”以及”结果→Column(s)”→statistics→Chi-square→Continue→OK1.直线相关分析:1)选择Alnalyze→Correlate→Bivariate→在Bivariate Correlations的视窗中,将进食量、增重量两变量同时选中,从左边源变量框中移置到由框中→OK2.直线回归分析:1)选择Alnalyze→Regession→Linear→在Linear Regession的视窗中,将左边“收缩压“变量单样本t检验配对设计资料的t检验独立样本t检验μ1=μ2S c2=(n1−1)S12+(n2−1)S22n1+n2−2S x̅1−x̅2=√S c2(1n1+1n2)t=x̅1−x̅2S x̅1−x̅2μ1=μ2完计算均差SS总=ΣX2−(ΣX)2N,SS组间=Σn i(x̅i−x̅)2=Σ(ΣX i)2n i−(ΣX)2N全 随机 F 检验 平方和SS 组内=ΣΣ(x i −x ̅i )2=ΣX 2−Σ(ΣX i )2n i =SS 总−SS 组间 计算自由度ν总=N −1,ν组间=k −1,ν组内=N −k计算均方MS 组间=SS 组间ν组间⁄,MS 组内=SS 组内ν组内⁄ 计算F 值 F =MS 组间MS 组内⁄随机区组 F 检计算均差 平方和SS 总=ΣX 2−(ΣX)2N ,SS 处理=Σ(ΣX i )2k −(ΣX)2N SS 区组=Σ(ΣX i )2n −(ΣX)2N ,SS 误差=SS 总−SS 处理−SS 区组 计算自由度ν总=N −1,ν处理=k −1,ν区组=n −1,ν误差=ν总−ν处理−ν区组 计算均方MS 处理=SS 处理ν处理⁄,MS 区组=SS 区组ν区组⁄,MS 误差=SS 误差ν误差⁄ 计算F 值 F 处理=MS 处理MS 误差⁄,F 区组=MS 区组MS 误差⁄ 相关系数 l xy =Σ(x −x ̅)(y −y ̅)=Σxy −ΣxΣy n , l xx =Σ(x −x ̅)2=Σx 2−(Σx)2n l yy =Σ(y −y ̅)2=Σy 2−(Σy)2n , r =r xy =l xy √(l xx ∗l yy )相关系数假设检验: ρ=0t r =|r−0|√(1−r)(n−2)⁄ ,ν=n −2成组设计四格表 π1=π2 T ≥5 n ≥40 n n n T C R RC =,()∑-=T T A 22χ或()()()()()d b c a d c b a n bc ad ++++-=22χ 1≤T<5n ≥40n n n T C R RC =,()∑--=T T A 225.0χ或()()()()()d b c a d c b a n n bc ad ++++--=222χ 配对设计四格表 B =Cb+c ≥40χ2=(b −c)2b +c ,ν=(R −1)(C −1) b+c<40 χ2=(|b −c |−1)2b +c ,ν=(R −1)(C −1)行×列表π1=π2=πn T>1 或1<T<5 少于1/5 1.率的标准化法: 采用统一标准计算各率的标准化率,使率具有可比性,目的是在比较总率时消除混杂因素的影响.2.相对数:两个有联系的绝对数、相对数或平均数之比.(常用的相对数有率、构成比和相对比3.非参数检验:在统计推断中,不依赖于总体的分布形式, 直接对总体分布位置是否相同进行检验的方法,称非参数检验.4.等级资料: 将观察单位按某种属性的不同程度分组,所得各组的观察单位数,称为等级资料5.参数统计:在统计推断中 ,假定样本所来自的总体分布为已知的函数形式,但其中有的参数为未知,统计推断的目的就是对这些未知参数进行估计或检验.6.参数估计:用样本统计量来估计总体参数,包括点值估计和区间估计.7.可信区间:在参数估计时,按一定可信度估计所得的总体参数所在的范围.8.假设检验:根据研究目的, 对样本所属总体特征提出一个假设, 然后用适当方法根据样本提供的信息, 推断此假设应当拒绝或不拒绝, 以使研究者了解在假设条件下,差异由抽样误差引起的可能性大小,便于比较分析.9.中位数:将一组观察值按从小到大的顺序排列后, 位次居中的观察值.10.影响1−β的因素是:1) 1−β与样本量成正比:n越大,标准误越小, β减小,发现组间差异的能力越强2) 1−β与参数的差值成正比:参数间的差值越大,样本指标间的差值就越大,越易获得拒绝H0的结论3) 1−β与个体差异成反比:标准差越小,标准误就越小,统计量就越大, 1−β越高4) 1−β与设计类型有关:配对设计和配伍设计比完全设计的1−β高5) 1−β与检验方法有关:①参数检验所含的信息量比非参数检验多, 1−β高;②与检验方法要求的条件的多少成正比: 参数检验比非参数检验的1−β高;③检验水准α的大小成正比: α与β呈反比11.假设检验的目的和意义是什么?答: 在实际研究中,一般都是抽样研究,则所得的样本统计量(均数、率)往往不相等,这种差异有两种原因造成: 其一是抽样误差所致,其二是由于样本来自不同总体。
中医统计学重点

1、卡方检验要求理论数不宜太小。
2、多个样本率(构成比)比较。
3、不管资料中的两个分类变量是有序还是无序,均用卡方检验是不妥的。
4、对于单向有序R*C表资料的统计分析。
5、对于双向有序且属性不同的R*C表资料的统计分析。
6、对于双向有序且属性相同的R*C表资料的统计分析。
1、线性相关表示两个变量之间的关系是双向的,当散点图出现直线趋势时再做分析。
2、相关系数的计算只适用于两个变量都服从正态分布的资料。
3、样本相关系数γ是总体相关系数ρ的一个估计值,γ与ρ之间存在着抽样误差,必须做假设检验。
4、相关分析是用相关系数来描述两个变量间相互关系的密切程度和方向,相关关系不一定是因果关系,也可能仅是伴随关系。
在正态分布是做参考值范围的估计
计算变异系数和均数的标准误
表示样本均数抽样误差的大小
描述样本均数的可靠性
结合样本均数估计总体均数的CI
进行均数间差别的假设检验
九:方差分析基本思想
将所有测量值间的总变异按照其变异的来源分解为多个部分,然后ห้องสมุดไป่ตู้各部分的变异与随机误差进行比较,以推断各处理组间的差异有无统计学意义。因此,方差分析的基本思路是分析变异,是一种在若干能相互比较的资料组中,把产生变异的原因加以区分开来的方法与技术,实质是关于观测值变异原因的数量分析。
十一:秩和检验的应用范围。
1、总体分布类型未知,或资料分布类型已知,但不符合正态分布的资料。
2、某些可能无法精确测量,只能以严重程度、优劣等级、次序先后等表示的等级资料。
3、个别数据偏大或数据的某一端或两端为不确定值的资料,例如“>50”和“<1”。
4、各总体方差不齐的资料。
中医统计学复习资料

统计学思考题(以下一切公式仅为帮助理解)总体:是根据研究目的所确定的研究对象的全体。
它是由许多性质相同的个体组成样本:是从总体中随机抽取的一部分有代表性的个体参数:根据总体分布的特征而计算的总体数值(总体的统计指标)统计量:由总体中随机抽取样本而计算的相应指标(样本的统计指标)抽样误差:指样本与总体之间的差别或同一总体中相同大小样本之间的差别概率:反映某一事件发生的可能性大小的量,常用P 表示,0≤P≤1当某事件发生的概率P≤0.05 或0.01,称为小概率事件。
数值变量资料:又称计量资料,对每一个观察单位用定量的方法测定某项指标的数值大小所得的资料分类变量资料:又称计数资料,是先将观察单位按性质或类别进行分组,然后清点各组观察单位的个数所得的资料统计工作的基本步骤:研究设计、收集资料、整理资料、分析资料实验设计基本要素:处理因素、受试对象、实验效应实验设计基本原则:对照原则、随机原则、重复原则(、均衡原则、盲法原则)资料的分析:统计描述、统计推断(参数估计、假设检验)统计表的基本结构:标题、标目(横标目、纵标目)、线条、数字如何正确编制统计表和统计图(讲稿P4、P5)常用统计图直条图:适用于按性质分组的不连续资料构成图:适用于构成比资料,分为百分条图和圆形图普通线图:适用于按数量分组的连续性资料直方图:适用于连续性频数分布资料计量资料的频数分布特征:集中趋势、离散趋势类型:对称分布、偏态分布平均数意义:分析计量资料的基本指标,表示一组性质相同的观察值的平均水平或集中趋势的指标常用平均数1.算术平均数:(均数)当一组变量值的频数分布呈对称分布或近似对称分布(正态或近似正态分布)时适用。
总体均数μ,样本均数X 。
2.几何平均数G:当一组变量值呈倍数关系(等比级数资料)或变量值呈对数正态分布时适用。
3.中位数M:当一组变量值呈偏态分布(非对数正态分布)或数据的一端或两端无界限或资料的分布特征不清楚时适用。
中医统计学 复习

1.中医统计学:处理中医理论与实践中的同质性和变异性的科学与艺术.以概率论和数理统计原理为基础,以中医理论与实践为主体,通过对数据的搜集、整理、分析和推断,从而达到探讨中医理论与方法内在规律的目的.2.总体:根据研究目的确定的同质观测单位的集合. (无限总体和有限总体)3.样本:从统计总体中随机抽取的、具有代表性的部分观测单位的集合.4.同质:构成总体的各个观测单位在某一方面或某几方面的性质相同或基本相同.5.变异:在同质基础上各观察单位(或个体)之间的差异.6.事件:泛指事物发生的某种情况或在调查、观察和实验中获得的某种结果.(确定性事件和随机事件)8.频率:某种现象在重复随机试验中发生的比例.9.概率:某随机事件A发生的可能性大小,记为P(A).10.频数:指研究对象安某属性进行分组后,各组中观测值的个数.11.众数:一群数据中出现次数(频数)最多的值.12.随机:在抽样、分组、实验/试验顺序安排过程中,每个观测单位都不受研究者主观意愿驱使,具有同等的机会被抽中、分配或安排,目的是保证样本具有代表性.13.随机变量:随机事件各种不同的结果.(离散型变量和连续型变量)14.量值:随机事件各种具体的观测值.15.误差:实际观测值与真值之差个差或样本指标与总体指标之差.(非随机误差(粗差、系统误差)和随机误差(测量误差、抽样误差))16.分布:随机变量取值的变化及相应的频率变化的规律性.17.频数分布:指观测值按大小分组,各个组段内观测值个数(频数)的分布,是了解数据分布形态特征和规律的基础.18.正态分布:(高斯分布)一种常见的、最重要的连续型对称分布标准正态分布:期望值μ=0,标准差σ=1的正态分布19.医学参考值范围:为了减小变异的影响,提高参考值作为为判断正常或异常的可靠性所确定的绝大多数正常人医学参考值的波动范围.20.构成比:事物内部各组成部分所占整体的比重或分布,常用百分数表示.构成比=(某现象内部某一部分的个体数/某现象内部个体数之和)×100%21.相对比:描述两个有关指标的比例关系(通常以倍数或百分数表示).率:表示某现象发生的频率或强度,是频率指标.22.抽样误差:由个体差异和随机抽样造成的样本和总体、样本与样本相应统计指标之间的差异.23.区间估计:结合样本统计量和标准误确定一个具有较大可信度的包含总体参数的区间,该区间称为总体参数的1-可信区间(CI)24.无效假设:记为,表示差别由抽样误差引起,无统计学意义.备择假设: 记为,表示差别为处理因素所致,有统计学意义.分为单侧和双侧两种形式25.检验水准:(显著性水准)符号为,事先规定的对假设成立与否作出判断的依据,常取0.05或0.0126.P值:在检验假设所规定的总体中作随机抽样,获得等于及大于/小于现有样本统计量的概率,即各样本统计量的差异来自抽样误差的概率,是判断成立与否的依据.确定P值的方法有查表法和计算法27.I型错误:统计推断结果拒绝了实际上成立的,犯了”弃真”的错误.指组间差异实际上不存在,统计推断结果却错误地认为存在组间差异,故称为以假为真的错误为阳性错误,其概率用表示II性错误:统计推断结果不拒绝实际上是不成立的,犯了”存伪”的错误. 指组间确实存在差异,统计推断结果却未检查出该差异,故称为以真为假的错误为阴性错误,其概率用表示28.检验效能:(把握度)符号为,当组间确实存在差异时,按所规定的水平能发现组间差异的能力,或当不成立时拒绝的概率29.秩次:全部观测值按顺序排列的位序. 秩和:同组秩次之和秩和检验:用于总体为非正态或不易确定的分布资料、不能或未加精确测量资料等效率较高的非参数检验方法30.相关:指一个变量增大,另一个变量也随之增大或减少的共变现象相关关系:两个变量有共变现象直线相关:判断两个变量之间有无直线相关关系并回答相关的方向和相关程度如何的统计分析方法相关系数:符号为r,说明具有相关关系的两个变量间相关关系的密切程度与相关方向的指标.31.直线回归:用直线回归方程或数学模型描述两个变量间线性依存关系的一种统计分析方法回归系数:回归方程中表示自变量x对因变量y影响大小的参数,在直线回归方程中中x每改变一个单位,y变动b个单位.32.无序资料:(名义资料)取值通常是具有某种特征或属性的个数,特点是可在非数字中取值,各类之间具有性质上的差异;有序资料:(等级资料或半定量资料),特点是各等级间有程度或量的差异,即可按数量的相对大小或程度的高低排出顺序.1.统计学的主要内容:研究设计(专业设计和统计学设计)、统计描述、统计推断(参数估计和假设检验)2.假设检验的步骤:1)建立检验假设、确定检验水准2)选择检验方法、计算统计量3)确定P值、做出推论3.专业设计的基本要素:受试对象、处理因素和试验效应4.统计设计的基本原则:对照(空白、实验、安慰剂、标准、历史、自身、相互和复合处理对照)、随机(单纯、系统、整群和分层随机抽样)、均衡、重复5.受试对象的选择需满足:对处理因素有较强的敏感性和特异性、对处理因素有较稳定的反应性、可行性6.数值变量的统计描述:1)集中趋势描述:描述一组观测值集中趋势的指标,是对同质基础上的样本或总体一般特征的指标.主要作用是①作为一组观测值的代表,表明该组观测值集中趋势的特征②便与同类研究对象进行对比分析.常用的平均数有算数平均数(总体均数μ、样本均数)、几何平均数G和中位数M;2)离散趋势描述:及变异性指标,描述一组同质观测值变异程度大小(、标准差s、变异系.常用的变异性指标有极差R、四分位数间距QR数CV、标准误SE.7.中医统计资料类型:1)计量资料:由数值变量产生的资料,即对每个观察单位用计量方法测得某项标志数值大小所获得的资料.特点是变量值大多有单位,其具体取值通常是正实数(零、正实数和小数); 2)计数资料:由分类变量产生的资料,即对每个观察单位按某种属性分组计数而得的资料.特点是变量值表现为互不相容的属性或类别,无度量衡单位.分为二分类资料(按互不相容的属性分类)和多分类资料(按不同类别分类(无序资料和有序资料))8.直线相关的注意事项:1)线性相关表示两个变量间的关系是双向的,当散点图出现直线趋势时再做分析2)相关系数的计算只适用于两个变量都服从正态分布的资料3)样本相关系数r是总体相关系数的一个估计值,r与间存在抽样误差,必须作假设检验4)相关分析是用相关系数来描述两个变量间相互关系的密切程度和方向,相关关系不一定是因果关系9.应用相对数的注意事项:1)计算时分母不宜太小,若观察单位数较小,宜直接用绝对数表示;2)观察单位数不等的几个率不能直接相加求其合计率;3)资料对比时应注意可比性;4)资料分析时不能已构成比代替10.直线回归注意的问题:1)作回归分析要有实际意义,不能把毫无关联的两种现象做回归分析.2)在进行直线回归分析前应先绘制散点图,观察点的分布有直线趋势时才适宜作直线回归分析,若呈曲线趋势宜直线化后再分析3)适用范围一般以自变量的取值范围为限,在此范围内求出的估计值称为内插,超过此范围的值称为外延,应避免外延.11.应用检验假设注意事项:1)事先进行严密的统计学设计:除对比的主要因素外,其他可能影响结果的因素在对比的组间应相同或相近2)单侧检验和双侧检验的选择:双侧检验的检验思路比单侧宽且无限制条件,较为常用,适用于对预试验结果分析,双侧的接受域位于某一特定分布的中部,拒绝域分布在两侧,而单侧检验的接受域和拒绝域各占某一特定分布的一侧,同一检验水准下单侧比双侧界值小、拒绝域大、更易得出拒绝3)灵活确定水准:根据实际工作中对不同分析目的和要求,选用的往往有一定的灵活性4)选择正确地统计方法:应根据分析目的、不同的资料类型及分布、设计方案的种类、样本量的大小等选用适当的检验方法5)正确理解统计推断的意义:统计推断结论是依据现有的设计、研究方法与条件、资料及分析目的和要求所取的水准,采用的统计分析方法等做出具有相应概率的解释,不宜将结论的意义扩大或缩小6)假设检验的结论不能绝对化:统计学结论是具有概率性质的推论,不能使用”肯定”、”证明”、”一定”、”说明”等词,此外有统计学意义时不一定有专业意义.(假设检验是否具有统计学意义取决于被研究事物有无本质差异、抽样误差的大小、所选用的高低及死单侧还是双侧)7)结合专业知识作出推论:假设检验可帮助研究者作出合理的推断,不能代替研究者做出专业结论8)CI与假设检验的区别与联系:CI推断参考值的范围(量的大小),假设检验判断各参数间有无质的不同12.统计表的结构:1)表号:位于顶线上方、标题的左侧,与标题之间的空2个字符,以阿拉伯数字表示2)标题:位于顶线上方、标号之后,简明扼要地说明表的内容;3)标目:横标目是统计表的主语,表示被说明事物的主要标志, 纵标目是统计表的谓语,说明主语的各项指标.对标目的要求是文字简明、层次清楚,一张表内不要安排过多标目;4)线条:一般只出现顶线、标目线和底线3条等长线;5)数字:一律采用阿拉伯数字,同一指标的小数位数应一致,位次对齐;6)备注:一般不列入表中,必要时可用’*’表示率和构成比的区别区别率构成比概念表示某现象发生的频率或强度表示事物内部各组成部分所占比重或分布特点某一分率的改变对其他无影响任一部分比重的增减都会影响其他部分意义反映事物的普遍性及严重程度事物按一个特征分类时,反映事物内部组成的结构特征事物按两个特征分类时,反映两个特征之间的关联关系合计各个率不能直接相加一定为100%标准差和均数标准误的区别标准差均数标准误意义描述个体观测值间的变异程度大小描述同一总体中随机抽出n相同的多个样本均属建德离散性公式与n的关系随着n的增大逐渐趋于稳定随着n的增大逐渐减小,与n的平方根成反比用途表示观测值变异大小结合均数描述正态分布的特征在正态分布时做参考值范围的估计计算变异系数和均数的标准误表示样本抽样误差的大小描述样本均数的可靠性结合均数估计总体均数的CI 进行均数间差别的假设检验区别总体均数的可信区间参考值范围的区别涵义根据抽样分布原理,按预先规定的概率(1-)给出被估计总体均数肯德数值范围.表示某总体均数的可能范围表示某项解剖、生理、生化等指标绝大多数个体观测值可能出现的范围计算已知:(未知:() 正态分布:(双侧)非正态分布:(双侧)与n的关系n越大,CI越小;n无穷大,CI趋近0 n越大,参考值范围越稳定用途估计总体均数估计某项指标绝大多数观测单位的波动范围直线相关直线回归联系(1) 反映应变量y与自变量x的互依关系,双向变化的关系体现应变量y随自变量x变化的依存关系,单向的关系(2)对两个变量间的关系进行描述,看是否有关系、关系是否密切及关系的性质对两个变量做定量描述,研究两个变量的数量关系(3) 只适用x,y服从双变量正态分布资料既适用于x,y服从双变量正态分布资料,也适用于y服从双变量正态分布,x是可以精确测量和严格控制的变量(4) r无单位,r的绝对值越大,两变量的关系越密切,相关程度越高b有单位,b的绝对值越大,回归直线越陡,y的平均变化越大(5) 两事物或现象间存在相关关系,不一定是因果关系两事物或现象间存在因果关系,则必然相关区别(1) 同时计算r和b,r与b同正负,r为正说明两变量间的相互关系是同向变化的;b为正说明x增(减)一个单位,y平均增(减)b个单位(2) r和b的假设检验等价,即对同一样本两者的t值相等,故简单的r的假设检验可代替对b的假设检验(3) 相关回归可以互相解释,称为确定系数,其可以从回归的角度了解相关程度设计方案水平特点完全随机设计单因素,两水平、多水平,不考虑混杂因素简单方便,应用广泛,容易进行统计分析,只能分析一个因素的作用,效率相对较低配对设计单因素,两水平,考虑混杂因素能缩小受试对象间的个体差异,从而减少实验误差,提高实验效率随机区组设计单因素,多水平,不考虑混杂因素各随机区组的受试对象数目相等,生物学特点较均衡,缩小了组间差别,实验效率较高SPSS电脑实验1.单样本t检验:1)用Explore正态性检验:选择Alnalyze→Descriptive statistics→Explore(Dependent:测量值, plots按钮:Normality plots with test)2)用One-Sample T Test单样本检测:选择Alnalyze→Compare Means→One-SampleT Test(右侧上面的Test框:测量值, 修改下面的Test框默认值(总体均数))2.配对t检验1)计算差值d: 选择Transform→Compute Variable(Target Variable:d,Numeric expession:方法一,单击运算键“-”,Numeric expession:法二)2)对差值d用Explore正态性检验: (Dependent:d,同上)3)配对t检验: 选择Alnalyze→Compare Means→Paired-Sample T Test (Paired Variable:方法一、方法二)3.方差齐性检验1)用Explore正态性检验,Spread vs.level with levene test→Untransformed 4.独立样本t检验1)选择Alnalyze→Compare Means→Independent-Samples T Test (Test框:测量值d,grouping:组别,Define groups:1、2等)1.完全随机设计F检验:1)选择Alnalyze→General Linear Model→Univariate(Dependent:测量值,Fixed Factor(s) :组别,Option视窗中Estimated Marginal Means→Display Means for:组别,Display: Descriptive statistics和Homogeneity tests→Continue→OK)2.随机区组设计F检验:1)选择Alnalyze→General Linear Model→Univariate(Dependent:测量值,Fixed Factor(s) :方法、药物;Model视窗中选择Custom→Model:方法、药物,Sum of Squares:Type III, →Include intercept inmodel→Continue;Post Hoc视窗中,Post Hoc Test for:方法,S-N-K →Continue ;Option视窗中Display Means for:组别,Display: Descriptivestatistics→Continue→OK)1.成组设计四格表检验:1)加权频数:Data→Weihgt cases→Weihgt case by(将频数变量选入框中返回)2)检验: 选择Alnalyze→Descriptive statistics→Crosstabs→”组别→Row(s)”以及”结果→Column(s)”对话框→statistics→Chi-square→Continue→OK2.配对设计四格表检验:1)加权频数:Data→Weihgt cases→Weihgt case by(将频数变量选入框中返回)2)检验: 选择Alnalyze→Descriptive statistics→Crosstabs→”新法→Row(s)”以及”旧法→Column(s)”→statistics→McNemar→Continue→OK3.R×C表检验:1)加权频数:Data→Weihgt cases→Weihgt case by(将频数变量选入框中返回)2)检验: 选择Alnalyze→Descriptive statistics→Crosstabs→”组别→Row(s)”以及”结果→Column(s)”→statistics→Chi-square→Continue→OK1.直线相关分析:1)选择Alnalyze→Correlate→Bivariate→在Bivariate Correlations的视窗中,将进食量、增重量两变量同时选中,从左边源变量框中移置到由框中→OK2.直线回归分析:1)选择Alnalyze→Regession→Linear→在Linear Regession的视窗中,将左边“收缩压“变量送入右边Dependent框中,左边”年龄”变量送入右边单样本t检验配对设计资料的t检验独立样本t检验完全随机F 检验计算均差平方和计算自由度计算均方计算F值随机区组F 检计算均差平方和计算自由度计算均方计算F值相关系数,,相关系数假设检验:成组设计四格表T≥5n≥40 nnnT CRRC=,()∑-=TTA22χ或()()()()()dbcadcbanbcad++++-=22χ1≤T<5n≥40nnnT CRRC=,()∑--=TTA225.0χ或()()()()()dbcadcbannbcad++++--=222χ配对设计四格表b+c≥40b+c<4行×列表T>1或1<T<5少于1/51.率的标准化法: 采用统一标准计算各率的标准化率,使率具有可比性,目的是在比较总率时消除混杂因素的影响.2.相对数:两个有联系的绝对数、相对数或平均数之比.(常用的相对数有率、构成比和相对比3.非参数检验:在统计推断中,不依赖于总体的分布形式, 直接对总体分布位置是否相同进行检验的方法,称非参数检验.4.等级资料: 将观察单位按某种属性的不同程度分组,所得各组的观察单位数,称为等级资料5.参数统计:在统计推断中 ,假定样本所来自的总体分布为已知的函数形式,但其中有的参数为未知, 统计推断的目的就是对这些未知参数进行估计或检验.6.参数估计:用样本统计量来估计总体参数,包括点值估计和区间估计.7.可信区间:在参数估计时,按一定可信度估计所得的总体参数所在的范围.8.假设检验:根据研究目的, 对样本所属总体特征提出一个假设, 然后用适当方法根据样本提供的信息, 推断此假设应当拒绝或不拒绝, 以使研究者了解在假设条件下,差异由抽样误差引起的可能性大小,便于比较分析.9.中位数:将一组观察值按从小到大的顺序排列后, 位次居中的观察值.10.影响的因素是:1)与样本量成正比:n越大,标准误越小,减小,发现组间差异的能力越强2)与参数的差值成正比:参数间的差值越大,样本指标间的差值就越大,越易获得拒绝的结论3)与个体差异成反比:标准差越小,标准误就越小,统计量就越大,越高4)与设计类型有关:配对设计和配伍设计比完全设计的高5)与检验方法有关:①参数检验所含的信息量比非参数检验多,高;②与检验方法要求的条件的多少成正比: 参数检验比非参数检验的高;③检验水准的大小成正比:与呈反比11.假设检验的目的和意义是什么?答: 在实际研究中,一般都是抽样研究,则所得的样本统计量(均数、率)往往不相等,这种差异有两种原因造成: 其一是抽样误差所致,其二是由于样本来自不同总体。
医学统计学总复习

医学统计学总复习1、几种集中趋势指标的适用条件均数—正态分布或近似正态分布;几何均数—呈正偏态分布,但数据经过对数变换后呈正态分布的资料,也可用于观察值之间呈倍数或近似倍数变化(等比关系)的资料;中位数—偏态分布资料以及频数分布的一端或两端无确切数据资料。
几种离散程度指标的适用条件:极差(全距)—常用于描述单峰对称分布小样本资料的变异程度或用于初步了解资料。
四分位数间距—常用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。
方差和标准差—正态分布和近似正态分布。
变异系数—比较计量单位不同以及均数相差悬殊的几组资料。
21.标准正态分布(u分布)与t分布的异同:相同点;集中位置都是0,都是单峰分布,是对称分布,标准正态分布是t分布的特例(自由度是无限大时)。
不同点:t分布是一簇分布曲线,t分布的曲线形态是随自由度的变化而变化,标准正态分布的曲线的形态不变,是固定不变的,因为它的形状参数为1。
3.为什么不可以说“总体均数有95%的概率落在这个区间里”?样调查的成本会更高5.t检验的应用条件为:▪①在单样本检验中,总体标准差未知且样本含量较小(n<50)时,要求样本来自正态分布总体;▪②成组检验要求两组资料相应的总体分别服从正态分布且方差齐。
当不满足这些条件时可使用变量变换将数据转换成正态或者近似正态分布,或使用秩和检验。
两小样本均数比较时,若两总体方差不相等,还可使用t’检验。
6.假设检验中的注意事项▪要保证组间的可比性▪要根据研究目的、设计类型和资料类型选用适当的检验方法▪正确理解假设检验中概率P值的含义▪结论不能绝对化▪单、双侧检验应事先确定7.方差分析的基本思想把全部观察值间的变异按设计类型的不同,分解成两个或多个组成部分,然后将各部分的变异与随机误差进行比较,以判断各部分的变异是否具有统计学意义。
8.方差分析的应用条件▪ 1. 各样本是相互独立的随机样本,均服从正态分布▪ 2. 各样本的总体方差相等,即方差齐性独立、正态、方差齐性如果方差不齐时,可采用F’检验或秩和检验。
统计笔记统计学复习

统计笔记统计学复习第一章第一节中医药统计学的意义和内容1 中医药统计学:是将数理统计学的原理和方法应用于生物医药特别是中医药科研,收集、整理和分析资料,推断不确定现象(随机现象)客观数量规律的一门应用学科。
2 中医药统计学的主要内容:(1)统计学基本原理(2)统计分析方法(统计设计、统计描述和统计推断、因素间的关系、生存分析、多元分析)第二节统计学发展及有关问题1、20世纪20年代,英国统计学家 R.A. Fisher爵士(1890-1962)创立了实验设计方法和统计分析技术,奠定现代生物统计的基础。
1948年,英国发表了评价链霉素治疗肺结核疗效的随机对照的临床试验报告,第一次采用生物统计方法进行临床干预试验。
生物统计学方法在我国医学界的传播与运用始于20世纪初。
1948年,郭祖超教授(1912~1999)编著的《医学与生物统计方法》,是我国第一部医学统计方法的教科书。
2、评价链霉素治疗肺结核疗效试验目标总体:15~30岁肺双侧进行性肺结核患者样本人群:目标总体中的107例患者试验方法:将107例患者随机(尽可能保证两组患者的病情相同,见下表1)分为两组,分到试验组的55例患者用链霉素治疗,分到对照组的52例患者用常规疗法(主要是卧床休息)试验结果:6个月后,试验组的生存率为93%,对照组的生存率为77%。
两组的生存率有较大差别,并且P<0.05。
应用统计学理论,可以得出链霉素对所有15~30岁肺双侧进行性肺结核患者都有效果的结论表1 随机化分组后两组患者的病情比较表2 两组疗效比较分组疗效合计生存率(%)分组身体状况血沉降/(mm.h-1) 生存死亡好一般差 0~ 11~ 21~ >50 试验组51 4 55 93 试验组 8 17 30 0 3 16 36 对照组40 12 52 77 对照组 8 20 24 1 2 20 29 3、医学论文中的统计:医学论文的两个作用:(1)通过撰写和发表论文,报告自己观察或试验的研究结果。
《医学统计学》复习重点总结-PPT文档资料

X
、 S、 CV ,
表达: x s
几何均数(G)
2) 描述计量数据变量值(x)分布范围
正态分布法
X 1 .96 S (正态或近似正态分布资料)
百分位数法 P2.5%-P97.5%
(偏态分布资料)
作用:①估计变量值分布范围 ②评价个体的指标正常与否
2、计数资料统计描述指标
相对数指标及含义: 率指标:说明事物发生的频率和强度。 构成比:说明各类别所占的构成比。说明事物 的组成和分布情况。 相对比:两事件的相对关系(增长速度)。 掌握: ①相对数指标意义及计算 ②应用时的注意问题
54
男
B
16.80
37.6
无效
实验与观察研究要求掌握概念
1.实验与观察研究二者的主要区别。 2.实验设计的三原则及意义和作用。 3.实验设计的三要素是什么? 4.观察研究中有那几种概率抽样方法? 5.观察研究有几种研究类型?主要回答那些 问题? 6.何为随机化分组与随机化抽样?
第四、六章 数据特征与统计描述
定性数据的频数表
两组疗效的比较 比较组 (x) 实验组 对照组 痊愈 20 2 疗效(y) 显效 25 5 有效 10 15 无效 2 30 合计 57 52
1.计量资料统计描述指标
1) 描述计量数据(X)几个特征值:
平均水平、变异程度指标 正态或近似正态分 布资料
描述指标:
偏态分布资料
中位数(M) 、四 分位间距(QR) 表达 :M (QR) 等比关系资料
相对数指标
不同职业各年龄(岁)组冠心病发 病率比较
年 龄 (岁 ) 50 病人数 % 9 25.7 4 23.5
职业
40病人数 % 干部 21 60 工人 12 70
医学统计学复习重点-精选.

医学统计学复习重点统计设计:调查设计、实验设计第一章绪论1.基本概念:总体——根据研究目的确定,所有同质观察单位某种观察值的全体。
样本——总体中抽取的一部分具有代表性的个体组成的集合。
参数——刻画总体特征的统计指标。
一般用希腊字母表示μ、σ、π统计量——刻画样本特征的统计指标。
抽取的样本不同,统计量会变化;一般用拉丁字母或英文字母表示X、S、p抽样误差:个体变异所致,抽样研究中样本信息与总体特征间的差异。
抽样误差是不可避免的。
属于随机误差,无方向性,重复抽样可以呈现一定的规律性。
小概率事件P≤0.052.*统计工作的四个步骤:设计、收集资料、整理资料、分析资料。
(用工作实例解释)第二章调查研究设计第三章实验研究设计1.调查研究(观察性研究):特点:无人为施加处理因素调查研究的分类:按调查涉及的对象划分:全面调查(普查)、抽样调查、典型调查注意:收集的资料要有可比性*随机抽样方法(做统计推断有意义):单纯随机抽样、系统抽样、分层抽样、整群抽样非随机抽样方法(不能做统计推断,可能有偏差):偶遇抽样、判断抽样、滚雪球抽样等2.实验研究特点:与调查研究最本质的区别:根据研究目的主动施加干预措施实验设计的三个基本要素:受试对象、处理因素、实验效应实验设计的基本原则:对照原则、随机化原则、重复原则第四章定量资料的统计描述第五章定性资料的统计描述1.定量资料(1)定量资料——*频数分布表、直方图、箱式图——判断分布类型——集中位置离散趋势(变异程度)*对称分布(正态分布)X±S 均数X标准差S*偏态分布M(P25~P75)中位数M=P50四分位数间距Q=P25~P75对数正态分布几何均数G 对数标准差S lgX(2)描述离散趋势的统计指标:✓极差R=最大值-最小值、✓四分位数间距Q:常用于描述*偏态分布资料的离散趋势、一端或两端无确切值的资料、分布不明确资料✓方差(总体、样本S2)&标准差(、S):*正态或近似正态分布✓变异系数%100⨯=XSCV(3)(4)正态分布及其应用:**制定医学参考值范围步骤:判断分布类型——正态分布——*双侧95%参考值范围:X±1.96S、单侧95%参考值范围:下限为X-1.64S、上限为X+1.64S——偏态分布——*双侧95%参考值范围:(百分位数法)P2.5~P97.5单侧95%参考值范围:下限为P5、上限为P952.定性资料*率:指某现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比。
(完整版)医学统计学复习要点

..第一章绪论1、数据/资料的分类:①、计量资料,又称定量资料或者数值变量;为观测每个观察单位某项治疗的大小而获得的资料。
②、计数资料,又称定性资料或者无序分类变量;为将观察单位按照某种属性或者类别分组计数,分组汇总各组观察单位数后而得到的资料。
③、等级资料,又称半定量资料或者有序分类变量。
为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。
2、统计学常用基本概念:①、统计学(statistics )是关于数据的科学与艺术,包括设计、搜集、整理、分析和表达等步骤,从数据中提炼新的有科学价值的信息。
②、总体(population )指的是根据研究目的而确定的同质观察单位的全体。
③、医学统计学(medical statistics ):用统计学的原理和方法处理医学资料中的同质性和变异性的科学和艺术,通过一定数量的观察、对比、分析,揭示那些困惑费解的医学问题背后的规律性。
④、样本(sample ):指的是从总体中随机抽取的部分观察单位。
⑤、变量(variable ):对观察单位某项特征进行测量或者观察,这种特征称为变量。
⑥、频率(frequency ):指的是样本的实际发生率。
⑦、概率(probability):指的是随机事件发生的可能性大小。
用大写的P 表示。
3、统计工作的基本步骤:①、统计设计:包括对资料的收集、整理和分析全过程的设想与安排;②、收集资料:采取措施取得准确可靠的原始数据;③、整理资料:将原始数据净化、系统化和条理化;④、分析资料:包括统计描述和统计推断两个方面。
第二章计量资料的统计描述1. 频数表的编制方法,频数分布的类型及频数表的用途①、求极差(range ):也称全距,即最大值和最小值之差,记作R ;②、确定组段数和组距,组段数通常取10-15组;③、根据组距写出组段,每个组段的下限为L ,上限为U ,变量X 值得归组统一定为L ≤X <U ,最后一组包括下限。
大学中医药专业考试复习资料--统计复习题

大学中医药专业考试复习资料统计复习题一.单项选择题(每小题4个备选答案中只有一个最佳答案,每小题2分,共10小题,共计20分)1.比较下列两药的疗效时,下列哪种情况可作单侧检验:A.已知A药效果不如B药B.已知A药与B药都有效C.已知A药与B药都无效D.已知A药与B药差不多2.下列资料中,哪个资料是有序变量:A.门诊月就诊量1000人B.痊愈、显效、好转、无效C.有效、无效D.玛丽某项技能测试得了5分3.一组数据中各个不同数据值出现的频数情况是:A.频数分布B.概率密度C.累积概率密度D.概率4.数据分布类型无法确定时,描述集中趋势宜选用的统计指标是:A.X B.GC.M D.S5.下列不属于相对比的指标是:A.RR B.ORC.有效率D.CV6.表示均数抽样误差的大小指标是:A.R B.XSC.CV D.四分位数间距7.假设80个被试被随机分配到5个不同的实验组,那么要考虑各组被试在某症状测量上的差异,F比值的自由度υ为多少:A.5,79 B.5,78C.4,79D.4,758、下列哪个相关系数所反映的相关程度最大:A.r=+0.53B.r=-0.69C.r=+0.37D.r=+0.729.R×C列联表2χ检验,如果有1/5以上的格子理论数小于5,或有格子中的理论数小于1,最好的处理方式是:A.增大样本量已达到增大理论数B.删去理论频数对应的行或列C. 按性质相近合并理论频数对应的行或列D.采用确切概率法10.对Pearson相关系数进行假设检验,其自由度是:A. n-1B. n-2C. 2n-1D. n二.判断对错题(对打勾、错打叉)(每小题2分,共10小题,共计20分)11.某市抽样测定150名健康成年男性的血清三酰甘油(TG)含量(mmol/),计算得666.1=X(mmol/L),S=0.5343(mmol/L)。
12.某医生对98例女性生殖器溃疡患者进行血清检测,发现杜克雷嗜血杆菌、梅毒螺旋体和人类单纯疱疹病毒2型病原体感染患者分别是30、51、17例,于是该医生得出结论:3种病原体感染率分别是30.6%、52.0%、17.4%,该结论是否正确?13.已知某地25岁成年男性的平均收缩压为113mmHg,从中随机抽取20名,测得平均收缩压为119mmHg,113mmHg与119mmHg不同是因为存在个体差异。
《中医统计学》习题及答案2010.9.12

《中医统计学》练习题第一部分绪论一、最佳选择题1.抽样研究是一种科学、高效的方法,目的是研究( B )A.样本B.总体C.抽样误差D.概率2.由样本推断总体,样本应该是( D )A.总体中的典型部分B.总体中有意义的部分C.总体中有价值的部分D.总体中有代表性的部分3.统计上所说的系统误差、过失误差、测量误差和抽样误差四种误差,在实际工作中( C )A.四种误差都不可避免B.过失误差和测量误差不可避免C.测量误差和抽样误差不可避免D.系统误差和抽样误差不可避免4.统计描述是指( C )A.比较指标的差别有无显著性B.估计参数C.用统计指标描述事物的特征D.判断无效假设是否成立5.统计推断是指( D )A.从总体推断样本特征B.从总体推断总体特征C.从样本推断样本特征D.从样本推断总体特征6.对某样品进行测量时,由于仪器事先未校正,造成测量结果普遍偏高,这种误差属于( A )A.系统误差B.随机测量误差C.抽样误差D.过失误差7.随机抽样的目的是( D )A.消除系统误差B.消除测量误差C.消除抽样误差D.减小样本偏性8.对某地200名16岁中学生口腔检查,发现患龋齿的人数为54人,该资料属于( B )A.数值变量资料B.无序分类变量资料C.有序分类变量资料D.三个都不是9.数值变量资料是( C )A.用仪器测量出来的资料B.按观察单位的类别,清点各类观察单位数的资料C.用定量方法测定观察单位某个变量的大小的资料D.按观察单位的等级,清点各等级观察单位数的资料10.无序分类变量资料是( B )A.用仪器测量出来的资料B.按观察单位的类别,清点各类观察单位数的资料C.用定量方法测定观察单位某个变量的大小的资料D.按观察单位的等级,清点各等级观察单位数的资料11.有序分类变量资料是( D )A.用仪器测量出来的资料B.按观察单位的类别,清点各类观察单位数的资料C.用定量方法测定观察单位某个变量的大小的资料D.按观察单位的等级,清点各等级观察单位数的资料12.下列哪种不属于数值变量资料( C )A.红细胞数B.血钙浓度C.阳性人数D.脉搏13.下列哪种属于有序分类变量资料( A )A.治疗痊愈、有效、无效人数B.各血型人数C.白细胞分类百分比D.贫血和不贫血人数二、判断题1.统计工作的主要内容是对资料进行统计分析。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.中医统计学:处理中医理论与实践中的同质性和变异性的科学与艺术.以概率论和数理统计原理为基础,以中医理论与实践为主体,通过对数据的搜集、整理、分析和推断,从而达到探讨中医理论与方法内在规律的目的.2.总体:根据研究目的确定的同质观测单位的集合. (无限总体和有限总体)3.样本:从统计总体中随机抽取的、具有代表性的部分观测单位的集合.4.同质:构成总体的各个观测单位在某一方面或某几方面的性质相同或基本相同.5.变异:在同质基础上各观察单位(或个体)之间的差异.6.事件:泛指事物发生的某种情况或在调查、观察和实验中获得的某种结果.(确定性事件和随机事件)8.频率:某种现象在重复随机试验中发生的比例.9.概率:某随机事件A发生的可能性大小,记为P(A).10.频数:指研究对象安某属性进行分组后,各组中观测值的个数.11.众数:一群数据中出现次数(频数)最多的值.12.随机:在抽样、分组、实验/试验顺序安排过程中,每个观测单位都不受研究者主观意愿驱使,具有同等的机会被抽中、分配或安排,目的是保证样本具有代表性.13.随机变量:随机事件各种不同的结果.(离散型变量和连续型变量)14.量值:随机事件各种具体的观测值.15.误差:实际观测值与真值之差个差或样本指标与总体指标之差.(非随机误差(粗差、系统误差)和随机误差(测量误差、抽样误差))16.分布:随机变量取值的变化及相应的频率变化的规律性.17.频数分布:指观测值按大小分组,各个组段内观测值个数(频数)的分布,是了解数据分布形态特征和规律的基础.18.正态分布:(高斯分布)一种常见的、最重要的连续型对称分布标准正态分布:期望值μ=0,标准差σ=1的正态分布19.医学参考值范围:为了减小变异的影响,提高参考值作为为判断正常或异常的可靠性所确定的绝大多数正常人医学参考值的波动范围.20.构成比:事物内部各组成部分所占整体的比重或分布,常用百分数表示.构成比=(某现象内部某一部分的个体数/某现象内部个体数之和)×100%21.相对比:描述两个有关指标的比例关系(通常以倍数或百分数表示).率:表示某现象发生的频率或强度,是频率指标.22.抽样误差:由个体差异和随机抽样造成的样本和总体、样本与样本相应统计指标之间的差异.23.区间估计:结合样本统计量和标准误确定一个具有较大可信度的包含总体参数的区间,该区间称为总体参数的1-α可信区间(CI)24.无效假设:记为 H0,表示差别由抽样误差引起,无统计学意义.备择假设: 记为 H1,表示差别为处理因素所致,有统计学意义.分为单侧和双侧两种形式25.检验水准:(显着性水准)符号为α,事先规定的对假设成立与否作出判断的依据,常取0.05或0.0126.P值:在检验假设所规定的总体中作随机抽样,获得等于及大于/小于现有样本统计量的概率,即各样本统计量的差异来自抽样误差的概率,是判断H0成立与否的依据.确定P值的方法有查表法和计算法27.I型错误:统计推断结果拒绝了实际上成立的H0,犯了”弃真”的错误.指组间差异实际上不存在,统计推断结果却错误地认为存在组间差异,故称为以假为真的错误为阳性错误,其概率用α表示II性错误:统计推断结果不拒绝实际上是不成立的H0,犯了”存伪”的错误. 指组间确实存在差异,统计推断结果却未检查出该差异,故称为以真为假的错误为阴性错误,其概率用β表示28.检验效能:(把握度)符号为1−β,当组间确实存在差异时,按所规定的α水平能发现组间差异的能力,或当H0不成立时拒绝H0的概率29.秩次:全部观测值按顺序排列的位序. 秩和:同组秩次之和秩和检验:用于总体为非正态或不易确定的分布资料、不能或未加精确测量资料等效率较高的非参数检验方法30.相关:指一个变量增大,另一个变量也随之增大或减少的共变现象相关关系:两个变量有共变现象直线相关:判断两个变量之间有无直线相关关系并回答相关的方向和相关程度如何的统计分析方法相关系数:符号为r,说明具有相关关系的两个变量间相关关系的密切程度与相关方向的指标.31.直线回归:用直线回归方程或数学模型描述两个变量间线性依存关系的一种统计分析方法回归系数:回归方程中表示自变量x对因变量y影响大小的参数,在直线回归方程中ŷ= a+bx中x每改变一个单位,y变动b个单位.32.无序资料:(名义资料)取值通常是具有某种特征或属性的个数,特点是可在非数字中取值,各类之间具有性质上的差异;有序资料:(等级资料或半定量资料),特点是各等级间有程度或量的差异,即可按数量的相对大小或程度的高低排出顺序.1.统计学的主要内容:研究设计(专业设计和统计学设计)、统计描述、统计推断(参数估计和假设检验)2.假设检验的步骤:1)建立检验假设、确定检验水准2)选择检验方法、计算统计量3)确定P值、做出推论3.专业设计的基本要素:受试对象、处理因素和试验效应4.统计设计的基本原则:对照(空白、实验、安慰剂、标准、历史、自身、相互和复合处理对照)、随机(单纯、系统、整群和分层随机抽样)、均衡、重复5.受试对象的选择需满足:对处理因素有较强的敏感性和特异性、对处理因素有较稳定的反应性、可行性6.数值变量的统计描述:1)集中趋势描述:描述一组观测值集中趋势的指标,是对同质基础上的样本或总体一般特征的指标.主要作用是①作为一组观测值的代表,表明该组观测值集中趋势的特征②便与同类研究对象进行对比分析.常用的平均数有算数平均数(总体均数μ、样本均数)、几何平均数G和中位数M;2)离散趋势描述:及变异,描述一组同质观测值变异程度大小(即数据的均匀性)的综合指标.常用的、标准差s、变异系数CV、标准误变异性指标有极差R、四分位数间距QR7.:1)计量资料:由数值变量产生的资料,即对每个观察单位用计量方法测得某项标志数值大小所获得的资料.特点是变量值大多有单位,其具体取值通常是正实数(零、正实数和小数); 2)计数资料:由分类变量产生的资料,即对每个观察单位按某种属性分组计数而得的资料.特点是变量值表现为互不相容的属性或类别,无度量衡单位.分为二分类资料(按互不相容的属性分类)和多分类资料(按不同类别分类(无序资料和有序资料))8.直线相关的注意事项:1)线性相关表示两个变量间的关系是双向的,当散点图出现直线趋势时再做分析2)相关系数的计算只适用于两个变量都服从正态分布的资料3)样本相关系数r是总体相关系数ρ的一个估计值,r与ρ间存在抽样误差,必须作假设检验4)相关分析是用相关系数来描述两个变量间相互关系的密切程度和方向,相关关系不一定是因果关系9.应用相对数的注意事项:1)计算时分母不宜太小,若观察单位数较小,宜直接用绝对数表示;2)观察单位数不等的几个率不能直接相加求其合计率;3)资料对比时应注意可比性;4)资料分析时不能已构成比代替10.直线回归注意的问题:1)作回归分析要有实际意义,不能把毫无关联的两种现象做回归分析.2)在进行直线回归分析前应先绘制散点图,观察点的分布有直线趋势时才适宜作直线回归分析,若呈曲线趋势宜直线化后再分析3)适用范围一般以自变量的取值范围为限,在此范围内求出的估计值称为内插,超过此范围的值称为外延,应避免外延.11.应用检验假设注意事项:1)事先进行严密的统计学设计:除对比的主要因素外,其他可能影响结果的因素在对比的组间应相同或相近2)单侧检验和双侧检验的选择:双侧检验的检验思路比单侧宽且无限制条件,较为常用,适用于对预试验结果分析,双侧的接受域位于某一特定分布的中部,拒绝域分布在两侧,而单侧检验的接受域和拒绝域各占某一特定分布的一侧,同一检验水准下单侧比双侧界值小、拒绝域大、更易得出拒绝H03)灵活确定α水准:根据实际工作中对不同分析目的和要求,选用的α往往有一定的灵活性4)选择正确地统计方法:应根据分析目的、不同的资料类型及分布、设计方案的种类、样本量的大小等选用适当的检验方法5)正确理解统计推断的意义:统计推断结论是依据现有的设计、研究方法与条件、资料及分析目的和要求所取的水准,采用的统计分析方法等做出具有相应概率的解释,不宜将结论的意义扩大或缩小6)假设检验的结论不能绝对化:统计学结论是具有概率性质的推论,不能使用”肯定”、”证明”、”一定”、”说明”等词,此外有统计学意义时不一定有专业意义.(假设检验是否具有统计学意义取决于被研究事物有无本质差异、抽样误差的大小、所选用的α高低及死单侧还是双侧)7)结合专业知识作出推论:假设检验可帮助研究者作出合理的推断,不能代替研究者做出专业结论8)CI与假设检验的区别与联系:CI推断参考值的范围(量的大小),假设检验判断各参数间有无质的不同12.统计表的结构:1)表号:位于顶线上方、标题的左侧,与标题之间的空2个字符,以阿拉伯数字表示2)标题:位于顶线上方、标号之后,简明扼要地说明表的内容;3)标目:横标目是统计表的主语,表示被说明事物的主要标志, 纵标目是统计表的谓语,说明主语的各项指标.对标目的要求是文字简明、层次清楚,一张表内不要安排过多标目;4)线条:一般只出现顶线、标目线和底线3条等长线;5)数字:一律采用阿拉伯数字,同一指标的小数位数应一致,位次对齐;6)备注:一般不列入表中,必要时可用’*’表示SPSS电脑实验1.单样本t检验:1)用Explore正态性检验:选择Alnalyze→Descriptive statistics→Explore(Dependent:测量值, plots按钮:Normality plots with test)2)用One-Sample T Test单样本检测:选择Alnalyze→Compare Means→One-Sample TTest(右侧上面的Test框:测量值, 修改下面的Test框默认值(总体均数))2.配对t检验1)计算差值d: 选择Transform→Compute Variable(Target Variable:d,Numeric expession:方法一,单击运算键“-”,Numericexpession:法二)2)对差值d用Explore正态性检验: (Dependent:d,同上)3)配对t检验: 选择Alnalyze→Compare Means→Paired-Sample T Test (Paired Variable:方法一、方法二)3.方差齐性检验1)用Explore正态性检验,Spread vs.level with levene test→Untransformed4.独立样本t检验1)选择Alnalyze→Compare Means→Independent-Samples T Test(Test框:测量值d,grouping:组别,Define groups:1、2等)1.完全随机设计F检验:1)选择Alnalyze→General Linear Model→Univariate(Dependent:测量值,Fixed Factor(s) :组别,Option视窗中Estimated Marginal Means →Display Means for:组别,Display: Descriptive statistics和Homogeneitytests→Continue→OK)2.随机区组设计F检验:1)选择Alnalyze→General Linear Model→Univariate(Dependent:测量值,Fixed Factor(s) :方法、药物;Model视窗中选择Custom→Model:方法、药物,Sum of Squares:Type III, →Include intercept in model→Continue;Post Hoc视窗中,Post Hoc Test for:方法,S-N-K →Continue ;Option视窗中Display Means for:组别,Display: Descriptivestatistics→Continue→OK)1.成组设计四格表χ2检验:1)加权频数:Data→Weihgt cases→Weihgt case by(将频数变量选入框中返回)2) χ2检验: 选择Alnalyze→Descriptive statistics→Crosstabs→”组别→Row(s)”以及”结果→Column(s)”对话框→statistics→Chi-square→Continue→OK2.配对设计四格表χ2检验:1)加权频数:Data→Weihgt cases→Weihgt case by(将频数变量选入框中返回)2) χ2检验: 选择Alnalyze→Descriptive statistics→Crosstabs→”新法→Row(s)”以及”旧法→Column(s)”→statistics→McNemar→Continue→OK3.R×C表χ2检验:1)加权频数:Data→Weihgt cases→Weihgt case by(将频数变量选入框中返回)2) χ2检验: 选择Alnalyze→Descriptive statistics→Crosstabs→”组别→Row(s)”以及”结果→Column(s)”→statistics→Chi-square→Continue→OK1.直线相关分析:1)选择Alnalyze→Correlate→Bivariate→在Bivariate Correlations的视窗中,将进食量、增重量两变量同时选中,从左边源变量框中移置到由框中→OK 2.直线回归分析:1)选择Alnalyze→Regession→Linear→在Linear Regession的视窗中,将左边“收缩压“变量送入右边Dependent框中,左边”年龄”变量送入右边1.率的标准化法: 采用统一标准计算各率的标准化率,使率具有可比性,目的是在比较总率时消除混杂因素的影响.2.相对数:两个有联系的绝对数、相对数或平均数之比.(常用的相对数有率、构成比和相对比3.非参数检验:在统计推断中,不依赖于总体的分布形式, 直接对总体分布位置是否相同进行检验的方法,称非参数检验.4.等级资料: 将观察单位按某种属性的不同程度分组,所得各组的观察单位数,称为等级资料5.参数统计:在统计推断中 ,假定样本所来自的总体分布为已知的函数形式,但其中有的参数为未知, 统计推断的目的就是对这些未知参数进行估计或检验.6.参数估计:用样本统计量来估计总体参数,包括点值估计和区间估计.7.可信区间:在参数估计时,按一定可信度估计所得的总体参数所在的范围.8.假设检验:根据研究目的, 对样本所属总体特征提出一个假设, 然后用适当方法根据样本提供的信息, 推断此假设应当拒绝或不拒绝, 以使研究者了解在假设条件下,差异由抽样误差引起的可能性大小,便于比较分析.9.中位数:将一组观察值按从小到大的顺序排列后, 位次居中的观察值.10.影响1−β的因素是:1) 1−β与样本量成正比:n越大,标准误越小, β减小,发现组间差异的能力越强2) 1−β与参数的差值成正比:参数间的差值越大,样本指标间的差值就越大,越易获得拒绝H0的结论3) 1−β与个体差异成反比:标准差越小,标准误就越小,统计量就越大, 1−β越高4) 1−β与设计类型有关:配对设计和配伍设计比完全设计的1−β高5) 1−β与检验方法有关:①参数检验所含的信息量比非参数检验多, 1−β高;②与检验方法要求的条件的多少成正比: 参数检验比非参数检验的1−β高;③检验水准α的大小成正比: α与β呈反比11.假设检验的目的和意义是什么?答: 在实际研究中,一般都是抽样研究,则所得的样本统计量(均数、率)往往不相等,这种差异有两种原因造成: 其一是抽样误差所致,其二是由于样本来自不同总体。