数值变量统计描述

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

0.69
0.77 0.86 1.02 1.08 1.27
0.66
0.86 1.13 1.38 1.63 2.04
3.59
3.86 4.08 4.30 4.30 5.96
1.92
3.75
6.62
二、分类变量资料:

是将观察单位按某种属性或类别分组, 然后清点各组观察单位的个数所得的数据 (无度量单位、整数、离散性资料)
2)重复原则(确定样本含量原则) 在预实验或大量调查的基础上,以预先规定的检验水准(ᵊ )和检验效能( ᵊ)达到预期效果所需要的最少观察单位数 。 3)对照原则 在均衡可比条件下进行实验组与对照组的科学对比。 均衡可比性:在各对比组中,除研究因素不同外,其他能够 影响实验效应的非研究因素要尽量一致。
集中趋势指标 统计指标
统计描述 统 计 分 析 统计推断 参数估计 区间估计 统计图表 假设检验 点估计
离散趋势指标
统计资料的类型
一、数值变量资料(计量资料) 对每个观察单位(观察对象)某个变量用定量的方法(仪器、实 验)进行测量所得到的数值(有度量单位、可以是小数、连续性资 料)。 2
三种人群的血浆总皮质醇测定值(10 μmol/L) 单纯性肥胖 0.17 0.33 0.55 正常人 0.11 0.52 0.61 皮质醇增多 2.70 2.81 2.92
实例数据1
³ ¨¶ Ü ° © ¸ ¹ Õ ß ° ¿ ² Ö Ö µ ± ê ± ´ · Å Ð Ô ± ð Ä ê Á ä£ ¨Ë ê £ ©° ¿ Î ¸ ± ´ · Å Ð Ô ± ð Ä Á ä £ ¨Ë ©° ¿ Î ¸ £ ¨ 1 £ ©£ ¨ 2 £ © ê£ ¨ 3£ ©ê £ £ ¨ 4 £ © £ ¨1£ © £ ¨2£ © £ ¨3£ © £ ¨4£ © 1 61 Ä Ð É Ï 1 61 Ä Ð É Ï 2 58 Å ® Ö Ð 2 58 Å ® Ö Ð 3 63 Å ® É Ï 3 63 Å ® É Ï 4 71 Å ® Ï Â 4 71 Å ® Ï Â 5 59 Ä Ð É Ï 5 59 Ä Ð É Ï ¡ ­ ¡ ­ ¡ ­ ¡ ­ ¡ ­ ¡ ­ ¡ ­ ¡ ­
组段 2.70~ 3.05~ 3.40~
频数(f) 2 3 8
频率(%) 1.23 1.85 4.95
3.75~ 4.10~
4.45~ 4.80~ 5.15~ 5.50~ 5.85~ 6.20~ 合计
16 27
45 29 18 9 4 1 162
9.88 16.67
27.78 17.90 11.11 5.56 2.47 0.62 100
6、SAS工作界面
数值变量资料的统计描述 用SPSS软件实现统计描述
医学统计工作的一般流程
研究设计
数据整理
统计描述
统计推断
专业设计 统计设计
资料来源 质量控制
统计指标 统计图表
参数估计 假设检验
医学统计学在科研中的应用
一、统计设计:
专业设计主要包括: 选题或立题,确定研究对象、处理因素、实 验方法、实验材料和实验设备、实验效应(特 异性指标)等。

4 统计设计目的:确保专业设计布局合理、实验结果可靠
二、收集资料和整理资料 三、分析资料 统计描述:对统计资料数量特征及分布特征进行描述 研究和描述表达 (1)统计指标 (2)统计表、统计图 统计推断:指根据样本信息(样本统计量)推断总体 信息(总体参数) (1) 参数估计 (2) 假设检验 (3) 相关与回归分析等
1、对称分布:集中位置居中,两侧基本对称的
频数分布
200
100
Std. Dev = 2.21 Mean = 14.42 0 7.25 9.25 11.25 13.25 15.25 17.25 19.25 21.25 N = 960.00
A
(1)正偏态:特点是峰偏左(频数大多偏于数值小 的左侧),长尾向右侧伸延
(2)多项分类:按属性或类别分组时,分成互不 相容的几种属性或类别;如血型A型、B型、O型、 AB型
维吾尔族与回族居民血型构成比 构成比(%) 民族 A B O AB 调查例数
维吾尔族
回族
29.21
27.23
31.92
28.34
27.50
35.94
11.37
8.49
1513
1355
2、有序分类变量资料(等级资料): 将观察单位按某种属性的不同程度、 档次或等级分类,然后清点各等级类别所 得的观察单位数。
5.07
4.54 4.40 4.64
4.80
3.82 4.14 4.37
5.30
4.01 5.01 4.87
4.65
4.89 4.37 4.60
4.77
4.62 5.24 4.72
4.50
5.12 4.60 4.83
5.37
4.85 4.71 5.33
5.49
4.59 4.82 4.68
5.22
5.08 4.94 4.80
统计设计主要包括:
调查设计
实验研究
1设计类型 实验设计 临床试验
实验研究:以动物或生物材料为研究对象,研究者对研究对 象施加各种干预。 临床试验:以病人为研究对象,研究者对研究对象施加各种 干预。
设计内容:确定统计分析方法、实验分组方 法、样本含量估计、数据质量控制(误差和 偏倚)等。 3 设计原则 1)随机化原则 随机抽样:总体中的每一个观察单位都有同 等机会进入样本。 随机分配:样本中的每一个受试对象都有同 等机会进入处理组和对照组或进入各个处理组。 2
4.05
4.28 4.52 4.76
4.16
4.78 4.64
5.04
4.51 4.75
5.15
4.63 4.49
4.50
4.36 4.22
频数表编制步骤如下:
1、求 全距(R) :本例R= Xmax- Xmin=3.62 最大值(Xmax=6.34)和最小值(Xmin=2.72)
2、定组段数与组距: 组段指各组的起止范围;组数指组段 的个数(用k)表示
•例3.1 某医生收集某区162名健康成年男性血清总胆固 醇(mmol/L)资料,检测结果如表2-1所示。
某区162名健康成年血清总胆固醇(mmol/L)
5.53
5.00 5.24 4.33
5.26
4.73 4.97 4.83
5.61
4.47 4.71 4.56
5.59
5.34 4.44 5.44
x Md
25 20
人数
15 10 5 0
13.5
19.5
25.5
31.5
37.5
43.5.
血清转氨酶(mmol/L)
图2-2 115名正常成年女子Fra Baidu bibliotek清转氨酶的频数分布
(2)负偏态:峰偏右(频数大多偏于数值大的右侧),长 尾向左伸延;(与正偏态相反)
x Md
25 20
人数
15 10 5 0
2.5
4.46
4.70 4.94 4.79
4.57
4.81 5.05 4.91
4.31
4.93 4.78 4.26
5.18
5.04 4.52 4.38
4.92
4.40 4.63 4.87
4.27
5.27 5.51 4.99
4.77
4.63 5.24 5.60
4.88
5.50 4.98 4.46
4.95
4.81 5.05 4.52
12.5
22.5
32.5
42.5
52.5
血清肌红蛋白 ( μ g / m L) 图 2-3 101 名 正 常 人 血 清 肌 红 蛋 白 的 频 数 分 布
两种药物治疗慢性气管炎的疗效 组别 标准组(A药) 对比组(B药) 无效 800 10 好转 1920 60 显效 680 26 控制 60 18 合计 3460 114
*有序分类变量资料与多项分类资料的区别:
各等级类别有程度上的差别(这种差别按 顺序排列,任何两类别的排序不能替换) *根据分析需要:各类变量资料之间可以互 相转化
SAS系统的特点




SAS系统是用于数据分析与决策支持的大型集成式模块化软件包,是一 种组合软件系统。核心部分是Base SAS软件,其它可选模块有: SAS/STAT软件、SAS/GRAPH软件、SAS/IML软件、SAS/OR软件、 SAS/ETS软件等30多个。 1、操作简便 SAS的宗旨是为所有需要进行数据处理、数据分析的非计 算机专业人员提供一种易学易用、完整可靠的软件系统。用户把要解决 的问题用SAS语言(近乎自然英语的非过程语言)表达出来,组成SAS程 序,提交给SAS系统就可以解决所提出的问题。 2、SAS系统将数据管理与统计分析溶为一体 SAS程序的结构由两个基 本步骤任意组合而成。DATA步用于对数据的加工处理;PROC步用于分 析数据和编写报告。SAS系统克服了通常软件或偏重于数据管理功能或 偏重于统计分析的弊病,把数据管理与统计分析有机地结合在一起。 3、适用性强、应用面广 SAS系统适用于任何经验的人员(初学者或有 经验的用户);适用于任何类型的数据;适用于几乎是任何应用的需要; 适用于任何计算机环境;扩展性能强。
4.58
4.82 5.05 4.15
5.07
4.93 4.79 4.65
4.76
4.62 4.48 4.71
4.88
4.73 4.59 5.21
4.61
4.47 5.09 4.94
3.97
4.58 5.20 4.68
4.08
4.70 5.32 5.17
4.58
4.81 5.05 4.91
4.31
4.55 4.41 5.02
É ú ² æ Ê ±¹ ä (Ô Â ) É ú ² æ Ê ±¹ ä (Ô Â ) £ ¨ 9£ © £ ¨9£ © 14 14 20 20 19 19 5 5 35 35 ¡ ­ ¡ ­
第三章 统计描述
第一节 频数发布
一、频数表:
频数( f ) :相同观察值(或观察结果)出现的 次数 观察值及其相应的频数按一定顺序排列的 表格.
样本量n大于100设10~15个组段 样本量n大于100设10~15个组段 组距(i):等距分组时i=R/k
本例i=3.62/10=0.362≈0.35(方便数)
3、确定组限:
(1)每个组段的起点为下限,终止点为上限 (2)第一组段下限取等于或略小于Xmin的整数 或方便数,其余各个组段依次累加I作下限 4、划记各组段频数:
³ ¨¶ Ü ° © ¸ ¹ Õ ß ° ¿ ² Ö Ö µ ± ê
² Ö ¸ ¯ ± Ì ´ È ² Ö Æ Ú µ Î ³ ª Ò Æ PCNA Ö µ Ê ý ² Ö ¸ ¯ ± Ì ´ ² Ö Æ Ú µ ³ ª Ò Ö µ Ê ý £ ¨ 5 £ ©È £ ¨ 6 £ © Σ ¨ 7£ ©Æ PCNA £ ¨8£ © £ ¨5£ © £ ¨6£ © £ ¨7£ © £ ¨8£ © 52 ³ Í Ö ¯ ¢ ñ Ñ ò Ô 52 ³ Í ² ² Ö ¸ ¸ ¯ ¢ ñ Ñ ò Ð Ð Ô 89 µ ß ² ² Ö ¸ ¸ ¯ ¢ ò Ò ó Ð Ô 89 µ ß Ö ¯ ¢ ò Ò ó Ð Ô 93 µ ß Ö ¯ ¢ ò Ò ó Ô 93 µ ß ² ² Ö ¸ ¸ ¯ ¢ ò Ò ó Ð Ð Ô 78 Ö Ð ² Ö ¸ ¯ ¢ ò Ñ ò Ð Ô 78 Ö Ð ² Ö ¸ ¯ ¢ ò Ñ ò Ð Ô 85 µ ß ² Ö ¸ ¯ ¢ ó Ò ó Ð Ô 85 µ ß ² Ö ¸ ¯ ¢ ó Ò ó¡ Ô ¡ ­ ¡ ­ ­Ð ¡ ­ ¡ ­ ¡ ­ ¡ ­ ¡ ­
二 频数图:
直方图是以垂直条段代表频数分布的一种图形,条段的高 度代表各组的频数,由纵轴标度,各组限由横轴标度,条段 的宽度表示组距
三、频数分布特征(两方面特征)
1、集中趋势:(图9—1)14~组段(居中组段)频 数最多,其它组段的频数分布向其靠拢. 2、离散趋势:居中组段两侧的频数逐渐减少
四、频数分布的类型
分类变量又可分为有序分类和无序分类两种情况: 1、无序分类变量资料(计数资料) (1)二项分类:按属性或类别分组时,分成对立的 两种属性或类别;如阳性与阴性、有效与无效
甲乙两种疗法治疗肺癌的2年生存率比较 疗法 甲 乙 合计 生存 22 35 57 死亡 24 23 47 合计 46 58 104 生存率(%) 47.83 60.34 54.81
医学统计学概述
现代统计学分为理论统计学和应用统计 学 理论统计学: 论述统计学的基本原理、 原则和统计方法 (概率论与数理统计) 应用统计学: 理论统计学在各个专业 领域的具体应用。

统计学思考与练习.doc
医学统计学是运用概率论和数理统 计的原理、方法, 结合医学实践,研 究医学数字资料的搜集、整理、推断 的一门学科。
相关文档
最新文档