数值变量资料的统计推断

合集下载

《中医统计学》习题及答案

《中医统计学》练习题第一部分绪论一、最佳选择题1.抽样研究是一种科学、高效的方法，目的是研究（ B ）A.样本B.总体C.抽样误差D.概率2.由样本推断总体，样本应该是（ D ）A.总体中的典型部分B.总体中有意义的部分C.总体中有价值的部分D.总体中有代表性的部分3.统计上所说的系统误差、过失误差、测量误差和抽样误差四种误差，在实际工作中（ C ）A.四种误差都不可避免B.过失误差和测量误差不可避免C.测量误差和抽样误差不可避免D.系统误差和抽样误差不可避免4.统计描述是指（ C ）A.比较指标的差别有无显著性B.估计参数C.用统计指标描述事物的特征D.判断无效假设是否成立5.统计推断是指（ D ）A.从总体推断样本特征B.从总体推断总体特征C.从样本推断样本特征D.从样本推断总体特征6.对某样品进行测量时，由于仪器事先未校正，造成测量结果普遍偏高，这种误差属于（ A ）A.系统误差B.随机测量误差C.抽样误差D.过失误差7.随机抽样的目的是（ D ）A.消除系统误差B.消除测量误差C.消除抽样误差D.减小样本偏性8.对某地200名16岁中学生口腔检查，发现患龋齿的人数为54人，该资料属于（ B ）A.数值变量资料B.无序分类变量资料C.有序分类变量资料D.三个都不是9.数值变量资料是（ C ）A.用仪器测量出来的资料B.按观察单位的类别，清点各类观察单位数的资料C.用定量方法测定观察单位某个变量的大小的资料D.按观察单位的等级，清点各等级观察单位数的资料10.无序分类变量资料是（ B ）A.用仪器测量出来的资料B.按观察单位的类别，清点各类观察单位数的资料C.用定量方法测定观察单位某个变量的大小的资料D.按观察单位的等级，清点各等级观察单位数的资料11.有序分类变量资料是（ D ）A.用仪器测量出来的资料B.按观察单位的类别，清点各类观察单位数的资料C.用定量方法测定观察单位某个变量的大小的资料D.按观察单位的等级，清点各等级观察单位数的资料12.下列哪种不属于数值变量资料（ C ）A.红细胞数B.血钙浓度C.阳性人数D.脉搏13.下列哪种属于有序分类变量资料（ A ）A.治疗痊愈、有效、无效人数B.各血型人数C.白细胞分类百分比D.贫血和不贫血人数二、判断题1.统计工作的主要内容是对资料进行统计分析。

数值变量资料的统计分析.

可信度即指估计的准确度，是我们预先给定的概率，符号为，常取95％或99％。
1、大样本（如n>100）数据总体均数的可信区间
移项后: 总体均数的95%可信区间：
缩写为：或：
例9.14(P167):
该地健康成年女性血红蛋白值总体均数有95％的可能落在117.48—120.12g/L之间。
2、小样本数据总体均数的可信区间
（一）极差（range）
极差又称全距，即一组观察值中最大值与最小值之差，用R表示。
适用范围：可用于所有资料的离散趋势描述，但较粗略。
（二）四分位数间距(quartile interval)
四分位数间距是上四分位数（即）与下四分位数（即）之差，其间包括了全部观察值中间的一半，用表示。
适用范围：可用于所有资料的离散趋势描述，但主要用于偏态分布资料。
例9.6(P160) 此150名某型食物中毒患者的四分位数间距是19.47天。
（三）方差和标准差
方差（variance）是每一观察值的离均差平方和的平均值。总体方差用表示，样本方差用表示。
标准差（standard deviation）即方差的平方根。总体标准差用表示，样本标准差用表示。
第三节参数估计和假设检验
一.均数的抽样误差与标准误
抽样研究的目的总是通过对样本的观察，用样本的水平推断其总体的水平。
由抽样而造成的样本指标与总体指标的差异，或各样本指标之间的差异，就称为抽样误差 ( sampling error)。
抽样研究时，抽样误差是不可避免的，只能估计其大小。
（2）均数对应的位置曲线最高，且以均数为中心左右对
称；
（3）正态分布曲线的位置和形状取决于两个参数

统计描述与统计推断

统计描述与统计推断统计的主要工作就是对统计数据进行统计描述和统计推断。

统计描述是统计分析的最基本内容，是指应用统计指标、统计表、统计图等方法，对资料的数量特征及其分布规律进行测定和描述；而统计推断是指通过抽样等方式进行样本估计总体特征的过程，包括参数估计和假设检验两项内容。

(一)统计描述1.计量资料的统计描述计量资料的统计描述主要通过编制频数分布表、计算集中趋势指标和离散趁势指标以及统计图表来进行。

(1)集中趋势。

指频数表中频数分布表现为频数向某一位置集中的趋势。

集中趋势的描述指标：1)算术平均数。

直接法：x为观察值，n为个数加权法又称频数表法，适用于频数表资料，当观察例数较多时用。

f为各组段的频数。

2）几何平均数（geometric mean）。

几何平均数用符号G表示。

用于反映一组经对数转换后呈对称分布的变量值在数学上的平均水平。

直接法：加权法又称频数表法，当观察例数n较大时，可先编制频数分布表，用此法算几何平均数：3)百分位数（percentile ）与中位数（median ）。

百分位数是一种位置坐标，用符号x P 表示常用的百分位数有 2.5P 、5P 、50P 、75P 、95P 、97.5P 等，其中25P 、50P 、75P 又称为四分位数。

百分位数常用于描述一组观察值在某百分位置上的水平，多个百分位结合使用，可更全面地描述资料的分布特征。

中位数是一个特定的百分位数即50P ，用符号M 表示。

把一组观察值按从小到大（或从大到小）的次序排列，位置居于最中央的那个数据就是中位数。

中位数也是反映频数分布集中位置的统计指标，但它只由所处中间位置的部分变量值计算所得，不能反映所有数值的变化，故中位数缺乏敏感性。

中位数理论上可以用于任何分布类型的资料，但实践中常用于偏态分布资料和分布两端无确定值的资料。

其计算方法有直接法和频数表法两种。

直接法：当观察例数n 不大时，此法常用，先将观察值按大小次序排列，选用下列公式求M 。

数值变量资料的统计推断

．从一个总体中抽取样本，产生抽样误差地原因是总体中个体之间存在变异抽样未遵循随机化原则被抽取地个体不同质组成样本地个体较少分组不合理．两样本均数比较地检验中，结果为<，有统计意义.愈小则说明两样本均数差别愈大说明两总体均数差别愈大说明样本均数与总体均数差别愈大愈有理由认为两样本均数不同愈有理由认为两总体均数不同．由对(个)数据组成地资料作配对检验，其自由度等于．检验结果，>，可以认为两总体均数差别无显著性两样本均数差别无显著性两总体均数差别有显著性两样本均数差别有显著性以上都不对．下列哪项不是检验地注意事项资料应具备可比性下结论切忌绝对化根据资料选择适宜地检验方法分母不宜过小资料应服从正态分布．在一项抽样研究中，当样本量逐渐增大时标准差逐渐减少标准误逐渐减少标准差逐渐增大标准误逐渐增大标准差和标准误都逐渐增大．＜()，统计上可认为两总体均数，差别无显著性两总体均数，差别有显著性两样本均数，差别无显著性两样本均数，差别有显著性以上均不是．两样本均数地检验中，检验假设（）是μ≠μ μμ ≠ 文档收集自网络，仅用于个人学习．同一总体地两个样本中，以下哪种指标值小地其样本均数估计总体均数更可靠？.．标准差与标准误地关系是：两者相等后者大于前者前者大于后者不一定随样本例数不同．在同一正态总体中随机抽取含量为地样本，理论上有地总体均数在何者范围内均数加减倍地标准差均数加减倍地标准差均数加减倍地标准误均数加减倍地标准误以上都不对．同一自由度下，值增大值不变值增大值减小值与值相等值增大或减小．两样本作均数差别地检验，要求资料分布近似正态，还要求两样本均数相近，方差相等两样本均数相近两样本方差相等两样本总体方差相等两样本例数相等、反映均数抽样误差地统计指标是：、标准差、标准误、变异系数、全距、方差、下列哪个公式可用于估计总体均数％可信区间：、±、±、μ±,υ 、μ±,υ 文档收集自网络，仅用于个人学习、±,υ、当自由度→∞时，值：、≠ 、< 、、> 、、α, >,ν,统计上可认为（）、两总体均数差别无显著意义、两样本均数差别无显著意义、两总体均数差别有显著意义、两样本均数差别有显著意义、以上均不对、作单侧检验地前提是：、已知新药优于旧药、已知新药差于旧药、不知新药好还是旧药好、已知新药不比旧药差、已知新旧药差不多好、用一种新药治疗高血脂症例，观察治疗前后红血清成固醇地浓度变化，欲知该药是否有效，宜采用：、配对设计检验、成组设计两样本均数比较地检验、成组设计两样本几何均数比较检验、两样本均数比较检验、检验、对两组大样本率地比较，可选用：、检验、检验、四格表确切计算概率法、以上都不对、都可以、在两样本均数比较地检验中，无效假设()地正确表达应为：、μ≠μ 、μμ 、≠ 、、ππ文档收集自网络，仅用于个人学习、在检验中，当> 时，则结论为：、> 、≥ 、< 、≤ 、≤文档收集自网络，仅用于个人学习、两个作检验，除样本都应呈正态分布以外，还应具备地条件是：、两数值接近、两数值接近、两相差较大、两相差较大、以上都不对、抽样调查男生和女生各名，并分别统计出身高与体重均数，其中同性别地身高与体重均数不可作假设检验，是因为：文档收集自网络，仅用于个人学习、资料不具备可比性、身高资料不呈正态分布、体重资料不呈正态分布、样本含量较小、由对(个)数据组成地资料作配对检验，其自由度等于：、、、、、对两样本均数作检验，，，其自由度等于：、、、、、.抽样研究中，为定值，若逐渐增大样本含量，则样本：．标准误减小．标准误增大．标准误不改变．标准误地变化与样本含量无关．以上都对、名妇女分别用两种测量肺活量地仪器测最大呼气率()，比较两种方法检测结果有无差别，可进行：文档收集自网络，仅用于个人学习、成组设计检验、成组设计检验、配对设计检验、配对设计检验、检验．比较两种药物疗效时，对于下列哪项可作单侧检验( ).．已知药与药均有效．不知药好还是药好.已知药不会优于药.不知药与药是否均有效.已知药与药均无效.两个大样本均数比较地检验, ,则统计结论是< < > 、<文档收集自网络，仅用于个人学习.配对计量资料比较地检验公式中，分母是. . . . 、.配对检验中，用药前数据减去用药后数据和用药后数据减去用药前数据，两次检验、值符号相反，结论相反、值符号相同，结论相同、值符号相反，但结论相同、值符号相同，但大小不同，结论相反、值符号与结论无关．下面那一项小，表示用该样本均数估计总体均数地可靠性大.．．．．．四分位数间距．两个小样本数值变量资料比较地假设，首先应考虑.．检验．检验．秩和检验．检验和秩和检验均可．资料符合检验还是秩和检验．抽样误差是指.总体参数与总体参数间地差异．个体值与样本统计量间地差异．总体参数间地差异．样本统计量与总体统计量间地差异．以上都不对、，统计上可接受（）地假设.、、、、、以上都错、统计推断地内容：.是用样本指标估计相应地总体指标.是检验统计上地“假设”、均不是、均是、以上都错、两样本均数比较，经检验，差别有显著性时，越小，说明：.两样本均数差别越大.两总体均数差别越大.越有理由认为两总体均数不同.越有理由认为两样本均数不同.样本均数与总体均数不同. 表示均数地抽样误差大小地统计指标是.标准差.方差 .均数标准误.变异系数.极差、表示均数地抽样误差大小地统计指标是：标准差方差均数标准误变异系数、全距、完全随机设计地两样本均数比较，其无效假设可以是：＝、统计推断地内容.. 是用样本指标估计相应地总体指标.是检验统计上地“假设” . 、均不是. 、均是. 以上都错文档收集自网络，仅用于个人学习、下面（）是错误地：Ａ．标准误大，说明用样本均数代表总体均数可靠性大Ｂ．标准误小，说明用样本均数代表总体均数可靠性大Ｃ．标准差大，标准误也大Ｄ．样本含量大，标准误则小Ｅ．标准误常用来估计总计均数可信区间、两样本均数比较地检验中，结果为<，有统计意义.愈小则：、说明两样本均数差别愈大、说明两总体均数差别愈大、说明样本均数与总体均数差别愈大愈有理由认为两样本均数不同、愈有理由认为两总体均数不同、下列哪项不是检验地注意事项、资料应具备可比性、下结论切忌绝对化、根据资料选择适宜地检验方法、分母不宜过小、资料应服从正态分布、＜()，统计上可认为：、两总体均数，差别无显著性、两总体均数，差别有显著性、两样本均数，差别无显著性、两样本均数，差别有显著性、以上均不是、要评价某市一名岁男孩地身高是否偏高或偏矮，应选用地统计方法是：．用该市岁男孩身高地或正常值范围来评价．作身高差别地假设检验来评价．用身高均数地或可信区间来评价．不能作评价以上都不对、来自同一总体中地两个样本中，以下哪种指标值小地其样本均数估计总体均数更可靠？文档收集自网络，仅用于个人学习、造成均数抽样误差地原因是．个体差异．群体差异．样本均数不同．总体均数不同以上都不对、同一自由度下，值增大值不变值增大值减小值与值相等值增大或减小、确定假设检验地检验水准后，同一资料.单侧检验显著，则双侧检验必然显著.双侧检验显著，则单侧检验必然显著.双侧检验不显著，则单侧检验也不显著.单、双检验结果没有联系以上都不对、两样本均数比较时，分别取以下检验水准，以所犯第二类错误最小、α 、α 、α 、α 、α文档收集自网络，仅用于个人学习。

第二章数值型变量的统计描述

1
例：某公司五名职员的薪水分别是： 10，100，1000，10000，100000。
10 100 1000 10000 100000 X 22222 5
G 10 100 1000 10000 100000 1000
5
lg 10 lg 100 lg 100000 1 15 G lg ( ) lg ( ) 1000 n 5
统计工作四大步骤之一：分析资料
分析资料：计算有关指标，反映数据的综合特征，阐明事物内在联系和规律（1）统计描述(descriptive statistics)：指用统计
指标、统计表、统计图等方法，对资料的数量特征及其分布规律进行测定和描述。
（2）统计推断(inferential statistics)：指如何根
n 2 n 1 2
2
求:中位数
第1组数：1、4、 3、 2、 3 第2组数： 3、 2、1、 3 第3组数：1、2、 1、 2
（2）频数表法：
适用于样本例数较大的资料（百分位数法）
步骤： ①从小到大计算累计频数和累计频数； ②确定中位数和百分位数所在组段；
③计算中位数M和百分位数PX
i Px＝ L n x % f L fx
考考你： BUN组段(1)
BUN组段(2)
2.00～2.40 2.40～2.80 2.80～3.20 3.20～3.60
BUN组段(3)
2.00～ 2.40～ 2.80～ 3.20～3.60
2.00～2.30
2.40～2.70 2.80～3.10 3.20～3.50
4、列表划记（数频数）：统计各组段内的
例2-3
二、几何均数（geometric mean）

数值变量的统计推断-t检验

例3 25例糖尿病患者随机分成两组，
甲组单纯用药物治疗，乙组采用药物
治疗合并饮食疗法，2个月后测空腹
血糖，如表所示，问二组患者血糖值
是否相同？
表 25 名糖尿病患者两种疗法治疗后 2 个月血糖值（mmol/L）编号 1 2 3 4 5 6 7 8 9 10 11 12 甲组血糖值（X1） 8.4 10.5 12.0 12.0 13.9 15.3 16.7 18.0 18.7 20.7 21.1 15.2 编号 1 2 3 4 5 6 7 8 9 10 11 12 13 乙组血糖值（X2） 5.4 6.4 6.4 7.5 7.6 8.1 11.6 12.0 13.4 13.5 14.8 15.6 18.7
表 5-3
编号
两种饲料喂养小白鼠 4 周后体重增重(g)情况
高蛋白组体重增加量(X1) 编号低蛋白组体重增加量(X2) 1 2 3 4 5 6 7 8 9 10 11 12 13 36 38 37 38 36 39 37 35 33 37 39 34 36
1 2 3 4 5 6 7 8 9 10 11 12
S 6.5次 / 分 , n 30
µ0=72次/分
µ=？
已知总体
n=30,
未知总体
x 74 .2 次/分 S 6.0 次/分
假设检验的基本步骤
Ⅰ 建立检验假设，确定检验水准 Ⅱ 选择统计方法，计算检验统计量 Ⅲ 确定P值，作出推断结论
Ⅰ、建立检验假设，确定检验水准
假设有两种：
（1）用H0表示：即检验假设，常称为无效假设。
样本对总体有较好代表性，对比组间有较好组间均衡性—随机抽样和随机分组；样本来自正态分布总体，配对t检验要求差值服从正态分布，实际应用时单峰对称分布也可以；大样本时，用u 检验，且

实用卫生统计学试题含答案

医学统计方法概述l ．统计中所说的总体是指： A 根据研究目的确定的同质的研究对象的全体2 •概率P=0,则表示B某事件必然不发生3．抽签的方法属于 D 单纯随机抽样4 .测量身高、体重等指标的原始资料叫：B计量资料5•某种新疗法治疗某病患者41人，治疗结果如下：该资料的类型是：D有序分类资料治疗结果治愈显效好转恶化死亡治疗人数8 23 6 3 16•样本是总体的C有代表性的部分7•将计量资料制作成频数表的过程，属于¬¬统计工作哪个基本步骤：C整理资料&统计工作的步骤正确的是C设计、收集资料、整理资料、分析资料9•良好的实验设计，能减少人力、物力，提高实验效率；还有助于消除或减少：B系统误差10•以下何者不是实验设计应遵循的原则D交叉的原则11•表示血清学滴度资料平均水平最常计算 B 几何均数12•某计量资料的分布性质未明，要计算集中趋势指标，宜选择 C M13.各观察值均加（或减）同一数后：B均数改变，标准差不变14.某厂发生食物中毒，9名患者潜伏期分别为：16、2、6、3、30、2、10、2、24+（小时）, 问该食物中毒的平均潜伏期为多少小时 C 615•比较12岁男孩和18岁男子身高变异程度大小，宜采用的指标是：D变异系数16•下列哪个公式可用于估计医学95%正常值范围 A X±1.96S17•标准差越大的意义，下列认识中错误的是B观察个体之间变异越小18.正态分布是以E均数为中心的频数分布19•确定正常人的某项指标的正常范围时，调查对象是B排除影响研究指标的疾病和因素的人20•均数与标准差之间的关系是E标准差越小，均数代表性越大21•从一个总体中抽取样本，产生抽样误差的原因是A总体中个体之间存在变异22•两样本均数比较的t检验中，结果为 P<0.05，有统计意义。

P愈小则 E愈有理由认为两总体均数不同23.由10对（20个）数据组成的资料作配对 t检验，其自由度等于 C 924• t检验结果，P>0.05,可以认为B两样本均数差别无显着性25.下列哪项不是t检验的注意事项 D分母不宜过小26.在一项抽样研究中，当样本量逐渐增大时B标准误逐渐减少27. tV t0.05（v），统计上可认为C两样本均数，差别无显着性28.两样本均数的t检验中，检验假设（H0）是 B 仁（1229.同一总体的两个样本中，以下哪种指标值小的其样本均数估计总体均数更可靠 A. Sx30.标准差与标准误的关系是：C前者大于后者31在同一正态总体中随机抽取含量为n的样本，理论上有 95%的总体均数在何者范围内 C均数加减1.96 倍的标准误32 .同一自由度下，P值增大C t值减小33.两样本作均数差别的 t检验，要求资料分布近似正态，还要求D两样本总体方差相等34.构成比的重要特点是各组成部分的百分比之和 C 一定等于135 .计算相对数的目的是 C为了便于比较36．某医院某日门诊病人数 1000 人，其中内科病人 400 人，求得 40%，这 40%是 B 构成比 37．四个样本率作比较，x2>x20.01（3），可以认为 A 各总体率不同或不全相同 38．卡方检验中自由度的计算公式是D （行数 -1）（列数 -1）39．作四格表卡方检验，当 N>40 ，且 _______________ 时，应该使用校正公式 E1<T<540 .若 X2> X2 0.05（贝V）A P<0 05 41．相对数使用时要注意以下几点，其中哪一项是不正确的 B 注意离散程度的影响42．反映某一事件发生强度的指标应选用 D 率43．反映事物内部组成部分的比重大小应选用 A 构成比44．计算标化率的目的是 D 消除资料内部构成不同的影响，使率具有可比性45.在两样本率比较的 X2检验中，无效假设（H0）的正确表达应为 C n 1= n2 46．四格表中四个格子基本数字是 D 两对实测阳性绝对数和阴性绝对数47 .比较某地1990~1997年肝炎发病率宜绘制C普通线图48．关于统计资料的列表原贝，错误的是 B 线条主要有顶线，底线及纵标目下面的横线，分析指标后有斜线和竖线49．比较甲、乙、丙三地区某年度某种疾病的发病率情况，可用 A 直条图50．描述某地某地 210 名健康成人发汞含量的分布，宜绘制 B 直方图 l 、统计中所说的总体是指： A 根据研究目的确定的同质的研究对象的全体。

数值变量资料的统计描述

538.06
fX2
(5)= (2)×(3) 2
20.10 37.07 114.70 198.98 346.74 521.67 401.03 313.27 227.53 148.21 106.92 57.67
2493.89
N＝∑f .
红细胞数
40
30
20
Frequency
10
Std. Dev = .45
可用于反映一组经对数转换后呈对称分布或正态分布的变量值在数量上的平均水平。
.
几何均数（geometric mean）
G n X1X2 Xn
lgG
1 n
(lg
X1
lg
X2
lg Xn)
lg X n
Glg1 lg X
n lg 表示以10为底的对数；
几何均数：变量对数值的算术均数的反对数。
lg1表示以10为底的反对数 X 0，为正值
（3）列出组段：第一组段的下限略小于最小值，最后一个组段上限必须包含最大值。
（4）划记计数：用划记法将所有数据归纳到各组段，得到各组段的频数。
.
138名成年女子的红细胞数(×1012/L)频数分布
组段
(1) 3.07～ 3.27～ 3.47～ 3.67～ 3.87～ 4.07～ 4.27～ 4.47～ 4.67～ 4.87～ 5.07～ 5.27～5.47
.
算术均数
算术均数：简称均数（mean）可用于反映一组呈对称分布的变量
值在数量上的平均水平或者说是集中位置的特征值。
.
1、计算方法
（1）直接计算法
公式： XX1X2 Xn X
n
n
举例：试计算4，4，4，6，6，8，8，8，10的均数？

实习指导

数值变量资料的统计推断一、目的要求1．通过习题练习掌握假设检验的基本步骤 2．掌握t 检验和u 检验的计算及应用条件 3．熟悉标准差与标准误在应用上的不同。

二、内容1．选择题（1）对于正态分布资料，可用_____估计95%的正常值范围。

A. s x 96.1± B. s x 58.2± C. x v s t x )(05.0± D. s t x v )(05.0±（2）总体均数的95%可信限可用______表示。

A ．σμ96.1± B. x σμ96.1± C. x v s t x )(05.0± D. s x 96.1±（3）在同一正态总体中以固定n 随机抽样时，理论上有99%的样本均数在____范围内。

A. s x 58.2± B. s x 96.1± C. x σμ96.1± D. σμ58.2± （4）σ表示_____。

A 总体均数标准误B 总体均数离散程度C 变量值X 的可靠程度D 样本均数标准差（5）两组数据作均数差别的t 检验时，不仅要求数据来自正态分布总体，而且要求_____。

A 两组数据均数相近，方差齐 B 两组数据方差齐C 两组数据均数相近D 两组数据的σ已知（6）进行两样本均数差别的u 检验时，要求______。

A 两样本含量要足够大B 两样本必须来自正态分布总体C 两样本所属总体的方差必须相等D 两组数据均数相近2．计算题（1）随机抽样调查上海市区男婴出生体重如下：X ：2.0~ 2.2~ 2.4~ 2.6~ 2.8~ 3.0~ 3.2~ 3.4~ 3.6~ 3.8~ 4.0~ 4.2~ 4.4~ 4.6 f ： 1 2 5 10 12 24 23 22 17 7 3 2 1 问：A.理论上99%的男婴出生体重在什么范围？B.估计全市男婴出生体重均数在什么范围？C.某男婴出生体重为4.51kg ，如何评价？D.在郊区抽查100例男婴的出生体重，其均数为3.23(kg)，标准差为0.47(kg)，问市区和郊区男婴出生体重均数是否不同？E.以往上海市区男婴平均出生体重为3kg ，现在出生的男婴是否比以往的更重些？F.若在这些男婴中随机抽样，根据正态分布原理，抽到出生体重为)(15.2kg ≤的男婴的可能性是多少？G.在这些男婴中随机抽查10人，抽到出生体重均数为)(2.3kg ≤的样本的可能性是多少？（2）将20名某病患者随机分为两组，分别用甲、乙两药治疗，测得治疗前后（治后1个月）的血沉（mm/h ）如下表，试问甲、乙两药是否均有效？甲乙两药的疗效有无差别？甲、乙两药治疗前后的血沉（mm/h ）甲药病人号1234567 8 9 10 治疗前 10 13 6 11 10 78 8 5 9 治疗后 6 9 3 10 10 42 53 3 乙药病人号1 2 3 4 5 6 7 8 9 10 治疗前9 10 9 138 6 10 11 10 10治疗后6353358274（3）某医生测得20例慢性支气管炎患者（1X ）及18例健康人（2X ）的尿17酮类固醇排出量（mg/dl ）如下，试比较两组的均数有无不同？1X ：3.14 5.83 7.35 4.62 4.05 5.08 4.98 4.22 4.35 2.35 2.89 2.165.555.94 4.40 5.35 3.80 4.12 4.10 4.202X ：4.12 7.89 3.40 6.36 3.48 6.74 4.67 7.38 4.95 4.20 5.34 4.276.54 4.62 5.92 5.18 5.30 5.40分类变量资料的统计推断一、目的要求1. 掌握率的标准误及可信区间估计方法。

医学统计知识点整理

医学统计学知识点整理第一节统计学中基本概念一、同质与变异同质：统计研究中，给观察单位规定一些相同的因素情况。

如儿童的生长发育，规定同性别、同年龄、健康的儿童即为同质的儿童。

变异：同质的基础上个体间的差异。

“同质”是相对的，是客观事物在特定条件下的相对一致性，而“变异”则是绝对的μ.δ.πX.S.p1.2.变量：确定总体之后，研究者应对每个观察单位的某项特征进行观察或测量，这种特征能表现观察单位的变异性，称为变量。

一、数值变量资料又称为计量资料、定量资料：观测每个观察单位某项指标的大小而获得的资料。

表现为数值大小，带有度、量、衡单位。

如身高（cm）、体重(kg)、血红蛋白（g）等。

二、无序分类变量资料又称为定性资料或计数资料：将观察对象按观察对象的某种类别或属性进行分组计数，分组汇总各组观察单位后得到的资料。

分类：二分类：+ -；有效，无效；多分类：ABO血型系统特点：没有度量衡单位，多为间断性资料【例题单选】某地A、B、O、AB血型人数分布的数据资料是( )A.定量资料B.计量资料C.计数资料D.等级资料分组统计描述：是利用统计指标、统计表和统计图相结合来描述样本资料的数量特征及分布规律。

统计推断：是使用样本信息来推断总体特征。

统计推断包括区间估计和假设检验。

第四节统计表与统计图★一、统计表统计表的基本结构与要求标题：高度概括表的主要内容，时间、地点、研究内容，位于表的上方，居中摆放，左侧加表的序号。

标目：横标目和纵标目。

线条：通常采用三线表和四线表的形式。

没有竖线或斜线。

数字：表内数字一律用阿拉伯数字。

同一指标，小数位数应一致，位次对齐。

无数字用“—”表示。

暂缺用“…”表示。

“0”为确切值。

备注：位于表的下面，通常是对表内数字的注解和说明，必要时可以用“*”等标出。

一张统计表的备注不宜太多。

二、制表原则1.（7理分布。

【例题填空】描述某地十年间结核病死亡率的变化趋势宜绘制_________图。

数值变量资料的统计描述(精)

（五）变异系数(Coefficient of Variation )
S CV 100% X
主要用于对均数相差较大或单位不同的几组观
察值的变异程度进行比较。
例3.3 测得某地成年人舒张压均数为 77.5mmHg,
标准差为 10.7mmHg ；收缩压均数为 122.9mmHg, 标准
差为 17.1mmHg 。试比较舒张压和收缩压的变异程度。
主要用作划分正常人与异常人的界线。 5.医学参考值范围的制定需要按照一定步骤进行。实
际中最好结合正常人和病人的数据分布特点，权衡假阳性
和假阴性的比例，选择一个适当的百分范围，最常用的百分界限是95%。 6.参考值范围估计的方法有多种，其中最基本的有百分位数法和正态分布法。正态法的优点是结果较稳定，但对资料要求严格；百分位数法适合于任何分布类型的资料，但要求大样本。
R甲 186 142 44(mmHg)
R乙 166 159 7 (mmHg)
该法简单明了、容易使用，如用于说明传染病、食
物中毒等的最短、最长潜伏期等；缺点是结果不稳
定。
（二）四分位数间距 (Quartile)
Q P75 P25
如由上一章例2.4 算出，50岁～60岁正常女性血清
参见书中计算实例……
第三节
医学参考值范围
(Reference Value Range) 一、基本概念
通常指正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。主要目的：用于临床疾病诊断。最常用的是95%参考值范围。
确定95%参考值范围示意图
二、医学参考值范围的制定方法
(一）选择一定数量的参照样本
f (X )
1 e 2

医学统计学考试习题集文档版

实习一统计学基础一、是非题1．统计学是一门研究数据的设计、收集、整理、分析和表达的科学。

( )2．概率是描述随机事件发生可能性大小的一个度量。

( )3．设计是影响研究成功与否的最关键环节。

( )4．对200例患者外周血的红细胞进行计数所得的资料为计数资料。

( )5．统计分析包括统计描述和统计推断。

( )6．计量资料、计数资料和等级资料可根据研究目的和分析的需要而相互转化。

( ) 7．欲了解中国40岁以上人口的高血压患病率，现对某地40岁以上人口进行调查，所得到的患病率是一个统计量。

( )8．统计推断的目的是由样本信息推断总体特征，因此，样本应该是有代表性的一部分。

( )二、最佳选择题1．统计学中对总体的要求是。

A．有限的 B．同质的 C．随机的 D．典型的E．大量的2．统计中所说的同质是指。

A．研究指标的可控制的主要影响因素相同 B．研究指标的不可控制的主要影响因素相同C．研究对象之间个体差异很小 D．研究对象的测量指标变异很小E．以上都不对3．从总体中随机抽取样本的目的是。

A．研究样本统计量 B．研究总体参数C．研究抽样误差D．由样本统计量推断总体参数 E．计算样本统计指标4．抽样误差是指。

A．个体指标值与参数值之差 B．个体指标值与样本统计量值之差C．样本统计量值与参数值之差 D．个体指标值与个体指标值之差E．以上都对5．欲研究某地成年男性血红蛋白的参考值范围，现随机调查了该地12000名健康成年男性的血红蛋白，那么本次调查的总体是。

A．该地所有成年男性B．该地所有成年男性的血红蛋白值C．该地所有健康成年男性的血红蛋白值 D．抽取的这12000名健康成年男性E．抽取的这12000名健康成年男性的血红蛋白值6．某医生对200名糖尿病患者采用某新疗法进行治疗，该研究的总体是。

A．全院收治的糖尿病患者 B．该医生收治的所有糖尿病患者C．接受该新疗法的所有糖尿病患者 D．所有糖尿病患者E．这200名糖尿病患者7．以下对概率描述错误的是。

数值变量资料的统计分析

数值变量资料的统计分析数值变量的统计分析是一种重要的数据分析方法，通过对数值变量的各种统计指标和分布进行分析，可以帮助我们了解和揭示数据的内在规律和特征。

数值变量的统计分析在各个领域和学科中都有着广泛的应用，如经济学、社会学、医学等。

本文将从描述统计、推断统计和回归分析三个方面介绍数值变量资料的统计分析方法。

描述统计是对数值变量资料进行整体描述的统计方法。

常用的描述统计指标包括中心趋势和离散程度两方面。

中心趋势指标包括平均数、中位数和众数。

平均数是最常用的中心趋势指标，它代表了样本数据的集中位置。

中位数是将数据按从小到大的顺序排列后，处于中间位置的数值，它对极端值不敏感，更能反映总体的典型水平。

众数是出现频率最高的数值，可以用来了解数据的分布特点。

离散程度指标包括范围、方差和标准差等。

范围是最大值和最小值的差值，表示了数据集的广度。

方差和标准差是衡量数据分散程度的指标，方差是每个数值与平均数的差的平方的平均值，标准差是方差的平方根，反映了数据的离散程度。

推断统计是利用样本数据对总体进行推断的统计方法。

常用的推断统计方法包括参数估计和假设检验。

参数估计是通过样本数据估计总体的未知参数，如均值、方差等。

常用的参数估计方法有点估计和区间估计。

点估计是通过样本数据得到总体参数的一个估计值。

常用的点估计方法有最大似然估计和矩估计。

区间估计则是对参数进行估计的同时还给出了一个可信的范围，可以用于报告不确定性。

假设检验是利用样本数据对总体参数进行假设检验的统计方法，用于判断总体参数是否符合一些假设。

假设检验包括单样本检验、双样本检验和方差分析等。

回归分析是一种用于研究变量之间关系的统计方法。

回归分析可以用于建立数值变量之间的函数关系，并用于预测和解释变量之间的关系。

常用的回归分析方法包括线性回归、多元回归和非线性回归等。

线性回归是建立线性关系模型的一种方法，通过最小二乘估计法来估计回归系数。

多元回归是在线性关系模型的基础上引入多个自变量进行分析。

数值变量资料的统计推断

估计总体均数95%置信区间。
xUsx
21.10.2020
x1.96sx,x2.58sx
h
12
区间估计（置信区间）例9-13 (P289)
• 健康男子20人, 即 n=20 ν= n-1
• 收缩压均数为: 118.4mmHg
• 标准差为:
S 10.8mmHg
• 代入公式: t , S
•
10.8 118 .4 t , 20 118 .4 t0.05,19 2.41
当样本例数较小（n<30)，样本来自呈正态分布的总体，总体标准差未知。在做两个样本均数比较时，
还要求两样本相应的总体方差相等（ 12 22 ）。
一、样本均数与总体均数的比较
样本均数与总体均数比较的目的是推断样本所代表的未知总体均数μ与已知的总体均数μ0是否有差别。
21.10.2020
h
16
例 9-15
在 0.05的水准上，接受H0, 该法测得均数与真值相同
21.10.2020
h
17
二、配对资料的比较
配对设计的均数的假设检验有三种情况： 1. 自身比较； 2. 同一样品用两种方法检验的结果； 3. 对成对设计的两个受试对象分别给予两种处
理，目的都是推断两种处理的效果有无差别。统计量的计算公式为：
第四讲
数值变量资料的统计推断
21.10.2020
h
1
统计推断Statistical inference
是用样本信息推论总体特征的过程。
(一)参数估计 (二)假设检验
21.10.2020
h
2
一、参数估计
• （一）点估计 • （二）区间估计（置信区间）
21.10.2020

实习四数值变量资料的统计推断（一）

实习四数值变量资料的统计推断（一）【目的要求】1.通过练习掌握假设检验的基本步骤。

2.掌握t 检验和u 检验的计算及应用条件。

3.熟悉标准差与标准误在应用上的不同。

【预习内容】1.预习显著性检验的概念、基本思想及基本步骤。

2.预习样本均数与总体均数、两样本均数以及配对资料的t 检验和U 检验。

3.预习标准误的计算及应用。

【实习内容】（一）选择题：1.对于正态分布资料，可用______估计95%的正常值范围。

A ．s x 961.±B ．s x 582.±C ．x s t x )(.ν050±D ．s t x )(.ν050±2.总体均数的95%可信限可用______表示。

A ．σμ961.±B ．x σμ961.±C ．x s t x )(.ν050±D ．s x 961.±3.在同一正态总体中以固定n 随机抽样时,理论上有99% 的样本均数在 _______范围内。

A ．x s x 582.±B ．x s x 961.±C ．x σμ961.±D ．x σμ582.± 4.x σ表示________。

A ．总体均数标准误B ．总体均数离散程度C ．变量值X 的可靠程度D ．样本均数标准差5.两组数据作均数差别的t 检验时，不仅要求数据来自正态分布总体，而且要求__________。

A ．两组数据均数相近，方差齐B ．两组数据方差齐C ．两组数据均数相近D ．两组数据的σ已知6.进行两样本均数差别的u 检验时，要求_______。

A ．两样本含量要足够大B ．两样本必须来自正态分布总体C ．两样本所属总体的方差必须相等D ．两组数据均数相近7.若t 不变，自由度υ增大，则______A ．p 值不变B ．p 值减小C ．p 值增大D ．给定α时，p 值减小E ．给定α时，p 值增大8.t 检验中，p ＜0.05，意义为_______。

第九章数值变量资料的统计推断

第九章数值变量资料的统计推断A1型题1 ．两样本均数比较时，需进行t 检验，若两样本含量均为n ，则由t 界值表查P值时自由度应为（）A . 2n -1B . 2n -2C . nD . 2nE . n -l2 ．两样本均数差别的假设检验得出p＜a ，说明（）A ．两样本均数相差很大B ．两样本均数的差别在医学上很有价值C ．两总体均数相差一定很大D ．两样本均数的差别有统计学意义E ．两个总体均数一定有差异3 ．在假设检验中，最有理由拒绝无效假设的概率为（）A ．P=0.06B ．P=0.3C ．P=0.05D ．P=0.5E ．P= O.0064 ．正态分布的数值变量资料，样本含量不大，总体标准差已知，若估计总体均数95% 的可信区间，最好选用（）A . （x-t0.025（v）sxx+t0.025（v）sx）B . ( x -1.96sx ，x＋1.96sx)C . ( x -1.96 σx ，x＋1.96σx)D . ( x -1.645 sx ，x＋1.645sx)E . ( x–2.58 sx ，x＋2.58sx)5 . ( )小，表示用该样本估计总体均数的可靠性大A . CVB . SC . RD ． xE . σx6 ．统计推断的内容是（）A ．计算样本率B ．检验统计上的“假设”C ．计算样本均值D ．计算标准化率E ．估计参考值范围7 ．sx表示（)A ．总体均数标准误B ．总体均数离散程度C ．变量值x 的可靠程度D ．样本均数标准差E ．变量值x 离散程度8 ．第Ⅰ类错误的概念是（)A . HO 是对的，统计检验结果未拒绝HB . H0是对的，统计检验结果拒绝H0C . H0是不对的，统计检验结果未拒绝HD . H0是不对的，统计检验结果拒绝HE ．以上都不对9 . 减小均数抽样误差的最好方法之一是（）A ．严格执行随机抽样B ．增大样本含量C ．设立对照D ．选一些处于中间状态的个体E ．减小样本含量10 ．进行两样本均数差别的u 检验时，不要求（）A ．两样本含量要足够大B ．两样本必须来自正态分布总体C ．两样本所属总体的方差必须相等D ．两组数据均数相近E ．两组数据单位相同11 ．单因素方差分析的无效假设是（）A . s12 =s22＝…＝sk2B . μ1=μ2= …=μkC . σ12 =σ22＝…＝σk2D ．x1=x2= …=xkE ．σx12 =σx22＝…＝σxk212 ．单因素方差分析中，必然有（）。

医药数理统计学：实习03 数值变量资料的统计推断

作业右上角写上“班级_学号_姓名”
请独立完成作业，抄袭复制作业者一律0分 27
于双侧尾部面积为0.05的所对应的|t|值 D. t分布的标准差大于等于1 E. 标准正态分布是 t 分布的极限分布
14
5.用大量来自同一总体的独立样本对总体参数作估计时，关于95%置信区间（CI），正确的说法是： ___
A. 大约有95%的样本的CI覆盖了总体参数 B. 各个样本估计出的CI是相同的 C. 对于每一个CI而言，有95%可能性覆盖总体参数 D. 样本含量越小，估计出来的CI越精确 E. 对于每一个CI而言，总体参数落在此区间的可能
几何均数的计算
1）应说明为何使用几何均数；
“抗体滴度资料呈对数正态分布”
2）最后要将计算结果公写共卫成生为学院1:医G学的统计形与流式行病
2015/3/20
学系
3
作业基本要求： 1. 首页右上角：班级、学号、姓名； 2. 不要将SPSS的结果直接复制粘贴，只报告必要的结果，如以表格形式报告，请整理成规范统计表； 3. 不需要报告SPSS的操作过程。
18
9.比较两药疗效时,若___时，可作单侧检验。 A. 已知A药与B药均有效 B. 不知A药好还是B药好 C. 已知A药不会优于B药 D. 已知A药与B药差不多好 E. 已知A药与B药疗效差别很大
19
10．在假设检验中，Ⅰ类错误的是指： A 拒绝实际上并不成立的H0 B 接受实际上并不成立的H0 C 拒绝实际成立的H0 D 接受实际成立的H0 E 拒绝实际上并不成立的H1
A. 182.082.623.46/11 B. 182.082.583.46/11 C. 182.082.623.46 D. 182.082.583.46 E. 182.081.963.46

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第二节 t 分布
X
～N
(
,
s
2
)
u X
s
N
(0,1)
u变换
u X
X～N (,s 2 ) sX N (0,1) X
(用s 的估计值S )
X
X
t X X
X～N
(
,
s
2 X
)
S tX变换 S / n
t
(
)
n 1
f(t)
0.4
υ=∞(标准正态分布）
υ＝5
0.3
υ＝1
0.2
0.1
以0为中心，左右对称，类似于标准正态分布
1. s已知，或s未知但n足够大:u分布法
1.1 s已知
sx
/2
1 -
/2
1
P u
2
X s
X
u
2
X
X u /2s X X u 2s X
总体均数的(1 )的可信区间为：
(X
u /2s X，X
u /2s X
)，或X
u
/
2s
。
X
1.2 s未知但n足够大
用s 的估计值S
X
X
t X X
SX S / n
样本量足够大，t分布趋向于u分布
总体均数的(1 )的可信区间为：
(X
u /2SX，X
u /2SX
)，或X
u
/
2
S
。
X
2. s未知:
1
P t
2,
X
S X
t
2,
X t 2, SX X t 2, SX
总体均数的(1 )的可信区间为：
( X t / 2, SX，X t / 2, SX ) ，或 X t / 2, SX 。
1000份样本抽样计算结果
n=5 n=10 n=30
总体均数 5.00
5.00
5.00
总体标准差s
0.50
0.50
0.50
均数的均数
4.987
均数的标准差
Sn
0.2300
5.011
0.1586
5.000
0.0920
sn
0.2236 0.1581 0.0913
1. 各样本均数未必等于总体均数； 2. 样本均数之间存在差异； 3. 样本均数的变异较之原变量的变异大大缩小；
2003年某地20岁应征男青年中随机抽取85人，平均身高为171.2cm，标准差为5.3cm，估计2003年当地20岁应征男青年身高总体均数的95％的可信区间。解：
由n 85，视为大样本数据， 171.2 1.96 5.3 ＝（170.1，172.3）(cm)
85 2003年当地20岁应征男青年身高总体均数的95％的可信区间为170.1～172.3cm。
中心极限定理：以数值
变量为例，若从正态总
体中以固定n反复多次
抽样，所得样本均数的
来自同一正态总体的样本：
分布是正态分布；即使从偏态总体中抽样，只
来X自~同N一（非，正s态2总）体的X样~本N：（要的n分，足布s够也2大近n，似)样正本态均分数布
小样本
非正态分布
大样本（n≥30） X 服从正态分布
30
0.683 0.854 1.697 2.042 …… 3.385 3.646
60
0.679 0.848 1.671 2.000 …… 3.232 3.460
100
0.677 0.845 1.660 1.984 …… 3.174 3.390
0.6745 0.8416 1.6449 1.9600 …… 3.0902 3.2905
0.001 0.0005
……
双 0.50 0.40 0.10 0.05
0.002 0.001
1
1.000 1.376 6.314 12.706 …… 318.309 636.619
2
0.816 1.061 2.920 4.303 …… 22.327 31.599
10
0.700 0.879 1.812 2.228 …… 4.144 4.587
与标准正态分布相比，曲线峰值较矮，两尾部翘得高；自由度越小，t值越分散，曲线峰值越小。
随着自由度逐渐增大，t分布逐渐逼近标准正态分布；当自由度趋于无穷，t分布即为标准正态分布。
0.0
t
-5 -4 -3 -2 -1 0 1 2 3 4 5
P 101
附表 2 t 界值表
概率 P /
自由度
单 0.25 0.20 0.05 0.025
t分布曲线下面积
规律：1. 同一下，P值越小，t值越大 2. 同一P值下，越大，t值越小
0
第三节总体均数的估计
区间估计
样本统计量 (点估计)
ˆ X
可信/置信区间 (区间估计)
置信下限
置信上限
sx
/2
1 -
/2
X
x
1-a称为置信水平或置信度，常用的有90%、 95%、99%；相应的区间可表示为90%CI、95%CI 、99%CI。
标准差 VS 标准误
内容
标准差
标准误
性质表示个体变异大小
反映样本均数的变异程度，表示抽样误差大小
控制个体变异或自然变异，不可
方法通过统计方法来控制。
增大样本含量可减少
算式
X 2 X 2 / n
S
n 1
S S/ n X
求参考值范围，计算变异系求可信区间，应用于均数的
用途数、标准误
假设检验等
第三章
数值变量资料的统计推断
教学要求
掌握标准误计算公式及意义熟悉t分布的特征掌握总体均数的估计方法掌握均数的假设检验方法
统计推断的过程
总体
抽
样
样
本
参数
统计推断
统计量
样本均数、率、标准差
思考：变量？总体？样本？
假如我们想了解我国正常成年男子的红细胞计数？
普查：对我国全部正常成年男子进行抽血，测定红细胞计
样本均数抽样误差的大小。
公式：s s
X
n
S S
X
n
当S一定时，n越大，即样本量越大，标准误越小；故：我们可以通过增加样本量来减小抽样误差。
例 2003年某地20岁应征男青年中随机抽取 85人，平均身高为171.2cm，标准差为 5.3cm，计算当地20岁应征男青年身高的标准误。
S S / n 5.3/ 85 0.57(cm) X
数。
抽样：随机抽样测定我国300名正常成年男子红细胞计数，通过分析该部分男子的红细胞计数推断全国情况。
现实生活中的抽样现象
炒菜时尝尝咸淡评价河水污染情况就医时做血常规检验
假设正常成年男子红细胞N(5.00,0.502) 的正态分布总体，从该总体中重复进行1000次抽样，样本量分别为5，10，30。计算其均数和标准差。
，左右基本对称，服从正态分布。
第一节均数的抽样误差
由于抽样造成的样本均数与总体均数之间、样本均数与样本均数之间的差异。
这种差异可用样本均数 X1、X2、X3……的变异，即样本均数的标准差来表示，又称标准误。
标准误反映样本均数之间的离散程度，也反映

数值变量资料的统计推断

《中医统计学》习题及答案

数值变量资料的统计分析.

统计描述与统计推断

数值变量资料的统计推断

第二章数值型变量的统计描述

数值变量的统计推断-t检验

实用卫生统计学试题含答案

数值变量资料的统计描述

实习指导

医学统计知识点整理

数值变量资料的统计描述(精)

医学统计学考试习题集文档版

数值变量资料的统计分析

数值变量资料的统计推断

实习四数值变量资料的统计推断（一）

第九章 数值变量资料的统计推断

医药数理统计学：实习03 数值变量资料的统计推断

第九章数值变量资料的统计推断