医学统计学课件:单个样本数据的参数估计

合集下载

医学统计学课件:参数估计

医学统计学课件:参数估计

区间估计
定义
区间估计是在给定样本数据的情况下,以一定的概率保证未知参数落在某个区间 内。这个概率通常被称为置信度或置信水平。
方法
枢轴法、百分位数法和方差法等。枢轴法是利用样本分布的枢轴量来计算区间估 计,百分位数法是通过计算样本数据的百分位数来估计参数的区间,方差法则是 利用样本方差和样本均值之间的关系来计算区间估计。
非参数统计与参数统计的比较
非参数统计对于数据的分布假设更加稳健,对于 不同的数据分布形式适应性更强。
参数统计需要对总体分布的具体形式进行假设, 因此对于数据真实分布的偏离会相应增大。
在实际应用中,非参数统计方法常常可以提供更 加准确的推断结果。
非参数统计的应用范围
非参数统计在医学研究中被广泛应用 于生存分析、预后分析和相关数据的 统计分析。
03
贝叶斯参数估计
贝叶斯估计的概念
1
贝叶斯估计是一种利用数据信息对未知参数进 行推断的方法,基于概率统计理论。
2
它利用已知参数的先验分布和样本信息,推导 出后验分布,进而对未知参数进行估计。
3
贝叶斯估计广泛应用于医学、经济学、生物学 等领域。
贝叶斯估计的原理
基于贝叶斯定理,将样本信息与先验分布结合,推导出后验分布。 通过分析后验分布,对未知参数进行估计,得出贝叶斯估计值。
详细描述
在医学研究中,通过对总体数据的分布特 征进行分析,可以了解总体的集中趋势和 离散程度。同时,通过对总体数据中是否 存在影响因素进行分析,可以了解影响总 体参数的各种因素。此外,还可以研究总 体数据是否符合某种特定的分布模型。
医学图像数据的分析
总结词
医学图像数据分析是医学统计学中参数估计的新兴应 用领域,通过对医学图像数据进行分析,可以提取更 多有关患者病情和治疗效果的信息。

医学统计学教学课件》第四章参数估计基础(研究生)

医学统计学教学课件》第四章参数估计基础(研究生)
提供一些课后习题供学生巩固知识。
介绍线性回归模型在最小二乘法估计中的使 用。
2 最小二乘估计
掌握最小二乘法估计法及其优势和不足。
置信区间
1 置信区间的概念和意义
了解置信区间的定义和在参数估计中的重要性。
2 构造置信区间
学习如何构造合适的置信区间。
3 置信区间的意义及应用
了解置信区间在统计决策中的作用。
样本量计算
1 样本容量的确定方法
点估计和区间估计
1 点估计
掌握点估计的概念、方法和性质。
2 区间估计
了解区间估计的定义、方法和性质。
极大似然估计
1 似然函数
理解似然函数在极大似然 估计中的作用。
2 极大似然估计
掌握使用极大似然估计法 进行参数估计的步骤和原 理。
3 举例
通过实际案例,了解极大 似然估计的应用。
最小二乘法估计
1 线性回归模型
医学统计学教学课件第四 章
本章将介绍医学统计学中的参数估计基础,包括参数估计的概念、点估计和 区间估计、极大似然估计、最小二乘法估计、置信区间和样本量计算。
参数估计的概念
1 什么是参数
了解医学统计学中的参数 及其定义。

了解参数估计中的误差来 源与影响因素。
掌握确定样本容量的常用方法。
3 相关性样本量计算
学习相关性研究中的样本量计算方法。
2 跨组设计的样本量计算
了解跨组设计中的样本量计算方法。
4 非劣效性试验的样本量计算
掌握非劣效性试验中的样本量计算方法。
总结
1 本章重点知识点回顾
总结本章重点内容和要点。
3 参考文献
列出本章学习所需的参考文献。
2 课后作业

医学统计学 第五讲 参数估计基础 公开课课件

医学统计学  第五讲  参数估计基础 公开课课件

标准差 2.74 6.57 5.36 4.81 5.41 4.50 4.04 5.71 8.26 5.24
…… 4.15
95%CL 165.45 169.37 160.86 170.26 164.37 172.03 163.24 170.11 161.02 168.76 163.14 169.58 163.27 169.05 165.02 173.19 161.27 173.08 162.38 169.87 …… …… 167.42 173.35
正态分布的特征
➢=Me=M0;偏度系数=0;峰度系数=3
温医大公卫学院预防医学系/附属眼视光医院临床研究中心
正态分布
➢当正态分布的参数=0,=1时,称为标准正态分布
z x
温医大公卫学院预防医学系/附属眼视光医院临床研究中心
样本均数的抽样分布与抽样误差
温医大公卫学院预防医学系/附属眼视光医院临床研究中心
表3-1 N(167.7, 5.32)总体中100个随机样本的均数、标准差和95%CI
ID 1 2 3 4 5 6 7 8 9 10 …… 50
均数 167.41 165.56 168.20 166.67 164.89 166.36 166.16 169.11 167.17 166.13 …… 170.39
概率与概率分布
➢概率(Probability)
随机事件发生的可能性,是对某一随机事件发生可能性的度量。取 值范围在[0,1]之间。 如果某一事件不可能发生,其概率为0,称为不可能事件;如果某 一事件肯定发生,其概率为1,称为肯定事件。 概率的基本性质
1≥P(A)≥0;P(Ω)=1;若AB=Ф,则P(A∪B)=P(A)+P(B)。 推论1:不可能事件的概率为0,即:P(Ф)=0。 推论2:P( A )=1-P(A), 表示A的对立事件,即它们二者必有一事件发 生但又不能同时发生。

医学统计学课件:单个样本数据的参数估计

医学统计学课件:单个样本数据的参数估计

某研究者欲研究经常在街头小餐点就餐的中 学生是否乙肝病毒的感染率高,在某地随机 抽取了200名中学生,询问是否经常在小餐 点就餐,并检查了乙肝病毒感染情况,结果 发现经常在小餐点就餐者89人,乙肝感染率 6.74%,不经常者111人,感染率4.60%,试 计算两类中学生乙肝感染率的标准误及总体 乙肝感染率可能所在的范围(95%)。
——均数的抽样误差和标准误
﹡表示方法:标准误(Standard error) 标准误为样本均数的标准差,是说
明样本均数抽样误差的大小的指标,反 映了样本均数与总体均数的差异。
﹡计算公式
x
n
SS
x
n
总体标准误
样本标准误,
为σχ的估计值
• 某市随机抽取了12岁男孩100人,测得平
均身高139.6cm,标准差为6.85cm,计算
—— 总体率的区间估计
正态近似法:
当总体率未知时,若 np 5和 n (1-p) 5,则 总体率(1- )可信区间为:
p USp = P - USp ~ P + USp
即:总体率95%可信区间为 P 1.96Sp 总体率99%可信区间为 P 2.58Sp
查表法:n≤50时, p ≥1%(见书)
X
X
n
s sX n
: x t / 2sX
p x n
(1 )p ຫໍສະໝຸດ np(1 p)sp
n
: p u / 2s p
特征:以0为中心,左右对称(与标准正态分布比较)
t-分布曲线的形状与自由度有关 t-分布曲线下面积为1 t-分布曲线下面积分布可由t值表中查出
f(t) = (χ-μ) / σχ -
= ∞(u-d) = 5 =1

医学统计学-参数估计

医学统计学-参数估计
将某地所有儿童的血钙值看成总体分布,从该总体中随 机抽取的120名健康儿童血钙值则组成了样本分布。
反复从该总体中随机抽取n=120的若干样本,用样本均
数作为观察值,称该120个样本指标值的频数分布为抽 样分布(sampling distribution)。
t分布、F分布、χ2分布等均为常见的抽样分布。
每次摸到红球的比例分别为12.5%,20.0%,35.5%,… 等,将其频率分布列于表4-2。
表4-2 总体概率为30%时的随机抽样结果(n=40)
红球比例(%)
样本频数
频率(%
10.0~
1
1
15.0~
2
2
20.0~
15
15
25.0~
23
23
30.0~
31
31
35.0~
20
20
40.0~
5
5
45.0~50.0
应总体概率间的差异,因而说明了率的抽样误差
大小。

p
1
n
s

p
p 1 p n=
pq n
四、二项分布和泊松分布的应用
(一)二项分布 1.二项分布的成立条件 2.二项分布的特征 3.二项分布的应用
(二)泊松分布 1.泊松分布的概率密度函数 2.泊松分布的特征 3.泊松分布的应用
(一) 二项分布(贝努利分布) (Bernoulli distribution)
0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 X
图D n=30,π=0.3
二项分布总体不同样本例数时的抽样分布
2.二项分布的特征
⑵二项分布的均数和标准差

医学统计课件人卫6版 第六章.参数估计与假设检验

医学统计课件人卫6版 第六章.参数估计与假设检验
变换,则将正态分布N(μ,σ2)变换 为标准正态分布N(0,1)。
• 已知样本均数也服从正态分布,那么对 样本均数采用Z变换,即可将其变换为标 准正态分布,即Z分布。
01.11.2021
西安医学院公共卫生系
但实际工作中 需 用x 来估s计x ,这样,
对正态变量采用的就不是Z变换而是t变
换了,即t =( -μ)/x
造成两者数值不同的原因可能有两个: 1)抽样误差所致; 2)由于环境条件的影响,两均数之间有本质差异。
01.11.2021
西安医学院公共卫生系
先假定该山区所有男子脉搏数数值组成一个总体,
其总体均数和标准差均为未知数,分别以 、 表示。
若假设该山区男子的脉搏数与一般地区的男子相
同,即属于同一总体, =72,所测量的30名男子的
值在±1.96之间,即:
P(-1.96<Z<+1.96)=0.95
P(-1.96< (x<)+/1.9x6)=0.95
移项后整理得,总体均数μ的95%可信区间为
x 1 .96 x,x 1 .96 x
01.11.2021
西安医学院公共卫生系
2.σ未知,但n足够大(如n>100)时,可知t分布 逼近Z分布,此时t曲线下有95%的t值在±1.96之间
• 附表2,t界值表
01.11.2021
西安医学院公共卫生系
3.σ未知且n小时,某自由度的t曲线下有95%的t值
在± t0.05之/ 2,间,即:
P ( t0 .0/2 5 , t t0 .0/2 5 ,) 0 .95
P ( t0 .0/2 5 , (x)/sx t0 .0/2 5 ,) 0 .95
上述假设。则认为两均数之间存在本质差异。

统计学-单个样本数据的参数估计

统计学-单个样本数据的参数估计

作出决策
将计算得到的检验统计量的值与 拒绝域进行比较,作出是否拒绝 原假设的决策。
结果解释与讨论
结果解释
对点估计、区间估计和假设检验的结果进行解释,说明各项结果 的含义和实际意义。
结果比较与讨论
将不同方法得到的结果进行比较和讨论,分析各种方法的优缺点和 适用范围,以及可能存在的误差和影响因素。
实例意义与启示
实例选择
01
选择某一具体领域的实例,如医学、经济学或社会学等,确保
实例具有代表性和实际意义。
背景介绍
02
简要介绍实例的研究背景、目的和意义,以及相关的统计学概
念和理论。
数据收集
03
说明数据的来源、收集方法和处理过程,包括ຫໍສະໝຸດ 据的类型、样本量、抽样方法等。
点估计和区间估计计算过程展示
选择合适的估计量
根据实例特点和研究目的,选择 合适的估计量,如均值、比例、 方差等。
3
最小二乘法估计的优缺点
优点是计算简便,易于理解和实现;缺点是对于 非线性模型,最小二乘法可能导致有偏估计。
点估计评价标准
无偏性
指估计量在多次重复抽样下的平均值等于被估计参数的真值。无偏性保证了估计量的长期平均性 能。
有效性
指对于同一总体参数的两个无偏点估计量,有更小方差的估计量更有效。有效性反映了估计量的 精度。
假设检验与参数估计关系
01
假设检验用于判断总体参数是否等于某个特定值或属于某个特定区间,而参数 估计则是给出总体参数的一个数值范围或点估计值。
02
假设检验与参数估计都是基于样本数据对总体进行推断的方法,但假设检验更 注重于对总体参数的假设进行判断,而参数估计则更注重于给出总体参数的一 个具体数值范围或点估计值。

医学统计学课件:参数估计

医学统计学课件:参数估计

医学统计学课件:参数估计xx年xx月xx日contents •参数估计概述•参数估计方法•参数估计在医学中的应用•参数估计的优缺点•参数估计的相关计算•医学统计学的未来发展目录01参数估计概述定义与意义参数估计利用样本信息对总体参数进行推断和估计。

意义通过参数估计,利用样本信息对总体特征进行推断、解释和预测,为研究设计和医学实践提供重要依据。

参数估计与点估计的关系参数估计包括点估计和区间估计。

点估计:用样本统计量估计总体参数的方法,是参数估计的基础。

区间估计:在点估计的基础上,给出总体参数的估计区间,是参数估计的拓展。

确定研究问题和研究假设。

设计研究方案和收集数据。

对样本数据进行分析,得到样本统计量和样本信息。

根据样本统计量和样本信息,构造合适的统计量(点估计)或区间估计量(区间估计)。

对所构造的统计量或区间估计量进行假设检验,判断其是否具有统计意义和实际意义。

根据参数估计的结果,进行推断分析和决策。

参数估计的基本步骤02参数估计方法1点估计23点估计是一种对总体参数的数值近似,通常用一个单一的数值来表示。

定义常见的点估计方法包括最大似然估计和矩估计。

方法点估计的优点是简单、直观,但可能存在精度不足的问题。

特点03特点区间估计的优点是能够给出总体参数的精度范围,但可能存在精度不足的问题。

区间估计01定义区间估计是一种对总体参数的区间范围的估计,通常用一个置信区间来表示。

02方法基于样本统计量和样本容量的信息,利用置信区间的计算公式来得到总体参数的置信区间。

定义贝叶斯估计是一种基于贝叶斯定理的参数估计方法,通常将总体参数看作是一个随机变量。

方法首先需要建立一个关于总体参数的先验分布,然后结合样本信息进行后验分布的计算,最后利用后验分布进行参数的估计。

特点贝叶斯估计的优点是能够充分利用先验知识和样本信息,从而得到更加精确的参数估计结果。

但是,贝叶斯估计方法需要更多的主观判断和计算成本。

贝叶斯估计03参数估计在医学中的应用样本均数和标准差估计通过分析临床试验数据,可以估计治疗组和对照组的均数和标准差,从而了解治疗效果和病情变化情况。

医学统计学ppt课件第4章参数估计pptx

医学统计学ppt课件第4章参数估计pptx

二项分布参数估计
样本比例
用于估计二项分布中的成功概率。
置信区间
构建关于成功概率的置信区间,以评估估计的准确性。
假设检验
基于二项分布的参数估计结果进行假设检验,以验证 研究假设。
泊松分布参数估计
样本均值
用于估计泊松分布中的平均发生率。
置信区间
构建关于平均发生率的置信区间,以评估估计 的准确性。
假设检验
医学统计学ppt课件第4章参 数估计pptx
contents
目录
• 参数估计基本概念 • 参数估计方法 • 参数估计应用举例 • 区间估计原理及方法 • 非参数Bootstrap方法简介 • 参数估计软件实现及结果解读
01
参数估计基本概念
参数与统计量
参数
描述总体特征的数,如总体均数、总 体率等。
SAS
功能强大的统计分析软件,支持多种复杂统计模型的参数估计。操作指南涉及程序编写、数据导入、模型运行、结果查看 等环节。
R语言 开源的统计计算和图形展示软件,具有强大的数据处理和参数估计能力。操作指南涵盖数据导入、数据 处理、模型拟合、结果可视化等方面。
结果解读与注意事项
结果解读
关注参数估计值、标准误、置信区间、假设检验等关键结果,理解各指标的含义和统计意义。
单个正态总体均值和方差区间估计
单个正态总体均值区间估计
未知方差时,使用t分布进行区间 估计。
使用卡方分布进行区间估计;
已知方差时,使用z分布进行区间 估计;
单个正态总体方差区间估计
需要考虑样本量对区间估计的影 响。
两个正态总体均值差和方差比区间估计
01
两个正态总体均值差区间估计
02
两总体方差已知且相等时,使用z分布进行区间估计;

《卫生统计学》PPT课件:05 参数估计基础

《卫生统计学》PPT课件:05  参数估计基础

(二)、总体概率的置信区间
总体概率的置信区间与样本含量n,阳性频率p的
大小有关,可根据n和p的大小选择以下两种方法。
1. 正态近似法
当样本含量足够大,且p和1-p不太小,则样本率
的分布近似正态分布。
公式为:
P
Z
2S P
,P
Z
2S P
P为样本率, 为率的标准误的估计值,
例5-7 用某种仪器检查已确诊的乳腺癌患者 94例,检出率为78.3%。估计该仪器乳腺癌总体检 出率的95%置信区间。 分析:本例样本例数较大,且样本率p不太小,可 用正态近似法:
通式:
tа/2,ν 是按自由度ν=n-1,由附表2查得的t值。
例5-3 已知某地27例健康成年男性血红蛋白量的均数

,标准差S=15g/L ,试问该地健康成年男
性血红蛋白量的95%和99%置信区间。
本例n=27,S=15
95%CI:
99%CI:
置信区间的两个要素
1. 准确度:反映置信度1-α的大小,即区间包
152.6~
1
153.2~
4
153.8~
4
154.4~
22
155.0~
25
155.6~
21
156.2~
17
156.8 ~
3
157.4 ~
2
158.0 ~
1
合计
100
152.9 153.5 154.1 154.7 155.3 155.9 156.5 157.1 157.7 158.3
(标准误的理论值)
个样本,样本均数 服从正态分布;即使是从偏态 总体中随机抽样,当n足够大时(如n>50), 也近 似正态分布。

医学统计学:5 参数估计

医学统计学:5 参数估计

2.920 4.303 6.965 9.925 14.089 22.327 31.599
2.353 3.182 4.541 5.841 7.453 10.215 12.924
2.132 2.776 3.747 4.604 5.598 7.173 8.610
2.015 2.571 3.365 4.032 4.773 5.893 6.869
合并方差与均数之差的标准误
• 合并方差(方差的加权平均)
sC2
(n1
1)s12 (n2 1)s22 n1 n2 2
• 均数之差的标准误
s X1 X2
sC2
(
1 n1
1 n2
)
与均数之差有关的抽样分布
“均数之差”与“均数之差的标准误”之比,
服从自由度 = n1+n2 -2的 t 分布。
附表2 t 界值表
概 率,P
-t
0
t
0.05 0.025 0.01 0.005 0.0025 0.001 0.0005
0.10 0.05 0.02 0.01 0.005 0.002 0.001
6.314 12.706 31.821 63.657 127.321 318.309636.619
2
0.816 1.061 1.886 2.920 4.303 6.965 9.925 14.089 22.327 31.599
例4.2
• n=120>100,标准正态分布代替t分布,u0.10=1.645
X
u0.10
s X
123.62 1.645 4.75 /
120 122.91(cm)
X
u0.10
s X
123.62 1.645 4.75 /

卫生统计学课件第五章 参数估计基础

卫生统计学课件第五章 参数估计基础

第二节 t 分布 (t-distribution)
一、t 分布的概念 1908年英国统计学家W.S.Gosset 以笔名“student ”发表了著名的t分布
设: X ~ N 0 , 1 , Y ~ 2 n , 且X与Y相互独立,称随机变量
t
X
Y /
n
服从自由度为n
的学生氏分布(student
t
表5-1 从N(155.4 , 5.32) 抽到的100份随机样本的计算结果(n=30)
样本号 1 2 3 4 … 52 53 … 57 … 59 … 96 99
100
均数 156.7 158.1 155.6 155.2
… 153.7 154.8
… 158.2
… 153.4
… 152.7 154.6 156.6
黑球比例% 5.0~ 8.0~ 11.0 ~ 14.0~ 17.0~ 20.0~ 22.0~ 25.0~ 28.0~ 31.0~ 34.0~ 40.0~ 合计
频数 3 7 5 8 16 22 15 7 7 5 3 2
100
% 3.0 7.0 5.0 8.0 16.0 22.0 15.0 7.0 7.0 5.0 3.0 2.0 100.0
标准误 0.91 0.95 1.16 1.03 … 0.80 0.89 … 0.97 … 0.91 … 0.75 0.71 1.16
95%置信区间
154.8
158.6
156.2
160.1*
153.3
158.0
153.1
157.3


152.1
155.4*
153.0
156.6


156.2

第五章 单个样本数据的参数估计

第五章 单个样本数据的参数估计

第五章 单个样本数据的参数估计一、均数(率)的抽样误差在同一总体中随机抽取样本含量相同的若干样本时,样本指标之间的差异以及样本指标与总体指标的差异,称为抽样误差。

统计学上,由于抽样而产生的同一总体中均数之间的差异称为均数的抽样误差,率之间的差异称为率的抽样误差。

在抽样研究中,抽样误差是不可避免的,只要存在抽样,就有抽样误差;因为抽样误差产生的根本原因是客观存在的个体变异。

(一)样本均数标准误从正态总体N (μ, σ2)中,随机抽取样本含量为n 的若干样本,各样本均数X 的分布服从正态分布N (μ,2X σ),各样本均数X 的总体均数为μ ,标准差为X σ。

X σ可按下列公式计算X σ=X σ为样本均数的标准差,又称为标准误,它反映了样本均数之间的离散程度,也反映了均数抽样误差的大小。

在实际应用中,总体标准差σ 常常未知,需要用样本标准差s 来估计。

因此均数标准误的估计值为X s =由公式,当样本含量n 固定时,均数的标准误与标准差成正比;当标准差固定时,均数的标准误与样本含量n 的平方根成反比,即在同一总体中随机抽样,样本含量n 越大,抽样误差越小。

所以在实际工作中减小均数抽样误差的一个重要途径是增加样本含量n 。

(二)率标准误从一个阳性率为 π 的总体中,随机抽取样本含量为n 的若干个样本,得到各样本率之间的差异以及样本率与总体率的差异,用率的标准差,又称率的标准误来描述。

样本率p 的标准差,它反映了样本率之间的离散程度;也反映了率抽样误差的大小。

在实际应用中,总体率π 常常未知,需要用样本率p 作为总体率 π 的估计值 。

二、t 分布的特征t 分布是一簇曲线,因为t 值的分布与自由度ν 有关。

其图形有如下特征:以0为中心,左右对称的单峰分布。

自由度ν = n -1越小,则t 值越分散,曲线变得越低平,尾部翘得越高。

③随着自由度ν 逐渐增大时,t 分布逐渐逼近标准正态分布;当ν 趋于∞ 时,t 分布就完全成为标准正态分布。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

标准误。
S
S
x
n
S =6.85 n=100
S χ =0.685(cm)
(二) 计数资料----率的的抽样误差
——率的抽样误差和标准误
﹡概念:
由抽样造成的样本率与总体率 的差别称为率的抽样误差(p - ; p为样品率, 为总体率)。
*率的标准误:表示率的抽样误差大 小的统计指标。
计算公式:
P
(1 )
总体均数区间估计的方法:
1) 当n足X够的大平(均如数1—χ0接0)近时标, 准正 态分布
总体均数95%可信区间:
X U
总体均数99%可信区间:
S
X
X
1.96S x
X
U SX
X
2.58S x
• 例:某地抽得正常成人200名,测得血清 胆固醇的均数为3.64mmol/ L,标准差 为1.20mmol/L,试估计该地正常成年 人血清胆固醇均数的95%可信区间。
统计推断
﹡用样本信息推断总体特征,称统计推 断(statistical inference)
﹡统计推断包括总体参数估计和假设检 验
﹡总体指标和样本的统计指标是有误差 的,称为抽样误差
一、抽样误差和标准误
(一) 计量资料----均数的的抽样误差
——均数的抽样误差和标准误
﹡概念:
由于抽样造成的样本均数与总体均 数的差异(x-μ)。 抽样误差是不可避免的, 但可以控制。
n
SP
P(1 P) n
(P为 的估计值; Sp 为p的估计值。)
二、 t-分布(t-distribution)
﹡概念
从正态总体N(μ,σ)中进行无数次样
本含量为n的随机抽样,每次均可得
到一个χ和一个s,通过
t X
S/ n

式转换,可得无数个t值,t值的分布即
为含量为n的t值的总体或称t-分布。
X
X
n
s sX n
: x t / 2sX
p x n
(1 )
p
n
p(1 p)
sp
n
: p u / 2s p
——均数的抽样误差和标准误
﹡表示方法:标准误(Standard error) 标准误为样本均数的标准差,是说
明样本均数抽样误差的大小的指标,反 映了样本均数与总体均数的差异。
﹡计算公式
x
n
SS
x
n
总体标准误
样本标准误,
为σχ的估计值
• 某市随机抽取了12岁男孩100人,测得平
均身高139.6cm,标准差为6.85cm,计算
特征:以0为中心,左右对称(与标准正态分布比较)
t-分布曲线的形状与自由度有关 t-分布曲线下面积为1 t-分布曲线下面积分布可由t值表中查出
f(t) = (χ-μ) / σχ -
= ∞(u-d) = 5 =1
-4 -3 -2 -1 0 +1 +2 +3 +4
自由度分别为1、5、∞估计的方法:
2) 当样本含量n较小时, X的平均数—χ 接近t-分布
总体均数的可信区间: X t,SX
• 例:某医师测得40名老年性慢性支气管炎 病人尿中17-酮类固醇排出量均数为 15.19μmol/d,标准差为5.03 μmol/d, 试估计该种病人尿17-酮类固醇排出量总 体均数95%可信区间。(t 0.05,39=2.023)
某研究者欲研究经常在街头小餐点就餐的中 学生是否乙肝病毒的感染率高,在某地随机 抽取了200名中学生,询问是否经常在小餐 点就餐,并检查了乙肝病毒感染情况,结果 发现经常在小餐点就餐者89人,乙肝感染率 6.74%,不经常者111人,感染率4.60%,试 计算两类中学生乙肝感染率的标准误及总体 乙肝感染率可能所在的范围(95%)。
—— 总体率的区间估计
正态近似法:
当总体率未知时,若 np 5和 n (1-p) 5,则 总体率(1- )可信区间为:
p USp = P - USp ~ P + USp
即:总体率95%可信区间为 P 1.96Sp 总体率99%可信区间为 P 2.58Sp
查表法:n≤50时, p ≥1%(见书)
概念:用样本指标(称为统计量) 估计总体指标(称为参数) 参数估计包括点估计和区间估计
—— 总体均数的估计 ﹡点估计(point estimation)
用样本均数作为总体均数的估计值
﹡区间估计(interval estimation)
按一定的概率(可信度,1 -α)估计总 体均数所在范围,亦称总体均数的可信区间
相关文档
最新文档