区间检验 统计学

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

§9.3 数值变量资料的统计推断

《卫生学(7)》医学统计与流行病学系 骆福添

一、均数的抽样误差与标准误

【例】我们将某地14岁健康女生身高资料作为总体。

μ=155.40cm , σ=5.30cm

• 样本1:120例,均数154.82 • 样本2:120例,均数155.41

• 样本均数与总体均数(或样本均数之间)的差异称为均数的抽样误差(sampling error of mean )

• 由于生物间的个体差异是客观存在的,因此抽样误差在抽样研究中是不可避免的,但有一定的规律可循

♦ 从此总体随机抽取n =10的100个样本,可计算100个样本的均数,得频数分布如下:

组段 151~ 152~ 153~ 154~ 155~ 156~ 157~ 158~ 159~ 频数

1

6

10

18

29

20

8

6

2

• 看出样本均数的分布近似服从正态分布 样本均数的均数为52.155=X ,64.1=X S

♦ 统计学中把样本均数的标准差称为均数的标准误,简称为标准误(standard error ,SE )

① 从正态总体中随机抽取例数为n 的样本,样本均数X 也服从正态分布;即使从偏态总体抽样,当n 足够大时(如n >30),

X 也近似服从正态分布

② 从均数μ,标准差σ的正态或偏态总体抽取例数为n 的样本,样本均数的总体均数为μ,标准差为x σ

(9-18)

1.68x σ=

• 与从100个样本均数计算出的样本均数的标准差(即标准误)1.64cm 相近

• σ未知,样本标准差S 作为σ的估计值

(9-19)

Luo :x σ称为理论标准误,x S 称为样本标准误 ■ 均数标准误的用途:

① 衡量样本均数的可靠性。均数标准误越小,说明样本均数与总体均数的差异程度越小,越可靠

② 估计总体均数的置信区间(见本节中的三) ③ 用于均数的假设检验(见本章第四节)。

二、t 分布

u 叫作标准正态变量,u 服从标准正态分布,简写为 N (0, 1)

♦ 用x S 来估计x σ,对X 采用的不是u 变换而是t 变换

(9-20)

标准t 变量不服从u 分布,而是t 分布(t -distribution )

♦ t 分布主要用于总体均数的区间估计及t 检验等。

表9-9 t 界值表

自由度 概率P ν 双侧: 0.10 0.05 0.02 0.01 单侧: 0.05 0.025 0.01 0.005 1

6.314

12.706

31.821

63.657

-4 -3 -2 -1 0 1 2 3 4 图9-7 不同自由度下t 分布图

-3 -2 -1 0 1 2 3 图B 标准正态分布图

2 2.920 4.30

3 6.965 9.925

3 2.353 3.182 4.541 5.841

4 2.132 2.776 3.747 4.604

5 2.015 2.571 3.365 4.032

6 1.943 2.44

7 3.143 3.707

7 1.895 2.365 2.998 3.499

8 1.860 2.306 2.896 3.355

9 1.833 2.262 2.821 3.250

10 1.812 2.228 2.764 3.169

11 1.796 2.201 2.718 3.106

12 1.782 2.179 2.681 3.055

13 1.771 2.160 2.650 3.012

14 1.761 2.145 2.624 2.977

15 1.753 2.131 2.602 2.947

16 1.746 2.120 2.583 2.921

17 1.740 2.110 2.567 2.898

18 1.734 2.101 2.552 2.878

19 1.729 2.093 2.539 2.861

20 1.725 2.086 2.528 2.845

21 1.721 2.080 2.518 2.831

22 1.717 2.074 2.508 2.819

23 1.714 2.069 2.500 2.807

24 1.711 2.064 2.492 2.797

25 1.708 2.060 2.485 2.787

26 1.706 2.056 2.479 2.779

27 1.703 2.052 2.473 2.771

28 1.701 2.048 2.467 2.763

29 1.699 2.462 2.756

30 1.697 2.457 2.750

40 1.685 2.423 2.704

50 1.676 2.403 2.678

60 1.671 2.390 2.660

…………

500 1.648 1.965 2.586 …

∞ 1.645 1.960 2.576 …

三、总体均数的置信区间估计

♦反映总体特征的统计指标称为参数(parameter)

♦反映样本特征的统计指标称为统计量(statistic)

1.点(值)估计(point estimation)

例如样本均数X、样本标准差S是总体均数μ、总体标准差σ的点估计,即

2.区间估计(interval estimation)

•根据一定的置信度进行估计得到的区间,称为置信区间或可信区间(confidence interval ,CI)

•可信度(confidence level)要预先确定,可用1-α表示,常用的可信度为95%

(1)σ已知时,按正态分布原理

(9-21)

相关文档
最新文档