第六章 抽样与抽样分布

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

卡方分布性质: ⅰ 卡方分布的值始终为正。
ⅱ 卡方分布的形状取决于n的大小,通常为 不对称的右偏分布,随着自由度的增大趋 向对称。 ⅲ 卡方对应的面积值是指从某一卡方(2) 到正无穷所对应的面积。
(3)卡方分布函数及反函数 ⅰ卡方分布函数【CHIDIST】 它的格式为CHIDIST(2,df), 2是 值,df是指自由度。
n
1
n
2
π1-π2
三、两样本方差比的抽样分布
(一)两样本方差比的抽样分布定义:从两个正态 总体中分别独立地抽取容量为n1和n2的样本,在 重复抽取容量为n1和n2的样本时,有两个样本比 的所有可能取值形成的相对频数分布,称为两样 本方差比的抽样分布,或称为F分布。
s s
2
1 2 2
F ( n1 - 1,n2 - 1), 其含义是 由度分 中较大
两方差比的分布服从自 位于分子的方差是二者 的方差。
别为 n1 - 1和n2 - 1的F分布,其中
(二)F分布图
(三)F函数及反函数 1、【 FDIST 】函数 其格式为 FDIST(x,df1,df2),其中 x是随机变量F的取值,df1,df2分别为分子 和分母的自由度。 2、 【FINV】函数 其格式为FINV(a,df1,df2),其中 a是欲查的某一特定值F右侧但尾概率,df1, df2分别为分子和分母的自由度。
二、三种不同性质的分布 (一)总体分布:总体中各元素的观测值所 形成的相对频数分布,称为总体分布。 (population distribution)。 (二)样本分布:从总体中抽取容量为n的样 本,有这n个观测值形成的相对频数分布, 称为样本分布(sample distribution)。 (三)某个样本统计量的抽样分布:从理论 上说就是在重复选取容量为n的样本时,由 该统计量的所有可能值形成的相对频数分 布。
(4)样本均值的抽样分布特征 设总体共有N个元素,其均值为μ,方差为 从中抽取容量为n的样本,样本均值的数学期望 (样本均值的均值)为 μ,样本均值的方差为总 体方差的1/n。 样本均值的均值 =μ
2
n
样本的方差值 = n
2
或 s(在总体标准差未知时,以样本方差代替总体方差) n
2
1.0 1.5 ... 3.5 4.5 40 样本均值的均值 2.5 16 16 样本均值的方差
可分为样本均数的抽样分布;样本率的抽样 分布;样本标准差的抽样分布。 1、样本均数的抽样分布 定义:在重复选取容量为n的样本时,由样本 均值的所有可能取值形成的相对频数分布, 称为样本均数的抽样分布。 (1)x-bar抽样分布的形成过程 例6.1.1:设一个总体有4个元素,即总体元 素的个数N=4,4个元素的取值分别为:x1=1, x2=2,x3=3,x4=4。
第二节 两个总体参数推断时样本统 计量的抽样分布

在实际问题中,有时研究的是两个总体,即总体1 和总体2,所关心的总体参数主要是两个总体均数 之差μ1—μ2,两个总体比例之差π1—π2,两个总 体的方差比 。相应地,用于推断这些参数的 统计量分别是两个样本均值之差 ,两个样 本比例之差p1—p2,两个样本方差之比 。因此, 此时需要分别研究两个总体参数推断时样本统计 量的抽样分布。包括两个样本均值之差的抽样分 布、比例之差的抽样分布、方差比的抽样分布。


2
_
x1 x 2 n1 n2 是两样本均数之差的为


2 1


2 2
,其含义
两样本抽样方差之和。
12
n

2 2Βιβλιοθήκη Baidu
1
n
2
12
n

2 2
1
n
2
μ1-μ2
二、两样本比例之差的抽样分布
(一)两样本比例之差的抽样分布定义:从 两个服从二项分布的总体中,分别独立地 抽取n1和n2的样本,在重复选取容量为n1和 n2的样本时,由两个样本比例之差的所有 可能取值形成的相对频数分布,称为两样 本比例之差的抽样分布。 注:所谓二项分布是指在总体中只存在两种 随机变量的分布。如要么是正品,要么是 次品;要么是正面,要么是反面;要么是 进球,要么是不进球,等等。
1、重复抽样 重复抽样:从总体中抽取一个元素后,把这 个元素放回到总体中,再抽取第二个元素,直 至抽取n个元素为止,这样的抽样方法称为重 复抽样(sampling with replacement)。
2、不重复抽样 不重复抽样:一个元素被抽中后不再放回总体, 然后再从所剩的元素中抽取第二个元素,直至 抽取n个元素为止,这样的抽样方法称为不重 复抽样(sampling without replacement)。
p的抽样分布均值 π π( 1 -π ) p( 1 - p) p的抽样方差值 或 n n (总体率未知时以样本率代替总体率)
3、样本方差的抽样分布
要用样本方差s 去估计总体方差 也必须知
2 2
道样本方差的抽样分布。
(1)定义:在重复选取容量为n的样本时,由样本 方差的所有可能取值形成的相对频数分布,称为 样本方差的抽样分布。
第六章 抽样与抽样分布
第一节 抽样与抽样分布的相关知识 一、简单随机抽样样本 (一)简单随机抽样样本定义 定义6.1.1:从含有N个元素中,抽取n个 元 素作为样本,使得总体中的每一个容量为n 的样本都有相同的机会被抽中这样抽出来 的样本称为简单随机抽样样本。 (二)简单随机抽样样本类型 它有两种类型:重复抽样与不重复抽样
样本方差的抽样分布 7 6 5
概率密度
4 3 2 1 0 0.00 0.50 样本方差 2.00 4.50
(2)样本抽样分布的性质(卡方分布)

2
(n 1) s
2

2

i 1
( xi x) 2
n


2
, 服从自由度
为n - 1的卡方分布。
当n=20时,卡方分布分布基本成对称分布
从总体中采取重复抽样方法抽取容量为n=2 的随机样本,写出样本均值x-bar的抽样分布。 第六章 抽样与抽样分布.ppt (2)抽样均值抽样分布的形成过程可以概括 如下:
总体N
容量为n的 所有样本
X-bar的抽样分布
计算出每一 个样本的均值 µ
(3)X-bar抽样分布形式
x-bar的抽样分布与原总体的分布和样本容量 有关。 结论: ⅰ 如果原有总体是正态分布,则无论样本容 量的大小,样本均值的抽样分布都服从正态 分布。 ⅱ 如果原有总体分布是非正态分布,则要看 样本的大小,随着样本容量的增大(n≥30) 不论原有总体是否是正态分布,样本均值的 抽样分布都趋于正态分布,该正态分布的均 值为µ,标准差为
(二)两个样本比例之差的抽样分布特征
E( p
1
p )
2 1
2
, 其含义 差。
是两样本比例之差抽布 的平均值等于两抽样之

2 p1-p2

1
( 1 - 1) 2 ( 1 - 2)
n
1
n
2
其含义是两样本比例抽 分布的方差 .


2 p1-p2
1
( 1 - 1) 2 ( 1 - 2)
一、两样本均值之差的抽样分布 (一)两样本均值之差的抽样分布定义:从两个总 体中分别独立地抽取容量为n1和n2的样本,在重 复选取n1和n2的样本时,由两个样本均数之差的 所有可能取值形成的相对频数分布,称为两样本 均值之差的抽样分布。
E ( ) 1 2,其含义 x1 x 2 是两样本均数之差的平均 数等于两总体均数之差。
(1)定义:样本比例的抽样分布是指在重复选取容 量为n的样本时,由样本比例的所有可能取值形成 的相对频数分布,称为样本比例的抽样分布。 (2)结论 ⅰ结论:当样本容量很大时,样本比例p的抽样分布 可用正态分布近似。 ⅱ 结论:对于一个具体的样本比例p,若np≥5和n (1-p)≥5,就可以认为样本容量足够大。
(x )
i 1
16

16
10 1.25 0.625 16 2 n
2
2、样本比例的抽样分布 比例问题适用于研究分类变量。就一个具有 N个元素的总体而言,具有某种属性的元素 个数为N0,具有另一种属性的元素个数为 N1,将具有某种属性的元素个数与总体全 部元素个数之比称为总体比例,用π表示, 则有π=N0/N,而具有另一种属性的元素 个数与总体全部单位数之比为 N1/N=1-π。相应地,样本比例用p表示, 同样有p=n0/n,n1/n=1-p。
2
n
ⅲ 如果总体不是正态分布,当n为小样本时 (n≤30),样本均值的分布不是正太分布, 这时就不能按正态分布来推断总体均值。 样本均值的抽样分布与总体分布的关系可 用下图来描述。
样本分布与总体分布关系图
总体分布
正态分布
非正态分布
大样本
小样本
大样本
小样本
样本均值分布 为正态分布
样本均值分布 样本均值分布 为正态分布 为非正态分布
指卡方
ⅱ 卡方分布的反函数【CHIINV】 它的格式为CHIDIINV(a,df),a是 指从某一卡方值到正无穷大的概率, df是指自由 度。
样本统计量的抽样分布
样本统计量
样本均值
样本比例
样本方差
正态总体或 非正态总体 大样本
非正态总体 (小样本)
大样本
正态分布
非正态分布
正态分布
卡方(2) 分布
相关文档
最新文档