06第六章商抽样与抽样分布-64页PPT资料
合集下载
第6章抽样与抽样分布
随机变量的分布的可加性 设相互独立的随机变量X ,Y均
服从某种分布,若它们的和X Y也 服从同一种分布(参数有所不同),我们 就称该分布具有可加性.
1.设X ,Y独立,且X ~ B(m, p),Y ~ B(n, p),
则X Y ~ B(m n, p)
2.设X ,Y独立,且X ~ P(1),Y ~ P(2 ),
定义2 从总体中抽出的一部分个体叫样本(子 样).样本中所含个体的数目叫做样本容量.样本所 取的值叫做样本值.
由于抽样具有随机性,所以样本是一组随机变量 (或随机向量).
一个容量为n的样本记为
X1, X2,, Xn
样本值记为
(x1,x2, xn)
抽样方法满足的条件:
(1) 随机性
(2) 独立性
(2)显然P( X x2 ) 0.01
由对称性得 : P( X x2 ) 0.005
查表得: x2 t0.005 (10) 3.1693
t分布的性质
(1)其密度函数f(x)为偶函数; (2)当n较大时,其分布很接近正态分布.
(3)t1 (n) t (n) 在n 45时,t (n) u
常用统计量 样本均值
样本方差
X
1 n
n i 1
Xi
S 2
1 n 1
n i 1
(Xi
X
)2
样本标准差
S
1 n 1
n i 1
(Xi
X
)2
样本k阶原点矩 样本k阶中心矩 样本离差平方和
Ak
1 n
n i 1
X
k i
Bk
1 n
n
(Xi
i 1
X )k
n
(Xi X )2
服从某种分布,若它们的和X Y也 服从同一种分布(参数有所不同),我们 就称该分布具有可加性.
1.设X ,Y独立,且X ~ B(m, p),Y ~ B(n, p),
则X Y ~ B(m n, p)
2.设X ,Y独立,且X ~ P(1),Y ~ P(2 ),
定义2 从总体中抽出的一部分个体叫样本(子 样).样本中所含个体的数目叫做样本容量.样本所 取的值叫做样本值.
由于抽样具有随机性,所以样本是一组随机变量 (或随机向量).
一个容量为n的样本记为
X1, X2,, Xn
样本值记为
(x1,x2, xn)
抽样方法满足的条件:
(1) 随机性
(2) 独立性
(2)显然P( X x2 ) 0.01
由对称性得 : P( X x2 ) 0.005
查表得: x2 t0.005 (10) 3.1693
t分布的性质
(1)其密度函数f(x)为偶函数; (2)当n较大时,其分布很接近正态分布.
(3)t1 (n) t (n) 在n 45时,t (n) u
常用统计量 样本均值
样本方差
X
1 n
n i 1
Xi
S 2
1 n 1
n i 1
(Xi
X
)2
样本标准差
S
1 n 1
n i 1
(Xi
X
)2
样本k阶原点矩 样本k阶中心矩 样本离差平方和
Ak
1 n
n i 1
X
k i
Bk
1 n
n
(Xi
i 1
X )k
n
(Xi X )2
《抽样和抽样分布》课件
《抽样和抽样分布》ppt课件
$number {01}
目录
• 抽样调查的基本概念 • 抽样分布的基础知识 • 抽样分布的原理 • 抽样误差的评估 • 实际应用中的抽样技术 • 案例分析
01
抽样调查的基本概念
抽样的定义和意义
定义
抽样是从总体中选取一部分个体 进行研究的方法。
意义
通过对部分个体的研究,推断出 总体的特征,以节省时间和资源 。
适用场景
当总体中存在周期性变化 或某种明显的模式时,系 统抽样能够提高样本的代 表性。
注意事项
要确保抽样的间隔与总体 中的变化模式相匹配,以 避免偏差。
分层抽样
分层抽样
注意事项
将总体分成若干层,然后从每层中随 机抽取一定数量的样本。
要确保分层依据合理,且层内样本的 抽取方法一致,以避免层间和层内的 偏差。
抽样误差的衡量指标
抽样平均误差
抽样平均误差是衡量抽样误差大小的指标,它反映了样本统 计量与总体参数之间的平均偏差。
抽样变异系数
抽样变异系数是衡量非系统抽样误差的指标,它反映了由于 随机性引起的样本统计量与总体参数之间的偏差程度。
05
实际应用中的抽样技术系统ຫໍສະໝຸດ 样010203
系统抽样
按照某种规则,每隔一定 数量的个体进行抽样,直 到达到所需的样本量。
步骤 1. 明确研究目的和要求。 2. 确定总体和样本规模。
抽样的原则和步骤
01 02 03
3. 选择合适的抽样方法。 4. 制定详细的抽样计划。
5. 实施抽样调查。
02
抽样分布的基础知识
总体和样本
1 2
3
总体
研究对象的全体集合。
样本
$number {01}
目录
• 抽样调查的基本概念 • 抽样分布的基础知识 • 抽样分布的原理 • 抽样误差的评估 • 实际应用中的抽样技术 • 案例分析
01
抽样调查的基本概念
抽样的定义和意义
定义
抽样是从总体中选取一部分个体 进行研究的方法。
意义
通过对部分个体的研究,推断出 总体的特征,以节省时间和资源 。
适用场景
当总体中存在周期性变化 或某种明显的模式时,系 统抽样能够提高样本的代 表性。
注意事项
要确保抽样的间隔与总体 中的变化模式相匹配,以 避免偏差。
分层抽样
分层抽样
注意事项
将总体分成若干层,然后从每层中随 机抽取一定数量的样本。
要确保分层依据合理,且层内样本的 抽取方法一致,以避免层间和层内的 偏差。
抽样误差的衡量指标
抽样平均误差
抽样平均误差是衡量抽样误差大小的指标,它反映了样本统 计量与总体参数之间的平均偏差。
抽样变异系数
抽样变异系数是衡量非系统抽样误差的指标,它反映了由于 随机性引起的样本统计量与总体参数之间的偏差程度。
05
实际应用中的抽样技术系统ຫໍສະໝຸດ 样010203
系统抽样
按照某种规则,每隔一定 数量的个体进行抽样,直 到达到所需的样本量。
步骤 1. 明确研究目的和要求。 2. 确定总体和样本规模。
抽样的原则和步骤
01 02 03
3. 选择合适的抽样方法。 4. 制定详细的抽样计划。
5. 实施抽样调查。
02
抽样分布的基础知识
总体和样本
1 2
3
总体
研究对象的全体集合。
样本
06第六章商抽样与抽样分布PPT精品文档64页
25.12.2019
统计学院
10
第六章 抽样和抽样分布
随机数字表
9745238942 3489962435 1287087765 7077434431 9424252386
1276465909 9866332890 2136217721 1422890012 4879903443
9874763642 8036522364 9878764346 0874321123 2177609554
本例中存栏肉猪10000头组成的总体,则称为全及总体,它 是指在统计抽样中所要了解的研究对象整体,又称为母体 ,当我确定了研究目标时,它具有惟一性。一般全及总体 的单位总数用N表示,称作总体容量。
25.12.2019
统计学院
4
第六章 抽样和抽样分布
STAT
[例] 某养猪场共有存栏肉猪10000头,现欲了解这批肉猪平均每
现实世界包含的素材集合非常庞大,从中提取需要的信息 非常困难。如: •选民人数:每个候选人的支持率是多少? •产品:不合格率是多少? •环境:污染程度如何? •市场:品种、价格、质量状况、购买力等情况的了解。
在这一章里,你将会了解到样本是怎样抽取的,样本统计 量是怎样分布的,如何根据样本统计量对总体参数做估计。
25.12.2019
统计学院
5
第六章 抽样和抽样分布
一、统计抽样的几个基本概念 1、全及总体和样本总体
全及总体:研究对象全体,又称母体。容量用N表 示。具备惟一性。
样本总体:按随机原则从总体中抽出的部分单位的 全体,简称样本,被抽出的每个单位称样本单位。容 量用n表示。样本不具惟一性。
25.12.2019
不放回抽样,抽样安排---对被抽到的单位登记后不再放回总体的 抽样方法。不放回抽样与放回抽样比较,每次抽样的条件是不同 的,前一次的抽取结果会对后一次的抽取产生影响,统计中称这 样的抽样为相互不独立的试验。
《抽样与抽样分布》PPT课件
通常对某个论题有强烈感觉的人,尤其是负面感觉, 比较会不嫌麻烦地去回应。
写信回应和电话回应,一定会导致高度偏差。
随机原则的实现
抽签法,是将总体中每个单位的编号写在外形 完全一致的签上,将其搅拌均匀,从中任意抽 选,签上的号码所对应的单位就是样本单位。
随机数表法:将总体中每个单位编上号码,然 后使用随机数表,查出所要抽取的调查单位。
案例
1936年美国总统选举的预测,民主党罗斯福VS 共和党兰登。《文摘》邮寄了1000万份调查表; 收回240万份,预测兰登获得57%的选票获胜。 而盖洛普(Gallup)研究所仅仅随机抽取了2000 多选民,预测罗斯福将得到54%的选票获胜。
选举结果是罗斯福获得62%的选票获胜。 此后,盖洛普研究所每年用1000~1500人的样
4 统计抽样与抽样分布
抽样的基本概念 抽样方法与误差 抽样分布的概念 样本均值的抽样分布 样本比率的抽识到通过样本推断 总体的科学性。
当总体元素非常多,或者检查具有破坏性时, 需要进行抽样。
抽样必定伴有某种程度的不确定性,需要用 概率来表示其可靠程度,这是推断统计的重 要特点。
两种有偏的抽样方法
方便抽样,在总体中选择最容易取得的个体。例如, 从每箱桔子中拿上面的几个检查,但它们可能无法 代表整箱桔子的情况。
自发性回应样本:是经由对某一诉求的回应而自然 形成的,会导致高度偏差。
两种有偏的抽样方法
自发性回应样本:例如,专栏作家Landers问读者: “如果可以重来一次,你还会要孩子吗?”她接到 1万份答复,其中70%说不要。难道70%的父母 都后悔了吗?
随机样本
与总体分布 特征相同
与总体分布 特征不同
总体
非随机样本
并非所有的抽样估计都按随机原则抽取样本, 也有非随机抽样。
写信回应和电话回应,一定会导致高度偏差。
随机原则的实现
抽签法,是将总体中每个单位的编号写在外形 完全一致的签上,将其搅拌均匀,从中任意抽 选,签上的号码所对应的单位就是样本单位。
随机数表法:将总体中每个单位编上号码,然 后使用随机数表,查出所要抽取的调查单位。
案例
1936年美国总统选举的预测,民主党罗斯福VS 共和党兰登。《文摘》邮寄了1000万份调查表; 收回240万份,预测兰登获得57%的选票获胜。 而盖洛普(Gallup)研究所仅仅随机抽取了2000 多选民,预测罗斯福将得到54%的选票获胜。
选举结果是罗斯福获得62%的选票获胜。 此后,盖洛普研究所每年用1000~1500人的样
4 统计抽样与抽样分布
抽样的基本概念 抽样方法与误差 抽样分布的概念 样本均值的抽样分布 样本比率的抽识到通过样本推断 总体的科学性。
当总体元素非常多,或者检查具有破坏性时, 需要进行抽样。
抽样必定伴有某种程度的不确定性,需要用 概率来表示其可靠程度,这是推断统计的重 要特点。
两种有偏的抽样方法
方便抽样,在总体中选择最容易取得的个体。例如, 从每箱桔子中拿上面的几个检查,但它们可能无法 代表整箱桔子的情况。
自发性回应样本:是经由对某一诉求的回应而自然 形成的,会导致高度偏差。
两种有偏的抽样方法
自发性回应样本:例如,专栏作家Landers问读者: “如果可以重来一次,你还会要孩子吗?”她接到 1万份答复,其中70%说不要。难道70%的父母 都后悔了吗?
随机样本
与总体分布 特征相同
与总体分布 特征不同
总体
非随机样本
并非所有的抽样估计都按随机原则抽取样本, 也有非随机抽样。
抽样和抽样分布
PPT文档演模板
抽样和抽样分布
等距抽样的优点:(1)能保证被抽取到
的样本单位在全及总体中均匀分布;(2) 简化抽样过程。
等距抽样应注意:要避免抽样间隔或样
本距离和现象本身的节奏性或循环周期 相重合。
PPT文档演模板
抽样和抽样分布
三、类型抽样
类型抽样:将全及总体中的所有单位按某
一主要标志分组,然后在各组中采用纯 随机抽样或等距抽样方式,抽取一定数 目的调查单位构成所需的样本。
PPT文档演模板
抽样和抽样分布
二、等距抽样:先将总体各单位按某一
有关标志(或无关标志)排队,然后相 等距离或相等间隔抽取样本单位。根据 需要抽取的样本单位数(n)和全及总体 单位数(N),可以计算出抽取各个样本 单位之间的距离和间隔,即:K=N/n, 然后按此间隔依次抽取必要的样本单位。
PPT文档演模板
适用范围:主要适用于总体情况比较复杂,
各类型或层次之间的差异较大,而总体 单位又较多的情形,分层使层内各单位 之间的差异减小,层间差异扩大。
PPT文档演模板
抽样和抽样分布
(一)类型比例抽样
按照总体单位数在各组之间的比例,分 配各组的抽样单位数。即:各类型中抽 取的样本单位数ni占该类型所有单位数Ni 的比例是相等的,等同于样本单位总数n 占总体单位数N的比例,即:
PPT文档演模板
抽样和抽样分布
n 抽样指标:由样本总体各单位标志值计 算出来反映样本特征,用来估计全及指 标的综合指标称为统计量(抽样指标)。 统计量是样本变量的函数,用来估计总 体参数,因此与总体参数相对应,统计 量有样本平均数(或抽样成数)、样本 标准差(或样本方差 )。
PPT文档演模板
抽样和抽样分布
概率论与数理统计基本概念及抽样分布PPT课件
~
2 (n1 ),
2 2
~
2 (n2 ), 且它们相互独立,
则
2 1
2 2
~
2 (n1
n2 )
《概率统计》
返回
下页
结束
4. 2分布的百分位点
对给定的α(0<α<1)
(1)称满足
P{ 2
2
(n)}
,即
f ( y)dy
x2 ( n)
的点为 2分布的上100α百分位点。
f(y)
(2)称满足
注:在研究中,往往关心每个个体的一个(或几个)数量指标和 该数量指标在总体中的分布情况. 这时,每个个体具有的数量 指标的全体就是总体.
或,总体:研究对象的某项数量指标的值的全体.
《概率统计》
某批 灯泡的 寿命
该批灯泡寿命的 全体就是总体
返回
下页
结束
为推断总体分布及各种特征,按一定规则从总体中抽取若 干个体进行观察试验,以获得有关总体的信息,这一抽取过程 为 “抽样”.
( x)
(1)称满足条件 P{X>Xα} =α,
α
即
( x)dx
X
的点Xα为N(0,1)分布的上100α百分位点.
X1-α
0
由于 P{X X } 1 记 -Xα= X1-α
(2)称满足条件 P {| X | X }
2
2
的点 X 为N(0,1)分布的双侧100α百分位点.
X
2
则
E(X )
E(1 n
n i 1
Xi)
1 n
n i 1
E(Xi )
1 n
n
D(X ) D(1 n
n i1
Xi)
抽样和抽样分布培训课件(PPT 49张)
0.07 0.5279 0.5675 0.6064 0.6443 0.6808 0.7157 0.7486 0.7794 0.8078 0.8340 0.8577 0.8790 0.8980 0.9147 0.9292 0.9418 0.9525 0.9616 0.9693 0.9756 0.9808 0.9850 0.9884 0.9911 0.9932 0.9949 0.9962 0.9972 0.9979 0.9985 0.9989
7
自有限总体的抽样
• 无放回抽样:一个元素一旦选入样本,就从总体中剔除, 不能再次被选入。 • 放回抽样:一个元素一旦选入样本,仍被放回总体中。
先前被选入的元素可能再次被选,并且在样本中可出现
多次(多于一次)。
8
自无限总体的抽样
• 无限总体经常被定义为一个持续进行的过程,总体的元 素由在相同条件下过程无限运行下去产生的每一项构成。 在这种情况下,对总体内所有项排列是不可能的。
14
点估计
样本均值 51814.00美元 样本标准差
3347.72美元
样本比率 0.63
点估计的 统计过程
15
由30名管理人员组成的简单随机样本的点估计值
16
由30名管理人员组成的500个简单随机样本的点估计值
17
由30名管理人员组成的500个简单随机样本的抽样分布
• 抽样分布:样本统计量所有可能值构成的概率分布。
0.04 0.5160 0.5557 0.5948 0.6331 0.6700 0.7054 0.7389 0.7704 0.7995 0.8264 0.8508 0.8729 0.8925 0.9099 0.9251 0.9382 0.9495 0.9591 0.9671 0.9738 0.9793 0.9838 0.9875 0.9904 0.9927 0.9945 0.9959 0.9969 0.9977 0.9984 0.9988
管理统计学课件_第06章
管理统计学
Beijing institute of technology
北京理工大学
两个样本均值差的抽样分布
例 某手机厂商对甲、乙两省份居民进行抽样调查后发现, 甲省消费者中有约18%的人使用过该品牌手机,而乙省 消费者中使用过该品牌手机的人数比例为14%。假设以 上调查结果是真实的,现在从甲省抽取1500人,乙省抽 取2000人组成两个独立随机样本,请分析甲省用过该品 牌手机的人数比例低于乙省用过该品牌手机人数比例的 可能性有多大?
Beijing institute of technology
北京理工大学
Management statistics
管理统计学
两个样本方差比的抽样分布
1 两个总体都为正态分布,即X1~N(μ1,σ12)的一个样本,Y1,
Y2,… ,Yn2是来自正态总体X2~N(μ2,σ22 )
2 从两个总体中分别抽取容量为n1和n2的独立样本 3
X ~ N ( ,
2
n
)
Beijing institute of technology
北京理工大学
Management statistics
管理统计学
示例
某高校在研究生入学体检后对所有结果进行统计分析,得 出其中某一项指标的均值是7,标准差2.2。从这个总体中 随机选取一个容量为31的样本。 (1)计算样本均值大于7.5的概率, (2)计算样本均值小于7.2的概率, (3)计算样本均值在7.2和7.5之间的概率。
2
2
~ ( n 1)
2
的抽样分布为自由度为 n 1 的卡方分布。即:
2
n
( n 1) S
2
2
Beijing institute of technology
北京理工大学
两个样本均值差的抽样分布
例 某手机厂商对甲、乙两省份居民进行抽样调查后发现, 甲省消费者中有约18%的人使用过该品牌手机,而乙省 消费者中使用过该品牌手机的人数比例为14%。假设以 上调查结果是真实的,现在从甲省抽取1500人,乙省抽 取2000人组成两个独立随机样本,请分析甲省用过该品 牌手机的人数比例低于乙省用过该品牌手机人数比例的 可能性有多大?
Beijing institute of technology
北京理工大学
Management statistics
管理统计学
两个样本方差比的抽样分布
1 两个总体都为正态分布,即X1~N(μ1,σ12)的一个样本,Y1,
Y2,… ,Yn2是来自正态总体X2~N(μ2,σ22 )
2 从两个总体中分别抽取容量为n1和n2的独立样本 3
X ~ N ( ,
2
n
)
Beijing institute of technology
北京理工大学
Management statistics
管理统计学
示例
某高校在研究生入学体检后对所有结果进行统计分析,得 出其中某一项指标的均值是7,标准差2.2。从这个总体中 随机选取一个容量为31的样本。 (1)计算样本均值大于7.5的概率, (2)计算样本均值小于7.2的概率, (3)计算样本均值在7.2和7.5之间的概率。
2
2
~ ( n 1)
2
的抽样分布为自由度为 n 1 的卡方分布。即:
2
n
( n 1) S
2
2
抽样与抽样分布PPT-PPT精品文档
特点:
(1)遵循随机原则; (2)推断被调查对象的总体特征; (3)计算推断的准确性与可靠性。 江西财经大学统计学院
1
统计学
所谓抽样
第三章
抽样和抽样分布
抽签 编号 摇号 随机数字表
75 18 26 53 86
90 85 89 64 97
96 18 48 81 06
91 63 57 95 12
江西财经大学统计学院
7
统计学
第三章
抽样和抽样分布
[例]10人年龄资料如下。N=10 n=3。 人: A B C D E F G H I J 年龄: 5 8 12 40 42 46 48 70 72 76 分类: N1=3 N2=4 N3=3 N=10 1=2.87 2=3.16 3=2.49 =8.52 n1=? n2=? n3=? n=3 1、等额分配:n1= n2= n3= 1 2、等比例分配:n1/N1= n2/N2= … = n/N ∵ n/N =0.3 ∴n1/N1=0.3 n1=0.3×N1=0.3 ×3= 0.9 3、最优分配: i/ =ni/Ni ∵ 1/ =2.87/8.52=0.34 ∴ n1/N1=0.34 n1=0.34×3 =1.02 江西财经大学统计学院 8 二、抽样误差的计算
Z x
2
t 概率度 抽样平均误差 x n
s替代 不知 ˆ替代 p P不知
江西财经大学统计学院
3
x x x tx x x x tx
统计学
第三章
抽样和抽样分布
[例]某公司出口一种名茶,规定每包规格重量不低于150g,现用
x x P { x } 1 F ( t ) x x x x P { x x } 1 F ( t ) x x x x
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
头毛重(设为 ),如果将每头肉猪过称去称而获取数据将是不
合算的。我们可以按照“等机会原则” 从中抽出100头称其重量,
计算出这100头猪的平均毛重(假定平均每头95.5kg),以达到我们
期望的目的。
本例中所抽出的100头肉猪组成的总体,则称为样本总体,它是 指在统计抽样中按照“等机会原则” 从全及总体的N(10000)中 抽出的部分单位(每个单位称作样本单位)所组成的整体,简称样 本,又称子样。一般样本总体的单位总数用n(100)表示,称作样 本容量。样本总体则不具惟一性,它的可能个数与N、n及抽样 方法有关。通常n<30称为小样本,n>30称为大样本,在抽样调 查中取大或小样本会直接影响到抽样分布的特征。
2659305984 7065436387 4890832769 0437575967 2148797544
1676587006 1327690879 2164896589 2132577995 7537697997
不放回抽样,抽样安排---对被抽到的单位登记后不再放回总体的 抽样方法。不放回抽样与放回抽样比较,每次抽样的条件是不同 的,前一次的抽取结果会对后一次的抽取产生影响,统计中称这 样的抽样为相互不独立的试验。
注意:二种方法都遵循了“等机会原则”
24.05.2020
统计学院
7
第六章 抽样和抽样分布
二、简单随机抽样
本例中存栏肉猪10000头组成的总体,则称为全及总体, 它是指在统计抽样中所要了解的研究对象整体,又称为母 体,当我确定了研究目标时,它具有惟一性。一般全及总 体的单位总数用N表示,称作总体容量。
24.05.2020
统计学院
3
第六章 抽样和抽样分布
STAT
[例] 某养猪场共有存栏肉猪10000头,现欲了解这批肉猪平均每
24.05.2020
统计学院
2
第六章 抽样和抽样分布
STAT
第一节 抽样及抽样组织形式 [例] 某养猪场共有存栏肉猪10000头,现欲了解这批肉猪平 均每头毛重,如果将每头肉猪都过称去称而获取数据将是 不合算的。我们可以按照“等机会原则” 从中抽出100头 肉猪称其重量,计算这100头猪的平均每头毛重,以达到我 们期望的目的。
第六章 抽样和抽样分布
统计实例(Statistics in Practice)
我国某家用电器公司是国内空调最大的生产厂家之一,2019 年时其空调年销售就已达到700万台,销售额为120亿元。这家低 调、在外界看来有些神秘的家电企业,尽管不作声张,极少炒作 ,甚至喊出“不想做行业老大”的话,之后3年来却成长势头迅 猛,增长率一直40%以上,赢利率极高。这背后的原因在于美的 较早就开始了提升企业竞争能力。为了避免当今家用电器行业低 价利薄的局面,实现多条腿走路,以在新一轮竞争中保持优势, 该电器集团决策人又提出了进军汽车行业的战略目标。为此他要 求公司营销部对国际国内各大汽车生产厂家生产能力、销售额、 营利能力、市场占有率等方面作调查分析。
24.05.2020
统计学院
4
第六章 抽样和抽样分布
一、统计抽样的几个基本概念 1、全及总体和样本总体
全及总体:研究对象全体,又称母体。容量用N表 示。具备惟一性。
样本总体:按随机原则从总体中抽出的部分单位的 全体,简称样本,被抽出的每个单位称样本单位。容 量用n表示。样本不具惟一性。
24.05.2020
现实世界包含的素材集合非常庞大,从中提取需要的信息 非常困难。如: •选民人数:每个候选人的支持率是多少? •产品:不合格率是多少? •环境:污染程度如何? •市场:品种、价格、质量状况、购买力等情况的了解。
在这一章里,你将会了解到样本是怎样抽取的,样本统计 量是怎样分布的,如何根据样本统计量对总体参数做估计。
24.05.2020
统计学院
9
第六章 抽样和抽样分布
随机数字表
9745238942 3489962435 1287087765 7077434431 9424252386
1276465909 9866332890 2136217721 142284763642 8036522364 9878764346 0874321123 2177609554
作为公司营销部负责人来说,他必须思考怎样去采集汽车生
产厂家的这些经济机密数据?获得这些数据后,应采用什么方法 作数据分析与推断。这必然会用到统计推断的知识。
24.05.2020
统计学院
1
第六章 抽样和抽样分布
从这一章开始便进入推断统计学的学习内容,它会节省人们 的时间和财物来达到认识对象的最佳限度。
统计学院
5
第六章 抽样和抽样分布
STAT
2、总体参数和样本统计量
根据全及总体各单位变量值计算的反映全及总体某数量 特征的综合指标,由于全及总体唯一确定,故称总体参
数。如上例中的
根据样本总体各单位变量值计算的反映样本总体某数量 特征的综合指标,由于样本总体不具惟一性,故称为样 本统计量,它是一个随机变量。
简单随机抽样也称为纯随机抽样。它是对总体单位 不做任何分类或排队,直接从总体中按“随机原则”抽 取样本单位的调查方式。
其样本抽取过程按总体为有限和无限的不同加以区别
1、有限总体抽样
从容量为N的有限总体中进行抽样,如果容量为n的每个 可能样本被抽到的可能性相等,则称被抽的样本为简单 随机样本。
24.05.2020
如上例中的100头肉猪的平均每头毛重(95.5kg)
24.05.2020
统计学院
6
第六章 抽样和抽样分布
3、放回抽样与不放回抽样 从全及总体中抽取样本有两种方法——放回抽样和不放回 抽样。
放回抽样,抽样安排---对每次被抽到的单位经登记后再放回总体 ,重新参与下一次抽选的抽样方法。在每次的抽取中样本单位被 抽中的概率都等于统计中称这样的抽样为相互独立的试验。
统计学院
8
第六章 抽样和抽样分布
为了便于抽取样本单位,一般在明确抽样框的条件下, 对总体的每个单位都要编号,然后用抽签式或利用《随 机数字表》进行抽取。
例如:N=500 n=10 编码从1-500号
在随机数表中随意点二个数字,得到54-50=4行,34列。 则选取的号码从这个被选中的数开始,由于500是个三 位数,则小于500的连续三位数即为中选号码。见表中 所示。
合算的。我们可以按照“等机会原则” 从中抽出100头称其重量,
计算出这100头猪的平均毛重(假定平均每头95.5kg),以达到我们
期望的目的。
本例中所抽出的100头肉猪组成的总体,则称为样本总体,它是 指在统计抽样中按照“等机会原则” 从全及总体的N(10000)中 抽出的部分单位(每个单位称作样本单位)所组成的整体,简称样 本,又称子样。一般样本总体的单位总数用n(100)表示,称作样 本容量。样本总体则不具惟一性,它的可能个数与N、n及抽样 方法有关。通常n<30称为小样本,n>30称为大样本,在抽样调 查中取大或小样本会直接影响到抽样分布的特征。
2659305984 7065436387 4890832769 0437575967 2148797544
1676587006 1327690879 2164896589 2132577995 7537697997
不放回抽样,抽样安排---对被抽到的单位登记后不再放回总体的 抽样方法。不放回抽样与放回抽样比较,每次抽样的条件是不同 的,前一次的抽取结果会对后一次的抽取产生影响,统计中称这 样的抽样为相互不独立的试验。
注意:二种方法都遵循了“等机会原则”
24.05.2020
统计学院
7
第六章 抽样和抽样分布
二、简单随机抽样
本例中存栏肉猪10000头组成的总体,则称为全及总体, 它是指在统计抽样中所要了解的研究对象整体,又称为母 体,当我确定了研究目标时,它具有惟一性。一般全及总 体的单位总数用N表示,称作总体容量。
24.05.2020
统计学院
3
第六章 抽样和抽样分布
STAT
[例] 某养猪场共有存栏肉猪10000头,现欲了解这批肉猪平均每
24.05.2020
统计学院
2
第六章 抽样和抽样分布
STAT
第一节 抽样及抽样组织形式 [例] 某养猪场共有存栏肉猪10000头,现欲了解这批肉猪平 均每头毛重,如果将每头肉猪都过称去称而获取数据将是 不合算的。我们可以按照“等机会原则” 从中抽出100头 肉猪称其重量,计算这100头猪的平均每头毛重,以达到我 们期望的目的。
第六章 抽样和抽样分布
统计实例(Statistics in Practice)
我国某家用电器公司是国内空调最大的生产厂家之一,2019 年时其空调年销售就已达到700万台,销售额为120亿元。这家低 调、在外界看来有些神秘的家电企业,尽管不作声张,极少炒作 ,甚至喊出“不想做行业老大”的话,之后3年来却成长势头迅 猛,增长率一直40%以上,赢利率极高。这背后的原因在于美的 较早就开始了提升企业竞争能力。为了避免当今家用电器行业低 价利薄的局面,实现多条腿走路,以在新一轮竞争中保持优势, 该电器集团决策人又提出了进军汽车行业的战略目标。为此他要 求公司营销部对国际国内各大汽车生产厂家生产能力、销售额、 营利能力、市场占有率等方面作调查分析。
24.05.2020
统计学院
4
第六章 抽样和抽样分布
一、统计抽样的几个基本概念 1、全及总体和样本总体
全及总体:研究对象全体,又称母体。容量用N表 示。具备惟一性。
样本总体:按随机原则从总体中抽出的部分单位的 全体,简称样本,被抽出的每个单位称样本单位。容 量用n表示。样本不具惟一性。
24.05.2020
现实世界包含的素材集合非常庞大,从中提取需要的信息 非常困难。如: •选民人数:每个候选人的支持率是多少? •产品:不合格率是多少? •环境:污染程度如何? •市场:品种、价格、质量状况、购买力等情况的了解。
在这一章里,你将会了解到样本是怎样抽取的,样本统计 量是怎样分布的,如何根据样本统计量对总体参数做估计。
24.05.2020
统计学院
9
第六章 抽样和抽样分布
随机数字表
9745238942 3489962435 1287087765 7077434431 9424252386
1276465909 9866332890 2136217721 142284763642 8036522364 9878764346 0874321123 2177609554
作为公司营销部负责人来说,他必须思考怎样去采集汽车生
产厂家的这些经济机密数据?获得这些数据后,应采用什么方法 作数据分析与推断。这必然会用到统计推断的知识。
24.05.2020
统计学院
1
第六章 抽样和抽样分布
从这一章开始便进入推断统计学的学习内容,它会节省人们 的时间和财物来达到认识对象的最佳限度。
统计学院
5
第六章 抽样和抽样分布
STAT
2、总体参数和样本统计量
根据全及总体各单位变量值计算的反映全及总体某数量 特征的综合指标,由于全及总体唯一确定,故称总体参
数。如上例中的
根据样本总体各单位变量值计算的反映样本总体某数量 特征的综合指标,由于样本总体不具惟一性,故称为样 本统计量,它是一个随机变量。
简单随机抽样也称为纯随机抽样。它是对总体单位 不做任何分类或排队,直接从总体中按“随机原则”抽 取样本单位的调查方式。
其样本抽取过程按总体为有限和无限的不同加以区别
1、有限总体抽样
从容量为N的有限总体中进行抽样,如果容量为n的每个 可能样本被抽到的可能性相等,则称被抽的样本为简单 随机样本。
24.05.2020
如上例中的100头肉猪的平均每头毛重(95.5kg)
24.05.2020
统计学院
6
第六章 抽样和抽样分布
3、放回抽样与不放回抽样 从全及总体中抽取样本有两种方法——放回抽样和不放回 抽样。
放回抽样,抽样安排---对每次被抽到的单位经登记后再放回总体 ,重新参与下一次抽选的抽样方法。在每次的抽取中样本单位被 抽中的概率都等于统计中称这样的抽样为相互独立的试验。
统计学院
8
第六章 抽样和抽样分布
为了便于抽取样本单位,一般在明确抽样框的条件下, 对总体的每个单位都要编号,然后用抽签式或利用《随 机数字表》进行抽取。
例如:N=500 n=10 编码从1-500号
在随机数表中随意点二个数字,得到54-50=4行,34列。 则选取的号码从这个被选中的数开始,由于500是个三 位数,则小于500的连续三位数即为中选号码。见表中 所示。