抽样和抽样分布培训课件ppt(49张)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6
自有限总体的抽样
• 例:人事主管正在制定一项公司2500名管理人员的简报。 假定2500名管理人员已经按照他们在职员文件中的顺序 依次标号(即1,2,3,⋯,2499,2500)
74715 63905 60678 25514 1866 91304 34729 71986 44826 63694 56936 58319 58020 74045 58006 28668 92038 95002 88451 52056 41343 47936 21472 78278 3868 57767 89168 60772 37953 51464 68345 17347 13514 31760 35717 21630 73683 31660 28409 99721 18734 91670 54770 2513 58818 47693 7499 58368 1386 37919
7
自有限总体的抽样
• 无放回抽样:一个元素一旦选入样本,就从总体中剔除, 不能再次被选入。
• 放回抽样:一个元素一旦选入样本,仍被放回总体中。 先前被选入的元素可能再次被选,并且在样本中可出现 多次(多于一次)。
8
自无限总体的抽样
• 无限总体经常被定义为一个持续进行的过程,总体的元 素由在相同条件下过程无限运行下去产生的每一项构成。 在这种情况下,对总体内所有项排列是不可能的。
10
练习
• 假定一个有限总体有350项,用下面五位随机数的后三位, 确定被选入简单随机样本的项的前四位。 98601 73022 83448 34229 27553 84147 93289 14209
11
练习
• 说明下列总体是有限还是无限的。 a. 加利福尼亚州所有登记的选民。 b. 由宾夕法尼亚州阿伦顿TV-M公司工厂生产的所有电 视装置。 c. 某一邮购业务公司处理的所有订单。 d. 所有打入某一地方警察局的紧急电话。 e. Fibercon有限公司在5月17日第二个轮班中制造的所 有部件。
400个 样本
支持人数 160
推断
支持该候选人的选民 占全部选民的比例:
160/400=40%
2
抽样估计方法主要用在下列两种情况:
• 对所考查的总体不可能进行全部测度; • 从理论上说可以对所考查的总体进行全部测度,但实践
上由于人力、财力、时间等方面的原因,无法(不划算) 进行全部测度。
抽样估计只得到对总体特征的近似测度,因此,抽 样估计还必须同时考察所得结果的“可能范围” 与“可 靠程度”。
3 抽样和抽样分布
简单随机抽样 点估计
x 的抽样分布
p 的抽样分布
点估计的性质 其他抽样方法
1
什么是抽样估计?
• 例1:制造商生产一种被认为寿命更长的新型轮胎。
120个 样本
测试
平均里程 36,500公里
推断
新轮胎 平均寿命: 36,500公里
• 例2:某党派想支持某一候选人参选美国某州议员,为了决定 是否支持该候选人,该党派领导需要估计支持该候选人的民 众占全部登记投票人总数的比例。由于时间及财力的限制:
• 方法:随机数表。
74715 63905 60678 25514 1866 91304 34729 71986 44826 63694 56936 58319 58020 74045 58006 28668 92038 95002 88451 52056 41343 47936 21472 78278 3868 57767 89168 60772 37953 51464 68345 17347 13514 31760 35717 21630 73683 31660 28409 99721 18734 91670 54770 2513 58818 47693 7499 58368 1386 37919
本容量很大时,样本均值的抽样分布可用正态概率分布 近似。
• 大样本条件可假定为简单随机样本样本容量为30或更多 • 当总体为正态概率分布时,对任何样本容量,样本均值
20
x 的数学期望
• 例:管理人员总体的年薪均值 μ=51800美元。
样本均值所有可能值的均值也等于51800美元。
21
x 的标准差(标准误差)
• 有限总体修正系数
• 经验法则:当n /N≤0.05时,一般可忽略有限总体修正系
数。
4000
22
x 抽样分布的形式
• 中心极限定理 从总体中抽取样本容量为n的简单随机样本,当样
12
3 抽样和抽样分布
简单随机抽样 点估计与抽样分布
x 的抽样分布
p 的抽样分布
点估计的性质 其他抽样方法
13
点估计
由30管理人员组成的简单随机样本的年薪和培训情况
14
点估计
样本均值 样本标准差
样本比率
51814.00美元
点估计的 3347.72美元 统计过程
0.63
15
由30名管理人员组成的简单随机样本的点估计值
16
由30名管理人员组成的500个简单随机样本的点估计值
17
由30名管理人员组成的500个简单随机样本的抽样分布
• 抽样分布:样本统计量所有可能值构成的概率分布。
18
3 抽样和抽样分布
简单随机抽样 点估计
x 的抽样分布
p 的抽样分布
点估计的性质 其他抽样方法
19
x 的抽样分布
• x 抽样分布的性质 – x 的均值或数学期望 – x 的标准差 – x 抽样分布本身的形状或形式
3
3 抽样和抽样分布
简单随机抽样 点估计
x 的抽样分布
p 的抽样分布
点估计的性质 其他抽样方法
4
简单随机抽样
• 简单随机样本(有限总体) –随机样本中每个样本点以相等的概率被抽出。
• 随机样本(无限总体) –每个个体来自同一总体。 –各个个体的选择是独立的。
5
自有限总体的抽样
• 每次只选择一个样本点,总体中的每一个体等可能被抽 到。
• 例:估计某一快餐店11:30-13:30午饭时间顾客从点餐到 拿到食品的平均时间。
9
wk.baidu.com
自无限总体的抽样
• 因为对于无限总体不可能进行标号排列,所以抽样过程 中不能用随机数。
• 例:当一名顾客出示打折券时,他之后的下一名顾客将 被选入样本。因为顾客出示打折赠品券的是随机而且独 立的,所以厂商的抽样计划满足来自无限总体的简单随 机样本的两个条件。
自有限总体的抽样
• 例:人事主管正在制定一项公司2500名管理人员的简报。 假定2500名管理人员已经按照他们在职员文件中的顺序 依次标号(即1,2,3,⋯,2499,2500)
74715 63905 60678 25514 1866 91304 34729 71986 44826 63694 56936 58319 58020 74045 58006 28668 92038 95002 88451 52056 41343 47936 21472 78278 3868 57767 89168 60772 37953 51464 68345 17347 13514 31760 35717 21630 73683 31660 28409 99721 18734 91670 54770 2513 58818 47693 7499 58368 1386 37919
7
自有限总体的抽样
• 无放回抽样:一个元素一旦选入样本,就从总体中剔除, 不能再次被选入。
• 放回抽样:一个元素一旦选入样本,仍被放回总体中。 先前被选入的元素可能再次被选,并且在样本中可出现 多次(多于一次)。
8
自无限总体的抽样
• 无限总体经常被定义为一个持续进行的过程,总体的元 素由在相同条件下过程无限运行下去产生的每一项构成。 在这种情况下,对总体内所有项排列是不可能的。
10
练习
• 假定一个有限总体有350项,用下面五位随机数的后三位, 确定被选入简单随机样本的项的前四位。 98601 73022 83448 34229 27553 84147 93289 14209
11
练习
• 说明下列总体是有限还是无限的。 a. 加利福尼亚州所有登记的选民。 b. 由宾夕法尼亚州阿伦顿TV-M公司工厂生产的所有电 视装置。 c. 某一邮购业务公司处理的所有订单。 d. 所有打入某一地方警察局的紧急电话。 e. Fibercon有限公司在5月17日第二个轮班中制造的所 有部件。
400个 样本
支持人数 160
推断
支持该候选人的选民 占全部选民的比例:
160/400=40%
2
抽样估计方法主要用在下列两种情况:
• 对所考查的总体不可能进行全部测度; • 从理论上说可以对所考查的总体进行全部测度,但实践
上由于人力、财力、时间等方面的原因,无法(不划算) 进行全部测度。
抽样估计只得到对总体特征的近似测度,因此,抽 样估计还必须同时考察所得结果的“可能范围” 与“可 靠程度”。
3 抽样和抽样分布
简单随机抽样 点估计
x 的抽样分布
p 的抽样分布
点估计的性质 其他抽样方法
1
什么是抽样估计?
• 例1:制造商生产一种被认为寿命更长的新型轮胎。
120个 样本
测试
平均里程 36,500公里
推断
新轮胎 平均寿命: 36,500公里
• 例2:某党派想支持某一候选人参选美国某州议员,为了决定 是否支持该候选人,该党派领导需要估计支持该候选人的民 众占全部登记投票人总数的比例。由于时间及财力的限制:
• 方法:随机数表。
74715 63905 60678 25514 1866 91304 34729 71986 44826 63694 56936 58319 58020 74045 58006 28668 92038 95002 88451 52056 41343 47936 21472 78278 3868 57767 89168 60772 37953 51464 68345 17347 13514 31760 35717 21630 73683 31660 28409 99721 18734 91670 54770 2513 58818 47693 7499 58368 1386 37919
本容量很大时,样本均值的抽样分布可用正态概率分布 近似。
• 大样本条件可假定为简单随机样本样本容量为30或更多 • 当总体为正态概率分布时,对任何样本容量,样本均值
20
x 的数学期望
• 例:管理人员总体的年薪均值 μ=51800美元。
样本均值所有可能值的均值也等于51800美元。
21
x 的标准差(标准误差)
• 有限总体修正系数
• 经验法则:当n /N≤0.05时,一般可忽略有限总体修正系
数。
4000
22
x 抽样分布的形式
• 中心极限定理 从总体中抽取样本容量为n的简单随机样本,当样
12
3 抽样和抽样分布
简单随机抽样 点估计与抽样分布
x 的抽样分布
p 的抽样分布
点估计的性质 其他抽样方法
13
点估计
由30管理人员组成的简单随机样本的年薪和培训情况
14
点估计
样本均值 样本标准差
样本比率
51814.00美元
点估计的 3347.72美元 统计过程
0.63
15
由30名管理人员组成的简单随机样本的点估计值
16
由30名管理人员组成的500个简单随机样本的点估计值
17
由30名管理人员组成的500个简单随机样本的抽样分布
• 抽样分布:样本统计量所有可能值构成的概率分布。
18
3 抽样和抽样分布
简单随机抽样 点估计
x 的抽样分布
p 的抽样分布
点估计的性质 其他抽样方法
19
x 的抽样分布
• x 抽样分布的性质 – x 的均值或数学期望 – x 的标准差 – x 抽样分布本身的形状或形式
3
3 抽样和抽样分布
简单随机抽样 点估计
x 的抽样分布
p 的抽样分布
点估计的性质 其他抽样方法
4
简单随机抽样
• 简单随机样本(有限总体) –随机样本中每个样本点以相等的概率被抽出。
• 随机样本(无限总体) –每个个体来自同一总体。 –各个个体的选择是独立的。
5
自有限总体的抽样
• 每次只选择一个样本点,总体中的每一个体等可能被抽 到。
• 例:估计某一快餐店11:30-13:30午饭时间顾客从点餐到 拿到食品的平均时间。
9
wk.baidu.com
自无限总体的抽样
• 因为对于无限总体不可能进行标号排列,所以抽样过程 中不能用随机数。
• 例:当一名顾客出示打折券时,他之后的下一名顾客将 被选入样本。因为顾客出示打折赠品券的是随机而且独 立的,所以厂商的抽样计划满足来自无限总体的简单随 机样本的两个条件。