《概率论与数理统计教程-朱庆峰》第5章 统计量及其分布.ppt
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数理统计的核心问题——由样本推断总体
第4页
数理统计的一般步骤: 数据资料的收集 数据的整理、分析 统计推断
第5页
第5.1节 总体与子样
一、总体与个体 二、随机样本的定义
一、总体与个体
第6页
一个统计问题总有它明确的研究对象.
研究对象的全体称为总体(母体),
总体中每个成员称为个体.
总体
研究某批灯泡的质量
总体
寿命 可用一概 F(x) 率分布来刻划
某批 灯泡的寿命
第10页
总体的三层含义:
• 研究对象的全体; • 数据; • 分布
第11页
例5.1.1 考察某厂的产品质量,以0记合格品,以1记 不合格品,则
总体 = {该厂生产的全部合格品与不合格品} = {由0或1组成的一堆数}
若以 p 表示这堆数中1的比例(不合格品率),则该 总体可由一个二点分布表示:
>552
元件数 4 4 1 2 2 3 1 13
表5.1.2中的样本观测值没有具体的数值, 只有一个范围,这样的样本称为分组样本。
第17页
样本的要求:简单随机样本
要使得推断可靠,对样本就有要求,使样本能很 好地代表总体。通常有如下两个要求:
➢ 随机性: 总体中每一个个体都有同等机会
被选入样本 -- xi 与总体X有相同的分布。
3.样本的分布
第20页
Hale Waihona Puke Baidu
定理(补充)设(1,2, ,n )为来自总体的样本.
(1)若总体的分布函数为F (x),则样本(1,2, ,n )
n
的分布函数为 F (xi ). i 1
(2)若总体的分布密度为p(x),则样本(1,2, ,n )
➢ 独立性: 样本中每一样品的取值不影响其
它样品的取值 -- x1, x2, …, xn 相互独立。
第18页
用简单随机抽样方法得到的样本称为 简单随机样本,也简称样本。
获得简单随机样本的抽样方法称为简单随机抽样. 于是,样本 x1, x2, …, xn 可以看成是 独立同分布( iid ) 的随机变量, 其共同分布即为总体分布。
X01 P 1p p
第12页
比如:两个生产同类产品的工厂的产品的总体 分布:
X
0
1
p
0.983
0.017
X
0
1
p
0.915
0.085
第13页
5.1.2 样本
样品、样本、样本容量: 样本具有两重性
• 一方面,由于样本是从总体中随机抽取的,抽 取前无法预知它们的数值,因此,样本是随机 变量,用大写字母 X1, X2, …, Xn 表示;
第1页
第五章 统计量及其分布
§5.1 总体与样本 §5.2 样本数据的整理与显示 §5.3 统计量及其分布 §5.4 三大抽样分布 §5.5 充分统计量
第2页
数理统计是在概率论的基础上研究怎样以有效的方 式收集、整理和分析可获得的有限的,带有随机性的 数据资料,对所考察问题的统计规律性尽可能作出精 确而可靠的推断或预测,为采取一定的决策和行动 提供依据和建议.
• 另一方面,样本在抽取以后经观测就有确定的 观测值,因此,样本又是一组数值。此时用小 写字母 x1, x2, …, xn 表示是恰当的。
简单起见,无论是样本还是其观测值,样本一般 均用 x1, x2,… xn 表示,应能从上下文中加以区别。
第14页
例5.1.3 啤酒厂生产的瓶装啤酒规定净含量为640 克。由于随机性,事实上不可能使得所有的啤酒 净含量均为640克。现从某厂生产的啤酒中随机 抽取10瓶测定其净含量,得到如下结果: 641, 635, 640, 637, 642, 638, 645, 643, 639, 640
通常,我们用随机变量 ,,,…, 等表示 总体。当我们说到总体,就是指一个具有确定 概率分布的随机变量。
注:总体的分布一般来说是未知的,统计学的主要任务正是
要对总体的未知分布进行推断.
第9页
如:研究某批灯泡的寿命时,我们关心的数 量指标就是寿命,那么,此总体就可以用随 机变量X表示,其分布函数F(x).
数理统计与概率论是两个有密切联系的学科,它们 都以随机现象的统计规律为研究对象。
第3页
但在研究问题的方法上有很大区别: 概率论 —— 已知随机变量服从的分布规律, 寻求
分布的性质、数字特征、及其应用;
数理统计 —— 通过对试验数据的统计分析,寻找 随机变量所服从的分布和数字特征, 从而推断整体的规律性.
元件数 4 8 6 5 3 4 5 4
寿命范围 (192 216] (216 240] (240 264] (264 288] (288 312] (312 336] (336 360] (360 184]
元件数 6 3 3 5 5 3 5 1
寿命范围 (384 408] (408 432] (432 456] (456 480] (480 504] (504 528] (528 552]
这是一个容量为10的样本的观测值, 对应的总体为该厂生产的瓶装啤酒的净含量。 这样的样本称为完全样本。
第15页
例5.1.4 考察某厂生产的某种电子元件的 寿命,选了100只进行寿命试验,得到 如下数据:
第16页
表5.1.2 100只元件的寿命数据
寿命范围 ( 0 24] (24 48] (48 72] (72 96] (96 120] (120 144] (144 168] (168 192]
总体 …
考察国产 轿车的质量
第7页
然而在统计研究中,人们往往关心每个 个体的一项(或几项)数量指标和该数量指标 在总体中的分布情况. 这时,每个个体具有 的数量指标的全体就是总体.
灯泡的寿命
国产轿车每公里 的耗油量
该批灯泡寿命的 全体就是总体
所有国产轿车每公里耗 油量的全体就是总体
第8页
相应的数量指标值的出现带有随机性。从而 可把此种数量指标看作随机变量,我们用一个 随机变量或其分布来描述总体。为此常用随机 变量的符号来表示总体,并把随机变量的分布 称为总体分布。
获取方法
(1)有放回取样 (2)不放回取样
(总体规模很大)
第19页
总体分为有限总体与无限总体
实际中总体中的个体数大多是有限的。当个体 数充分大时,将有限总体看作无限总体是一种 合理的抽象。
对无限总体,随机性与独立性容易实现,困难 在于排除有意或无意的人为干扰。
对有限总体,只要总体所含个体数很大,特别 是与样本量相比很大,则独立性也可基本得到 满足。
第4页
数理统计的一般步骤: 数据资料的收集 数据的整理、分析 统计推断
第5页
第5.1节 总体与子样
一、总体与个体 二、随机样本的定义
一、总体与个体
第6页
一个统计问题总有它明确的研究对象.
研究对象的全体称为总体(母体),
总体中每个成员称为个体.
总体
研究某批灯泡的质量
总体
寿命 可用一概 F(x) 率分布来刻划
某批 灯泡的寿命
第10页
总体的三层含义:
• 研究对象的全体; • 数据; • 分布
第11页
例5.1.1 考察某厂的产品质量,以0记合格品,以1记 不合格品,则
总体 = {该厂生产的全部合格品与不合格品} = {由0或1组成的一堆数}
若以 p 表示这堆数中1的比例(不合格品率),则该 总体可由一个二点分布表示:
>552
元件数 4 4 1 2 2 3 1 13
表5.1.2中的样本观测值没有具体的数值, 只有一个范围,这样的样本称为分组样本。
第17页
样本的要求:简单随机样本
要使得推断可靠,对样本就有要求,使样本能很 好地代表总体。通常有如下两个要求:
➢ 随机性: 总体中每一个个体都有同等机会
被选入样本 -- xi 与总体X有相同的分布。
3.样本的分布
第20页
Hale Waihona Puke Baidu
定理(补充)设(1,2, ,n )为来自总体的样本.
(1)若总体的分布函数为F (x),则样本(1,2, ,n )
n
的分布函数为 F (xi ). i 1
(2)若总体的分布密度为p(x),则样本(1,2, ,n )
➢ 独立性: 样本中每一样品的取值不影响其
它样品的取值 -- x1, x2, …, xn 相互独立。
第18页
用简单随机抽样方法得到的样本称为 简单随机样本,也简称样本。
获得简单随机样本的抽样方法称为简单随机抽样. 于是,样本 x1, x2, …, xn 可以看成是 独立同分布( iid ) 的随机变量, 其共同分布即为总体分布。
X01 P 1p p
第12页
比如:两个生产同类产品的工厂的产品的总体 分布:
X
0
1
p
0.983
0.017
X
0
1
p
0.915
0.085
第13页
5.1.2 样本
样品、样本、样本容量: 样本具有两重性
• 一方面,由于样本是从总体中随机抽取的,抽 取前无法预知它们的数值,因此,样本是随机 变量,用大写字母 X1, X2, …, Xn 表示;
第1页
第五章 统计量及其分布
§5.1 总体与样本 §5.2 样本数据的整理与显示 §5.3 统计量及其分布 §5.4 三大抽样分布 §5.5 充分统计量
第2页
数理统计是在概率论的基础上研究怎样以有效的方 式收集、整理和分析可获得的有限的,带有随机性的 数据资料,对所考察问题的统计规律性尽可能作出精 确而可靠的推断或预测,为采取一定的决策和行动 提供依据和建议.
• 另一方面,样本在抽取以后经观测就有确定的 观测值,因此,样本又是一组数值。此时用小 写字母 x1, x2, …, xn 表示是恰当的。
简单起见,无论是样本还是其观测值,样本一般 均用 x1, x2,… xn 表示,应能从上下文中加以区别。
第14页
例5.1.3 啤酒厂生产的瓶装啤酒规定净含量为640 克。由于随机性,事实上不可能使得所有的啤酒 净含量均为640克。现从某厂生产的啤酒中随机 抽取10瓶测定其净含量,得到如下结果: 641, 635, 640, 637, 642, 638, 645, 643, 639, 640
通常,我们用随机变量 ,,,…, 等表示 总体。当我们说到总体,就是指一个具有确定 概率分布的随机变量。
注:总体的分布一般来说是未知的,统计学的主要任务正是
要对总体的未知分布进行推断.
第9页
如:研究某批灯泡的寿命时,我们关心的数 量指标就是寿命,那么,此总体就可以用随 机变量X表示,其分布函数F(x).
数理统计与概率论是两个有密切联系的学科,它们 都以随机现象的统计规律为研究对象。
第3页
但在研究问题的方法上有很大区别: 概率论 —— 已知随机变量服从的分布规律, 寻求
分布的性质、数字特征、及其应用;
数理统计 —— 通过对试验数据的统计分析,寻找 随机变量所服从的分布和数字特征, 从而推断整体的规律性.
元件数 4 8 6 5 3 4 5 4
寿命范围 (192 216] (216 240] (240 264] (264 288] (288 312] (312 336] (336 360] (360 184]
元件数 6 3 3 5 5 3 5 1
寿命范围 (384 408] (408 432] (432 456] (456 480] (480 504] (504 528] (528 552]
这是一个容量为10的样本的观测值, 对应的总体为该厂生产的瓶装啤酒的净含量。 这样的样本称为完全样本。
第15页
例5.1.4 考察某厂生产的某种电子元件的 寿命,选了100只进行寿命试验,得到 如下数据:
第16页
表5.1.2 100只元件的寿命数据
寿命范围 ( 0 24] (24 48] (48 72] (72 96] (96 120] (120 144] (144 168] (168 192]
总体 …
考察国产 轿车的质量
第7页
然而在统计研究中,人们往往关心每个 个体的一项(或几项)数量指标和该数量指标 在总体中的分布情况. 这时,每个个体具有 的数量指标的全体就是总体.
灯泡的寿命
国产轿车每公里 的耗油量
该批灯泡寿命的 全体就是总体
所有国产轿车每公里耗 油量的全体就是总体
第8页
相应的数量指标值的出现带有随机性。从而 可把此种数量指标看作随机变量,我们用一个 随机变量或其分布来描述总体。为此常用随机 变量的符号来表示总体,并把随机变量的分布 称为总体分布。
获取方法
(1)有放回取样 (2)不放回取样
(总体规模很大)
第19页
总体分为有限总体与无限总体
实际中总体中的个体数大多是有限的。当个体 数充分大时,将有限总体看作无限总体是一种 合理的抽象。
对无限总体,随机性与独立性容易实现,困难 在于排除有意或无意的人为干扰。
对有限总体,只要总体所含个体数很大,特别 是与样本量相比很大,则独立性也可基本得到 满足。