概率论课件.ppt
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
样本容量为5
对总体X在相同的条件下, 进行n次重复、独立 观察, 其结果依次记为X1, X2, …, Xn, 这样得到的随 机变量X1, X2, …, Xn是来自总体X的一个简单随机样 本, 与总体随机变量具有相同的分布. n是样本的容 量. 这种抽样, 叫作“简单随机抽样”, 其特点:
1. 代表性: X1, X2,…, Xn中每一个与所考察的总体有 相同的分布.
在概率论中所研究的随机变量,它的分布都 是假设已知的,在这一前提下去研究它的性质、 特点和规律性,例如求出它的数字特征,讨论随机 变量函数的分布,介绍常用的各种分布等。
而在数理统计中的随机变量,它的分布是未 知的,或者不完全知道,人们通过对所研究的随 机变量进行重复、独立的观察,得到许多观察值 ,对这些数据进行分析,从而对随机变量的分布 作出种种判断。
源自文库
6.1 随机样本 总体和样本
数理统计不同于一般的资料统计,它更侧重 于应用随机现象本身的规律性进行资料的收集、 整理和分析.
由于大量随机现象必然呈现出它的规律性, 因而从理论上讲,只要对随机现象进行足够多次 观察,被研究的随机现象的规律性一定能清楚地 呈现出来. 但客观上只允许我们对随机现象进行 次数不多的观察试验,也就是说, 我们获得的只 是局部观察资料.
今后, 我们称X的分布函数和数字特征分别为总 体的分布函数和数字特征, 并不再区分总体与相应 的随机变量X.
对总体的称呼: 总体, 总体X与总体F.
例3 (例l续) 例l中,若农户年收入以万元计, 假定N户中收入X为以下几种取值: 0.5, 0.8, l, 1.2和1.5. 取这些值的农户个数分别为:n1, n2, n3, n4, n5,
3. 样本
总体分布一般是未知, 或只知道是包含未知参 数的分布, 为推断总体分布及各种特征, 按一定规 则从总体中抽取若干个体进行观察试验, 以获得有 关总体的信息 , 这一抽取过程称为 “抽样”, 所抽 取的部分个体称为样本. 样本中所包含的个体数目 称为样本容量.
从国产轿车中抽5辆 进行耗油量试验
钱粮、户口、地震、水灾等等的记载,说明人 们很早就开始了统计的工作 . 但是当时的统计, 只是对有关事实的简单记录和整理,而没有在 一定理论的指导下,作出超越这些数据范围之 外的推断.
到了十九世纪末二十世纪初,随着近代数 学和概率论的发展,才真正诞生了数理统计学 这门学科.
数理统计学是一门应用性很强的学科. 它 是研究怎样以有效的方式收集、 整理和分析带 有随机性的数据,以便对所考察的问题作出推 断和预测,直至为采取一定的决策和行动提供 依据和建议.
• 计算机科学学院 • 王艳娥
第六章 样本及抽样分布
引言 随机样本 抽样分布
引言
本章转入课程的第二部分 数理统计
概率论是数理统计的理论基础,数理统计是概 率论的重要应用。
数理统计是以概率论的理论为基础、通过试验 所得数据来研究随机现象的一门数学分支,应用广 泛,内容丰富。
从历史的典籍中,人们不难发现许多关于
在数理统计中,不是对所研究的对象全体 (称 为总体)进行观察,而是抽取其中的部分(称为样本) 进行观察获得数据(抽样),并通过这些数据对总体 进行推断.
数理统计方法具有“部分推断整体”的特征 .
1.总体
实际上,我们真正关心的并不是研究对象本身, 而是其某项数量指标.
比如某家工厂的一种产品的使用寿命这样一 项数量指标.
(这里n1+n2+n3+n4+n5=N).
则总体X的分布为离散型分布, 其分布律为:
X 0.5 0.8 1 1.2 1.5 P k n1/N n2/N n3/N n4/N n5/N
例如:研究某批灯泡的寿命时,关心的数量指 标就是寿命,那么,此总体就可以用随机变量X 表示,或用其分布函数F(x)表示 .
现实世界中存在着形形色色的数据,分析这些 数据需要多种多样的方法.
因此,数理统计中的方法和支持这些方法的相 应理论是相当丰富的.概括起来可以归纳成两大类:
参数估计──根据数据,用一些方法对分布的 未知参数进行估计.
假设检验──根据数据,用一些方法对分布的 未知参数进行检验.
它们构成了统计推断的两种基本形式.这两种 推断渗透到了数理统计的每个分支.
对无限总体, 因抽取一个个体不影响它的分布, 所以总是采用不放回抽样.
定义: 设X是具有分布函数F的随机变量,若X1, X2, …, Xn是具有同一分布函数的、相互独立的随机 变量,则称X1, X2, …, Xn为从分布函数F(或总体F、 或总体X) 得到的容量为n的简单随机样本,简称样 本,它们的观察值x1, x2,…, xn称为样本值,又称为X 的n个独立的观察值.
某批 灯泡的寿命
国产轿车每公里 的耗油量
该批灯泡寿命的全 体就是总体
国产轿车每公里耗油量 的全体就是总体
对研究对象上的某项数量指标进行观察。 试验的全部可能的观察值称为总体. 这些值不一定各不相同(可能重复),数目上 也不一定有限. 每一个可能的观察值称为个体. 总体中所包含的个体的个数称为总体的容量.
2. 独立性: X1, X2,…, Xn是相互独立的随机变量.
当n次观察一经完成, 得到n个具体的数 x1, x2,…, xn , 称为样本X1, … , Xn的一次观察值, 简称样本值 .
对有限总体, 采用放回抽样可得简单随机样本, 但放回抽样使用起来不方便, 当个体总数N比要得 到的样本的容量n大得多时, 在实际中可将不放回抽 样近似当作放回抽样来处理.
总 体
…
寿命 X 可用指数分布 来刻划
寿命总体是指数分布总体
某批 灯泡的寿命
鉴于此,常用随机变量的记号 或用其分布函数表示总体.
如说总体X或总体F(x) .
类似地,在研究某地区中学生的营养状况时 , 若关心的数量指标是身高和体重,我们用X 和Y 分别表示身高和体重,那么此总体就可用二维随 机变量(X,Y)或其联合分布函数 F(x,y)来表示.
有限总体 总体
无限总体
例1 研究某地区N个农户的年收人. 总体指他们的年收入的N个数字.
例2 用一把尺子去量一个物体的长度. 总体应该理解为一切所有可能的测量值的全体.
2、总体的分布
一般, 我们所研究的总体的某项数量指标X是一个 随机变量, 其取值在客观上有一定的分布. 因此, 对 总体的研究,就是对相应的随机变量X的研究。
对总体X在相同的条件下, 进行n次重复、独立 观察, 其结果依次记为X1, X2, …, Xn, 这样得到的随 机变量X1, X2, …, Xn是来自总体X的一个简单随机样 本, 与总体随机变量具有相同的分布. n是样本的容 量. 这种抽样, 叫作“简单随机抽样”, 其特点:
1. 代表性: X1, X2,…, Xn中每一个与所考察的总体有 相同的分布.
在概率论中所研究的随机变量,它的分布都 是假设已知的,在这一前提下去研究它的性质、 特点和规律性,例如求出它的数字特征,讨论随机 变量函数的分布,介绍常用的各种分布等。
而在数理统计中的随机变量,它的分布是未 知的,或者不完全知道,人们通过对所研究的随 机变量进行重复、独立的观察,得到许多观察值 ,对这些数据进行分析,从而对随机变量的分布 作出种种判断。
源自文库
6.1 随机样本 总体和样本
数理统计不同于一般的资料统计,它更侧重 于应用随机现象本身的规律性进行资料的收集、 整理和分析.
由于大量随机现象必然呈现出它的规律性, 因而从理论上讲,只要对随机现象进行足够多次 观察,被研究的随机现象的规律性一定能清楚地 呈现出来. 但客观上只允许我们对随机现象进行 次数不多的观察试验,也就是说, 我们获得的只 是局部观察资料.
今后, 我们称X的分布函数和数字特征分别为总 体的分布函数和数字特征, 并不再区分总体与相应 的随机变量X.
对总体的称呼: 总体, 总体X与总体F.
例3 (例l续) 例l中,若农户年收入以万元计, 假定N户中收入X为以下几种取值: 0.5, 0.8, l, 1.2和1.5. 取这些值的农户个数分别为:n1, n2, n3, n4, n5,
3. 样本
总体分布一般是未知, 或只知道是包含未知参 数的分布, 为推断总体分布及各种特征, 按一定规 则从总体中抽取若干个体进行观察试验, 以获得有 关总体的信息 , 这一抽取过程称为 “抽样”, 所抽 取的部分个体称为样本. 样本中所包含的个体数目 称为样本容量.
从国产轿车中抽5辆 进行耗油量试验
钱粮、户口、地震、水灾等等的记载,说明人 们很早就开始了统计的工作 . 但是当时的统计, 只是对有关事实的简单记录和整理,而没有在 一定理论的指导下,作出超越这些数据范围之 外的推断.
到了十九世纪末二十世纪初,随着近代数 学和概率论的发展,才真正诞生了数理统计学 这门学科.
数理统计学是一门应用性很强的学科. 它 是研究怎样以有效的方式收集、 整理和分析带 有随机性的数据,以便对所考察的问题作出推 断和预测,直至为采取一定的决策和行动提供 依据和建议.
• 计算机科学学院 • 王艳娥
第六章 样本及抽样分布
引言 随机样本 抽样分布
引言
本章转入课程的第二部分 数理统计
概率论是数理统计的理论基础,数理统计是概 率论的重要应用。
数理统计是以概率论的理论为基础、通过试验 所得数据来研究随机现象的一门数学分支,应用广 泛,内容丰富。
从历史的典籍中,人们不难发现许多关于
在数理统计中,不是对所研究的对象全体 (称 为总体)进行观察,而是抽取其中的部分(称为样本) 进行观察获得数据(抽样),并通过这些数据对总体 进行推断.
数理统计方法具有“部分推断整体”的特征 .
1.总体
实际上,我们真正关心的并不是研究对象本身, 而是其某项数量指标.
比如某家工厂的一种产品的使用寿命这样一 项数量指标.
(这里n1+n2+n3+n4+n5=N).
则总体X的分布为离散型分布, 其分布律为:
X 0.5 0.8 1 1.2 1.5 P k n1/N n2/N n3/N n4/N n5/N
例如:研究某批灯泡的寿命时,关心的数量指 标就是寿命,那么,此总体就可以用随机变量X 表示,或用其分布函数F(x)表示 .
现实世界中存在着形形色色的数据,分析这些 数据需要多种多样的方法.
因此,数理统计中的方法和支持这些方法的相 应理论是相当丰富的.概括起来可以归纳成两大类:
参数估计──根据数据,用一些方法对分布的 未知参数进行估计.
假设检验──根据数据,用一些方法对分布的 未知参数进行检验.
它们构成了统计推断的两种基本形式.这两种 推断渗透到了数理统计的每个分支.
对无限总体, 因抽取一个个体不影响它的分布, 所以总是采用不放回抽样.
定义: 设X是具有分布函数F的随机变量,若X1, X2, …, Xn是具有同一分布函数的、相互独立的随机 变量,则称X1, X2, …, Xn为从分布函数F(或总体F、 或总体X) 得到的容量为n的简单随机样本,简称样 本,它们的观察值x1, x2,…, xn称为样本值,又称为X 的n个独立的观察值.
某批 灯泡的寿命
国产轿车每公里 的耗油量
该批灯泡寿命的全 体就是总体
国产轿车每公里耗油量 的全体就是总体
对研究对象上的某项数量指标进行观察。 试验的全部可能的观察值称为总体. 这些值不一定各不相同(可能重复),数目上 也不一定有限. 每一个可能的观察值称为个体. 总体中所包含的个体的个数称为总体的容量.
2. 独立性: X1, X2,…, Xn是相互独立的随机变量.
当n次观察一经完成, 得到n个具体的数 x1, x2,…, xn , 称为样本X1, … , Xn的一次观察值, 简称样本值 .
对有限总体, 采用放回抽样可得简单随机样本, 但放回抽样使用起来不方便, 当个体总数N比要得 到的样本的容量n大得多时, 在实际中可将不放回抽 样近似当作放回抽样来处理.
总 体
…
寿命 X 可用指数分布 来刻划
寿命总体是指数分布总体
某批 灯泡的寿命
鉴于此,常用随机变量的记号 或用其分布函数表示总体.
如说总体X或总体F(x) .
类似地,在研究某地区中学生的营养状况时 , 若关心的数量指标是身高和体重,我们用X 和Y 分别表示身高和体重,那么此总体就可用二维随 机变量(X,Y)或其联合分布函数 F(x,y)来表示.
有限总体 总体
无限总体
例1 研究某地区N个农户的年收人. 总体指他们的年收入的N个数字.
例2 用一把尺子去量一个物体的长度. 总体应该理解为一切所有可能的测量值的全体.
2、总体的分布
一般, 我们所研究的总体的某项数量指标X是一个 随机变量, 其取值在客观上有一定的分布. 因此, 对 总体的研究,就是对相应的随机变量X的研究。