概率论与数理统计课件:6-1 样本及抽样分布

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

从理论上讲,只要我们对随机现象进行大量的 观察或试验,它的统计规律性就会呈现出来。
在数理统计学中,我们总是对随机现象进行有 限次的观察或试验,以获取数据。通过对数据 的分析与推断去寻找隐藏在数据中的统计规律 性。
数理统计是研究怎样以有效的方式收 集、 整理和分析带有随机性的数据,在此 基础上,对所研究的问题作出统计推断, 直至对可能作出的决策提供依据和建议.
密度函数为:
∏n
f (x1, x2 ,..., xn ) =
i =1
1
− 1 ( xi −µ )2
e2 σ
2π σ
例6.1.2:总体X~B(1,p),0<p<1,写出其样本 (X1,X2,…Xn)的联合概率函数为:
∏n
n
n
p xi (1 −
p )1− xi
=
∑ xi p i=1 (1 −
∑ n− xi p) i=1
从国产轿车中抽5辆 进行耗油量试验
样本容量为5
样本是随机变量.抽到哪5辆是随机的
容量为 n 的样本可以看作 n 维随机变量 (X1, X2,…, Xn). 但是,一旦取定一组样本,得到的是 n 个 具体的数 (x1, x2,…, xn),称为样本的一次 观察值,简称样本值 .
由于抽样的目的是为了对总体进行统计推断, 为了使抽取的样本能很好地反映总体的信息,必须 考虑抽样方法.
i =1
3. 总体、样本、样本值的关系
如我们从某班大学生中欲抽取10人测量身 高,用 X1, X2, …, X10表示10个人的身高。进行 试验后,得到10个数, x1, x2,…,x10,它们是样 本取到的值,即样本值。我们只能观察到随机 变量取的值而见不到随机变量。
总体分布决定了样本取值的概率规律, 也就是样本取到样本值的规律,因而可以由 样本值去推断总体.
本的联合分布函数为
F(x1) F(x2) … F(xn)
(1)、若总体X为连续型随机变量,概率密度 函数为f( x), 则样本 ( X1, X 2 ,, X n )
的联合概率密度函数为
n
∏ f * (x1, x2 ,, xn ) = f (xi ) i =1
(2)、若总体X为离散型随机变量,概率分布为 P{X=xi}=pi,i=1,2,….,则样本(X1,X2,…Xn)的联合分 布律,也称为联合概率函数,为:
统计就是从手中已有的资料 —— 样本 值,去推断总体分布F(x)的性质.

对已取得的观测值进行整理、

分析,作出推断、决策,从而

找出所研究的对象的规律性
推断 统计学
参数估计 假设检验 方差分析 回归分析
第六章 样本及抽样分布
• 总体和样本 • 统计量 • 顺序统计量和经验分布函数
§6.1 随机样本
1.总体
在一个统计问题中,把研究的对象全体称为总体. 构成总体的每个成员称为个体.
数理统计研究的内容
第一个问题是怎样对随机现象进行有限次的观察 或试验?
——试验设计与抽样方法
第二个问题是:如何对这有限次的观察或试验所 得到的,带有随机性的数据进行合理的分析,作 出科学的推断?
——统计推断
描述统计学 ——

对随机现象进行观测、试验,

以取得有代表性的观测值

计 推断统计学 ——
由于每个个体的出现是随机的,所以相 应的数量指标的出现也带有随机性.从而可以 把这种数量指标看作一个随机变量,该随机 变量的分布就是该数量指标在总体中的分布.
这样,总体就可以用一个随机变量及其分 布来描述.
例如:研究某批灯泡的寿命时,关心的数量指标就 是寿命,那么,此总体就可以用随机变量X表示, 或用其分布函数F(x)表示.
在许多实际问题中,所描述的随机现象的 随机变量的概率分布可能完全不知道;或者 由于现象的某些事实而知道其分布形式,但 是不知道其分布函数中所含的参数。
例如 某种型号的电视机的寿命X 服从什么
分布是完全不知道的
→ 我们希望知道它的分布. → 或者,希望知道该分布的一些数字特征, 如期望和方差等
例如 某工厂生产大批电子元件,已知元件的 寿命服从指数分布,实际中常常提出如下问题:
f
*
(
x1
,
x
2
,,
xn
来自百度文库
)
=
P( X 1
=
x1 , X 2
=
x2
,,
X
n
=
xn )
= P( X1 = x1 ) ⋅ P( X 2 = x2 ) P( X n = xn )
n
∏ = P( X i = xi ) i =1
例6.1.1:总体X~N (µ,σ 2 ) , 样本(X1,X2 …Xn) 的联合
→ 元件的平均寿命是多少?. → 若按国家规定,这种元件的平均寿命应 大于5000小时。那么该工厂生产的元件是否 符合国家的规定?
类似的问题在生产活动和经济活动中是 经常会遇到的,数理统计就是在解决这些实 际问题中逐渐形成的一门独立的学科。它与 概率论既有区别又有联系,大体上可以说概 率论是数理统计的基础,而数理统计是概率 论的一种应用。
鉴于此,常用随机变量的记号或用其分布函 数表示总体.比如说总体X或总体F(x) .
类似地,在研究某地区中学生的营养状况时, 若关心的数量指标是身高和体重,我们用X和Y分别 表示身高和体重,那么此总体就可用二维随机变量 (X,Y)或其联合分布函数F(x,y)来表示.
2. 样本
为推断总体分布及其各种特征,按一定规则 从总体中抽取若干个体进行观察试验,以获得有 关总体的信息,这一抽取过程称为“抽样”,所 抽取的部分个体称为样本.样本中所包含的个体数 目称为样本容量.
最常用的一种抽样方法叫作“简单随机抽样”, 具有下面两特点:
1. 代表性: X1, X2,…, Xn中每一个都与总体 X 有相 同的分布.
2. 独立性: X1, X2,…, Xn是相互独立的随机变量.
当说到“X1, X2,…, Xn是取自某总体的样本”时, 若不特别说明,就指简单随机样本.
若总体 X 的分布函数为F(x),则其简单随机样
把含有有限个个体的总体成为有限总体 把含有无限个个体的总体成为无限总体 在实际工作中,一般把个体数目很大的总体 也看成无限总体
然而在实际问题中,人们关心的仅仅是总 体中个体的某一项数量指标X,或某几项数量 指标(Y, Z).
因而将个体具有的数量指标的全体作为总体。 而将构成总体的每个成员的指标作为一个个体。
相关文档
最新文档