应用统计基本概念与抽样分布

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

它完全由总体X的分布函数确定
两种形式
n
f
(x1, x2 ,,
xn )
ຫໍສະໝຸດ Baidu
i 1
f
(xi
)
n
P( X 1
x1, X 2
x2 ,, X n
xn )
i 1
pi
例1.1 设有一批产品,其次品率为p,如果记“X 0 ”
表示抽取一件产品是次品;X“ 1 ” 表示抽取一件
产品是正品;那么,产品的质量就可以用X的分布来衡 量。
F(1) (x) P( X (1) x) 1 P( X (1) x)
1 P(X1 x, X 2 x, , X n x)
n
1
i 1
P(
X
i
x)
1 [1
F (x)]n
• 如果总体中服从均匀分布则
0
F(
n)
(
x)
xn
n
1
x0
0 x x
0
F(1)
(
x)
1
(
x)n
n
1
x0
0 x x
1
2
2
(xi )2 )
• 统计量
• 统计量的定义
定义1.2 设 ( X1, X 2, , X n ) 为总体X的一个样本, T T ( X1, X 2, , X n )为 X1, X 2 , X n 的连续函数, 且不含有任何未知参数,则称T为一个统计量。
注:1.统计量是完全由样本确定的一个量,即样 本有一个观测值时,统计量就有一个唯一确定的 值;
10
P( X i xi ) pxi (1 p)1xi
• 例1.2 设总体X服从参数为 , 2 的正态分布,
求样本 ( X1, X 2, , X n ) 的分布密度。
解:总体X的分布密度为
f ,
2
(x)
1
1( x )2
e2
2
x
所以( X1, X 2,
f (x1, x2 ,
, X n ) 的概率分布为
, xn ) (
1
2
)n
exp(
简单称随样机本样的本分,布F为(x样) 为本总分体布X。的如分果布函( X数1, X,2则, 样, X本n分) 为
布有比较简单的形式
F(x1, x2 ,, xn ) P( X1 x1, X 2 x2 ,, X n xn )
P( X1 x1)P( X 2 x2 )
n
i 1
F
(
xi
)
P( X n xn )
数理统计的基本概念与抽样分布
例:某钢筋厂每天可以生产某型号钢筋10000根, 钢筋厂每天需要对生产过程进行控制,对产品的 质量进行检验。如果把钢筋的强度作为钢筋质量 的重有指标,于是质量管理人员需要做如下方面 的工作
第一,对生产出来的钢筋的强度进行检测,获 得必要的数据。
第二,对通过抽样获取的部分数据进行整理、 分析并推断出这10000根钢筋的质量是否合乎要 求。
• 其分布密度为
f(n)
(x)
nx n1
n
0
0 x
其它
f (1)
(x)
n(
x) n1
n
0
0 x
其它
• 充分统计量
• 例:某厂要了解其产品的不合格率p,检验员 检查了10件产品,检查结果是,除前二件是 不合格品(记为 X1 1, X 2 1)外,其它都是 合格品(记为 X i 0,i 3,4,, n )。当厂长问 及检查结果时检验员可作如下两种回答:
的分布 P( X1 x1, X 2 x2 , X10 x10 )
10
10
P( X i xi ) pxi (1 p)1xi
i 1
i 1
p xi (1 p)10 xi
pT1 (1 p)10T1
• 由于P( X1 x1, X 2 x2 , X10 x10 ,T1 t1)
10
X服从0-1分布,参数就是次品率p。如果为简单随机样 本,求样本分布.
P(解X:总x体)X的p概x率(1分布p为)1x ,
所以( X1, X 2 , , X n )的概率分布为
n
P( X 1
x1, X 2
x2 ,, X n
xn )
p xi (1 i 1
p )1 xi
n
n
xi
n xi
p i1 (1 p) i1
• 例1.3 设总体X为连续型的,求最大顺序统计量 与最小顺序统计量的分布密度 . 解: 最大顺序统计量 X (n) 的分布函数为
F(n) (x) P( X (n) x) P( X 1 x, X 2 x, X n x)
n
i 1
P(
X
i
x)
[F (x)]n
• 最小顺序统计量 的分布函数为
样本具有二重性:随机性和确定性
• 定义1.1 设总体X的样本满足 ⑴ 独立性:每次观测结果既不影响其它结果,也不受其
它结果的影响;即相互独立; ⑵ 代表性:样本中每一个个体都与总体X有相同分布。 则称此样本为简单随机样本。
进行有放回抽样就是简单随机样本 ,无放回抽样就 不是简单随机样本。但N很大,n相对较小时无放回抽 样得到的样本可以近似看作简单随机样本.
2.统计量是一个随机变量,它将高维随机变 量问题转化为一维随机变量来处理 ,但不会损 失所讨论问题的信息量.
• 常见的统计量 1.样本均值 2.样本方差 3.k 阶原点矩 4.k 阶中心矩
最大顺序统计量:X(1)
5.顺序统计量最小顺序统计量:X(n)
第K顺序统计量:X(k)
6.样本极差 与中位数
(1) 10次检验中不合格品出现了几次;
(2) 不合格品出现在哪几次试验上。
第二种信息(试验编号信息)对了解不合格
品率p是没有什么帮助的 .
充分统计量就是能把含在样本中有关总体或
者参数的信息一点都不损失地提取出来。或者
说充分统计量包含了有关总体或有关参数的全 部信息.
考虑样本 ( X1, X 2 , X10 )
§1.2 总体、个体、样本
• 1.2.1 总体与个体 我们把所研究对象的全体称为总体或母体。
组成总体的每个单元称为个体 总体X可看作一个随机变量 ,称X的概率分布
为总体分布,称X的数字特征为总体的数字特 征 ,对总体进行研究就是对总体的分布或对总体 的数字特征进行研究 . • 1.2.2 样本
从总体中抽取的一部分个体称为样本或者子 样,其中所含个体的个数称为样本容量 .
(1) 10件中有两件不合格;
(2) 前两件不合格。
这两种回答反映了检验员对样本的两种不同 的加工方法。其所用的统计量分别为
10
T1 X i ; I 1
T2 X 1 X 2
• 显然,第二种回答是不能令人满意的,因为统 计量不包含样本中有关p的全部信息。而第一 种回答是综合了样本中有关p的全部信息。因 为样本 ( X1, X 2 , X10 )提供了两种信息:
相关文档
最新文档