第六章样本及抽样分布11

合集下载

统计学第6章统计量及其抽样分布

统计学第6章统计量及其抽样分布

整理ppt
16
2. T统计量
设X1,X2,…,Xn是来自正态总体N~ (μ,σ2 )
n
的一个样本,
X
1 n
n i 1
Xi
(Xi X )2 s 2 i1
n 1
则 T(X) ~t(n1)
S/ n
称为T统计量,它服从自由度为(n-1)的t分布。
整理ppt
17
F分布
定义:设随机变量Y与Z相互独立,且Y和Z分别服 从自由度为m和n的c2分布,随机变量X有如下表达式:
整理ppt
8
中心极限定理
设从均值为,方差为2的一个任意总 体中抽取容量为n的样本,当n充分大时, 样本均值的抽样分布近似服从均值为μ、 方差为σ2/n的正态分布。
当样本容量足够大时
(n≥30),样本均值的抽样
分布逐渐趋于正态分布
整理ppt
9
标准误差
标准误差:样本统计量与总体参数之间的平均差异
1. 所有可能的样本均值的标准差,测度所有样本 均值的离散程度
因此,估计这100名患者治愈成功的比 例在85%至95%的概率为90.5%
整理ppt
22
6.5 两个样本平均值之差的分布

X
1
是独立地抽自总体
X1 ~N(1,12)
的一个容量
为n1的样本的均值。 X 2 是独立地抽自总体
X2 ~N(2,22)的一个容量为n2的样本的均值,则有
E (X 1X 2)E (X 1) E (X 2)12
2. 样本均值的标准误差小于总体标准差
3. 计算公式为
x
n
整理ppt
10
【例】设从一个均值μ=8、标准差σ=0.7的总 体中随机抽取容量为n=49的样本。要求:

第六章样本及样本函数的分布

第六章样本及样本函数的分布

∼ t(n −1). .
Sn
177
概率论与数理统计全程学习指导
∑ = ∑ 【评注】 10
1 统计量 σ 2
n
(X i

μ)2

i =1
(n −1)S2 σ2
1 σ2
n
(X i

X )2
的分布在自由度上是
i =1
∑ ∑ 1
有差别的,这是因为在 σ2
n
(X i

X )2
中有一个约束条件
X
i =1
=1 n
x(1) ≤ x(2) ≤
≤x (k)
,并假设
x( i )
出现的频数为
ni
,那么
x( i )
出现的频率为
i = 1, 2, , k, k ≤ n . 函数
fi
=
ni n

⎧ 0,

∑ Fn (x)
=
⎪ ⎨
i
fj,
⎪ j=1
⎪⎩ 1,
x < x(1),
x(i) ≤ x < x(i+1), i = 1, 2, , k −1, x ≥ x(k).
③ χ2 分布的性质
10 若 χ2 ∼ χ2 (n) ,则 E(χ2 ) = n , D(χ2 ) = 2n ;
20
(可加性)若
χ
2
1

χ2 (n1) ,
χ
2
2

χ2 (n2 )
,且
χ
2
1

χ
2
2
相互独立,则
χ
2
1
+
χ
2

概率论 第六章 样本及抽样分布

概率论 第六章 样本及抽样分布
函数Fn(x)为 Fn(x)=S(x)/n , -∞<x< +∞。
一般,设 x1,x2, …,xn 是总体F的一个容 量为n的样本值,先将x1,x2, …,xn 按自小到 大的次序排列,并重新编号,设为
x(1) ≤x(2) ≤…≤x(n) 则经验分布函数Fn(x)的观察值为
0,
若x x(1) ,
性质:
(1) limf (t)
1
e ; t2 2
n
2
(2)当n 45时 取t (n) Z .
(三)设X~2(n1), Y~ 2(n2), 且X 与Y相互独立,则随机变量
F X/ n1 Y / n2
则称F服从第一自由度为n1,第二自由 度为n2的F分布,记作
F~F(n1 ,n2)
F分布的分布密度为
2 2
E( X 2 ) D( X ) (E( X ))2
2 2
n
E(S 2 )
E[ 1 n 1
n i 1
(Xi
X
)2 ]
E[
1
n
(
n 1 i1
X
2 i
2
n X )]
1
n
E(
n 1 i1
X
2 i
nX
2
)
1 [E( n 1
n i 1
X
2 i
)
E(n X
2
)]
1[ n 1
n i 1
考察某厂生产的电容器
的使用寿命。在这个试验 中什么是总体,什么是个 体。
解 个体是每一个电容器 的使用寿命;总体X是各个 电容器的使用寿命的集合。
2. 样本
为推断总体分布及各种特征,按一定规 则从总体中抽取若干个体进行观察试验,以 获得有关总体的信息,这一抽取过程称为 “抽样”,所抽取的部分个体称为样本. 样 本中所包含的个体数称为样本容量.

统计学第六章抽样和抽样分布

统计学第六章抽样和抽样分布

2021/3/4
统计学第六章抽样和抽样分布
4
一、总体与样本
▪ 把握两个问题: ▪ 1、总体和总体参数; ▪ 2、样本和样本统计量。
2021/3/4
统计学第六章抽样和抽样分布
5
1、总体与总体参数
(1)总体:指根据研究目的确定的所 要研究的同类事物的全体,是所要说 明其数量特征的研究对象。按所研究 标志性质不同,分为变量总体和属性 总体,分别研究总体的数量特征和品 质特征。 构成总体的个别事物(基本单元 )就是总体单位,也称个体。总体单 位的总数称为总体容量,记作N。
缺点:受主观影响易产生倾向性误差; 不能计算、控制误差,无法说明调查结果 的可靠程度。
抽样一般都是指概率抽样。
2021/3/4
统计学第六章抽样和抽样分布
15
2、重复抽样和非重复抽样
(1)重复抽样:又称重置抽样,是指从总体 中抽出一个样本单位,记录其标志值后,又将 其放回总体中继续参加下一轮单位的抽取。特 点是:第一,n个单位的样本是由n次试验的结 果构成的。第二,每次试验是独立的,即其试 验的结果与前次、后次的结果无关。第三,每 次试验是在相同条件下进行的,每个单位在多 次试验中选中的机会(概率)是相同的。在重复 试验中,样本可能的个数是 N n ,N为总体单位 数,n为样本容量。
2021/3/4
统计学第六章抽样和抽样分布
16
2、重复抽样和非重复抽样
(2)非重复抽样:又称为不重置抽样,即每次从
总体抽取一个单位,登记后不放回原总体,不参加下
一轮抽样。下一次继续从总体中余下的单位抽取样本
。特点是:第一,n个单位的样本由 n 次试验结果构成
统计学第六章抽样和抽样分 布
第六章 抽样与抽样分布

样本及抽样分布

样本及抽样分布

样本及抽样分布§6.1 基本概念一、总体:在统计学中, 我们把所研究的全部元素组成的集合称作母体或总体, 总体中的每一个元素称为个体。

我们只研究感兴趣的某个或者几个指标(记为X),因此把这些指标的分布称为总体的分布,记为X~F(x)。

二、样本:设总体X具有分布函数F(x),若X1, X2,…,Xn是具有分布函数F(x)的相互独立的随机向量,则称其为总体F(或总体X )的简单随机样本, 简称样本,它们的观察值x1,x2, …, xn称为样本观察值, 又称为X 的n 个独立的观察值。

三、统计量:设X 1, X 2, …, X n 是来自总体X 的一个样本, g (X 1, X 2, …, X n )是一个与总体分布中未知参数无关的样本的连续函数,则称g (X 1,X 2,…,X n )为统计量。

统计量是样本的函数,它是一个随机变量,如果x 1, x 2, …, x n 是样本观察值, 则g (x 1, x 2, …, x n )是统计量g (X 1, X 2, …, X n )的一个观察值.四、 常用的统计量:, ,)(x 11s ,,x 1x 1. n12i2n1i 称为样本方差均值仍称为样本它们的观察值为∑∑==--==i i x n n .B ,,1,2,X A ,1k 2.22221S S nn B k ≈-====当样本容量很大时时当时当3.kkkk若总体X 的k 阶矩E(X )存在,则当n时, A .P注:ni i 111. X X ;n ==∑样本均值2n 2i i 112. S (X );n-1X ==-∑样本方差n kk i 113. k A X , k 1, 2,;n i ===∑样本阶原点矩nk i i 114. k B (X ) , k 2, 3,.n k X ==-=∑样本阶中心矩4.样本的联合分布:2) 若总体X 是离散型随机变量,其分布律为 p x =P (X=x ) , x=x 1,x 2,… 则样本X 1, X 2, …, X n 的联合分布:11112(,,)(),,;(1,2,,)nn n i i i i P X y X y P X y y x x i n =======∏其中12n *12i 13)(), ,X , (, ,)()n n i X f x X X f x x x f x ==∏若具有概率密度则的联合概率密度为12121211)(),,,,, ,,,:()()n n n*n i i X ~F x X X X F X X X F x , x ,x F x ==∏若为的一个样本则的联合分布函数为例1:X~U (0,θ),X 1, X 2, …, X n 是来自X 的样本,求(X 1, X 2, …, X n )的联合密度函数。

概率论与数理统计-第六章

概率论与数理统计-第六章
大街上随机抽取200人,进行调查。记录了
这200人的年龄数据。
总体:北京市民的年龄 随机变量:年龄X
个体:张三28岁;李四5岁;
样本:{ 28;5;14;56;23;2;39;…;69} 样本容量:200
抽样:随机抽取200人进行调查的过程
6
例2:为了确定工厂生产的电池电量分布情况,在
产品中随机抽取500个,测量其电量。记录了
x
0
F n1 , n2
F分布的分位数
x
F分布的上α分位点
对于给定的 , 0 1, 称满足条件
F n1 , n2
f x; n1 , n2 dx 的点F n1 , n2
为F n1 , n2 分布的上 分位数。F n1 , n2 的值可查F 分布表
17
不易计算!
18
抽样分布 —— 任意统计量 Q = g (X1, X2, …, Xn ) 的分布函数 抽样分布的计算: 多维随机变量(独立、同分布)的函数的分布 函数的计算问题。
得到统计量 Q 的抽样分布,就可以用来解决
关于总体 X 的统计推断问题。
19
关于随机变量独立性的两个定理
解:(1)作变换 Yi
显然Y1 , Y2 ,
2 n i 1
Xi
, Yn相互独立,且Yi N 0,1 i 1, 2,
Xi

i 1, 2,
,n
,n
于是 (

) Yi 2 2 n
2 i 1
28
n
(2)
2 ( X X ) X1 X 2 ~ N (0, 2 2 ), 1 2 2 ~ 2 (1) 2

《样本及其抽样分布》课件

《样本及其抽样分布》课件
阶段可采用不同的抽样方法。
特点
第一阶段采用简单随机抽样,后 一阶段采用系统抽样或分层抽样

适用范围
适用于大规模、多阶段的复杂调 查。
03
抽样分布
抽样分布的定义
抽样分布
描述样本统计量(如均值、中位数、众数等)如 何分散和变化的分布。
样本统计量
从样本中计算得出的数值,用于估计总体参数。
总体参数
描述总体特性的数值,如总体均值、总体比例等 。
中心极限定理的应用
中心极限定理表明,无论总体分布是什么,只要样本容量足够大,样本均值的分布 就会趋近于正态分布。
在实际应用中,中心极限定理用于推断总体参数,通过样本均值来推断总体均值和 总体标准差。
中心极限定理是统计分析中重要的理论基础之一,它为样本均值的分布提供了理论 支持。
样本均值的分布近似正态分布
有效性
如果样本统计量的方差最小,则该统计量是有效 的。
3
一致性
随着样本量的增加,样本统计量逐渐接近总体参 数。
04
样本统计量
样本均值
定义
样本均值的计算公式为 $bar{x} = frac{1}{n}sum_{i=1}^{n} x_i$,其中 $n$ 是样本容量 ,$x_i$ 是每个样本观测值。
意义
样本均值代表了样本数据的集中趋势和平均水平。
应用
在统计分析中,样本均值常用于推断总体均值,是描述数据分布特性的重要统计量之一。
样本方差和标准差
定义
01
样本方差的计算公式为 $s^2 = frac{1}{n}sum_{i=1}^{n} (x_i -
bar{x})^2$,标准差的计算公式为 $s = sqrt{s^2}$。

概率论第六章样本及抽样分布

概率论第六章样本及抽样分布
2 1 2 2
本相互独立,记
1 n1 X Xi n1 i 1 1 n2 Y Yi n2 i 1
则有 ⑴
2 1 2 2 2 1 2 2
1 n1 S12 ( X k X )2 n1 1 k 1 1 n2 2 S2 (Yk Y ) 2 n2 1 k 1
S / ~ F (n1 1, n2 1) S /
⑵ 当 时
2 1 2 2 2
X Y ( 1 2 ) ~ N (0,1) 1 1 n1 n2
(n1 1) S12

2 1

2 (n2 1) S2

2 2
~ 2 (n1 n2 2)
X Y ( 1 2 ) ~ t (n1 n2 2) 1 1 S n1 n2
2
又因为
(n 1)S 2

2
~ (n 1)
2
X n1 X n
故 Y

(n 1) S 2
n n 1 ~ t (n 1) /(n 1)

2
X n1 X n Y S
n ~ t (n 1) n 1
例4
设总体X , Y 相互独立 X ~ N (0,32 ) , Y ~ N (0,32 ) ,
2
X n1 X n n X 1 , X 2 ,, X n , X n1 , 求 Y 的分布 . S n 1 1 n 1 n 2 2 其中 X n X i , S ( Xi X n ) n i 1 n 1 i 1
1 2 解 由已知得 X n1 ~ N ( , ) , X n ~ N ( , ) , n n 1 2 所以 X n1 X n ~ N (0, ) n n 标准化得 X n1 X n ~ N (0,1) n 1

(完整版)样本及抽样分布

(完整版)样本及抽样分布

第六章样本及抽样分布【基本要求】1、理解总体、个体和样本的概念;2、理解样本均值、样本方差和样本矩的概念并会计算;3、理解统计量的概念,掌握几种常用统计量的分布及其结论;4、理解分位数的概念,会计算几种重要分布的分位数。

【本章重点】样本均值、样本方差和样本矩的计算;抽样分布——2 分布,t分布,F分布;分位数的理解和计算。

【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。

【学时分配】4学时【授课内容】§6.0 前言前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一门数学分支。

它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性;而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的一门数学分支。

所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来选择、构造数学模型(即研究随机现象)。

其研究方法是归纳法(部分到整体)。

对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。

数理统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。

§6.1 随机样本一、总体与样本1.总体、个体在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。

例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每个男大学生就是个体。

但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几项数量指标X(可以是向量)和该数量指标X在总体的分布情况。

在上述例子中X是表示灯泡的寿命或男大学生的身高和体重。

在试验中,抽取了若干个个体就观察到了X的这样或那样的数值,因而这个数量指标X是一个随机变量(或向量),而X的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。

贾俊平统计学第六章 抽样分布

贾俊平统计学第六章 抽样分布
σ =10
n=4 σx = 5 n =16 σ x = 2.5
µ = 50
X
µx = 50
X
总体分布
抽样分布
中心极限定理
(central limit theorem)
中心极限定理: 中心极限定理:设从均值为µ,方差为σ 2的一个任意总 体中抽取容量为n的样本, 充分大时, 体中抽取容量为n的样本,当n充分大时,样本均值的抽 样分布近似服从均值为µ 方差为σ 样分布近似服从均值为µ、方差为σ2/n的正态分布
解:根据中心极限定理,样本容量>30,可视 为样本均值近似服从正态分布。
样本均值的抽样分布与中心极限定理 (例题分析)
因此知,样本均值服从:
0.62 X~N ( µ , σ 2 n ) = N 10, = N (10, 0.01) 36 (1) P X <9. = P X − 10 < 9.9 − 10 9) ( 0.1 0.1
6.1 统计量
1. 统计量的概念 2. 常用的统计量
统计量的概念
定义:
设X1,X2,……,Xn是从总体X中抽取的样本容 量为n的一个样本,如果由此样本构造一个函数 T(X1,X2,……,Xn),不依赖任何未知参数, 则称行数T(X1,X2,……,Xn)是一个统计量。 统计量是样本的函数 统计量不依赖任何未知总体参数 根据具体样本的观测值x1,x2,……,xn带入统 计量函数,计算出来的值是一个具体的统计量 的值。
0.1 0 1.0 1.5 2.0 2.5 3.0 3.5 4.0 X 0.3 0.2 P (X )
样本均值的抽样分布 3.0 3 3.5 2 4.0 1
均值X的取值 均值 的取值 均值X的个数 均值 的个数

第六章 样本及抽样分布

第六章 样本及抽样分布


n
i =1
X i , k = 1,2 , L
k
( 5 ) 样本 k 阶(中心)矩 中心)

n
i =1
( X i − X ) k , k = 1,2 , L
常用统计量的性质
以下约定: 表示总体的均值, 表示总体的方差, 以下约定: µ 表示总体的均值, σ 2 表示总体的方差, α k 表示 总体的 k阶原点矩, µ k 表示总体的 k阶中心矩,即记 阶原点矩, 阶中心矩, EX = µ , D ( X ) = E ( X − µ ) 2 = σ 2 EX k = α k , E ( X − µ ) k = µ k 并且约定, 并且约定,在我们用到 α(或 µ k)时,假定它是存在的 。 k 定理 1 设总体 X 服从分布 F ( x ), X = ( X 1 , X 2 , L , X n )是从该总体
第六章 样本及抽样分布
数理统计的基本概念 抽样分布
退出 返回
Байду номын сангаас
数理统计的基本概念
总体和样本 统计量 顺序统计量和经验分布函数
继续
返回
总体、 总体、个体
总体:在统计学中, 总体:在统计学中,把所研究的全部元素组成 的集合称为母体, 总体。 的集合称为母体,或总体。 个体:而把组成母体的每个元素称为个体, 个体:而把组成母体的每个元素称为个体, 个体 例如:灯泡的平均寿命, 例如:灯泡的平均寿命,该批灯泡的全体就组 成了母体,而其中每个灯泡就是个体。 成了母体,而其中每个灯泡就是个体。但是在统 计里, 计里,由于我们关心的不是每个个体的种种具体 特性,而仅仅是它的某一项或某几项数量指标X 特性,而仅仅是它的某一项或某几项数量指标 和该数量指标X在总体中的分布情况 和该数量指标 在总体中的分布情况

概率课件-样本及抽样分布

概率课件-样本及抽样分布
是来自总体的一个样本,则
(1) E( X ) E( X ) ,
(2) D( X ) D( X ) 2 n ,
n
(3) E(S 2 ) D( X ) 2
矩估計法的 理論根據
若总体X的k阶矩E( X k ) k存在,则
(4) Ak
1 n
n i 1
Xik
p k
k 1, 2,
.
(3)证明:E(S2 )
2. 樣本
• 總體分佈一般是未知,或只知道是包含未知參 數的分佈。
• 為推斷總體分佈及各種特徵,按一定規則從總 體中抽取若干個體進行觀察試驗,以獲得有關 總體的資訊,這一抽取過程稱為 “抽樣”。
• 所抽取的部分個體稱為樣本。 • 樣本中所包含的個體數目稱為樣本容量。
对总体X在相同的条件下,进行n次重复、独立 观察,其结果依次记为X1,X2,,Xn .
概率論與數理統計的區別: • 概率論所研究的隨機變數,其分佈都是假設已知
的,在這個前提下研究其性質、特點和規律性。 • 數理統計所研究的隨機變數,其分佈是未知或不
完全知道的。需要通過獨立重複的觀察並對觀察 數據進行分析,來推斷其分佈。
數理統計的任務就是研究有效地收集、整理、 分析所獲得的有限的資料,對所研究的問題, 盡 可能地作出精確可靠的結論.
Y ( X1 X2 X3 )2 ( X4 X5 X6 )2
试决定常数C,使随机变量CY 服从 2分布.
解: 因为 X1 X2 X3 ~ N (0,3) 所以 X1 X2 X3 ~ N (0,1) 3
从而
X1
X2 3
X3
2
~
2 (1)
同理可知
X4
X5 3
X6
2

样本及其抽样分布PPT课件

样本及其抽样分布PPT课件
总体
等同于
相应的随机变量
研 究 对 象体现为 研 究 对 象 的 某 项 数可 看 作 某 个 随 机 变 量
的全体
量指标值的全体
取值的全体
第1页/共23页
样本: 由部分个体构成的集合。经常说,来 自(或取自 )某总体的样本。
样本具有二重性: 在抽样前,它是随机向量, 在抽样后,它是数值向量(随机向量的取值)。
例6.3.3 设 N (0,4) 的s.r.s,
是取自总体
当a=
, b=
时,
解(1)服从 2(n)(2)由题意得
a =1/20 b=1/100
第9页/共23页
3. 2(n)的密度曲线
f(x) n=1 n=4
n=10 X
随着n的增大,密度曲线逐渐趋于平缓,对称.
第10页/共23页
五、t 分布及其性质
X
是样本均值,则有
X
~
N
,
2 n
注:在大样本情况下,无论总体服从何种分布均有
X
~
N ,
2 n
第7页/共23页
二、 2分布及其性质
1.定义: 称 n 个相互独立同标准正态分布的随机变量的平方和X的分布为自由度为n的
分布,记作
2.性质:
X ~ 2(n)
(1) X 1,X2,…Xn独立,Xi~N(0,1),(i=1,2,…,n),则
1
t2
e2
2
(2)
n
E(T) 0, D(T)
(n 2)
n2
(3) h(t)的图形关于Y轴对称
第13页/共23页
例6.3.6
设随机变量 X 和 Y 相
互独立且都服从正态分布

概率论与数理统计6.第六章:样本及抽样分布

概率论与数理统计6.第六章:样本及抽样分布

),
,
,
,
是来
Z=
(

证明统计量 Z 服从自由度为 2 的 t 分布。
14
),
,
,
,
是来 , .ຫໍສະໝຸດ 自 总 体 X 的 样 本 , E( ) 则 ,D( )=
是来自总体 X ,D(X)= . ,
,D( )=
11
3. 设 , 本 ,E(X)=
, , 为来自总体 X 的样 ,D(X)=9, 为样本均值 , 试用 < ≥ ,
切比雪夫不等式估计 P{ P{ 4.设 , 则当 K= > ≤ , , . 是总体 X
lim f (t ) (t )
n
1 e 2
t2 2
, x
3.分位点 设 T~t(n), 若对 :0<<1,存在 t(n)>0,
4
满足 P{Tt(n)}=, 则称 t(n)为 t(n)的上侧分位点 注: t1 (n) t (n) 三、F—分布 1.构造 若 1 ~2(n1), 2~2(n2),1, 2 独立,则
y0
2. F—分布的分位点 对于 :0<<1,若存在 F(n1, n2)>0, 满足 P{FF(n1, n2)}=, 则称 F(n1, n2)
5
为 F(n1, n2)的上侧 分位点; 注: F1 (n1 , n2 )
1 F (n2 , n1 )
§ 6.3 正态总体的抽样分布定理
X Y /n ~ t ( n)
t(n)称为自由度为 n 的 t—分布。 t(n) 的概率密度为
n 1 ) 1 t 2 n2 2 f (t ) (1 ) , t n n n ( ) 2 (
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
联合概率函数为 n f (x1, x2 ,, xn) f (xi ) i 1
设 X1, X2,, Xn为来自总体 X ~ N (, 2 ) 的样本,
则样本的联合密度为
n
f (x1,, xn )
i 1
1
2
e (xi )2 2 2
(
1
2 )n
e
1 2
2
i
n
( 1
xi
)2
设 X1, X 2 ,是,来X n自总体
组限 12.5~129.5 129.5~134.5 134.5~139.5 139.5~144.5 144.5~149.5 149.5~154.5 154.5~159.5
频数 1 4 10 33 24 9 3
频率 0.0119 0.0476 0.1191 0.3929 0.2857 0.1071 0.0357
二 箱线图
定义 设有容量为n的样本观测值x1,x2,...,xn , 样本 p分位数(0 p 1)记为x p ,它具有以下的性质: (1)至少有np个观测值小于或等于x p;
(2)至少有n(1 p)个观测值大于或等于x p
求P分位数法则
(1)将x1 ,x2 ,...,xn 按自小到大的次序排列;
未分组数据—多批数据箱线图 (例题分析)
105 95 85 75 65 55 45
英语 经济数学 西方经济学 市场营销学 财务管理 基础会计学
统计学 计算机应用基础
8门课程考试成绩的箱线图
Min-Max 25%-75% Median value
未分组数据——多批数据箱线图 (例题分析)
105
95
生的成绩都在全班平均成绩 的附近波动,所以总体可视为 X ~ N( , 2 ).
考察某工厂生产的某批灯泡的寿命 因X为, 每个灯泡
的寿命都在该批灯泡平均寿命 的附近波动,所以总体可 视为 X ~ N( , 2 ).
考察某工厂生产的零件是否合格,记
0, 零件合格
X
1,
零件不合格
则总体可视为 X ~ b(1, p), p为零件的次品率.
1 2
(123
132)
127.5
Min 102, Max 150,作出箱线图如图所示
102 113.5 120
120 150
分布的形状与箱线图
QL 中位数 QU
QL 中位数 QU
QL 中位数 QU
左偏分布
对称分布
不同分布的箱线图
右偏分布
箱线图适合比较两个或两个以上数据集的性质
【例】 从某大
学经济管理专 业二年级学生 中 随 机 抽 取 11 人,对8门主 要课程的考试 成绩进行调查 ,所得结果如 表。试绘制各 科考试成绩的 批比较箱线图 ,并分析各科 考试成绩的分 布特征
对长度为 的工件进行了6次测量,测量值为
29.1, 30.2, 29.3, 29.1, 30.3, 29.5
总体为工件长度
X ~ NN((30, 2 )
样本容量为6,样本为 X1, X2, X3, X4, X5, X6
样本观察值为 29.1, 30.2, 29.3, 29.1, 30.3, 29.5
课程名称
英语 经济数学 西方经济学 市场营销学 财务管理 基础会计学 统计学 计算机应用基础
11名学生各科的考试成绩数据 学生编号
1 2 3 4 5 6 7 8 9 10 11
76 90 97 71 70 93 86 83 78 85 81 65 95 51 74 78 63 91 82 75 71 55 93 81 76 88 66 79 83 92 78 86 78 74 87 85 69 90 80 77 84 91 74 70 68 75 70 84 73 60 76 81 88 68 75 70 73 92 65 78 87 90 70 66 79 68 55 91 68 73 84 81 70 69 94 62 71 85 78 81 95 70 67 82 72 80 81 77
n
(
Xi
)2
,
i 1
max{ X i }
1i n
为什么要求统计量不含任何未知参数
试验前 g(X1, X2 ,是, 随Xn机) 变量 试验后 g(X1, X2 ,是, 具Xn体) 的数值
与均值和方差 有什么不同?
X
1
n
n
i 1
Xi
为什么不是
1 n
(下章说明)
S2
1
n1
n
(Xi
i 1
X
)2
S
S2
例3 以下是8个病人的血压(收缩,mmHg)数据(已经 排序),试做出箱线图
102 110 117 118 122 123 132 150

因np
8 0.25
2, 故Q1
1 2
(110
117)
113.5
因np
8
0.5
4, 故Q0.5
Q2
1 2
(118
122)
120
因np
8
0.75
6,
故Q0.75
Q3
(2)若np不是整数,只有一个数满足定义要求。 即位于[np] 1处的数;
(3)若np为整数,有两个数 x(np)、x(np1)满足定义要求, 取x p 12[ x(np) x(np1)]
例2: 设有一组容量为18的样本值如下(已经过排序) 122 126 133 140 145 145 149 150 157 162 166 175 177 177 183 188 199 212
小时. 试问该批元件是否达到了要求?
这些问题都是统
计推断问题
第六章 样本及抽样分布
什么是实验数据
科学试验,或对某事物、现象进行观察获得的数据称为 试验数据
特点:数据受随机因素的影响
处理实验数据的过程 收集、整理、分析、推断
《数理统计》围绕这 四个过程来进行研究
如何收集和整理数据
本节将研究“收集”和“整理”数据的数学含 义
一 直方图
为了研究总体分布的性质,人们通过实验得到许 多观测值,一般来说这些数据实杂乱无章的,为了利 用它们进行统计分析,将这些数据加以整理,还借助 于表格或图形对它们加以描述。
例1:下面列出了84个伊特拉斯坎(Etruscan)人男子的 头颅的最大宽度(mm),现在来画这些数据的“频率直 方图”
解 首先整理数据,
数据的最大值、最小值分别为126、158, 即所有数据落在区间[126,158]上,现取区间 [124.5,159.5],它能覆盖区间[126,158],
将区间[124.5,159.5]等分为7个小区间, 小区间的长度记为△,△=(159.5-124.5)/7=5, △称为组距,小区间的端点称为组限, 数出落在每个小区间内的数据的频数fi, 出频率fi/n,如下表:
累积频率 0.0119 0.0595 0.1786 0.5715 0.8572 0.9524 1
现在自左至右依次在各个小区间上作以 fi / 为高的小
n
矩形, 这种图行叫频率直方图
0.0119 / 5 0.00328 0.0476 / 5 0.00952 0.1191/ 5 0.02382
的X 样~ F本(x)
X1, X2,, Xn 是一堆“杂乱无章”的数据 X1, X2,, Xn 包含了有关总体的“信息” X1, X2,, Xn 是对总体进行推断的依据
在观察前 X1, X2,是, 一Xn组独立同分布r.v 在观察后 x1, x2,是, 一xn 组具体的数据
样本的联合分布为
n
F (x1, x2 ,, xn) F(xi) i 1
某厂生产了一大批灯泡,现从中随机抽取5只进行检测, 测得其寿命(小时)分别为
980, 960, 1030, 1300, 850
总体为灯泡的寿命
X ~ N(, 2)
样本容量为5,样本为 X1, X 2 , X 3, X 4 , X5
样本观察值为 980, 9称为总体 总体中的一个具体对象称为个体 考察某班级学生的英语课程学习成绩,则全体学生构 成了一个总体,每个同学就是一个个体. 考察某工厂生产的某批灯泡的寿命,则该厂生产的该 批灯泡构成了一个总体,每个灯泡就是一个个体.
不符合总不数体是学:这研研研样究究究定它的对义们特象的点的总-数-体-量抽和指象个标体而X是是~具F研体(x究)的数对量象指,标 个体: r.v X的这值些数量指标是服从某种分布的r.v
总体
个体
特征
一批产品 一批灯泡 一年的日平均气温
数轴上某一线段
每件产品 每个灯泡 每天日平均气温
线段中每一点
等级 寿命 度数
坐标
一批彩票
每张彩票
号码
人们感兴趣的是总体的某一个或几个数量指标的分布 情况。每个个体所取的值不同,但它按一定规律分布。
以随机变量X代表总体的特征
考察某班级学生的英语课程学习成绩 因X为, 每个学
1
n1
n
(Xi
i 1
X
)2
Ak
1
n
n
X
k i
(k 1, 2,)
i 1
Bk
1
n
n
(Xi
X
)k
(k 1, 2,)
i 1
X(1) min{X1, X2,, Xn}
箱线图
数据集的箱线图是由箱子和直线组成的图形,它是
基于以下5个数的图形概括:
最小值Min
第一四分位数Q1
第三四分位数Q3 最大值Max
中位数M
连接两个四分(位)数画出箱子,并画出中位
数再将两个极值点与箱子相连接
Min Q1
相关文档
最新文档