统计量及其分布
统计量及其分布
样本均值的抽样分布 (例题分析)
【例】设一个总体含有4 个个体,分别为X1=1、X2=2、 X3=3 、X4=4 。总体的均值、方差及分布如下。
总体均值和方差
总体的频数分布
X
i 1
N
i
N
N
2.5
2
2 ( X ) i i 1
0.02 0 2 1 0.1
21 Φ0.2
0.8414
(4) 样本 k 阶(原点)矩
1 n k Ak X i , k 1, 2, ; n i 1
1 n k 其观察值 k x i , k 1, 2, . n i 1
n n 1 2 1 2 2 E( S ) E X i nX (Xi X ) E n 1 i 1 n 1 i 1
2
1 n 2 2 E ( X i ) nE ( X ) n 1 i 1 2 1 n 2 2 2 ( ) n 2 n 1 i 1 n
n
k 1
n
2
2
n
,
定理 设总体X的期望E(X) = ,方差D(X) = 2,X1, X2,…,Xn为总体X的样本, X,S2分别为样本均值 和样本方差,则
E( X ) E( X )
D( X ) 2 D( X ) n n
E( S 2 ) D( X ) 2
思考:在分组样本场合,样本均值如何计算? 二者结果相同吗?
x1 f1 x n f n 其中 x n
《概率论与数理统计》统计量及其分布
但数理统计以概率论为基础,更着重于根据试验得
到的数据来对研究对象的客观规律作出种种合理的估
计和判断.
4
第5章
统计量及其分布
数
描述统计学
理
对随机现象进行观测、试验, 以取得有代表
统
性的观测值.
计
的
推断统计学
分
对已取得的观测值进行整理、分析, 作出推
类
断、决策,从而找出所研究的对象的规律性.
O
5
n 10
10
15
20
x
32
01
抽样分布
2. t 分布
2
X
~
N
(0,1)
,
Y
~
x
(n),且X与Y 独立,则
设随机变量
X
T
Y /n
服从自由度为n的t分布,记为t(n).
性质 密度f(t)是偶函数,且t分布的极限分布是标准正
态分布.
33
01
抽样分布
t分布的密度函数
n 1
n 1
那么如何来利用样本呢?
列表?
画图?
统计量!
样本来自于总体,含有总体性质的信息,但较为分
散. 为了进行统计推断,需要把分散的信息进行整理,
针对不同的研究目的,构造不同的样本函数,这种函
数在统计学中称为统计量.
18
本讲内容
01
总体与个体
02
样本
03
统计量
03
统计量
3.统计量
统计量——不含有未知参数的样本函数
f ( x)
n1
n2
x
第6章-统计量及其抽样分布
对应于每个数值的相对出现频数排成另一列, 由此,全部可能的样本统计量值形成了一个概 率分布,这个分布就是我们想要得到的抽样分 布。
样本均值的抽样分布 与中心极限定理
当总体服从正态分布N(μ,σ2)时,来自该总体的所有 容量为n的样本的均值x也服从正态分布,x 的数
1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
样本均值的抽样分布
所有样本均值的均值和1.0 1.5 4.0 16
2.5 m
n
(xi mx )2
s
2 x
i 1
M
M为样本数目
(1.0 2.5)2
(4.0 2.5)2
s2
0.625
16
n
1. 样本均值的均值(数学期望)等于总体均值 2. 样本均值的方差等于总体方差的1/n
从检查一部分得知全体。
复习 抽样方法
抽样方式
概率抽样
非概率抽样
简单随机抽样 整群抽样
多阶段抽样
分层抽样 系统抽样
方便抽样 自愿样本 配额抽样
判断抽样 滚雪球抽样
6.2.1 抽样分布 (sampling distribution)
1. 样本统计量的概率分布,是一种理论分布
在重复选取容量为n的样本时,由该统计量的所有可 能取值形成的相对频数分布
2. 随机变量是 样本统计量
样本均值, 样本比例,样本方差等
3. 结果来自容量相同的所有可能样本
4. 提供了样本统计量长远而稳定的信息,是进行推 断的理论基础,也是抽样推断科学性的重要依据
抽样分布的形成过程 (sampling
distribution)
统计量及其分布
思考题
设 X1, X2 , … , Xn 是取自正态总体 N (, 2 ),
的一个样本,求 E( XS 2 ) ?
定理 2 设 X1, X2 , … , Xn 是取自正态总体 N (, 2 )
的样本,X 和S 分别为样本均值和样本均方差,则有
1) X ~ N(0, 1); / n
2) X ~ t(n 1).
nx 2 ];
③ s
1 n 1
n i 1
( xi
x )2
;
④
ak
1 n
n i 1
xik ,
k 1, 2
;
⑤ bk
1 n
n
(xi x )k ,
i 1
k
1, 2
.
例1 设总体X 的期望为 E(X ) , 方差为 D(X ) 2 其样本为 X1, X2, , Xn , 求E(X ), D(X ), E(S 2) .
为t分布的上 分位点。
t1 (n) t (n)
若 0.5,直接查表;若 0.5, t (n) t1 (n).
当 n 45 , t (n) z .
(3) F-分布
设随机变量X与Y相互独立,且 X ~ 2 (n1), Y ~ 2 (n2 ),
则随机变量
F
X Y
/ n1 / n2
所服从的分布是自由度为 (n1, n2 )
~
F (2,
2)
作 业 17
P137: 4 P147: 4
1.6664.
解:因为
(n 1)
2
S
2
~ 2(n 1)
15S 2
2
~ 2(15)
P
S
2 2
1.6664
统计量及其分布教案
统计量及其分布教案教案标题:统计量及其分布教案一、教学目标:1. 理解统计量的概念并能正确区分常用的统计量。
2. 了解和掌握统计量的计算方法与应用。
3. 掌握统计量的分布特征及其在统计推断中的应用。
二、教学内容:1. 统计量的概念:a. 定义和目的:统计量用于对样本数据进行总结和描述,并从中推断总体特征。
b. 常用统计量的举例:均值、中位数、众数、方差等。
2. 统计量的计算方法:a. 样本均值的计算方法及应用。
b. 样本方差的计算方法及应用。
c. 样本标准差的计算方法及应用。
3. 统计量的分布特征:a. 正态分布的性质和应用。
b. t 分布的概念和特点。
c. 卡方分布的定义和用途。
4. 统计量在统计推断中的应用:a. 点估计和区间估计的概念和方法。
b. 假设检验的基本思想和步骤。
c. 统计量在假设检验中的作用和应用。
三、教学步骤:1. 导入部分:a. 引入统计量的概念及其在实际生活中的应用背景。
b. 师生互动讨论,学生提出对于统计量的初步理解和疑问。
2. 理论讲解:a. 通过例子和图表展示统计量的不同计算方法和应用。
b. 解答学生提出的问题,确保学生对统计量的概念和计算方法有清晰的理解。
3. 练习与实践:a. 基于实际数据,让学生进行统计量的计算和分析。
b. 学生小组合作讨论并展示各自的计算结果及分析。
c. 教师针对学生的计算过程和结果给予指导和评价。
4. 拓展和应用:a. 引导学生思考统计量在各个学科领域的应用情况。
b. 鼓励学生进行小研究,探索在实际问题中如何选择合适的统计量进行分析。
四、教学评价:1. 学生练习和实践的成果,包括计算的准确性和分析的合理性。
2. 学生对于统计量概念和计算方法的理解程度。
3. 学生对于统计量在实际问题中应用的思考和创造力。
五、教学资源:1. PowerPoint 或其他展示工具。
2. 统计软件或计算器。
3. 实际问题的数据材料。
六、教学延伸:1. 统计量的更高级应用:如方差分析、回归分析等。
统计学6
6 - 33
经济、管理类 基础课程
统计学
三、样本方差的分布
6 - 34
经济、管理类 基础课程
统计学
(一)样本方差的分布
设总体服从正态分布N 设总体服从正态分布N ~ (µ,σ2 ), X1,X2,… ,Xn为来自该正态总体的样本,则样本方差 为来自该正态总体的样本, s2 的分布为
(n −1)s
2
2. 3.
,则
Z=
X −µ
令 Y = Z 2 ,则 Y 服从自由度为1的χ2分布,即 服从自由度为1 分布,
σ
~ N(0,1)
Y ~ χ (1)
2
4.
当总体 X ~ N(µ,σ 2 ) ,从中抽取容量为n的样本,则 从中抽取容量为n的样本,
样 本 6 - 10
经济、管理类 基础课程
(三)抽样分布
(sampling distribution) distribution)
统计学
1. 样本统计量的概率分布 2. 是一种理论概率分布 3. 随机变量是 样本统计量
样本均值, 样本均值, 样本比例,样本方差等
4. 结果来自容量相同的所有可能样本 结果来自容量相同的所有可能样本 5. 提供了样本统计量长远我们稳定的信息,是进 行推断的理论基础,也是抽样推断科学性的重 要依据
总体分布、样本分布、抽样分布
三、渐进分布和近似分布
6-3
经济、管理类 基础课程
统计学
一、统计量
(一)统计量的概念 • 是样本的特征值 • 设X1 , X2 ,…, Xn是从总体中抽取的容量 为n的一个样本,如果由此样本构造一 个函数T 个函数T( X1 , X2 ,…, Xn ),不依赖于 任何未知参数,则称函数T 任何未知参数,则称函数T( X1 , X2 ,…, Xn )是一个统计量。
统计学第二章-统计量及其分布-重点难点归纳及答案解析
统计量及其分布习题知识点精析与应用一、填空题(将正确答案的序号填在括号内,共5小题,每小题2分,共10分)1、简单随机抽样样本均值X 的方差取决于 和_________,要使X 的标准差降低到原来的50%,则样本容量需要扩大到原来的 倍。
2、设1217,,,X X X 是总体(,4)N μ的样本,2S 是样本方差,若2()0.01P S a >=,则a =____________。
(注:20.99(17)33.4χ=, 20.995(17)35.7χ=, 20.99(16)32.0χ=, 20.995(16)34.2χ=)3、若(5)X t ,则2X 服从_______分布。
4、已知0.95(10,5) 4.74F =,则0.05(5,10)F 等于___________。
5、中心极限定理是说:如果总体存在有限的方差,那么,随着 的增加,不论这个总体变量的分布如何,抽样平均数的分布趋近于 。
,二、选择题(将正确答案的序号填在括号内,共5小题,每小题2分,共10分)1、中心极限定理可保证在大量观察下A 样本平均数趋近于总体平均数的趋势B 样本方差趋近于总体方差的趋势C 样本平均数分布趋近于正态分布的趋势D 样本比例趋近于总体比例的趋势2、设随机变量()(1)X t n n >,则21/Y X =服从21/Y X = 。
A 正态分布B 卡方分布C t 分布D F 分布3、根据抽样测定100名4岁男孩身体发育情况的资料,平均身高为95cm ,,标准差为0.4cm 。
至少以 的概率可确信4岁男孩平均身高在93.8cm 到96.2cm 之间。
A 68.27%B 90%C 95.45%D 99.73%4、某品牌袋装糖果重量的标准是(500±5)克。
为了检验该产品的重量是否符合标准,现从某日生产的这种糖果中随机抽查10袋,测得平均每袋重量为498克。
下列说法中错误的是( )A 、样本容量为10B 、抽样误差为2C 、样本平均每袋重量是统计量D 、498是估计值5、设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本平均数的分布都是服从或近似服从A (100/,25)N nB NC (100,25/)N nD (100,N 三、判断题1、所有可能样本平均数的方差等于总体方差。
(概率论与数理统计 茆诗松) 第5章 统计量及其分布(5.4)
当随机变量 2 2(n) 时,对给定 (01), 称满足 P(2 12(n)) 的 12(n) 是自由度为 n1的卡方分布的 1 分位数. 分位数 12(n) 可以从附表3 中查到。
P{ X
2 1
(n)} ,
该密度函 数的图像 是一只取 非负值的 偏态分布
E 2 n, Var( 2 ) 2n
习题5.4:
Q4
5.4.2 F 分布
定义5.4.2 设X1 2(m), X2 2(n), X1与X2独立, 则称 F =(X1/m)/(X2/n) 的分布是自由度为 m 与 n 的 F分布,记为F F(m, n),其中m 称为分子自 由度,n 称为分母自由度。
t ( n)
t
(n)
当随机变量t t(n) 时,称满足 P(t t1(n)) =1 的 t1(n) 是自由度为 n 的 t 分布的1分位数. 分位数 t1(n) 可以从附表4中查到。 譬如 n=10,=0.05,那么从附表4上查得
t10.05(10) = t0.95(10)=1.812 . 由于 t 分布的密度函数关于0 对称, 故其分位数 间有如下关系
~ t (m n 2)
1 4 5 7 9 14 16
• n2时,t 分布的方差存在,且为n/(n2);
• 当自由度较大 (如n30) 时, t 分布可以用正态分布 N(0,1)近似。
当随机变量t t(n) 时,称满足 P(t t1(n)) =1 的 t1(n) 是自由度为 n 的 t 分布的1分位数.
注:
t (n) t1 (n)
在推论5.4.1的记号下,设 12 =22 = 2 ,
2 2 ( x x ) ( y y ) i i i 1 i 1 m n
统计量及其分布ppt课件
图5.1.1 SONY彩电彩色浓度分布图q
表5.1.1 各等级彩电的比例(%)
等级
I
|X-m|<5/3
II
III
5/3<|X-m|<10/3 10/3 <|X-m|<5
IV
|X-m|>5
美产 33.3 33.3 33.3
0
日产 68.3 27.1 4.3
0.3
抽样 :
5.1.2 样本
要了解总体的分布规律,在统计分析工作中,往往 是从总体中抽取一部分个体进行观测,这个过程称为抽 样。样本
x 344 344 x 347 347 x 351 351 x 355
x 355
由伯努里大数定律:
第25页
两点分布,只要 n 相当大,Fn(x)依概率收敛于F(x) 。
更深刻的结论:格里纹科定理
定理5.2.1 设 x1,x2,L,xn 是取自总体分布函数为F(x) 的样本F,n ( x ) 为其经验分布函数,当n 时,有
若以 p 表示这堆数中1的比例(不合格品率), 则该总体可由一个二点分布表示:
X01 P 1p p
比如:两个生产同类产品的工厂的产品 的总体分布:
例5.1.2 在二十世纪七十年代后期,美国消费者购买
日产SONY彩电的热情高于购买美产 SONY彩电,原因何在?
原因在于总体的差异上!
➢ 1979年4月17日日本《朝日新闻》刊登调查报 告指出N(m, (5/3)2),日产SONY彩电的彩色浓 度服从正态分布,而美产SONY彩电的彩色浓 度服从(m5 , m+5)上的均匀分布。
元件数 4 8 6 5 3 4 5 4
寿命范围 (192 216] (216 240] (240 264] (264 288] (288 312] (312 336] (336 360] (360 184]
统计量及其分布..
服从的分布可能是完全不知道的,或者知道其分布概
型,但是其中的某些参数是未知的。
例 5.0.1
某公司要采购一批产品,每件产品不
是合格品就是不合格品,但该批产品总有一 个不合格品率 p 。由此,若从该批产品中随 机抽取一件,用 X 表示这一件产品的不合格 数,不难看出 X 服从一个二点分布 b ( 1 , p ) , 但分布中的参数 p 是不知道的。一些问题:
表5.2.1 例5.2.2 的频数频率分布表 组序 分组区间 组中值 频数 频率 (%) 1 (147,157] 152 4 0.20 2 (157,167] 162 8 0.40 3 (167,177] 172 5 0.25 4 (177,187] 182 2 0.10 5 (187,197] 192 1 0.05 合计 20 1 累计频率 20 60 85 95 100
样;其中样本中所包含的个体数量称为样本容量。样本
中的个体称为样品。
5.1.2 样本
样本具有两重性:
• 一方面,由于样本是从总体中随机抽取的,抽 取前无法预知它们的数值,因此,样本是随机 变量,用大写字母 X1, X2, …, Xn 表示;
• 另一方面,样本在抽取以后经观测就有确定的 观测值,因此,样本又是一组数值。此时用小 写字母 x1, x2, …, xn 表示是恰当的。 在本书中,无论是样本还是其观测值,样本一般均用 x1, x2,… xn 表示,大家要注意从上下文中加以识别。
§5.1
总体与个体
在数理统计中,把研究对象的全体称为总体 (population)或母体,而把组成总体的每个单元
称为个体。
总体的三层含义:
• 研究对象的全体; • 数据; • 分布
(概率论与数理统计茆诗松)第5章统计量及其分布
统计量用于评估和 预测经济趋势例如 GDP、CPI等。
统计量用于研究经济 现象之间的相关性例 如通过回归分析探究 收入与消费的关系。
统计量用于风险评估 和决策制定例如在投 资组合优化中应用统 计量来降低风险。
统计量用于市场调研和 消费者行为分析例如通 过调查数据了解消费者 的购买意愿和偏好。
统计量用于描述大量粒子系统的宏观性质如温度、压强等。 在高能物理实验中统计量用于分析粒子碰撞数据以发现新粒子或研究基本粒子的相互作用。 在天体物理中统计量用于研究星系分布、宇宙射线等以揭示宇宙的演化历史和结构。 在凝聚态物理中统计量用于描述量子多体系统的性质如超导、量子相变等。
单击此处添加标题
性质:二项分布具有可加性即如果有两个独立的二项分布的随机变量X和Y那么 X+Y仍然服从二项分布。
单击此处添加标题
应用:二项分布在统计学、生物学、医学等领域有广泛的应用例如在遗传学中 研究基因的遗传规律在可靠性工程中研究设备的寿命等。
定义:泊松分布是一种离散概率分布描述了在单位时间内(或单位面积内)随机事件发生的次数。
适用范围:非参数检验适用于总体分布未知或已知分布不满足参数检验条件的情况能够更加灵活地处理 各种数据类型和分布。
添加标题
常见方法:常见的非参数检验方法包括符号检验、秩次检验、中位数检验等这些方法都是基于样本数据 本身的特性进行统计推断不需要对总体参数进行假设检验。
添加标题
优点与局限性:非参数检验具有适用范围广、灵活性高等优点但也存在一定的局限性如对于小样本数据 可能不太稳定等。因此在选择统计检验方法时需要根据具体情况进行综合考虑。
性
构造方法:利 用样本数据和 适当的数学方 法来构造有效
估计
应用:在统计 学、经济学、 社会学等领域
5.3统计量及其分布
例题1
现从离散均匀分布的总体中抽取容量为3的样本。 求有序统计量 x ( 1 ) , x ( 2 ) , x ( 3 ) 的分布列。 有序统计量既不相互 独立,又不同分布 X p 2 1/27 0 1/3 1 1/3 2 1/3
x(1)
p
0 19/27
1 7/27
2.单个次序统计量的分布
• • • • 定理: 设总体X的密度函数为p(x),分布函数为F(x) x1 , x 2 , L x n 为样本,则第k个次序统计量 x (k ) 的密度函数为
1.样本偏度
b3 γ1 = 2 3 b2
• 样本偏度反映了总体分布密度函数的对称性, • 当r1=0时,样本对称 • 当r1<0时,样本左尾长;当r1>0时,样本右尾长
2.样本峰度
b4 γ2 = 2 −3 b2
•样本峰度反映了总体分布密度曲线在其峰值 附近的陡峭程度。 •当r2<0时,曲线为平顶型; •当r2>0时,曲线为尖顶型 作业:268页16
2 i 2 i 2 i 2 i 2 2 i
2
2.性质
• 定理 设总体X具有二阶矩, x1 , x 2 , L x n 为总体 • 得到的样本,其中 E ( x) = µ Var ( x) = σ 2 < +∞
则E ( x) = µ
分析
2
Var ( x) =
σ
2
n
2
E (s ) = σ
2
2
1 E ( s ) = E[ ( xi − x) 2 ] ∑ n -1
四、次序统计量及其分布
• 1、定义 x • 设 x1 , x 2 ,L xn 是取自总体X的样本,(i ) 称为该样 本的第i个次序统计量。 • 最小次序统计量 最大次序统计量 从小到大排列后的有序样本
数理统计-第一章 统计量及其分布
太原理工大学 景英川
第一章 统计量及其分布
太原理工大学 景英川
第一章 统计量及其分布
但在实际中,在样本量特别大时 (如 n≥100 ),又常用分组样本来代替完 全样本,这时需要对样本进行分组整理, 它能简明扼要地表示样本,使人们能更 好地认识总体,这是分组样本的优点。
太原理工大学 景英川
第一章 统计量及其分布
则 Fn (x)是一非减右连续函数,且满足 Fn (-∞) =0, Fn (+ ∞)=1 由此可见, Fn (x)是一个分布函数,称 Fn (x)为经验分 布函数。 太原理工大学 景英川
第一章 统计量及其分布
1.6 某食品厂生产听装饮料,现从生产线上随机 抽取 5 听饮料,称得其净重为(单 位:克) 351 347 355 344 351 这是一个容量为 5 的样本,经排序可得有序样本:
而若第一次抽到的是合格品,则第二次抽到不合格品 的概率为
太原理工大学 景英川
第一章 统计量及其分布
显然,如此得到的样本不是简单随 机样本。但是,当 N 很大时,我们可 以看到上述二种情 形的概率都近似等 于 p。所以当 N 很大,而 n不大(一个 经验法则是 )时可以把 该样本近似地 看成简单随机样本。
从总体中抽取样本可以有不同的抽法,为了能 由样本对总体作出较可靠的推断,就希望 样本能很 好的代表总体。这就需要对抽样方法提出一些要 求,最常用的"简单随机抽样”有 如下二个要求: (1)样本具有随机性,即要求总体中每一个个体 都有同等机会被选入样本,这便意味着每一样品xi 与总体X有相同的分布。 (2)样本要有独立性,即要求样本中每一样品的 取值不影响其它样品的取值,这意 味着x1, x2, …,xn 相互独立。
第一章 统计量及其分布
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
x1, x2, … , xn
tribution
~
X
用简单随机抽样方法得到的样本称为简单随机样本, 也简称样本。
于是,样本 x1, x2, …, xn 可以看成是独立同分 布( iid ) 的随机变量,其共同分布即为总体分布。 设总体X具有分布函数F(x), x1, x2, …, xn 为取 自该总体的容量为n的样本,则样本联合分布 函数为
实际中总体中的个体数大多是有限的。当 个体数充分大时,将有限总体看作无限总体是 一种合理的抽象。 本书以无限总体作为主要研究对象。
1.2 样本
样品、样本、样本量:
随机抽样:按照随机的方式 ,从总体X中抽取部分个体, 进行观测或测试的过程。简称抽样。
样本:从总体X中抽取n个个体,则它们的
指标值x1, x2 , ……,xn, 称为总体的一个样本 样本容量:样本所含个体的个数——n
100只元件的寿命数据
寿命范围 (192 216] (216 240] (240 264] (264 288] (288 312] (312 336] (336 360] (360 184] 元件数 6 3 3 5 5 3 5 1 寿命范围 (384 408] (408 432] (432 456] (456 480] (480 504] (504 528] (528 552] >552 元件数 4 4 1 2 2 3 1 13
F ( x1 , ..., x n )
F ( x ).
i i 1
n
总体分为有限总体与无限总体
实际中总体中的个体数大多是有限的。当个体 数充分大时,将有限总体看作无限总体是一种 合理的抽象。 对无限总体,随机性与独立性容易实现,困难 在于排除有意或无意的人为干扰。 对有限总体,只要总体所含个体数很大,特别 是与样本量相比很大,则独立性也可基本得到 满足。
简单起见,无论是样本还是其观测值,样本一般 均用 x1, x2,… xn 表示,应能从上下文中加以区别。
例1.3 啤酒厂生产的瓶装啤酒规定净含量为640 克。由于随机性,事实上不可能使得所有的啤酒 净含量均为640克。现从某厂生产的啤酒中随机 抽取10瓶测定其净含量,得到如下结果:
641, 635, 640, 637, 642, 638, 645, 643, 639, 640
表1.2中的样本观测值没有具体的数值, 只有一个范围,这样的样本称为分组样本。
样本的要求:简单随机样本
要使得推断可靠,对样本就有要求,使样本能很 好地代表总体。通常有如下两个要求: 随机性: 总体中每一个个体都有同等机会 被选入样本 -- xi 与总体X有相同的分布。 独立性: 样本中每一样品的取值不影响其 它样品的取值 -- x1, x2, …, xn 相互独立。
样品:样本中的个体
样本具有两重性 • 一方面,由于样本是从总体中随机抽取的,抽 取前无法预知它们的数值,因此,样本是随机 变量,用大写字母 X1, X2, …, Xn 表示;
• 另一方面,样本在抽取以后经观测就有确定的 观测值,因此,样本又是一组数值。此时用小 写字母 x1, x2, …, xn 表示是恰当的。
布情况时,济南市的全体男大学生组成了总体, 济南市的每个男大学生都是个体。
但是在数理统计中,由于我们关心的不是 每个个体的所有具体特性,而仅仅是它的某一 项或某几项的数量指标X(可以是向量)和该数 量指标在总体中的分布情况。
上述例子中X是表示灯泡的寿命或男大学生的身高 和体重,就此数量指标而言,每个个体所取值是不同的。 在试验中抽取了若干个个体,就观察到了X的这样或那 样的数值,因而这个数量指标X就是一个随机变量(或 向量)。而X的分布就完全描述了总体中我们所关心的
那个数量指标的分布情况。由于我们关心的正是这个 数量指标,因此我们以后就把总体和数量指标X 可能 取值的的全体组成的集合等同起来。 所谓总体的分布也就是指数量指标X 的分布。 以后说从“总体中抽样”与“从某分布中抽样”是同一个 意思。
总体的三层含义:
• 研究对象的全体; • 数据; • 分布
例1.1 考察某厂的产品质量,以0记合格品,以1记 不合格品,则 总体 = {该厂生产的全部合格品与不合格品} = {由0或1组成的一堆数} 若以 p 表示这堆数中1的比例(不合格品率),则该 总体可由一个二点分布表示:
X P
0 1p
1 p
比如:两个生产同类产品的工厂的产品的总体分布:
X p X p 0 0.983 0 0.915 1 0.017 1 0.085
可见:第一个工厂的产品质量优于第二个工厂 但是:在实际中,分布中的不合格品率是未知的, 所以也面临对其进行估计的问题. 例1.2
我们对每一个研究对象可能要观测两个 甚至更多个指标,此时可用多维随机向量及 其联合分布来描述总体,这种总体称为多维 总体。 一维和二维总体是基本的。本书主要研究 一维总体,某些地方也会涉及二维总体。 总体分为有限总体与无限总体
例1.5 设有一批产品共N个,需要进行抽样检 验以了解其不合格品率p。现从中采取不放回 抽样抽出2个产品,这时,第二次抽到不合格 品的概率依赖于第一次抽到的是否是不合格 品,如果第一次抽到不合格品,则 P(x2 = 1 | x1 = 1) = (Np1)/(N1) 而若第一次抽到的是合格品,则第二次抽到不合 格品的概率为 P(x2 = 1 | x1 = 0) = (Np)(N1)
这是一个容量为10的样本的观测值, 对应的总体为该厂生产的瓶装啤酒的净含量。 这样的样本称为完全样本。
例1.4 考察某厂生产的某种电子元件的 寿命,选了100只进行寿命试验,得到 如下数据:
表1.2
寿命范围 ( 0 24] (24 48] (48 72] (72 96] (96 120] (120 144] (144 168] (168 192] 元件数 4 8 6 5 3 4 5 4
统计量及其分布
§1 总体与样本 §2 样本数据的整理与显示
§3 统计量及其分布
§4 三大抽样分布
§5 充分统计量
§1
总体:
总体与样本
• 研究对象的全体;
个体:而把组成总体的每个元素称为个体。
例1 在研究某批灯泡的寿命时,该批灯泡的全 体就组成了总体,而其中每个灯泡就是个体。 例2 在研究济南市男大学生的身高和体重的分