第二讲 数据的分布及其总体参数的估计

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
13
标准正态分布的重要性
1. 一般的正态分布取决于均值和标准差 2. 计算概率时 ,每一个正态分布都需要有
自己的正态概率分布表,这种表格是无穷 多的 3. 若能将一般的正态分布转化为标准正态分 布,计算概率时只需要查一张表
14
标准正态分布函数
1. 任何一个一般的正态分布,可通过下面的线性 变换转化为标准正态分布
12
正态分布函数的性质
1. 概率密度函数在x 的上方,即f (x)>0
2. 正态曲线的最高点在均值,它也是分布的中位
数和众数
3. 正态分布是一个分布族,每一特定正态分布通过
均值的标准差来区分。 决定曲线的高度,
决定曲线的平缓程度,即宽度
4. 曲线f(x)相对于均值对称,尾端向两个方向无限
延伸,且理论上永远不会与横轴相交 5. 正态曲线下的总面积等于1 6. 随机变量的概率由曲线下的面积给出
4
2.5 3.0 3.5 4.0
.3 P ( x ) .2 .1 0
1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
N
.2
N
(Xi )2
.1 0
2 i1
1.25
N
总体分布
1 23
4
24
样本均值的抽样分布
(一个例子)
现从总体中抽取n=2的简单随机样本,在重复 抽样条件下,共有42=16个样本。所有样本的结果 如下表
所有可能的n = 2 的样本(共16个)
第一个
第二个观察值
观察值
1
2
3
4
1
1,1
1,2
1,3
1,4
21
样本分布
样本分布是指样本统计量的分布,是统 计推论的重要依据,只有知道样本统计 量的分布规律,才能通过样本对总体进 行推论,并确定推论正确或错误的概率 是多少。
22
几种重要的样本统计量的分布
样本平均数的分布:
(1)总体正态分布,总体平均数为 ,
标准差为 (或方差为 2 )已知,样本
5
概率的基本性质
任何一个事件出现的概率都是非负的; 必然事件的概率为1; 不可能事件的概率为0; 任何一个随机事件的概率介于0和1之间。
6
概率的基本定理
互不相容事件 独立事件
7
概率的基本定理
加法定理:两个互不相容的事件A、B之 和的概率等于两个事件概率之和,即: P(A+B)=P(A)+P(B) 互不相容事件:如果A 发生,则B一定 不发生, 如果B 发生,则A一定不发生,
平均数服从正态分布,平均值为 方差 2 n

X~N(,2/n) Z X ~N(0,1)
/ n
23
样本均值的抽样分布
【例】设一个总体,含有4个元素(个体),即总体单 位数N=4。4 个个体分别为X1=1、X2=2、X3=3 、X4=4 。总体的均值、方差及分布如下
均值和方差
N
Xi
.3
i1 2.5
P X 2 C 3 2 (0 .0)2 5 (0 .9)3 5 2 0 .0071
19
二项分布的性质
p=q时图形是对称的
二项分布的平均值和标准差
如果二项分布满足p<q, np 5 或p>q, nq 5
时,二项分布接近正态分布,
均值:
μ= np
标准差: npq
20
二项分布的应用
投掷硬币的试验,有10个硬币掷一次,5 次正面向上的概率是多大,5次或5次以 上正面向上的概率是多大。
乘法定理:两个独立事件同时出现的概 率等于两事件概率的乘积。 独立事件:一个事件是否出现对另外一 个事件不产生影响。
8
一些简单概率的计算
例:两道四选一的选择题,一考生全凭 猜测,问猜对一个题的概率有多大。
例:随机从52张扑克牌中抽出一张,抽 出来的数字大于10的概率有多大。
例:一个袋子中有A个白球,B个红球,采 用有放回抽取,抽出一个白球和一个红 球的概率是多大,如果采用无放回的抽 取,抽出一个白球和一个红球的概率是 多大。
第二讲 数据的分布及其总体参 数的估计
1
概率的定义
概率的两种定义: (1)统计定义:对随机事件进行n次观测,其
中某一事件A出现的次数m与n的比值,当n趋 于无穷大时,这一比值趋于以固定的常数P, 将这一常数P称为事件A发生的概率。 (2)古典定义:在下列条件下(a)试验的每一 种可能结果是有限的;(b)每一个基本事件 出现的可能性相等;如果基本事件的总数为n, 事件A包含 m个基本事件,则事件A的概率为 m/n。
2
2,1
2,2
2,3
2,4
3
3,1
3,2
3,3
3,4
4
4,1
4,2
4,3
4,4
25
样本均值的抽样分布
(一个例子)
计算出各样本的均值,如下表。并给出样本均 值的抽样分布
16个样本的均值(x)
第一个
第二个观察值
观察值 1
2
3
4
1
1.0 1.5 2.0 2.5
2 1.5 2.0 2.5 3.0
3
2.0 2.5 3.0 3.5
9
正态分布
正态分布又称为常态分布,是连续随机 变量概率分布的一种,其密度函数为:
f (x)
1
(x)2
e 22
2
10
正态分布曲线
f (x)
x
11
正态分布
对称分布,算术平均数、中数和众数相等 正态分布下数据与标准差有一定数量关系:
X 1SD
X 1.96SD
X2.58SD
包含所有数据的68.26% 包含所有数据的95% 包含所有数据的99%
b(x,n,p)C n xpxqnx
其中: Cnx
n! x!(n x)!
18
二项分布(实例)
【例】已知100件产品中有5件次品,现从中任 取一件,有放回地抽取3次。求在所抽取的3件 产品中恰好有2件次品的概率
解:设 X 为所抽取的3件产品中的次品数, 则X~B ( 3 , 0.05),根据二项分布公式有
ZX~N(0,1)
2. 标准正态分布的概率密度函数
(x)21e2 x2 , x
3.
标准正态分布的分布函数
(x)x(x)dtx
1
t2 -
e2dt
2
15
一般正态分布
标准正态分布
Z X
标准正态分布
1
x
Biblioteka Baidu
Z
16
标准化的例子
P(2.9 X 7.1)
一般正态分布
Z X 2.95 .21 10
Z X 7.15 .21 10
标准正态分布
= 10
=1
.1664
2.9 5 7.1 X
.0832 .0832
-.21 0 .21 Z
17
二项分布
二项分布是指统计变量中只有性质不同 的两项群体的概率分布,用符号b(x,n,p) 表示,表示在n次试验中有x次成功,每 次成功的概率为p,二项分布的概率函数 可以写作:
相关文档
最新文档