统计学正态分布及t分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
以x轴为渐近线,向它无限靠近. (6)当μ一定时,曲线的形状由σ确定 . σ越大,曲线越“矮胖”,表示总体的分布越分散; σ越小,曲线越“瘦高”,表示总体的分布越集中.
13
❖ 而整个正态分布则应该是各区间密度函数的累计积分.
❖ 一种连续的分布不可能求某项(某点)的概率,而只能求某个 区间的概率.
❖ 任意两点x1,x2且(x1x2),X在 (x1, x2)范围内取值的概率P, 即正态分布曲线在(x1, x2)下面积
10
在σ不变的情况下 函数曲线形状不变,若μ变大时,曲线位置向右移; 若变小时,曲线位置向左移,故称μ为位置参数。
11
在μ不变的情况下 函数曲线位置不变,若σ变大时,曲线形状变的越来越 “胖”和“矮”; 若σ变小时,曲线形状变的越来越“瘦”和“高”,故 称σ为形态参数或变异度参数。
1 2
3
12
正态曲线的性质
6
• 当n∞,直方条面积(频率)各自的概率 • 然后组距0时,直方条的宽度0,直
方条垂直线,各个直方条顶点间的连线 构成一条光滑的曲线,即:概率密度曲线, 而曲线下(直方条)的总面积始终为1,在区 间[a,b]的概率=对应曲线段下的面积(直方 条面积) 。
7
正态分布的概念
8
• 正态曲线的定义:
生物统计学
T分布
1
正态分布
2
❖ 样本有几个特别重要的数字特征,这些数字是描述样本频 率分布特征的,称之为样本特征数
❖ 而在生物统计学中,样本特征数使用频繁的有以下几个 ❖ 1.算术平均数,简称平均数( )。
3
• 2.样本方差:样本中各数据与样本平均数的 差的平方和的平均数。
• 3.样本标准差:样本方差的算术平方根做。
20
特殊区间的概率:
若X~N ( , 2 ) ,则对于任何实数a>0,概率
a
P( a ≤ a) , ( x)dx
a
为如图中的阴影部分的面积,对于固定的 和 而言,该面
积随着 的减少而变大。这说明 越小, 落在区间
的概率越大,即X集中在 周围概率越大。
(a,a]
x=μ
特别地有
函数
f (x)
1
2
( x )2
e 2 2
x (,)
称f( x)的图象称为正态曲线
式中:л= 3.1416
e= 2.71828
x----表示变量
μ---表示理论平均数
表示总体标准差 δ2—表示总体方差
这个公式表示x变量区间内发生的概率
δ---
9
如果变量X的概率密度函数服从上述函数, 则称该变量服从正态分布。记做 X~N(,2)
17
变换后的正态分布密度函数为:f (u)
1
u2
e2
2
标准正态分布均具有μ=0,σ2=1的特性
如果随机变量u服从标准正态分布,可记为:u~N(0,1)
18
标准正态函数
f (x)
x2
1
e2
2
x (,)
y
μ=0 σ=1
-3 -2 -1 0 1 2 3 x
19
事实上,上面的计算已经制成了表格,只要知 道了平均数和标准差即可查出相应的区间概 率.
16
正态分布转化为标准正态分布
可以将x作一变换,令 u x
u称为标准正态变量或标准正态离差,服从标准正态分布 的随机变量
这个变换称为标准化或u变换,由于x是随机变量,因此u 也是随机变量,所得到的随机变量U也服从正态分布, 因此,由任意正态分布随机变量标准化得到的随机变量 的标准正态分布常称为u分布。
P x2 x1
1
(x)2
e 22 dx
2
14
标准正态分布
正态分布由μ和σ所决定,不同的μ、σ值就决定了不同的正态分布 密度函数,因此在实际计算中很不方便的。需将一般的N(μ,σ2 ) 转换为μ=0, σ2 =1的正态分布。我们称μ=0, σ2 =1的正态分 布为标准正态分布(standard normal distribution)
就是由正态分布密度函数
f (x) 1 e(x22)2
2
得到标准正态分布密度函数:
f (x)
1
x2
e2
15
2
由于正态分布的概率密度函数比较复杂,积分的 计算也比较麻烦,最好的解决办法:将正态分布 转化为标准正态分布,然后根据标准正态分布表 直接查出概率值。
对于服从任意正态分布N(μ,σ2)的随机变量, 欲求其在某个区间的取值概率,需先将它标准化 为标准正态分布N(0,1)的随机变量,然后查表 即可。
4
样本方差和样本标准差都是衡量一个样本 波动大小的量,样本方差或样本标准差越 大,样本数据的波动就越大。
方差和标准差是测算离散趋势最重要、最 常用的指标。
5
• 正态分布的概念 • 如果把数值变量资料编制频数表后绘制频数分布图(又称直方
图,它用矩形面积表示数值变量资料的频数分布,每条直条的 宽表示组距,直条的面积表示频数(或频率)大小,直条与直 条之间不留空隙。),若频数分布呈现中间为最多,左右两侧 基本对称,越靠近中间频数越多,离中间越远,频数越少,形 成一个中间频数多,两侧频数逐渐减少且基本对称的分布,那 我们一般认为该数值 • 变量服从或近似服从 • 数学上的正态分布。
由于这些概率值很小(一般不超过5 % ),通常称这些情况发生为小概率事件。
22
T分布 几个重要概念
从一个正态总体中抽取的样本统计量的分布样本平
均数 x 和样本方差S2是描述样本特征的两个最重
要的统计量
如果原总体的平均数为μ,标准差为σ,那么样本平均数 抽样总体:
-a +
a
P(X)0.6826, P(2X2)0.9544, P(3X3)0.9974.
21
我们从上图看到,正态总体在 2,2 以外取值的概率只有4.6%,在3,3以外
取值的概率只有0.3 %。
当 a 3 时正态总体的取值几乎总取值于区间 ( 3 , 3 ) 之内,其他区间取值几乎不可能.在实 际运用中就只考虑这个区间,称为 3 原则.
μ= -1
y σ=0.5
Leabharlann Baidu
y
y
μ=0 σ=1
μ=1 σ=2
-3 -2 -1 0 1 2 x -3 -2 -1 0 1 2 3 x -3 -2 -1 0 1 2 3 4 x
(1)曲线在x轴的上方,与x轴不相交. (2)曲线是单峰的,它关于直线x=μ对称. (3)曲线在x=μ处达到峰值(最高点) (4)曲线与x轴之间的面积为1 (5)当 x<μ时,曲线上升;当x>μ时,曲线下降.并且当曲线向左、右两边无限延伸时,
13
❖ 而整个正态分布则应该是各区间密度函数的累计积分.
❖ 一种连续的分布不可能求某项(某点)的概率,而只能求某个 区间的概率.
❖ 任意两点x1,x2且(x1x2),X在 (x1, x2)范围内取值的概率P, 即正态分布曲线在(x1, x2)下面积
10
在σ不变的情况下 函数曲线形状不变,若μ变大时,曲线位置向右移; 若变小时,曲线位置向左移,故称μ为位置参数。
11
在μ不变的情况下 函数曲线位置不变,若σ变大时,曲线形状变的越来越 “胖”和“矮”; 若σ变小时,曲线形状变的越来越“瘦”和“高”,故 称σ为形态参数或变异度参数。
1 2
3
12
正态曲线的性质
6
• 当n∞,直方条面积(频率)各自的概率 • 然后组距0时,直方条的宽度0,直
方条垂直线,各个直方条顶点间的连线 构成一条光滑的曲线,即:概率密度曲线, 而曲线下(直方条)的总面积始终为1,在区 间[a,b]的概率=对应曲线段下的面积(直方 条面积) 。
7
正态分布的概念
8
• 正态曲线的定义:
生物统计学
T分布
1
正态分布
2
❖ 样本有几个特别重要的数字特征,这些数字是描述样本频 率分布特征的,称之为样本特征数
❖ 而在生物统计学中,样本特征数使用频繁的有以下几个 ❖ 1.算术平均数,简称平均数( )。
3
• 2.样本方差:样本中各数据与样本平均数的 差的平方和的平均数。
• 3.样本标准差:样本方差的算术平方根做。
20
特殊区间的概率:
若X~N ( , 2 ) ,则对于任何实数a>0,概率
a
P( a ≤ a) , ( x)dx
a
为如图中的阴影部分的面积,对于固定的 和 而言,该面
积随着 的减少而变大。这说明 越小, 落在区间
的概率越大,即X集中在 周围概率越大。
(a,a]
x=μ
特别地有
函数
f (x)
1
2
( x )2
e 2 2
x (,)
称f( x)的图象称为正态曲线
式中:л= 3.1416
e= 2.71828
x----表示变量
μ---表示理论平均数
表示总体标准差 δ2—表示总体方差
这个公式表示x变量区间内发生的概率
δ---
9
如果变量X的概率密度函数服从上述函数, 则称该变量服从正态分布。记做 X~N(,2)
17
变换后的正态分布密度函数为:f (u)
1
u2
e2
2
标准正态分布均具有μ=0,σ2=1的特性
如果随机变量u服从标准正态分布,可记为:u~N(0,1)
18
标准正态函数
f (x)
x2
1
e2
2
x (,)
y
μ=0 σ=1
-3 -2 -1 0 1 2 3 x
19
事实上,上面的计算已经制成了表格,只要知 道了平均数和标准差即可查出相应的区间概 率.
16
正态分布转化为标准正态分布
可以将x作一变换,令 u x
u称为标准正态变量或标准正态离差,服从标准正态分布 的随机变量
这个变换称为标准化或u变换,由于x是随机变量,因此u 也是随机变量,所得到的随机变量U也服从正态分布, 因此,由任意正态分布随机变量标准化得到的随机变量 的标准正态分布常称为u分布。
P x2 x1
1
(x)2
e 22 dx
2
14
标准正态分布
正态分布由μ和σ所决定,不同的μ、σ值就决定了不同的正态分布 密度函数,因此在实际计算中很不方便的。需将一般的N(μ,σ2 ) 转换为μ=0, σ2 =1的正态分布。我们称μ=0, σ2 =1的正态分 布为标准正态分布(standard normal distribution)
就是由正态分布密度函数
f (x) 1 e(x22)2
2
得到标准正态分布密度函数:
f (x)
1
x2
e2
15
2
由于正态分布的概率密度函数比较复杂,积分的 计算也比较麻烦,最好的解决办法:将正态分布 转化为标准正态分布,然后根据标准正态分布表 直接查出概率值。
对于服从任意正态分布N(μ,σ2)的随机变量, 欲求其在某个区间的取值概率,需先将它标准化 为标准正态分布N(0,1)的随机变量,然后查表 即可。
4
样本方差和样本标准差都是衡量一个样本 波动大小的量,样本方差或样本标准差越 大,样本数据的波动就越大。
方差和标准差是测算离散趋势最重要、最 常用的指标。
5
• 正态分布的概念 • 如果把数值变量资料编制频数表后绘制频数分布图(又称直方
图,它用矩形面积表示数值变量资料的频数分布,每条直条的 宽表示组距,直条的面积表示频数(或频率)大小,直条与直 条之间不留空隙。),若频数分布呈现中间为最多,左右两侧 基本对称,越靠近中间频数越多,离中间越远,频数越少,形 成一个中间频数多,两侧频数逐渐减少且基本对称的分布,那 我们一般认为该数值 • 变量服从或近似服从 • 数学上的正态分布。
由于这些概率值很小(一般不超过5 % ),通常称这些情况发生为小概率事件。
22
T分布 几个重要概念
从一个正态总体中抽取的样本统计量的分布样本平
均数 x 和样本方差S2是描述样本特征的两个最重
要的统计量
如果原总体的平均数为μ,标准差为σ,那么样本平均数 抽样总体:
-a +
a
P(X)0.6826, P(2X2)0.9544, P(3X3)0.9974.
21
我们从上图看到,正态总体在 2,2 以外取值的概率只有4.6%,在3,3以外
取值的概率只有0.3 %。
当 a 3 时正态总体的取值几乎总取值于区间 ( 3 , 3 ) 之内,其他区间取值几乎不可能.在实 际运用中就只考虑这个区间,称为 3 原则.
μ= -1
y σ=0.5
Leabharlann Baidu
y
y
μ=0 σ=1
μ=1 σ=2
-3 -2 -1 0 1 2 x -3 -2 -1 0 1 2 3 x -3 -2 -1 0 1 2 3 4 x
(1)曲线在x轴的上方,与x轴不相交. (2)曲线是单峰的,它关于直线x=μ对称. (3)曲线在x=μ处达到峰值(最高点) (4)曲线与x轴之间的面积为1 (5)当 x<μ时,曲线上升;当x>μ时,曲线下降.并且当曲线向左、右两边无限延伸时,