正态分布与二项分布解析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
正态分布与二项分布
主要内容正态分布的概念和特征
标准正态分布
正态分布曲线下的面积
医学参考值范围
二项分布的基本概念和性质二项分布的概率计算方法
体重分布
65.062.560.057.555.052.550.047.545.042.540.060
50
40
30
20
100
Std. Dev = 5.76
Mean = 51.5
N = 300.00
正态分布
正态分布(normal distribution)又称高斯(Gauss)分布,是以均数为中心,左右两侧基本对称的钟型分布。
越接近均数,频数分布越多,离均数越远,频数分布越少。
正态分布是一种重要的连续型分布,是许多统计方法的理论基础。
正态分布的概率密度函数
将正态分布曲线用函数形式表达,称为正态分布的概率密度函数,记为f(x),即正态分布曲线的方程为:
一般用N (μ,σ2)表示均数为μ,方差为
σ2的正态分布。
2
22)(21)(σμσπ--=x e x f
正态分布曲线
3
210-1-2-3μ-σ
μ+σμ
正态分布曲线
密度曲线图中,横轴表示测量指标x,纵轴表示密度函数值f(x)。
⏹观察值x附近个体值分布越密集,f(x)值越大;
⏹x附近的个体值分布越稀疏,f(x)值就越小。密度函数f(x)的大小,反映了x附近的测量值的密集程度。
正态分布的特征
正态曲线为位于横轴上方的钟形曲线。
正态分布以μ为中心,左右两侧对称。
正态分布曲线以横轴为其渐近线,但两端与横轴永不相交。
正态分布有两个参数,即μ和σ。
可通过标准化变换将一般正态分布N(μ,σ2)转化为标准正态分布N(0,1)。
正态分布曲线下的面积具有一定的规律性。
正态分布的两个参数:μ和σμ是位置参数,用以描述正态分布的集中位置。
⏹当σ恒定,改变μ,则曲线沿x轴平移,但形状不变,⏹μ越大,则曲线沿横轴越向右移动;μ越小,则曲线
沿横轴越向左移动。
σ是变异度参数或形状参数,用以描述曲线的离散程度。
⏹当μ恒定时,改变σ,则曲线的形状会发生变化,而
曲线的中心位置不变,
⏹σ越大,表示数据越分散,曲线越扁平,变异越大;σ
越小,表示数据越集中,曲线越陡峭,变异越小。
如果一个随机变量X取对数后,其值的分布为正态分布,则称随机变量X服从对数正态分布。
如果进行标准化变换(u 变换),
并使μ=0,σ=1,正态分布的中心位置就由μ移到0,一般正态分布N (μ,σ2)转化为标准正态分布N (0,1)。
σ
μ
-=x u
标准正态分布曲线
-2
-3
-1
1
3
2
标准正态分布
标准正态分布也称为u 分布(Z 分布),u 称为标准正态变量或标准正态离差。标准正态分布可用N (0,1)表示。标准正态分布的概率密度函数为:
2
221)(u e u -=πϕ
标准正态分布(u分布)的特征
u分布曲线为位于横轴上方的钟形曲线。
u分布以 =0为中心,左右两侧对称。
u分布曲线以横轴为其渐近线,但两端与横轴永不相交。
u分布的μ=0,σ=1。
u分布曲线下的面积具有一定的规律性。
正态曲线下面积(AUC)
可根据正态分布曲线下某个区间的面积(Area Under the Curve),以估计该区间的例数占总例数的百分数(频率分布),或变量值落在该区间的概率(概率分布)。
正态曲线下的面积,可以通过对正态变量X 的累计分布函数F (X )的积分来求得,它反映了正态曲线下,自-∞到X 的面积,即左侧累计面积。
X
X
x d e X F ⎰∞---=222)(21
)(σμσπ
曲线下横轴上的总面积为100%或1。
服从正态分布的随机变量在一区间上曲线下的面积与其在这一区间上取值的概率相等。当μ、σ和X 已知时,可先进行u 转换:
然后对u 的累计分布函数Φ(u)进行积分。
σμ-=
x u u
u
u d e u ⎰∞--=Φ2221
)(π
为了计算方便,统计学家已按公式编制成附表2,标准正态分布曲线下的面积。
即在实际应用中,经u变换后,再用该附表,可把求解任意一个正态分布曲线下面积的问题,转化成标准正态分布曲线下相应的面积。
曲线下对称于0的区间,面积相等。区间(-∞,-u)和区间(u,+∞)的面积相等,因而附表2中只列出Φ(-u)的值,
Φ(u)=1-Φ(-u)。
正态曲线下面积的计算公式为:
P(u
1<U<u
2
)=Φ(u
2
) Φ(u
1
)。
正态曲线下面积的分布规律Φ(1.96)=1-Φ(-1.96)=1-0.025=0.975,
从u=-1.96到u=1.96的面积:
P(-1.96<U<1.96)=
Φ(1.96)-Φ(-1.96)=0.975-0.025=0.95
正态曲线下面积的分布规律Φ(2.58)=1-Φ(-2.58)=1-0.005=0.995,
从u=-2.58到u=2.58的面积:
P(-2.58<U<2.58)=
Φ(2.58)-Φ(-2.58)=0.995-0.005=0.99