标准偏差

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

标准偏差

从Wikipedia，自由的百科全书

情节一个正态分布（或钟形曲线）。每个彩色带，有1个标准差的宽度。更多：经验法则

与预期值0，标准偏差为1的正态分布的累积概率

一个数据集平均50（蓝色所示）和20个标准偏差（σ）。

例如，两个相同的均值和不同的标准偏差的样本人群。红色的人口意味着100和SD 10;蓝色人口平均100和SD 50。

标准差是一种广泛使用的变异性或多样性中使用测量统计和概率论。它显示了多大变化从平均（或“ 分散“的存在意味着，或预期值）。低标准差表示，数据点往往是非常接近的平均，而高标准的偏差表明数据点分布在大范围的价值观。

一个随机变量，统计人口数据集，或概率分布的标准偏差是其方差的平方根。虽然几乎比平均绝对偏差少强劲，这是代数简单。[1][2]一个有用的属性是标准差，方差不同，它的数据相同的单位表示。

此外，以表达对人口的变化，标准差通常用来衡量在统计结论的信心。例如，投票数据误差在确定预期结果的标准偏差计算，如果进行多次相同的调查。报道保证金的错误通常是约两倍的标准差-半径95％的置信区间。在科学，研究人员通常报告的实验数据的标准偏差，只影响，远远超出标准差的范围内被认为是统计学意义-从因果关系的变化区分这是正常的随机误差或测量的变化。标准偏差也很重要，在金融，地方上的投资回报率上的标准差是衡量的波动，投资。

当只有一个样品从人口数据是可用的，总体标准偏差，可以通过修改后的数量称为样本标准差估计，解释如下。

内容 [hide]

1 基本的例子

2 人口值的定义

2.1 离散随机

变量

2.2 连续型随

机变量

3 估计

3.1样品的标准

偏差

3.2样本的标准

偏差

3.3 其他估计

3.4取样的标准

差的置信区间

4 身份和数学性质

5 释义及适用范围

5.1 应用实例

5.1.1

气候

5.1.2

体育

5.1.3

财务

5.2 几何解释

5.3 切比雪夫

不等式

5.4 正态分布

的数据规则

6 标准差与平均值之

间的关系

7 快速计算方法

7.1 加权计算

8 相结合的标准偏差

8.1 人口的统

计数据

8.2 样品的统

计数据

9 历史

10 参见

11 参考文献

12 外部链接

[ 编辑]

基本的例子

考虑人口以下八个值组成：

这8个数据点的平均值（平均值）5：

计算总体标准偏差，首先从平均计算每个数据点的差异，每平方米的结果：

下一步计算这些值的平均值，并采取平方根：

这个数量是人口的标准差，它等于方差的平方根。公式是有效的，只有八个值，我们开始形成完整的人口。如果他们，而不是随机抽样，得出一些较大的，“父”人口，那么我们应该使用7而不是8（这是N - 1）（N），在最后一个公式的分母，然后由此获得的数量将被称为样本标准差。看到下面的部分估计更多的细节。

一个稍微复杂的现实生活的例子，在美国成年男子平均身高大约是70“的标准差约3”。这意味着，大多数男人（约68％，假设正态分布）“的平均高度在3（67”-73“）-一个标准差-几乎所有的人（约95％）有高度在6 “平均（64”-76“）- 两个标准差。如果标准偏差为零，那么所有的人正是70“高。如果标准偏差分别为20”，那么男人会多变量高峰，一个约50“-90”的典型范围。三个标准偏差为99.7％的样本人口研究，假设分布是正常的（钟形）。

[ 编辑]

人口值的定义

设X是一个随机变量与平均值μ：

在这里，运营商E为X 的平均预期值。X 的标准差是数量

也就是说，标准偏差σ（西格玛），即X 的方差的平方根，它是平均值的平方根（x - μ）2。

该分布的随机变量的标准偏差的（单因素）的概率分布是相同。并非所有随机变量有一个标准的偏差，因为这些预期值不存在。例如，一个随机变量，如下标准偏差柯西分布是不确定的，因为它是不确定的预期值μ。

[ 编辑]

离散型随机变量

其中X从有限的数据与每个值具有相同的概率

N的随机值的情况

×1，×2，...，x

下，标准差为

或者，利用求和符号，

值，而不是有平等的概率，如果有不同的概率，让×1的概率为p 1，×2的概率为p 2，...，N有概率

N。在这种情况下，将标准偏差

[ 编辑]

连续随机变量

一个标准差，连续实值随机变量X的概率密度函数P（X）

积分定积分的多组随机变量X的可能值范围x。

在一个分布参数的家庭的情况下，标准差，可以在参数方面表示。例如，在对数正态分布参数μ和σ2的情况下，标准差为[（EXP（σ2）- 1）EXP（2μ+σ2）] 1/2。

[ 编辑]

估计

一个能找到的情况下，整个人口（如标准偏差标准化测试），其中每一个成员的人口进行采样。在哪里不能做的情况下，标准差σ估计，通过检查从人口采取随机抽样。一些估计如下：

[ 编辑]

随着样本的标准偏差

有时用一个Σ的估计是样本的标准偏差的N表示，定义如下：

这估计有均匀小均方误差比样本的标准偏差（见下文），是人口正态分布的最大似然估计[ 需要的引证]。但是，这种估计，适用于小型或中等大小的样品时，往往是太低：它是一种有偏估计。