标准偏差

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

标准偏差

从Wikipedia,自由的百科全书

情节一个正态分布(或钟形曲线)。每个彩色带,有1个标准差的宽度。更多:经验法则

与预期值0,标准偏差为1的正态分布的累积概率

一个数据集平均50(蓝色所示)和20个标准偏差(σ)。

例如,两个相同的均值和不同的标准偏差的样本人群。红色的人口意味着100和SD 10;蓝色人口平均100和SD 50。

标准差是一种广泛使用的变异性或多样性中使用测量统计和概率论。它显示了多大变化从平均(或“ 分散“的存在意味着,或预期值)。低标准差表示,数据点往往是非常接近的平均,而高标准的偏差表明数据点分布在大范围的价值观。

一个随机变量,统计人口数据集,或概率分布的标准偏差是其方差的平方根。虽然几乎比平均绝对偏差少强劲,这是代数简单。[1][2]一个有用的属性是标准差,方差不同,它的数据相同的单位表示。

此外,以表达对人口的变化,标准差通常用来衡量在统计结论的信心。例如,投票数据误差在确定预期结果的标准偏差计算,如果进行多次相同的调查。报道保证金的错误通常是约两倍的标准差-半径95%的置信区间。在科学,研究人员通常报告的实验数据的标准偏差,只影响,远远超出标准差的范围内被认为是统计学意义-从因果关系的变化区分这是正常的随机误差或测量的变化。标准偏差也很重要,在金融,地方上的投资回报率上的标准差是衡量的波动,投资。

当只有一个样品从人口数据是可用的,总体标准偏差,可以通过修改后的数量称为样本标准差估计,解释如下。

内容 [hide]

1 基本的例子

2 人口值的定义

2.1 离散随机

变量

2.2 连续型随

机变量

3 估计

3.1样品的标准

偏差

3.2样本的标准

偏差

3.3 其他估计

3.4取样的标准

差的置信区间

4 身份和数学性质

5 释义及适用范围

5.1 应用实例

5.1.1

气候

5.1.2

体育

5.1.3

财务

5.2 几何解释

5.3 切比雪夫

不等式

5.4 正态分布

的数据规则

6 标准差与平均值之

间的关系

7 快速计算方法

7.1 加权计算

8 相结合的标准偏差

8.1 人口的统

计数据

8.2 样品的统

计数据

9 历史

10 参见

11 参考文献

12 外部链接

[ 编辑]

基本的例子

考虑人口以下八个值组成:

这8个数据点的平均值(平均值)5:

计算总体标准偏差,首先从平均计算每个数据点的差异,每平方米的结果:

下一步计算这些值的平均值,并采取平方根:

这个数量是人口的标准差,它等于方差的平方根。公式是有效的,只有八个值,我们开始形成完整的人口。如果他们,而不是随机抽样,得出一些较大的,“父”人口,那么我们应该使用7而不是8(这是N - 1)(N),在最后一个公式的分母,然后由此获得的数量将被称为样本标准差。看到下面的部分估计更多的细节。

一个稍微复杂的现实生活的例子,在美国成年男子平均身高大约是70“的标准差约3”。这意味着,大多数男人(约68%,假设正态分布)“的平均高度在3(67”-73“)-一个标准差-几乎所有的人(约95%)有高度在6 “平均(64”-76“)- 两个标准差。如果标准偏差为零,那么所有的人正是70“高。如果标准偏差分别为20”,那么男人会多变量高峰,一个约50“-90”的典型范围。三个标准偏差为99.7%的样本人口研究,假设分布是正常的(钟形)。

[ 编辑]

人口值的定义

设X是一个随机变量与平均值μ:

在这里,运营商E为X 的平均预期值。X 的标准差是数量

也就是说,标准偏差σ(西格玛),即X 的方差的平方根,它是平均值的平方根(x - μ)2。

该分布的随机变量的标准偏差的(单因素)的概率分布是相同。并非所有随机变量有一个标准的偏差,因为这些预期值不存在。例如,一个随机变量,如下标准偏差柯西分布是不确定的,因为它是不确定的预期值μ。

[ 编辑]

离散型随机变量

其中X从有限的数据与每个值具有相同的概率

N的随机值的情况

×1,×2,...,x

下,标准差为

或者,利用求和符号,

值,而不是有平等的概率,如果有不同的概率,让×1的概率为p 1,×2的概率为p 2,...,N有概率

N。在这种情况下,将标准偏差

P

[ 编辑]

连续随机变量

一个标准差,连续实值随机变量X的概率密度函数P(X)

积分定积分的多组随机变量X的可能值范围x。

在一个分布参数的家庭的情况下,标准差,可以在参数方面表示。例如,在对数正态分布参数μ和σ2的情况下,标准差为[(EXP(σ2)- 1)EXP(2μ+σ2)] 1/2。

[ 编辑]

估计

一个能找到的情况下,整个人口(如标准偏差标准化测试),其中每一个成员的人口进行采样。在哪里不能做的情况下,标准差σ估计,通过检查从人口采取随机抽样。一些估计如下:

[ 编辑]

随着样本的标准偏差

有时用一个Σ的估计是样本的标准偏差的N表示,定义如下:

这估计有均匀小均方误差比样本的标准偏差(见下文),是人口正态分布的最大似然估计[ 需要的引证]。但是,这种估计,适用于小型或中等大小的样品时,往往是太低:它是一种有偏估计。

相关文档
最新文档