var(x)与D(x)有什么区别
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
var(x)与D(x)有什么区别
一、概念和公式
方差的概念与计算公式,例1 两人的5次测验成绩如下:X:50,100,100,60,50 E(X)=72;Y:73,70,75,72,70 E(Y)=72。
平均成绩相同,但X 不稳定,对平均值的偏离大。
方差描述随机变量对于数学期望的偏离程度。
单个偏离是消除符号影响方差即偏离平方的均值,记为D(X):直接计算公式分离散型和连续型,具体为:这里是一个数。
推导另一种计算公式得到:方差等于平方的均值减去均值的平方。
其中,分别为离散型和连续型计算公式。
称为标准差或均方差,方差描述波动程度。
基本定义:设X是一个随机变量,若E{[X-E(X)]2}存在,则称E{[X-E(X)]2}为X 的方差,记为D(X),Var(X)或DX。
即D(X)=E{[X-E(X)]2}称为方差,而(X)=D(X)0.5(与X有相同的量纲)称为标准差(或均方差)。
即用来衡量一组数据的离散程度的统计量。
方差刻画了随机变量的取值对于其数学期望的离散程度。
(标准差、方差越大,离散程度越大。
否则,反之)若X的取值比较集中,则方差D(X)较小,若X的取值比较分散,则方差D(X)较大。
因此,D(X)是刻画X取值分散程度的一个量,它是衡量取值分散程度的一个尺度。
当数据分布比较分散(即数据在平均数附近波动较大)时,各个数据与平均数的差的平方和较大,方差就较大;当数据分布比较集中时,各个数据与平均数的差的平方和较小。
因此方差越大,数据的波动越大;方差越小,数据的波动就越小
二、计算方法和原理
若x1,x2,x3......xn的平均数为m则方差方差公式方差公式例1 两人的5次测验成绩如下:
X:50,100,100,60,50 E(X )=72;
Y:73,70,75,72,70 E(Y )=72。
平均成绩相同,但X 不稳定,对平均值的偏离大。
方差描述随机变量对于数学期望的偏离程度。
单个偏离是消除符号影响方差即偏离平方的均值,记为D(X ):
直接计算公式分离散型和连续型,具体为:这里是一个数。
推导另一种计算公式
得到:方差等于平方的均值减去均值的平方。
其中,分别为离散型和连续型的计算公式。
称为标准差或均方差,方差描述波动。
设一组数据x1,x2,x3xn中,各组数据与它们的平均数x(拔)的差的平方分别是(x1-x拔)2,(x2-x拔)2(xn-x拔)2,那么我们用他们的平均数来衡量这组数据的波动大小,并把它叫做这组数据的方差。
方差分析的基本原理是认为不同处理组的均数间的差别基本来源有两个:
(1) 随机误差,如测量误差造成的差异或个体间的差异,称为组内差异,用变量在各组的均值与该组内变量值之偏差平方和的总和表示,记作SSw,组内自由度dfw。
(2) 实验条件,即不同的处理造成的差异,称为组间差异。
用变量在各组的均值与总均值之偏差平方和表示,记作SSb,组间自由度dfb。
总偏差平方和SSt = SSb + SSw。
组内SSw、组间SSb除以各自的自由度(组内dfw =n-m,组间dfb=m-1,其中n为样本总数,m为组数),得到其均方MSw和MSb,一种情况是处理没有作
用,即各组样本均来自同一总体,MSb/MSw1。
另一种情况是处理确实有作用,组间均方是由于误差与不同处理共同导致的结果,即各样本来自不同总体。
那么,MSbMSw(远远大于)。
MSb/MSw比值构成F分布。
用F值与其临界值比较,推断各样本是否来自相同的总体
三、计算和性质
方差的计算公式D(X)=E(X)-[E(X)]
例题:随机变量X的分布函数F(X)=﹛0,x0﹜,{x,0=x=1},{1,x1},求E(X),D(X).步骤:E(X)={-,+}xdF(x)={0,1}3xdx=3/4,E(X)={-,+}xdF(x)={0,1}3x^4dx=3/5 D(X)=E(X)-[E(X)]=3/80
若x1,x2,x3......xn的平均数为m
则方差s^2=1/n[(x1-m)^2+(x2-m)^2+.......+(xn-m)^2]
方差即偏离平方的均值,称为标准差或均方差,方差描述随机变量x的波动程度。
计算时有些是采取1/n,有些是采取1/(n-1)。
理解这个问题,首先要知道估计的无偏性,无偏性有什么好处作用。
样本估计量(如
[1/(n-1)][(x1-x_)^2+(x2-x_)^2+...+(xn-x_)^2])的数学期望等于整体方差,说明这个样本估计量搜索是无偏的。
从分析测试的观点看,无偏性意味着测定的准确度。
方差反映了随机变量取值的平均分散程度,D(X)=E[X-E(X)]~2,实质上,方差也是一个数学期望,它是一个特殊随机变量的数学期望。
学习方法
性质:
1、D(C)=0;
2、D(CX)=C~2*D(X);
3、D(X+C)=D(X);
4、若X与Y独立,则D(X+或-Y)=D(X)+D(Y);。