数据模型公式..
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章: 总体方差:2
2
()i
x N
μσ-=
∑;
样本方差:22
()1
i
x x s n -=
-∑
i i x x
z s
-=
样本协方差S xy =
1
)
)((1
---∑=n Y Y X X n
i i
i
总体协方差()()
i
i
xy x
y
x y N
μμ
σ--=
∑
皮尔逊积矩相关系数:r xy = y
x S S Sxy
第五章:离散型概率分布 数学期望()()E x xf x μ==∑, 方差2
2
()()()Var x x f x σμ==-∑
f(x)为概率
二项概率函数:
f(x)= )()1(x n x p p x n --⎪⎪⎭
⎫ ⎝⎛ 5.5 泊松概率分布
f(x)=
!
x e x μ
μ-,在一个时间区间内事件发生x 次的概率,μ为数学期望(与方差相差)
第六章:连续型概率分布 6.1均匀概率密度函数
a
b -1
a ≤x ≤
b f(x)=
其他
E(x)=2
b
a +, Var(x)=12)(2a
b -
连续型概率分布
6.3二项概率的正态近似
均值μ=np
,标准差σ=p
p(x)时,x-0.5。
6.4 指数概率分布
f(x)=
μμ
/1
x e -,表示两起事件之间的时间间隔
累积概率:不超过X 0分钟
P(x ≤x 0) =1-μ
/0x e
-
x z μ
σ
-=
第八章:总体均值区间估计
8.1 总体标准差σ已知,求总体均值μ的置信区间估计
95%置信水平(confidence level),0.95置信系数(confidence coefficient ),置信区间(confidence interval)
x σ=
n
σ
,边际误差=2/αz x σ=2
/αz n σ
,α=1-0.95=0.05,α/2=0.025(上侧面积)
总体均值的区间估计=μ=x +2
/αz n
σ
8.2 总体标准差σ未知,求总体均值μ的置信区间估计(t 分布)
用样本标准差s 代替总体标准差σ,t 代替z
μ=x +2
/αt n
s ,自由度
df=n-1
x t =
8.3 样本容量的确定
n=2
222/)(E
z σα,E 为所希望的总体均值μ的边际误差 8.4 总体比率:只有z,没有t
p σ=
n
p p )
1(-,边际误差=2/αz p σ=2
/αz n
p p )
1(-=E 总体均值的区间估计=p +2/αz n
p p )1(-
n= (2/αz )2 p*(1-p*)/E 2
第九章:假设检验(一个μ)
总体均值μ假设检验 H 0:μ=μ0; H a :μ≠μ
0 ,μ0为假定值
p-value ≤α,即z ≥αz (上侧)或z ≤-αz (下侧),则拒绝 p(z ≥1.96)=0.025
9.3总体标准差σ已知,求z
z=n
x /0σμ-, x 为样本均值 置信区间法:x +2
/αz n
σ
,看μ0是否落在该区间内
9.4总体标准差σ未知,求
t
x t =
,df=n-1
9.5 总体比率假设检验,求z
H 0:p=p 0; H a :p ≠p 0 ,p 0为假定值
p p
-
9.7计算第二类错误的概率
(1)在显著性水平α下,根据临界值法确定临界值2/αz 并建立拒绝法则(如,如果z ≤2/αz ,则拒绝);
(2)根据2/αz ,解出样本均值x 取值范围(根据z=n
x /0
σμ-≤或≥2/αz );
(3)建立接受域,如x >a ;
(4)根据接受域(不变)与满足备择假设的新μ,计算概率(z=
n
x /σμ
-)。
第二类错误概率β,做出拒绝H0的正确结论的概率称为功效,值为1-β 越接近原假设均值μ,发生第二类错误的风险越大。
9.8 确定总体均值μ假设检验的样本容量
n=
222
0()()
a z z αβσμμ+-
α为第一类错误概率,β为第二类错误概率,μ0为原假设总体均值,μa 为第二类错误所用总体均值。 双侧检验中,以Z α/2代替
Z α
第十章:两总体均值和比例的推断(两个μ)
10.1两总体均值之差(μ1-μ2)的推断,总体方差σ1和σ2已知 标准差1
2
x x σ-
=
Margin of error=/2
z α