均匀分布U[0, 1] 样本最大值分布 - 描述统计
概率论与数理统计浙大四版 第二章3讲
f(x) 13, 2 x5, 0, 其他.
设 A 表示“ X 的观测值大于 3”,
即 A={ X >3 }.
由 P (A 于 ) P { X 3 }
51 dx
2,
33
3
设Y 表示3次独立观测中观测值大于3的次数,
则 因而有
Y
~
b 3,
32.
P{Y2}23322132333231320
解: F(x) = P(X x) =
x
f (t)dt
f(x)2 1x2, 1x1
0, 其它
解: 对x < -1,F(x) = 0
求 F(x).
对 1x1,
F(x)10d t x21t2dt
1
x
1x21ar
cxsi1n 2
对 x>1, F (x) = 1
即
0,
x1
F(x) x
1x21arcsx in1 2,
1, x 1
(2) 求X的概率密度.
解: (1) P(0.3<X<0.7)=F(0.7)-F(0.3)=0.72-0.32=0.4
(2)
f(x)= dF ( x ) dx
2x,
0,
0 x 1 其它
注意到F(x)在1处导数不存在,根据改变被积函数 在个别点处的值不影响积分结果的性质,可以在
F(x) 没意义的点处,任意规定 F(x)的值.
由此得, 1) 对连续型 r.v X,有
P ( a X b ) P ( a X b )
P(aXb) P(aXb)
2) 由P(X=a)=0 可推知
P (X R a ) f(x )d x P (X a ) 1 而 {X=a} 并非不可能事件 {XR{a}}并非必然事件
[1,N]离散均匀分布样本最大值分布-描述统计
1,N 离散均匀分布样本最大值分布基于Wolfram Mathematica9,下表给出了 1,N 区间内离散均匀分布DU 1,N 样本最大值的概率密度(质量)函数、累积分布函数、累积分布函数、逆生存函数、风险函数(故障率)、矩母函数 MGF 、中心矩母函数 CMGF 、累积量母函数 CGF 、阶乘矩母函数 FMGF 、特征函数的计算和结果表达式,均值、中位值、众数、四分位数列表、q分位数、方差、标准差、一三四分位数间矩、偏度系数、峰度系数、四分偏度系数、r阶原点矩、r阶中心矩、r阶阶乘矩、r阶累积量、信息熵等描述性统计量的计算和结果表达式。
In[105]:=dist DiscreteUniformDistribution 1,N ;dist1 OrderDistribution dist,n ,n ;"1.概率密度(质量)函数:"PDF dist1,k"2.累积分布函数:"CDF dist1,k"3.生存(可靠性)函数:"SurvivalFunction dist1,k"4.逆生存函数:"InverseSurvivalFunction dist1,q"5.风险函数(故障率):"HazardFunction dist1,k"6.矩母函数 MGF :"MomentGeneratingFunction dist1,t"7.中心矩母函数 CMGF :"CentralMomentGeneratingFunction dist1,t"8.累积量母函数 CGF :"CumulantGeneratingFunction dist1,t"9.阶乘矩母函数 FMGF :"CharacteristicFunction dist1,t"10.特征函数:"CharacteristicFunction dist1,t"11.均值:"Mean dist1"12.中位值:"Median dist1"13.四分位数列表:"Quartiles dist1"14.q分位数:"Quantile dist1,q"15.方差:"Variance dist1"16.标准差:"StandardDeviation dist1"17.一、三四分位数间矩:"InterquartileRange dist1"18.偏度系数:"Skewness dist1"19.峰度系数:"Kurtosis dist1"20.四分偏度系数:"QuartileSkewness dist1"21.r阶原点矩矩:"Moment dist1,r"22.r阶中心矩:"CentralMoment dist1,r"23.r阶阶乘矩:"FactorialMoment dist1,r"24.r阶累积量:"Cumulant dist1,r"25.信息熵:"Sum PDF dist1,k Log PDF dist1,k , k,1,N Out[107]= 1.概率密度(质量)函数:Out[108]= 1NkN n k N n k 1&&k N 0 1 1 1N n k N 0&&k 1 0k N 0 k 1 1 1N n k 1&&k N 0 N n TrueOut[109]= 2.累积分布函数:Out[110]= Floor k N n1 k N1k N0True Out[111]= 3.生存(可靠性)函数:Out[112]=1k 11 1 N Floor kN n1 k N 0TrueOut[113]= 4.逆生存函数:Out[114]=ConditionalExpression Max 1,Ceiling N 1 q 1n 0 1 1 q 1n 1N1 1 q 1n 01True,0 1 q 1n 1Out[115]= 5.风险函数(故障率):2[1,N]离散均匀分布样本最大值分布-描述统计.nbOut[116]=1 k NN n1 k 2&&k N 0 1k 2 0 k N 11 k NN n 1 1 k N N n1 1 1 k NN n k 2&&k N 0 0TrueOut[117]= 6.矩母函数 MGF :Out[118]=MomentGeneratingFunctionOrderDistribution DiscreteUniformDistribution 1,N ,n ,n ,t Out[119]=7.中心矩母函数 CMGF :Out[120]=CentralMomentGeneratingFunctionOrderDistribution DiscreteUniformDistribution 1,N ,n ,n ,t Out[121]=8.累积量母函数 CGF :Out[122]=CumulantGeneratingFunctionOrderDistribution DiscreteUniformDistribution 1,N ,n ,n ,t Out[123]=9.阶乘矩母函数 FMGF :Out[124]=CharacteristicFunctionOrderDistribution DiscreteUniformDistribution 1,N ,n ,n ,t Out[125]=10.特征函数:Out[126]=CharacteristicFunctionOrderDistribution DiscreteUniformDistribution 1,N ,n ,n ,t Out[127]=11.均值:Out[128]=1 N N n BernoulliB 1 n,1 BernoulliB 1 n,1 N1 nOut[129]=12.中位值:Out[130]=ConditionalExpression Max 1,Ceiling 2 1 n N 0 2 1 n 112 1 n 0N True,0 2 1 n 1Out[131]=13.四分位数列表:[1,N]离散均匀分布样本最大值分布-描述统计.nb3Out[132]=ConditionalExpressionMax 1,Ceiling 4 1 n N 0 4 1 n 114 1 n 0N True,0 4 1 n 1 ,ConditionalExpressionMax 1,Ceiling 2 1 n N 0 2 1 n 112 1 n 0N True,0 2 1 n 1 ,ConditionalExpressionMax 1,Ceiling 341nN 0341n11 341n 0NTrue,0341n1Out[133]=14.q 分位数:Out[134]=ConditionalExpressionMax 1,Ceiling N q 1n 0 q 1n 11q 1n 0N True,0 q 1n 1Out[135]=15.方差:Out[136]=1 N 11 nN nBernoulliB 1 n,1 BernoulliB 1 n,1 N 2N nBernoulliB 1 n,1 BernoulliB 1 n,N 1 n2 BernoulliB 2 n,1 BernoulliB 2 n,N2 nBernoulliB 3 n,1 BernoulliB 3 n,N3 nOut[137]=16.标准差:Out[138]=1 N11 nNnBernoulliB 1 n,1 BernoulliB 1 n,1 N2N nBernoulliB 1 n,1 BernoulliB 1 n,N1 n2 BernoulliB 2 n,1 BernoulliB 2 n,N 2 nBernoulliB 3 n,1 BernoulliB 3 n,N3 nOut[139]=17.一、三四分位数间矩:4 [1,N]离散均匀分布样本最大值分布-描述统计.nbOut[140]=ConditionalExpressionN Max 1,Ceiling 341nN341n1&&41n 1N Max 1,Ceiling 4 1 n N341n 1&&41n 1Max 1,Ceiling 341n N Max 1,Ceiling 4 1 n N 341n 1&&41n 10True,0341n1&&0 4 1 n 1Out[141]=18.偏度系数:Out[142]=21 N11 nNnBernoulliB 1 n,1 BernoulliB 1 n,1 N33N n 1 N 11 nN n BernoulliB 1 n,1 BernoulliB 1 n,1 NBernoulliB 1 n,1 BernoulliB 1 n,N1 n2 BernoulliB 2 n,1 BernoulliB 2 n,N 2 nBernoulliB 3 n,1 BernoulliB 3 n,N3 nN nBernoulliB 1 n,1 BernoulliB 1 n,N1 n3 BernoulliB 2 n,1 BernoulliB 2 n,N 2 n3 BernoulliB 3 n,1 BernoulliB 3 n,N 3 nBernoulliB 4 n,1 BernoulliB 4 n,N4 n1 N 11 nNnBernoulliB 1 n,1 BernoulliB 1 n,1 N2N nBernoulliB 1 n,1 BernoulliB 1 n,N1 n2 BernoulliB 2 n,1 BernoulliB 2 n,N 2 nBernoulliB 3 n,1 BernoulliB 3 n,N3 n3 2[1,N]离散均匀分布样本最大值分布-描述统计.nb5Out[143]=19.峰度系数:Out[144]=31 N 11 nNnBernoulliB 1 n,1 BernoulliB 1 n,1 N46Nn1 N11 nN nBernoulliB 1 n,1 BernoulliB 1 n,1 N 2BernoulliB 1 n,1 BernoulliB 1 n,N 1 n2 BernoulliB 2 n,1 BernoulliB 2 n,N2 nBernoulliB 3 n,1 BernoulliB 3 n,N3 n4N n 1 N 11 nN n BernoulliB 1 n,1 BernoulliB 1 n,1 NBernoulliB 1 n,1 BernoulliB 1 n,N 1 n3 BernoulliB 2 n,1 BernoulliB 2 n,N2 n3 BernoulliB 3 n,1 BernoulliB 3 n,N3 nBernoulliB 4 n,1 BernoulliB 4 n,N4 nN n BernoulliB 1 n,1 BernoulliB 1 n,N1 n4 BernoulliB 2 n,1 BernoulliB 2 n,N2 n6 BernoulliB 3 n,1 BernoulliB 3 n,N3 n4 BernoulliB 4 n,1 BernoulliB 4 n,N4 nBernoulliB 5 n,1 BernoulliB 5 n,N5 n1 N 11 nNnBernoulliB 1 n,1 BernoulliB 1 n,1 N2N nBernoulliB 1 n,1 BernoulliB 1 n,N1 n2 BernoulliB 2 n,1 BernoulliB 2 n,N2 n26 [1,N]离散均匀分布样本最大值分布-描述统计.nbBernoulliB 3 n,1 BernoulliB 3 n,N3 n2 Out[145]=20.四分偏度系数:Out[146]=ConditionalExpression 1 34 Indeterminate 34 ComplexInfinity 34N Max 1,Ceiling 34 1n N 2Max 1,Ceiling 2 1 n NN Max 1,Ceiling 34 1n N341 342N Max 1,Ceiling 34 1n N Max 1,Ceiling 4 1 n NMax 1,Ceiling 34 1n N Max 1,Ceiling 4 1 n N34N 2Max 1,Ceiling 2 1 n N Max 1,Ceiling 4 1 n NN Max 1,Ceiling 4 1 n N 34Max 1,Ceiling 34 1n N2Max 1,Ceiling 2 1 n N Max 1,Ceiling 4 1 n NMax 1,Ceiling 34 1n N Max 1,Ceiling 4 1 n NTrueOut[147]=21.r阶原点矩矩:Out[148]=Moment OrderDistribution DiscreteUniformDistribution 1,N ,n ,n ,rOut[149]=22.r阶中心矩:Out[150]=CentralMoment OrderDistribution DiscreteUniformDistribution 1,N ,n ,n ,rOut[151]=23.r阶阶乘矩:Out[152]=FactorialMoment OrderDistribution DiscreteUniformDistribution 1,N ,n ,n ,rOut[153]=24.r阶累积量:Out[154]=Cumulant OrderDistribution DiscreteUniformDistribution 1,N ,n ,n ,rOut[155]=25.信息熵:[1,N]离散均匀分布样本最大值分布-描述统计.nb7Out[156]=k 1NLog1Nk N n k Nnk 1&&k N 01 1 1Nn k N 0&&k 10k N 0 k 1 11Nn k 1&&k N 0 N nTrue1Nk N n k Nnk 1&&k N 01 1 1Nn k N 0&&k 10k N 0 k 1 11Nn k 1&&k N 0 N nTrue8 [1,N]离散均匀分布样本最大值分布-描述统计.nb。
[1,N]离散均匀分布样本中位数分布-描述统计
1,N 离散均匀分布样本中位数分布基于Wolfram Mathematica9,下表给出了 1,N 区间内离散均匀分布DU 1,N 样本中位数的概率密度(质量)函数、累积分布函数、累积分布函数、逆生存函数、风险函数(故障率)、矩母函数 MGF 、中心矩母函数 CMGF 、累积量母函数 CGF 、阶乘矩母函数 FMGF 、特征函数的计算和结果表达式,均值、中位值、众数、四分位数列表、q分位数、方差、标准差、一三四分位数间矩、偏度系数、峰度系数、四分偏度系数、r阶原点矩、r阶中心矩、r阶阶乘矩、r阶累积量、信息熵等描述性统计量的计算和结果表达式。
dist DiscreteUniformDistribution 1,N ;dist1 OrderDistribution dist,2n 1 ,n 1 ;"1.概率密度(质量)函数:"PDF dist1,k"2.累积分布函数:"CDF dist1,k"3.生存(可靠性)函数:"SurvivalFunction dist1,k"4.逆生存函数:"InverseSurvivalFunction dist1,q"5.风险函数(故障率):"HazardFunction dist1,k"6.矩母函数 MGF :"MomentGeneratingFunction dist1,t"7.中心矩母函数 CMGF :"CentralMomentGeneratingFunction dist1,t"8.累积量母函数 CGF :"CumulantGeneratingFunction dist1,t"9.阶乘矩母函数 FMGF :"CharacteristicFunction dist1,t"10.特征函数:"CharacteristicFunction dist1,t"11.均值:"Mean dist1"12.中位值:"Median dist1"13.四分位数列表:"Quartiles dist1"14.q分位数:"Quantile dist1,q"15.方差:"Variance dist1"16.标准差:"StandardDeviation dist1"17.一、三四分位数间矩:"InterquartileRange dist1"18.偏度系数:"Skewness dist1"19.峰度系数:"Kurtosis dist1"20.四分偏度系数:"QuartileSkewness dist1"21.r阶原点矩矩:"Moment dist1,r"22.r阶中心矩:"CentralMoment dist1,r"23.r阶阶乘矩:"FactorialMoment dist1,r"24.r阶累积量:"Cumulant dist1,r"25.信息熵:"Sum PDF dist1,k Log PDF dist1,k , k,1,N 1.概率密度(质量)函数:BetaRegularized 1N kN,1 n,1 n BetaRegularized kN,1 n,1 n k 1&&k N 01 BetaRegularized 1 1N,1 n,1 n k 1&&k N 0BetaRegularized 1N,1 n,1 n k 1&&k N 0 0True2.累积分布函数:BetaRegularized Floor kN,1 n,1 n 1 k N1k N0True3.生存(可靠性)函数:1k 1BetaRegularized N Floor kN,1 n,1 n 1 k N0True4.逆生存函数:ConditionalExpression Max 1,Ceiling N 1 InverseBetaRegularizedq,1 n,1 nInverseBetaRegularizedN InverseBetaRegularized 1True5.风险函数(故障率):2[1,N]离散均匀分布样本中位数分布-描述统计.nb1 BetaRegularized k N N,1 n,1 n1 k 2&&k N 01k 2 0 k N 1 BetaRegularized k N N,1 n,1 nBetaRegularized 1 k NN,1 n,1 nBetaRegularized 1 k N N ,1 n,1 nk 2&&k N 0True6.矩母函数 MGF :MomentGeneratingFunctionOrderDistribution DiscreteUniformDistribution 1,N ,1 2n ,1 n ,t 7.中心矩母函数 CMGF :CentralMomentGeneratingFunctionOrderDistribution DiscreteUniformDistribution 1,N ,1 2n ,1 n ,t 8.累积量母函数 CGF :CumulantGeneratingFunctionOrderDistribution DiscreteUniformDistribution 1,N ,1 2n ,1 n ,t 9.阶乘矩母函数 FMGF :CharacteristicFunctionOrderDistribution DiscreteUniformDistribution 1,N ,1 2n ,1 n ,t 10.特征函数:CharacteristicFunctionOrderDistribution DiscreteUniformDistribution 1,N ,1 2n ,1 n ,t 11.均值:Mean OrderDistribution DiscreteUniformDistribution 1,N ,1 2n ,1 n 12.中位值:ConditionalExpressionMax 1,Ceiling N InverseBetaRegularized 12,1 n,1 nInverseBetaRegularized1InverseBetaRegularized NTrue13.四分位数列表:[1,N]离散均匀分布样本中位数分布-描述统计.nb3ConditionalExpression Max 1,Ceiling N InverseBetaRegularized 14,1 n,1 nInverseBetaRegularized1InverseBetaRegularized N TrueConditionalExpression Max 1,Ceiling N InverseBetaRegularized 12,1 n,1 nInverseBetaRegularized1InverseBetaRegularized N TrueConditionalExpression Max 1,Ceiling N InverseBetaRegularized 34,1 n,1 nInverseBetaRegularized1InverseBetaRegularized N True14.q分位数:ConditionalExpression Max 1,Ceiling N InverseBetaRegularized q,1 n,1 nInverseBetaRegularized1InverseBetaRegularized N True15.方差:Variance OrderDistribution DiscreteUniformDistribution 1,N ,1 2n ,1 n16.标准差:StandardDeviationOrderDistribution DiscreteUniformDistribution 1,N ,1 2n ,1 n17.一、三四分位数间矩:4[1,N]离散均匀分布样本中位数分布-描述统计.nbConditionalExpression 1 N InverseBetaRegularized14,1 n,1 n 1&&InverseBetaRegularized1 N InverseBetaRegularized14,1 n,1 n 0&&InverseBetaRegularized1Max 1,Ceiling N InverseBetaRegularized14,1 n,1 n0 InverseBetaRegularized14,1 n,1 n 1&&InverseBetaRegularizedNMax 1,Ceiling N InverseBetaRegularized14,1 n,1 n0 InverseBetaRegularized14,1 n,1 n 1&&InverseBetaRegularized1Max 1,Ceiling N InverseBetaRegularized34,1 n,1 nInverseBetaRegularized0&&0 InverseBetaRegularize34,1 n,1 n 1NMax 1,Ceiling N InverseBetaRegularized34,1 n,1 nInverseBetaRegularized1&&0 InverseBetaRegularize34,1 n,1 n 1Max 1,Ceiling N InverseBetaRegularized14,1 n,1 nMax 1,Ceiling N InverseBetaRegularized34,1 n,1 n0 InverseBetaRegularized14,1 n,1 n 1&&0 InverseBetaRegularized34,1 n,1 n 10True0 InverseBetaRegularized 34,1 n,1 n 118.偏度系数:Skewness OrderDistribution DiscreteUniformDistribution 1,N ,1 2n ,1 n19.峰度系数:Kurtosis OrderDistribution DiscreteUniformDistribution 1,N ,1 2n ,1 n20.四分偏度系数:1 InverseBetaRegularized1&&InverseBetaRegularize14,1 n,1 n &&InverseBetaRegularized,1 n,1 n 1InverseBetaRegularized0&&InverseBetaRegularize1,1 n,1 n &&[1,N]离散均匀分布样本中位数分布-描述统计.nb54,1 n,1 n &&InverseBetaRegularized12,1 n,1 n Indeterminate InverseBetaRegularized1&&InverseBetaRegularize12,1 n,1 n &&InverseBetaRegularized,1 n,1 n 1InverseBetaRegularized0&&InverseBetaRegularize12,1 n,1 n &&InverseBetaRegularized34,1 n,1 n1 InverseBetaRegularized1&&InverseBetaRegularize12,1 n,1 n &&InverseBetaRegularized,1 n,1 n 1InverseBetaRegularized0&&InverseBetaRegularize12,1 n,1 n &&InverseBetaRegularized34,1 n,1 n ComplexInfinity InverseBetaRegularized1&&InverseBetaRegularize14,1 n,1 n &&InverseBetaRegularized,1 n,1 n 1InverseBetaRegularized0&&InverseBetaRegularize14,1 n,1 n &&InverseBetaRegularized3 4,1 n,1 n1 2N Max 1,Ceiling N InverseBetaRegularized 14,1 n,1 n 1 Max 1, Ceiling N InverseBetaRegularized1 4,1 n,1 n0 InverseBetaRegularized14,1 n,1 n 1&&InverseBetaRegularized0&&InverseBetaRegularized2 N Max 1,Ceiling N InverseBetaRegularized 1,1 n,1 n N Max 1,0 InverseBetaRegularized14,1 n,1 n 1&& InverseBetaRegularized1&&6[1,N]离散均匀分布样本中位数分布-描述统计.nbConditionalExpression4,1 n,1 n N Max 1,Ceiling N InverseBetaRegularized14,1 n,1 nInverseBetaRegularized1&&InverseBetaRegularized11 N 1 N 2Max 1,Ceiling N InverseBetaRegularized12,1 n,1 nInverseBetaRegularized14,1 n,1 n 1&&InverseBetaRegularized0&&0 InverseBetaRegularize12,1 n,1 n 1 11 N 1 N 2Max 1,Ceiling N InverseBetaRegularized12,1 n,1 nInverseBetaRegularized14,1 n,1 n 0&&InverseBetaRegularized1&&0 InverseBetaRegularize12,1 n,1 n 11 Max 1,Ceiling N InverseBetaRegularized14,1 n,1 n 2Max 1,Ceiling N InverseBetaRegularized12,1 n,1 n 1 Max 1,Ceiling N InverseBetaRegularized14,1 n,1 n0 InverseBetaRegularized14,1 n,1 n 1&&InverseBetaRegularized0&&0 InverseBetaRegularize12,1 n,1 n 1N Max 1,Ceiling N InverseBetaRegularized14,1 n,1 n 2Max 1,Ceiling N InverseBetaRegularized12,1 n,1 n N Max 1,Ceiling N InverseBetaRegularized14,1 n,1 n0 InverseBetaRegularized14,1 n,1 n 1&&InverseBetaRegularized1&&0 InverseBetaRegularize12,1 n,1 n 11 2N Max 1,Ceiling N InverseBetaRegularized34,1 n,1 n 1 Max 1,Ceiling N InverseBetaRegularized34,1 n,1 nInverseBetaRegularized0&&0 InverseBetaRegularize34,1 n,1 n 1&&InverseBetaRegularized 2 N Max 1,Ceiling N InverseBetaRegularized34,1 n,1 n N Max 1,Ceiling N InverseBetaRegularized34,1 n,1 nInverseBetaRegularized1&&0 InverseBetaRegularize34,1 n,1 n 1&&InverseBetaRegularized 2 Max 1,Ceiling N InverseBetaRegularized14,1 n,1 n Max 1,Ceiling N InverseBetaRegularized0 InverseBetaRegularized14,1 n,1 n 1&&0 InverseBetaRegularized3,1 n,1 n 1&&[1,N]离散均匀分布样本中位数分布-描述统计.nb7Ceiling N InverseBetaRegularized34,1 n,1 n Max 1,Ceiling N InverseBetaRegularized14,1 n,1 n Max 1,Ceiling N InverseBetaRegularized 34,1 n,1 n4,1 n,1 n 1&&InverseBetaRegularized2N Max 1,Ceiling N InverseBetaRegularized14,1 n,1 n Max 1,Ceiling N InverseBetaRegularized 34,1 n,1 n Max 1,Ceiling N InverseBetaRegularized14,1 n,1 n Max 1,Ceiling N InverseBetaRegularized 34,1 n,1 n0 InverseBetaRegularized14,1 n,1 n 1&&0 InverseBetaRegularized 34,1 n,1 n 1&&InverseBetaRegularized1 2Max 1,Ceiling N InverseBetaRegularized12,1 n,1 n Max 1,Ceiling N InverseBetaRegularized 34,1 n,1 n1 Max 1,Ceiling N InverseBetaRegularized34,1 n,1 nInverseBetaRegularized0&&0 InverseBetaRegularize34,1 n,1 n 1&&0 InverseBetaRegularized12,1 n,1 n 1N 2Max 1,Ceiling N InverseBetaRegularized12,1 n,1 n Max 1,Ceiling N InverseBetaRegularized 34,1 n,1 nN Max 1,CeilingN InverseBetaRegularized34,1 n,1 nInverseBetaRegularized1&&0 InverseBetaRegularize34,1 n,1 n 1&&0 InverseBetaRegularized12,1 n,1 n 1Max 1,Ceiling N InverseBetaRegularized 14,1 n,1 n 2Max 1,Ceiling N InverseBetaRegularized12,1 n,1 n Max 1,Ceiling N InverseBetaRegularized34,1 n,1 n Max 1,Ceiling N InverseBetaRegularized14,1 n,1 n Max 1,Ceiling N InverseBetaRegularized34,1 n,1 nTrue&&8 [1,N]离散均匀分布样本中位数分布-描述统计.nb0 InverseBetaRegularized 12,1 n,1 n 1&&0 InverseBetaRegularized 34,1 n,1 n 121.r 阶原点矩矩:Moment OrderDistribution DiscreteUniformDistribution 1,N ,1 2n ,1 n ,r 22.r 阶中心矩:CentralMomentOrderDistribution DiscreteUniformDistribution 1,N ,1 2n ,1 n ,r 23.r 阶阶乘矩:FactorialMomentOrderDistribution DiscreteUniformDistribution 1,N ,1 2n ,1 n ,r 24.r 阶累积量:Cumulant OrderDistribution DiscreteUniformDistribution 1,N ,1 2n ,1 n ,r 25.信息熵:k 1NLogBetaRegularized 1Nk N ,1 n,1 n BetaRegularized k N,1 n,1 n k 1&&k1 BetaRegularized 11N,1 n,1 n k 1&&k BetaRegularized 1N,1 n,1 n k 1&&k 0True[1,N]离散均匀分布样本中位数分布-描述统计.nb9。
《概率论与数理统计》第4-7 章自测题讲评
《概率论与数理统计》第4-7章自测题讲评第四章﹑数字特征1. 设随机变量X 的密度函数f(x)= ⎩⎨⎧5x 4 0≤x ≤10 其他 , 求数学期望EX 。
【讲评】考点:连续型随机变量数学期望的定义为EX= ∫-∞+∞xf(x)dx 。
[解]:EX= ∫-∞+∞xf(x)dx = 5∫01x 5dx = 5[x 56]01= 562.设随机变量X ~N (-1,3),Y ~N (0,5),Cov(X ,Y )=0.4,求D (X +Y )的值。
【讲评】考点:正态分布N(μ, σ2)的数字特征,EX=μ,DX=σ2。
和的方差公式:D(X+Y)=DX+DY+2Cov(X, Y)。
[解]:D(X+Y)=DX+DY+2Cov(X, Y)= 3+5+2×0.4 = 8.83. 设随机变量X 和Y 的密度函数分别为f X (x)= ⎩⎨⎧0.5, 1≤x ≤30, 其它 ,f Y (y)= ⎩⎨⎧3e -3y , y>00, y ≤0 ,若X ,Y 相互独立,求: E(XY)【讲评】考点:均匀分布与指数分布的数学期望,X~U[a,b] ⇒ EX=a+b 2 。
X~exp(λ) ⇒ EX=1λ 。
若X 与Y 相互独立,则 E(XY)=EXEY 。
本题:注意:X~U[1,3], Y~Exp(3) ⇒ EX=1+32 =1, EY=1/3,因为X, Y 相互独立,则 E(XY)=E(X)E(Y)=1×(1/3) =1/34. 设 X 服从参数为 λ 的普阿松分布(λ>0),则下列6个等式中那几个是错误的。
DX=1λ , E(X)D(X) =1 , E(X 2)=E(X)[E(X)+1] , E(X) = λ , E (X - λ)2 = 0, EX=λ2+λ【讲评】考点:普阿松分布X~P(λ)的数字特征:EX=λ, DX=λ 。
及DX = E(X-EX)2 = EX 2 – (EX)2 , EX 2 =DX+(EX)2本题:X~P(λ) ⇒ EX=λ, DX=λ, EX 2=λ+λ2 .所以E(X)D(X) =1,E(X 2)=λ2+λ=E(X)[E(X)+1],E(X) = λ,但是 DX=1λ , E (X - λ)2 = 0, 这两个是错误等式。
统计学第3章数据分布特征描述
3.分析现象之间的依存关系。 如研究劳动者文化程度与收入的关系。
4.(数值)平均指标是推断统计中的重要 统计量,是进行统计推断的基础。
几种常见的位置特征数
N
MH
N
i 1
1
1 xi
wi
wi
i 1
N
i 1
1 xi
wi
N
wi
i 1
MH
1 N1
N N1
i1 xi i1 xi
N
k0:几何平均数 加权
N
M G i 1w i x 1 w 1x2 w 2 xN w N
简单
M G N x 1x 2 x N
fi
i1
i 1(xifi)254 674 58 012 1110 % 01.7 1%
n(xifi) i1 xi
1 2% 6 56 1 4% 0 75 1 4% 2 80 10350
(四)几何平均数(Geometric mean)
简单几何平均数— n个变量值连乘积的n次方根。
n(xi x)2 min
i1
性质(3)证明:
(三)调和平均数(Harmonic mean)
调和平均数,也称倒数平均数。 各变量值倒数(1/xi)的算术平均数的倒数。 计算公式为:
n
xHx11m1x12m12... x1nmn
m1m2... mn
m1m2 ... mn
与单项式分组资料一样,采用加权算术平均数计算。
数理统计作业答案
数理统计作业答案1、设总体X 服从正态分布),(2σµN ,其中µ已知,2σ未知,n X X X ,,,21 为其样本,2≥n ,则下列说法中正确的是( D )。
(A )∑=-ni i X n122)(µσ是统计量(B )∑=ni i X n122σ是统计量(C )∑=--ni iX n 122)(1µσ是统计量(D )∑=ni iX n12µ是统计量2、设两独⽴随机变量)1,0(~N X ,)9(~2χY ,则YX 3服从( C )。
服从( C )。
4、设n X X ,,1 是来⾃总体X 的样本,且µ=EX ,则下列是µ的⽆偏估计的是( A ). 5、设4321,,,X X X X 是总体2(0,)N σ的样本,2σ未知,则下列随机变量是统计量的是( B ).(A )3/X σ;(B )414ii X=∑;(C )σ-1X ;(D )4221/ii Xσ=∑6、设总体),(~2σµN X ,1,,n X X 为样本,S X ,分别为样本均值和标准差,则下列正确的是( C ).7、设总体X 服从两点分布B (1,p ),其中p 是未知参数,15,,X X 是来⾃总体的简单随机样本,则下列随机变量不是统计量为( C ) ( A ) . 12X X +( B ) {}max,15i X i ≤≤( C ) 52X p + ( D ) ()251X X -8、设1,,n X X 为来⾃正态总体2(,)N µσ的⼀个样本,µ,2σ未知。
则2σ的最⼤似然估计量为( B )。
(A )∑=-n i i X n 12)(1µ (B )()211∑=-n i i X X n (C )∑=--n i i X n 12)(11µ(D )()∑=--n i i( D )分布.10、设1,,n X X 为来⾃正态总体2 (,)N µσ的⼀个样本,µ,2σ未知。
初级统计复习笔记整理—统计学基础知识
第一章统计学和数据第一节统计学的含义及其应用统计学:关于数据的一门学问所关注的是大量可重复事物现象数量特征总体:研究的全部个体或数据的集合往往只有一个,特征唯一确定的,但未知的样本:从总体中抽取的一部分元素构成的集合不唯一,不确定,特征已知的样本量n:构成样本的元素的数目统计方法:描述统计:搜集、处理和描述推断统计:利用样本数据推断总体特征(参数估计和假设检验)第二节统计学发展简史古典统计学:国势学派—H·康令“显著事项”、有统计学之名,无统计学之实政治算术学派—威廉·配第(统计学创始人),有统计学之实,无统计学之名近代统计学:A·凯特勒(统计学之父)现代统计学:哥塞特—推断统计学先驱者费雪—推断统计学建立者第三节变量与数据观察数据:客观现象....观测得到无人为控制和条件约束实验数据:科学实验环境下得到的数据第四节数据的搜集↓↓↓直接来源(一手数据/原始数据):统计调查(观测数据)实验(实验数据):实验组和对照组的产生是随机的,匹配的。
间接来源(二手数据/次级数据):由其他人搜集和整理得到的统计数据公开出版的数据未公开发表的数据网络爬取的数据搜集数据方式:1.询问(访谈):面访(面对面交谈)、邮寄、计算机辅助电话调查、座谈会、个别深入访谈2.观察实验:观察法(调查对象没有意识到的情况下)、实验法第五节数据的误差↓抽样误差:不可避免,概率抽样中能计量并控制......总体内部差异越大,误差越大样本容量越大,误差越小重复抽样误差大于不重复抽样,分层抽样误差小于其他抽样非抽样误差:不能通过增大样本量加以控制抽样框误差,应答误差,无回答误差,计量误差(登记错误)第二章 数据描述第一节用统计量描述数据集中趋势平均数...①② 受极端值影响 主用于数值型数据 数据对称分布时应用 中位数...③/分位数...④ 不受极端值影响.......主用于顺序数据....... 数据分布偏斜程度较大时应用众数..⑤ 主用于分类数据中位数不能用于分类数据...........众数、中位数和平均数的关系:均值在哪边就是往哪边偏众数中位数均值对称分布众数中位数均值 左偏分布....众数中位数均值右偏分布....公式① 算术平均数简单平均数(未分组):x =x 1+x 2+ ···+x nn =∑x in i=1n加权平均数(分组):x=x 1f 1+x 2f 2+ ···+x k f kf 1+f 2+ ···+f k=∑x i f i k i=1∑f ik i=1有分组取组中值为平均数,若有开口组, 上开口组....:组中值=该组上限-(下组上限-下组下限)/2 下开口组....:组中值=该组下限-(上组上限-上组下限)/2② 几何平均数简单(每个数据只出现一次):G =√x 1·x 2·… ·x n n=√∏x n加权(每个数据出现不止一次):G =√x 1f 1·x 2f 2·… ·x n f n f 1+f 2+···+f n =√∏x f ∑f x③ 中位数 n 是奇数:M e=x n+12n 是偶数:M e =12[x(n 2)+x (n 2+1)]下限公式:M e=L +∑f2−S m−1f m·dL :中位数所在组上限 ∑f :各组频数之和 S m−1:中位数所在组以前各组的累计频数 d :中位数所在组组距 上限公式....:M e =U −∑f2−S m+1f m·dU :中位数所在组下限 f m :中位数所在组的频数 S m+1:中位数所在组以后各组的累计频数④ 分位数:Q L =(n +1)/4 Q M =2(n +1)/4 Q U =3(n +1)/4⑤ 众数下限公式:M 0=L +∆1∆1+∆2·d 上限公式:M 0=U −∆2∆1+∆2·d∆1:众数所在组的频数与前一组频数之差 ∆2:众数所在组的频数与后一组频数之差公式⑥异众比率V r=1−f0∑f i(f0:众数组的频数)⑦极差/全距R=max(x i)−min (x i)⑧四分位距:Q d=Q U−Q L⑨平均差未分组:MAD=∑|x i−x|n已分组:MAD=∑|x i−x|f∑f⑪离散系数总体:Vσ=σx̅样本:V s=sx̅⑫标准分数z i=x i−x̅sz的均值=0 标准差s=1(z=1.2,说明观察值比平均值大1.2倍s)偏态系数(SK)⑬峰值系数(K)⑭SK=0对称SK<0左偏SK>0右偏正态分布K<0扁平分布K>0尖峰分布公式⑬偏态系数未分组:SK=n∑(x i−x̅)3 (n−1)(n−2)s3已分组:SK=n∑(M i−x̅)3f ins3⑭峰态系数未分组:K=n(n+1)∑(x i−x̅)4−3[∑(x i−x̅)2]2(n−1) (n−1)(n−2)(n−3)s4已分组:K=∑(M i−x̅)4f ins4−3第二节用表格描述数据频数分布表分组→频数分组数K=1+log(n) log(2)K:组数n:数据个数2K>n组距=全距/组数各组组距=上限-下限各组组中值=(上限+下限)/2等距数列:每一组距相等,研究的现象变动比较均匀...........不等距/异距数列:每一组距不全相等,研究的对象变动分布均匀,波动幅度很大......“上限不在内”原则第三节用图形描述数据1.直方图用矩形面积表示各组频数分布(面积之和...)....=.总频数对于不等距分组,纵轴必须表示为频数密度(频数..)......../.组距2.箱线图找5个特征点:最大值、最小值、中位数、两个四分位数3.茎叶图类似横置直方图,既反映数据分布,又保留原始数据大致信息4.折线图5.气泡图6.雷达图(蜘蛛图):总的绝对值与图形所围成的区域成正比.................Array 7.散点图:观.察两个变量之间的相关程度和类型最直观的方法.....................8.条形图9.饼图:主要用于结构性问题研究10.环形图:反映多个样本(或总体)之间的结构差异11.帕累托图:双直接坐标系表示,左边纵坐标表示频数,右边纵坐标表示频率,分析线表示累计频率按各类别数据出现的频率排序(降序),并画出累计百分比双直角坐标系表示第三章参数估计第一节统计量与抽样分布一、统计量的抽样分布统计量:对样本数量特征的概括性度量不含任何未知参数的样本的函数是一个随机变量不同样本可算出不同的统计量值抽样分布:样本统计量的概率分布仅仅是一种理论分布提供了样本统计量长远而稳定的信息,构成推断总体参数的理论基础点估计:用样本统计量的某个实际取值作为相应的总体参数的估计值的过程常用——用样本均值x̅估计总体均值μ用样本比例p估计总体比例π用样本方差s2估计总体方差σ2总体参数是未知的,但可以利用样本信息来推断。
数理统计试题及答案
一、 (满分12分)X X X n ,,,12是总体X 的随机样本, X 的密度函数为)( ⎩≥⎨=><<∞⎧-λλλx f x e x x 0,0()0,0(1) 求X 的特征函数;(2) 利用X 的特征函数,求EX D X ,(); (3) 求∑==S X k k n1的概率密度函数. 二、(满分8分))(>X X X n n ,,,1122是总体μσN (,)2的随机样本,记 ,∑∑∑∑+--===-=-=-==+==+S S n n n n Y X Y X S X Y S X Y Z n Y Y k k n k k n k k k k n n n n 11,,(),()1111()121111*2*212112212*22*2222求统计量Z 的分布.三、 (满分14分)总体X 服从均匀分布θU (0,), X X X n ,,,12为其样本,(1) 证明,==+=+θθθn X n X X n n ,(1)2ˆˆˆ11()2(1)3都是未知参数θ的无偏估计; (2) 比较这三个估计量的优劣性.四、(满分14分)测得两批电子器材的电阻值(单位:Ω)分别为:A 批: 30, 32, 34, 36, 38, 42, 48, 52, 52, 56B 批: 31, 33, 37, 42, 46, 48, 53, 55, 56, 59设A 批器材的电阻μσX N ~(,),112B 批器材的电阻μσY N ~(,)222,而且总体相互独立.在显著性水平=α0.05下,能否认为两批器材的电阻的分布相同? 五、(满分14分)X X X n ,,,12是总体X 的随机样本,X 的密度函数为他其)( ⎩⎪⎨=>⎪<<⎧-θθθθf x x x 0,(;)0,01111(1)求未知参数θ的极大似然估计量θˆ; (2)证明θˆ是未知参数θ的UMVUE .六、(满分8分)将一颗骰子掷了120次,所得结果如下: 点数i 1 2 3 4 5 6 出现次数νi232718221416试在显著性水平=α0.05下,检验一颗骰子是否均匀、对称?七、 (满分16分)假定在某种产品表面进行腐蚀刻线试验,得到腐蚀深度y 与腐蚀时间x 对应的数据如下:x s / 1 2 3 4 5 6 7 8 9 10 μy m /7101316182123252730应用线性模型⎩⎨⎧=++εσεεεεN y a bx n ~(0,),,,,212为其样本.(1) 求a 和b 的最小二乘估计及回归方程;(2) 在显著性水平=α0.05下,检验原假设=H b :00;(3)预测腐蚀时间为=x s 6.50时,腐蚀深度y 0的范围-=a (10.95); (4) 若要使腐蚀深度在20-26μm 之间,腐蚀时间应该如何控制(=α0.05).八、 (满分14分) 某种型号的电池4批,分别为四个工厂所生产.各随机抽取5只电池样品,得它们的寿命如下:A 140 48 40 42 45 A 2 26 34 30 28 32 A 339 40 41 50 50 A 43634404035试在显著性水平=α0.05下,检验各批电池的平均寿命有无显著性的差异. 附注:计算中可能用到的数据如下:,,,,,,)(======Φ===χF F F r F t t (99) 4.03(1,8) 5.32,(3,16) 3.24.511.071(8)0.6319(99) 3.18(1.96)0.975,(18) 2.101,(8) 2.306,0.9750.950.950.950.050.9520.9750.975一、(满分12) 解:(1)X 的特征函数为())1)00()()|1()it xitxit xX e itt f x e dx edx it λλλφλλλ---∞∞---∞-∞====---⎰⎰(((2)21222222221()1(0)(0)222()1(0)(0)1()X X X X X X i it i t EX i it t EX i DX EX EX φφφλλλλφφφλλλλλ----⎛⎫'''=-=== ⎪⎝⎭--⎛⎫''''''=-=== ⎪⎝⎭=-=,,;,,;.(3)S 的特征函数为S ()[()](1/)n n X t t it φφλ-==-所以),(λn Γ~ S ,其密度函数为.0,00,!1)(1S ⎪⎩⎪⎨⎧≤>-=--y y n e y y f yn n )(λλ 二、(满分8)解:根据抽样分布定理得,*2*22222121222*2*21212(1)(1)11~(,),~(,),~(1)~(1),,n S n S Y N Y N n n n n Y Y S S μσμσχχσσ----,并且,,相互独立.于是,212*2*212*2*2122~(0,)~(0,1)(1)(1)2~(22)21)(1)2Y Y N N n n S n S n n S n S σχσσ--+---+-,,相互独立. 由t 分布的定义得 ,~(16)~(22)t Z t n =-,即. 三、(满分14分)解: (1)X 的密度函数为X 的分布函数为 0,0(),01,x F x x x x θθθθ≤⎧⎪=<<⎨⎪≥⎩;)(n X 的密度函数为()11,0()[()]()0,n n n nX n x x f x n F x f x θθθθ--⎧<<⎪==⎨⎪⎩;;其他 ()1()01ˆ.1nn n nx n n EX n dx E E X n n θθθθθ+⎡⎤====⎢⎥+⎣⎦⎰, (1)X 的密度函数为(1)11(),0()[1()]()0,n n n X n x x f x n F x f x θθθθθ--⎧-<<⎪=-=⎨⎪⎩;;其他 1(1)2(1)0()ˆ(1)1n nx x EX n dx E E n X n θθθθθθ--⎡⎤===+=⎣⎦+⎰,. 3ˆ(2)2E E X EX θθ===. 所以,1()2(1)31ˆˆˆ,(1),2n n X n X X nθθθ+==+=都是θ的无偏估计量. 2)122222()()()()2()()2(2)(1)n n n n n nx n n EXn dx D X EX EX n n n θθθθ+===-=+++⎰, ()2122222(1)(1(1)(1)2()2()(2)(1)(2)(1)n nx x n EX n D X EX EX n n n n θθθθθ--===-=++++⎰,.10()0,x f x θθθ⎧<<⎪=⎨⎪⎩,;其他()()2221()2(1)31ˆˆˆ()()()(1)()2(2)23n n n D D X D D n X D D X n n n n nθθθθθθ+===+===++,,所以,当1n >,132ˆˆˆ()()()D D D θθθ<<, 132ˆˆˆθθθ最有效,次之,效果最差. 四、(满分14)解:首先检验 2222012112:,:H H σσσσ=≠ 当0H 成立时, *21*22~(9,9)S F F S =拒绝域为 0,975(9,9) 4.03F F ≥= 或0.0251(9,9)0.2484.03F F ≤== 得 *2*21242,88,46,99.3333x S y S ====*21*220.8859S F S ==由于0.2480.8859 4.03F <=<,所以接受0H ,即认为两批器材的电阻的方差没有显著性差异.在此基础上检验012112:,:H H μμμμ=≠ 当0H 成立时,~(18)t t =拒绝域为 0.975||(18) 2.101t t ≥= 计算可得0.9242t ==- 由于||0.9242 2.101t =<,所以接受0H ,即认为两批器材的电阻的均值没有显著性的差异.综合以上,可以认为两批器材的电阻的分布相同. 五、(满分14分)解:(1) 11111()(;)()0nnk kn k k L f x x θθθθθ-====>∏∏,取对数得,11ln ()ln 1ln nk k L n x θθθ=⎛⎫=-+- ⎪⎝⎭∑令211ln ()ln 0n k k d n L x d θθθθ==--=∑ 解得 =11ˆln nkk x n θ=-∑ 所以,未知参数θ的极大似然估计量 11ˆln n k k X n θ-=-∑. (2) :(;)0f x θθ>{}=(0,1)与未知参数θ无关.[]11101211222202111(ln )ln 1(ln )ln 2ln 11ˆˆln ,()ln ttn nk k k k tE X xx dx e dt t E X xx dx e dt D X E E X D D X n n n θθθθθθθθθθθθθθθ--∞--∞==-===-===-=⎡⎤⎡⎤=-==-=⎢⎥⎢⎥⎣⎦⎣⎦⎰⎰⎰⎰∑∑,,,,,2223222121ln 21);(ln )(θθθθθθθθ=+-=⎥⎦⎤⎢⎣⎡+-=⎥⎦⎤⎢⎣⎡∂∂-=X E X f E I 由于 21ˆ()()D nnI θθθ==, 所以,=11ˆln nkk X n θ=-∑是未知参数θ的有效估计量,也是未知参数θ的UMVUE . 六、(满分8分)解: 0111:(1,2,,6),:(1,2,,6)66i i H p i H p i ===不全是当0H 成立时, 26221()(5).k k k k np np νχχ=-=∑近似服从 拒绝域为 22210.95(5)=(5)11.071αχχχ-≥=经计算得 2621() 5.911.071k k k knp np νχ=-==<∑ 所以接受0H ,可以认为这个骰子是均匀、对称的. 七、(满分16)解:(1)21112111155,()82.5,19,()512,205.n nn k xx k k k k k n nyy k xy k k k k x x L x x y y n n L y y L x y nx y ========-====-==-⨯=∑∑∑∑∑.设a 和b 的最小二乘估计分别为aˆ和b ˆ,则 205ˆˆˆ 5.3333, 2.484882.5xy xx L ay bx b L =-==== 回归方程为 ˆˆˆ 5.3333 2.4848ya bx x =+=+. (2)0:,0:10≠=b H b H当0H 成立时, )2(~ˆˆ-=n t L bt xx e σ拒绝域为 1-/20.975||(2)(8) 2.306t t n t α≥-==计算可得,ˆ0.570839.541e t σ====,由于||39.541 2.306t =>,所以,拒绝0H ,认为回归效果显著.(3)当0 6.5x =时,ε++=00bx a y ,00ˆˆˆ21.4848y a bx =+= 由于, )2(~)(11ˆˆ2000--++-=n t Lxxx x n y yt e σ得到, αα-=-<-1)}2(|{|21n tt P所以,成本0y 的置信水平为α-1的预测区间为120012ˆˆˆˆ(2)(2).yt n y t n αασσ--⎛--+- ⎝代入数据计算可得,001122ˆ20.1ˆˆˆ((22.870e e y t n y t n αασσ----+-=,所以,当06x =.5,腐蚀深度0y 的置信水平为95.0的预测区间为20.10,22.87().(4)当腐蚀深度在20-26m μ之间,近似地有0.97511ˆˆ'(')(200.5708 1.96 5.3333) 6.35ˆ 2.4848e x y u a b σ=+-=+⨯-=0.97511ˆˆ''('')=(260.5708 1.96 5.3333)7.87ˆ 2.4848e x y u a bσ=---⨯-= 所以,腐蚀时间控制6.35~7.87s ,可以使腐蚀深度在20-26m μ之间. 八(满分14)、解:20,5,44321======n n n n n r)4,,2,1(:,:143210 ====k H H k μμμμμ不全相同.当0H 成立时, ),1(~1r n r F rn S r S F e A----=拒绝域为 10.95(1,)(3,16) 3.24F F r n r F α-≥--== . 计算可得,1122111111111143,()48n n k k k k x x n S x x n =====-=∑∑2222222222112130,()40n n kk k k x xn S x x n =====-=∑∑3322333333113144,()122n n k k k k x x n S x x n =====-=∑∑4422444444114137,()32n n kk k k x xn S x x n =====-=∑∑24212==∑=rk kk e S n S 42211()5()625rA k k k k k S n x x x x ===-=-=∑∑由于 113.77 3.24Ae S r F S n r-==>-,所以拒绝0H ,即认为不同厂家的电池的平均寿命有显著性差异.。
实验9 随机模拟
(5)二项分布随机数 1) binornd(n, p):产生一个二项分布随机数 2) binornd(n,p,m,n)产生m行n列的二项分布随机数 例4、产生B(10, 0.8)上的一个随机数,15个随机数, 3行6列的随机数。 命令 (1) y1=binornd(10,0.8) (2) y2=binornd(10,0.8,1,15) (3) y3=binornd(10,0.8,3,6)
生成Y = min{ X 1 , X 2 , , X n }的随机数
(2)离散分布的直接抽样法 设分布律为P(X=xi)= pi , i=1, 2, ... ① 产生均匀随机数u,即u~U(0,1) ②
2,3, xi 若p1 + ... + pi −1 < u ≤ p1 + ... + pi , (i = X = 若u ≤ p1 x1
练习3: 掷一枚骰子两次,比较掷出的点数之和为9 和为10这两个事件何者更容易发生.,
二 中心极限定理 中心极限定理讨论的是充分大的n,互相独立的 随机变量X1,X2,……..,Xn的和的分布问题。即:
∑X
i =1
n
i
近似服从正态分布。
{ X i , i = 1, 2,3}
例7、设{Xi ,i=1,2,3…} 是一些独立同分布的随机变 量且它们都服从泊松分布P(λ),则部分和
(1)均匀分布U(a,b) 1)unifrnd (a,b)产生一个[a,b] 均匀分布的随机数 2)unifrnd (a,b,m, n)产生m行n列的均匀分布随机数矩阵 当只知道一个随机变量取值在(a,b)内,但不 知道(也没理由假设)它在何处取值的概率大,在 何处取值的概率小,就只好用U(a,b)来模拟它。
[1,N]离散均匀分布样本最小值分布-描述统计
1,N 离散均匀分布样本最小值分布基于Wolfram Mathematica9,下表给出了 1,N 区间内离散均匀分布DU 1,N 样本最小值的概率密度(质量)函数、累积分布函数、累积分布函数、逆生存函数、风险函数(故障率)、矩母函数 MGF 、中心矩母函数 CMGF 、累积量母函数 CGF 、阶乘矩母函数 FMGF 、特征函数的计算和结果表达式,均值、中位值、众数、四分位数列表、q分位数、方差、标准差、一三四分位数间矩、偏度系数、峰度系数、四分偏度系数、r阶原点矩、r阶中心矩、r阶阶乘矩、r阶累积量、信息熵等描述性统计量的计算和结果表达式。
In[53]:=dist DiscreteUniformDistribution 1,N ;dist1 OrderDistribution dist,n ,1"1.概率密度(质量)函数:"PDF dist1,k"2.累积分布函数:"CDF dist1,k"3.生存(可靠性)函数:"SurvivalFunction dist1,k"4.逆生存函数:"InverseSurvivalFunction dist1,q"5.风险函数(故障率):"HazardFunction dist1,k"6.矩母函数 MGF :"MomentGeneratingFunction dist1,t"7.中心矩母函数 CMGF :"CentralMomentGeneratingFunction dist1,t"8.累积量母函数 CGF :"CumulantGeneratingFunction dist1,t"9.阶乘矩母函数 FMGF :"CharacteristicFunction dist1,t"10.特征函数:"CharacteristicFunction dist1,t"11.均值:"Mean dist1"12.中位值:"Median dist1"13.四分位数列表:"Quartiles dist1"14.q分位数:"Quantile dist1,q"15.方差:"Variance dist1"16.标准差:"StandardDeviation dist1"17.一、三四分位数间矩:"InterquartileRange dist1"18.偏度系数:"Skewness dist1"19.峰度系数:"Kurtosis dist1"20.四分偏度系数:"QuartileSkewness dist1"21.r阶原点矩矩:"Moment dist1,r"22.r阶中心矩:"CentralMoment dist1,r"23.r阶阶乘矩:"FactorialMoment dist1,r"24.r阶累积量:"Cumulant dist1,r"25.信息熵:"Sum PDF dist1,k Log PDF dist1,k , k,1,NOut[54]=OrderDistribution DiscreteUniformDistribution 1,N ,n ,1 Out[55]= 1.概率密度(质量)函数:Out[56]= 1 kN n 1 1N k N n k 1&&k N 0 N n k N 0&&k 1 0k N 0 k 1 1 N n k 1&&k N 0 1 1 1N n TrueOut[57]= 2.累积分布函数:Out[58]=1 1 Floor kN n1 k N 1k N0TrueOut[59]= 3.生存(可靠性)函数:Out[60]=1k 1 N Floor k N n1 k N 0TrueOut[61]= 4.逆生存函数:Out[62]=ConditionalExpression Max 1,Ceiling N 1 q1n 0 q1n 1N q1n 01True,0 q1n 1Out[63]= 5.风险函数(故障率):2[1,N]离散均匀分布样本最小值分布-描述统计.nbOut[64]=1 k N Nn1 k 2&&k N 01k 2 0 k N 1 1 k N Nn11 k N Nn1k N Nnk 2&&k N 00TrueOut[65]= 6.矩母函数 MGF :Out[66]=MomentGeneratingFunctionOrderDistribution DiscreteUniformDistribution 1,N ,n ,1 ,t Out[67]=7.中心矩母函数 CMGF :Out[68]=CentralMomentGeneratingFunctionOrderDistribution DiscreteUniformDistribution 1,N ,n ,1 ,t Out[69]=8.累积量母函数 CGF :Out[70]=CumulantGeneratingFunctionOrderDistribution DiscreteUniformDistribution 1,N ,n ,1 ,t Out[71]=9.阶乘矩母函数 FMGF :Out[72]=CharacteristicFunctionOrderDistribution DiscreteUniformDistribution 1,N ,n ,1 ,t Out[73]=10.特征函数:Out[74]=CharacteristicFunctionOrderDistribution DiscreteUniformDistribution 1,N ,n ,1 ,t Out[75]=11.均值:Out[76]=Mean OrderDistribution DiscreteUniformDistribution 1,N ,n ,1 Out[77]=12.中位值:Out[78]=ConditionalExpressionMax 1,Ceiling 1 2 1 n N 0 1 2 1 n 111 2 1 n 0NTrue,0 2 1 n 1Out[79]=13.四分位数列表:Out[80]=ConditionalExpressionMax 1,Ceiling 1 34N 0 1 341n 111 341n 0NTrue,0341n1 ,ConditionalExpressionMax 1,Ceiling 1 2 1 n N 0 1 2 1 n 111 2 1 n 0NTrue,0 2 1 n 1 ,ConditionalExpressionMax 1,Ceiling 1 4 1 n N 0 1 4 1 n 111 4 1 n 0NTrue,0 4 1 n 1[1,N]离散均匀分布样本最小值分布-描述统计.nb3Out[81]=14.q 分位数:Out[82]=ConditionalExpressionMax 1,Ceiling N 1 1 q 1n 0 1 1 q 1n 111 1 q 1n0NTrue,0 1 q 1n 1Out[83]=15.方差:Out[84]=Variance OrderDistribution DiscreteUniformDistribution 1,N ,n ,1 Out[85]=16.标准差:Out[86]=StandardDeviation OrderDistribution DiscreteUniformDistribution 1,N ,n ,1 Out[87]=17.一、三四分位数间矩:Out[88]=ConditionalExpression1 Max 1,Ceiling N 341n N341n 1&&41n 11 Max 1,Ceiling N 4 1 nN341n1&&41n 1 Max 1,Ceiling N 341nN Max 1,Ceiling N4 1 nN341n1&&41n 10True,0341n1&&0 4 1 n 1Out[89]=18.偏度系数:Out[90]=Skewness OrderDistribution DiscreteUniformDistribution 1,N ,n ,1 Out[91]=19.峰度系数:Out[92]=Kurtosis OrderDistribution DiscreteUniformDistribution 1,N ,n ,1 Out[93]=20.四分偏度系数:4 [1,N]离散均匀分布样本最小值分布-描述统计.nbOut[94]=ConditionalExpression 1 34 Indeterminate 34 ComplexInfinity 341 341 Max 1,Ceiling N 34 1n N2Max 1,Ceiling N 2 1 n N1 Max 1,Ceiling N 34 1n N342 Max 1,Ceiling N 34 1n NMax 1,Ceiling N 4 1 n NMax 1,Ceiling N 34 1n N Max 1,Ceiling N 4 1 n N342Max 1,Ceiling N 2 1 n NMax 1,Ceiling N 4 1 n N1 Max 1,Ceiling N 4 1 n N34Max 1,Ceiling N 34 1n N 2Max 1,Ceiling N 2 1 n NMax 1,Ceiling N 4 1 n NMax 1,Ceiling N 34 1n N Max 1,Ceiling N 4 1 n NTrueOut[95]=21.r阶原点矩矩:Out[96]=Moment OrderDistribution DiscreteUniformDistribution 1,N ,n ,1 ,rOut[97]=22.r阶中心矩:Out[98]=CentralMoment OrderDistribution DiscreteUniformDistribution 1,N ,n ,1 ,rOut[99]=23.r阶阶乘矩:Out[100]=FactorialMoment OrderDistribution DiscreteUniformDistribution 1,N ,n ,1 ,rOut[101]=24.r阶累积量:Out[102]=Cumulant OrderDistribution DiscreteUniformDistribution 1,N ,n ,1 ,rOut[103]=25.信息熵:[1,N]离散均匀分布样本最小值分布-描述统计.nb5Out[104]=k 1NLog1k Nn 11Nk Nn k 1&&k N 0N n k N 0&&k 10k N 0 k 1 1 N nk 1&&k N 0 1 1 1Nn True1k Nn 11Nk Nn k 1&&k N 0N n k N 0&&k 10k N 0 k 1 1 N nk 1&&k N 0 1 11Nn True6 [1,N]离散均匀分布样本最小值分布-描述统计.nb。
MCMC及R实现
贝叶斯集锦(3):从MC、MC到MCMC2013-07-31 23:03:39#####一份草稿贝叶斯计算基础一、从MC、MC到MCMC斯坦福统计学教授Persi Diaconis是一位传奇式的人物。
Diaconis14岁就成了一名魔术师,为了看懂数学家Feller的概率论著作,24岁时进入大学读书。
他向《科学美国人》投稿介绍他的洗牌方法,在《科学美国人》上常年开设数学游戏专栏的著名数学科普作家马丁•加德纳给他写了推荐信去哈佛大学,当时哈佛的统计学家Mosteller 正在研究魔术,于是Diaconis成了Mosteller的学生。
(对他这段传奇经历有兴趣的读者可以看一看统计学史话《女士品茶》)。
下面要讲的这个故事,是Diaconis 在他的文章The Markov Chain Monte Carlo Revolution中给出的破译犯人密码的例子。
一天,一位研究犯罪心理学的心理医生来到斯坦福拜访Diaconis。
他带来了一个囚犯所写的密码信息。
他希望Diaconis帮助他把这个密码中的信息找出来。
这个密码里的每个符号应该对应着某个字母,但是如何把这些字母准确地找出来呢Diaconis和他的学生Marc采用了一种叫做MCMC(马尔科夫链蒙特卡洛)的方法解决了这个问题。
这个MCMC方法就是这一节我们所要讨论的内容。
(1)贝叶斯推断的计算问题在上节我们看到,贝叶斯统计学是利用后验分布对θ进行推断。
这种推断的计算很多情况下要用积分计算来完成。
比如,我们要计算θ的函数g(θ)的期望:E(g(θ∣x))=∫g(θ)fθ∣x(θ∣x)dθ其中函数f表示后验分布。
当g(θ)=θ时,得到的就是关于θ的点估计。
但是对很多贝叶斯推断问题来说,有时候后验分布过于复杂,使得积分没有显示结果,数值方法也很难应用;有时候需要计算多重积分(比如后验分布是多元分布时)。
这些都会带来计算上的很大困难。
这也是在很长的时期内,贝叶斯统计得不到快速发展的一个原因。
均匀分布u[-θ,θ]参数θ的几种估计量
均匀分布u[-θ,θ]参数θ的几种估计量均匀分布u[-θ,θ]的参数θ的几种估计量包括:
1. 极大似然估计量:通过最大化样本的似然函数来估计参数θ。
在均匀分布中,样本的似然函数即为样本数据的上下界与参数θ的关系。
通过求解似然方程,可以得到θ的最大似然估计量。
2. 矩估计量:基于样本矩的统计量进行参数的估计。
在均匀分布中,可以使用样本的平均数和方差来估计参数θ。
通过求解矩方程,即样本矩与理论矩的差异,可以得到θ的矩估计量。
3. 最小二乘估计量:通过最小化样本观测值与均匀分布理论分布的平方残差之和来估计参数θ。
在均匀分布中,最小二乘估计量可以通过求解最小化平方残差的方程得到。
需要注意的是,以上估计量都是基于样本数据的统计方法,估计结果可能受到样本量大小、样本选择以及估计方法的影响。
数理统计茆诗松第二章自测题
《数理统计》第二章自测题时间:120分钟,卷面分值:100分一、填空题:(每题2分,共10分)得分 _________1.设总体X 服从参数为兄的泊松分布,龙,尼 …,见是取自尤的随机样本,其均值和方差分别为乂和S3如果A = aX + (2-3a )S2是2的无偏估计,则圧 ; ' [,…,x“为来自该总体的一 个简单随机样本,则参数&的矩估计量为 2.设总体X 的密度函数为/(兀&)= x <0,3.己知玄,&为未知参数&的两个无偏估计,且玄与&不相关,£>(&)=4£>(&)。
如果 也是&的无偏估计,且是&6的所有同类型线性组合中方差最小的,则 <3= 4•设尤是在一次随机试验中事件月发生的次数,进行了力次试验得一组样本屁 见•: X, 其中事件月发生了 R 次,则事件月发生的概率为P ,p?的最大似然估计为 ____________ ; p (l-p )的 矩估计为 ______ 5.设总体X~N ( u, 0 2), 口,° $均为未知参数,X b X 2> -X n <n N 3〉为来自总体X 的一个样 本,当用2X - Xp £及0・2Xi + 0. 3X2 + 0. 5X3作为口的估计时,最有效的 二、选择题:(每题3分,共24分) 得分1.设总体X 服从[a, b] (a<b ) ±的均匀分布,冬b 均为未知参数,X b X 2, …Xn 为来自总体X的一个样本,则用与庄的最人似然估计量为() max Xf]2, =[1 W i 冬 nmin XiJ 2 1 冬 i W n a 2 = [ min XiJ 2, b J 二[max XiJ 21 W i 冬门 1 W i W n (C )a2 = [X - S]2,b 2 = [X + S22.设总体X 的概率分布为 (D )a 2 = [X + Sl^b 2=[X - S]2P 6223(1-0)021-26>其中& (0<弘1⑵是未知参数,从总体/中抽取容量为8的一组样本,其样本值为3, 1, 3,0, 3, 1, 2, 3,则参数&的矩估计值为()。
考研数学一(概率论与数理统计)-试卷5
考研数学一(概率论与数理统计)-试卷5(总分:56.00,做题时间:90分钟)一、选择题(总题数:6,分数:12.00)1.选择题下列每题给出的四个选项中,只有一个选项符合题目要求。
(分数:2.00)__________________________________________________________________________________________ 解析:2.设随机变量X与Y相互独立,且都在[0,1]上服从均匀分布,则 ( )(分数:2.00)A.(X,Y)是服从均匀分布的二维随机变量√B.Z=X+Y是服从均匀分布的随机变量C.Z=X-Y是服从均匀分布的随机变量D.Z-X 2是服从均匀分布的随机变量解析:解析:当X与Y相互独立,且都在[0,1]上服从均匀分布时,(X,Y)(X,Y)是服从均匀分布的二维随机变量.因此本题选(A).3.设二维连续型随机变量(X,Y)的概率密度为f(x,y),则随机变量Z=Y-X的概率密度f Z(z)= ((分数:2.00)A.B.C. √D.解析:解析:记Z的分布函数为F Z(z),则其中D z={(x,y)Θy-x≤z)如图3-1的阴影部分所示,4.设随机变量X与Y相互独立,且X~P{|X-Y|<1} ( )(分数:2.00)A.随σ1与σ2的减少而减少B.随σ1与σ2的增加而增加C.随σ1的增加而减少,随σ2的减少而增加√D.随σ1的增加而增加,随σ2的减少而减少解析:解析:由X~N ,从而由于Ф(x)是x的单调增加函数,因此当σ1增加时,减少;当σ2减少时增加.因此本题选(C).5.设随机变量X与Y相互独立,且X~N(0,1),Y~B(n,p)(0<p<1),则X+Y的分布函数 ( )(分数:2.00)A.为连续函数√B.恰有n+1个间断点C.恰有1个间断点D.有无穷多个间断点解析:解析:记Z=X+Y,则Z n+1个连续函数之和,所以为连续函数.因此本题选(A).6.现有10张奖券,其中8张为2元的,2张为5元的.今从中任取3张,则奖金的数学期望为 ( )(分数:2.00)A.6B.7.8 √C.9D.11.2解析:解析:记奖金为X,则X全部可能取的值为6,9,12二、填空题(总题数:5,分数:10.00)7.Z=Y.min{X,Y}的分布律为 1(分数:2.00)填空项1:__________________ (正确答案:正确答案:[*])解析:解析:Z全部可能取值为0,1,2,3,且P(Z=0)=P{Y.min{X,Y}=0}=P{min{X,Y}=0}=P{X=0)=P{Z=1}=P{Y.min{X,Y}=1}=P{Y=1,min{X,Y}=1}=P{X=1,Y=1)=P{Z=2}=P(Y.min{X,Y}=2}=P{Y=2,min{X,Y}=1}=P{X=1,Y=2}=P{Z=3}=P{Y.min(X,Y}=3)=P{Y=3,min{X,Y}=1}=P(X=1,Y=3)=所以Z8.设随机变量X与Y相互独立,且都服从参数为1 1(分数:2.00)填空项1:__________________ (正确答案:正确答案:[*])解析:解析:X9.一台设备由三个部件构成,在设备运转中各部件需要调整的概率分别为0.10,0.20,0.30,设备部件状态相互独立,以X表示同时需要调整的部件数,则X的方差DX为 1(分数:2.00)填空项1:__________________ (正确答案:正确答案:0.46)解析:解析:X的全部可能取值为0,1,2,3,且P{X=0}=(1-0.10)×(1-0.20)×(1-0.30)=0.504,P{X=1}=(1-0.10)×(1-0.20)×0.30+(1-0.10)×(1-0.30)×0.20+(1-0.20)×(1-0.30)×0.10=0.398,P{X=2}=(1-0.10)×0.20×0.30+(1-0.20)×0.10×0.30+(1-0.30)×0.10×0.20=0.092,P{X=3}=0.10×0.20×0.30=0.006,所以EX=0×0.504+1×0.398+2×0.092+3×0.006=0.6,E(X 2 )=0 2×0.504+1 2×0.398+2 2×0.092+3 2×0.006=0.82. DX=E(X 2 )-(EX) 2 =0.82-(0.6) 2 =0.46.10.设随机变量X 1(分数:2.00)填空项1:__________________ (正确答案:正确答案:[*])11.设随机变量Y服从参数为1的指数分布,记E(X 1 +X 2 )为 1(分数:2.00)填空项1:__________________ (正确答案:正确答案:[*])解析:解析:所以E(X 1 +X 2 )=EX 1 +EX 2 =e -1 +e -2三、解答题(总题数:14,分数:34.00)12.解答题解答应写出文字说明、证明过程或演算步骤。
常用的采样方法
常⽤的采样⽅法在复杂函数求期望、⾮线性函数近似等问题中,需要从⼀些特定的函数中采样。
⽽不同于⾼斯分布、均匀分布和Gamma分布等较为简单的分布,这些分布往往难以直接采样,因此需要从其他⾓度设计采样⽅法。
这⾥介绍⼏种常⽤的⽅法。
⼀、接收-拒绝采样(acceptance-rejection method)假设p(x) 难以直接采样,q(x)是⼀个⽐较容易采样的分布,如⾼斯、均匀分布,且正整数M使得p(x)/(Mq(x))<1。
则接收-拒绝采样的流程:1. 从q(x)采样得到⼀个粒⼦,从均匀分布U(0,1)中采样得到µ.2. 检验µ<p(x)/(Mq(x))。
成⽴,接受该粒⼦是从p(x)中采样的粒⼦;否则,拒绝。
(从上步骤可以看出,得到⼀个有效粒⼦需要平均M次采样)可以理解为,p(x)表⽰⼀个超多⾯体包围的区域(如圆形⾯积),Mq(x)为另⼀个完全包含p(x)的超多⾯体区域(如⼀个包含圆形的正⽅形),则当随机粒⼦µ<p(x)/(Mq(x)),则该粒⼦位于p(x)所包围区域中。
为了使得接受率尽可能⾼,M应该在满⾜p(x)/(Mq(x))<1的条件下尽量⼩。
该⽅法的缺点是:找到合适的q(x)很难;且接受概率可能很低,使得采样效率低下。
⼆、重要性采样(Importance Sampling)假设p(x)难以直接采样,q(x)是⼀个⽐较容易采样的分布(称为proposal function),则对p(x)的采样可以转换成从q(x)中采样的粒⼦x i的权重和,p(x)=q(x)p(x)q(x)≈∑i w iδ(x i)其中w i=p(x i)q(x i)为重要性权重(Importance Weight)。
重要性采样的关键在于寻找合适的proposal function,通常q(x)与p(x)越相似越好。
在贝叶斯估计中,⼀般可以将预测分布作为proposal function。