统计学大题(1-3)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一,根据以下数据,分别计算:算术平均数,中位数,众数,标准差。 抽取零售企业105家的销售收入如下表:
解:
先求出组中值,如上表所示。 直接按计算器,可得:算术平均数=76.09 标准差=30.65
中位数=60+ {(105/2)-34/26}*20=74.23 众数=60+{(26-19)/(26-19)+(26-20)}*20=70.77 附:计算器按法:开机→mode →2→shift →mode →1→=→
输入数据(30 shift ,15 M+ 50 shift ,19 M+ …… )→shift →2 →计算器即显示各个指标,1为平均数,2为总体标准差,3为样本标准差 2,区间估计
求置信区间的方法与步骤:
第一步 根据中心极限定理,构造一个含未知参数的分布 第二步 对给定的置信度, 1-α 查表得到标准分z α/2 第三步 利用不等式变形,求出未知参数1-α置信区间.
⎪⎪
⎭
⎫
⎝⎛⋅
+⋅-=⎪⎪⎭⎫ ⎝
⎛⋅±-n Z x n Z x n Z x σσσμμα
ααα2
22,:::1的置信区间为总体均值就有给定置信度
二,总体均值的区间估计
①正态总体,方差已知,(大、小)样本
例1,某种零件长度服从正态分布,从该批产品中随机抽取9件,测得其平均长度为21.4 mm 。已知总体标准差σ =0.15mm ,试建立该种零件平均长度的置信区间,给定置信水平为0.95。 解:已知X-N (μ,0.152),⎺x =2.14, n =9, 1-α = 0.95,Zα/2=1.96 总体均值μ的置信区间为
⎪⎭⎫ ⎝
⎛
+-n Z x n Z x σσαα22,⎪⎭⎫ ⎝⎛+-=915.096.14.21,915.096.14.21()498.21,302.21=
结论: 我们可以95%的概率保证该种零件的平均长度在21.302~21.498 mm 间。 当
%5>N n 时,需要修正,⎪⎪⎭
⎫
⎝⎛--⋅±1:2N n N n Z x σμα 例2,某企业生产某种产品的工人有1000人,某日采用非重复抽样 抽取100人调查他们的当日产量,样本人均产量为35件,如果总体产量的标准差为4.5件,试以95.45%的置信度估计平均产量的抽样极限误差和置信区间。
()()μ
ασ21:%45.951,5.4,35%5%1030100n ,1000N :x
x N
n
∆=-==>=>==求已知 ()()()()()()
86.35,14.3486.035:286.011000100
1000100
5.421
12
%45.951:2
2
=±=∆±=--⨯
⨯
=--⋅
⋅
=∆==-x x x N n N n
Z Z μσ
ααα件知由解
②正态总体,大样本,当方差未知时,以样本方差替代即可 ③总体比例的区间估计
重复抽样VS 不重复抽样 : ⎪⎪⎭
⎫
⎝
⎛--⋅
±⎪⎪⎭⎫
⎝⎛⋅
±==1::)
,(:222N n N n pq Z p P n pq Z p P pq s p x α
α大样本
例:某企业在一项关于职工流动原因的研究中,从该企业前职工的总体中随机选取了200人组成一个样本。在对其进行访问时,有140人说他们离开该企业是由于同管理人员不能融洽相处。试对由于这种原因而离开该企业的人员的真正比例构造95%的置信区间。
解:已知 n =200 , p
ˆ=0.7 , α= 0.95,Zα/2=1.96
()
764.0,636.0200
)
7.01(7.096
.17.0)ˆ1(ˆˆ2-±=-±n p p
Z p
α
结论:我们可以95%的概率保证该企业职工由于同管理人员不能融洽相处而离开的比例在63.6%~76.4%之间。
④T 分布:正态总体、当样本容量n <30,总体标准差σ未知时,用样本标准差S 代替。 自由度为(n-1) 置信区间为:()
⎪⎪⎭
⎫
⎝
⎛⋅
±-n s t x n 12
α
例:某商场从一批袋装食品中随机抽取10袋,测得每袋重量(单位:克)分别为789、780、794、762、802、813、770、785、810、806,如果袋装重量服从正态分布,要求以95%的把握程度,估计这批食品的平均每袋重量的区间范围及其允许误差。
()()()μ
α21:%951136.171
109
.26421
1
.79110
806780789:2
x
n x x s n
x x ∆=-=-=
--=
=+++==∑
∑求已知
()
()
()
()
()()()
36.803,
84.77826.121.791:26.1210136
.172622.22622
.2%951:12
1102
05.012
=±=∆±=⨯=⋅
=∆∴===----x n x n x n s t t t μαα
α克知由解
三,样本容量的计算
估计总体均值时样本容量的确定 :
①根据均值区间估计公式可得样本容量n 为 2
2220∆
=σαZ n
②根据比例区间估计公式可得样本容量n 为 2
2
2)
1(∆-=p p Z n α(若总体比例P 未知时,可用样本比例来
代替)
例:某超级市场欲估计每个顾客平均每次购物的金额,根据过去的经验,标准差大约为160元,现要求以95%的置信度估计每个顾客的购物金额,并要求允许误差不超过20元,应抽多少顾客作样本?
n
x :95.01,20,160:求已知=-=∆=ασ