第2章统计数据的描述
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第2章统计数据的描述——练习题
●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下:
B E
C C A
D C B A E
D A C B C D
E C E E
A D
B
C C A E
D C B
B A
C
D
E A B D D C
C B C E
D B C C B C
D A C B C D
E C E B
B E
C C A
D C B A E
B A
C
D
E A B D D C
A D
B
C C A E
D C B
C B C E
D B C C B C
(1) 指出上面的数据属于什么类型;
(2)用Excel制作一张频数分布表;
(3) 绘制一张条形图,反映评价等级的分布。
解:(1)由于表中的数据为服务质量的等级,可以进行优劣等级比较,但不能计算差异大小,属于顺序数据。
(2)频数分布表如下:
服务质量等级评价的频数分布
服务质量等级家庭数(频数)频率%
A1414
B2121
C3232
D1818
E1515
合计100100
(3)条形图的制作:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导→条形图→选择子图表类型→完成(见Excel练习题。即得到如下的条形图:
700716728719685709691684705718
706715712722691708690692707701
708729694681695685706661735665
668710693697674658698666696698
706692691747699682698700710722
694690736689696651673749708727
688689683685702741698713676702
701671718707683717733712683692
693697664681721720677679695691
713699725726704729703696717688
(1)利用计算机对上面的数据进行排序;
(2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图;
(3)绘制茎叶图,并与直方图作比较。
解:(1)排序:将全部数据复制到Excel中,并移动到同一列,点击:数据→排序→确定,即完成数据排序的工作。(见Excel练习题(2)按题目要求,利用已排序的Excel表数据进行分组及统计,得到频数分布表如下:
(见Excel练习题
100只灯泡使用寿命非频数分布
按使用寿命分组(小时)灯泡个数(只)频率(%)
650~66022
660~67055
670~68066
680~6901414
690~7002626
700~7101818
710~7201313
720~7301010
730~74033
740~75033
合计100100
制作直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,选择全表后,点击:图表向导→柱形图→选择子图表类型→完成。即得到如下的直方图:
(见Excel练习题
(3)制作茎叶图:以十位以上数作为茎,填入表格的首列,将百、十位数相同的数据的个位数按由小到大的顺序填入相应行中,即成为叶,得到茎叶图如下:
第5章 参数估计
●1.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。
(1) 假定总体标准差为15元,求样本均值的抽样标准误差; (2) 在95%的置信水平下,求允许误差;
(3) 如果样本均值为120元,求总体均值95%的置信区间。 解:(1)已假定总体标准差为σ=15元, 则样本均值的抽样标准误差为
x σσ15=
(2)已知置信水平1-α=95%,得 α/2Z =,
于是,允许误差是E =
α/2
σ
Z =×=。 (3)已知样本均值为x =120元,置信水平1-α=95%,得 α/2Z =, 这时总体均值的置信区间为
±α/2
x Z ±=124.2115.8
(1)假定总体标准差为15元,求样本均值的抽样标准误差。
x σ=
=
= (2)在95%的置信水平下,求边际误差。
x x t σ∆=⋅,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=2z α
因此,x x t σ∆=⋅2x z ασ=⋅0.025x z σ=⋅=×=
(3)如果样本均值为120元,求总体均值 的95%的置信区间。 置信区间为:
(),x x x x -∆+∆=()120 4.2,120 4.2-+=(,)
可知,如果样本均值为120元,总体均值95%的置信区间为(,)元。
利用下面的信息,构建总体均值µ的置信区间:
1) 总体服从正态分布,且已知σ = 500,n = 15, =8900,置信水平为95%。
解: N=15,为小样本正态分布,但σ已知。则1-=95%,
。其置信区间公式为
∴置信区间为:8900±×500÷√15=( , )
2) 总体不服从正态分布,且已知σ = 500,n = 35, =8900,置信水平为95%。
解:为大样本总体非正态分布,但σ已知。则1-=95%,
。其置信区间公式为
∴置信区间为:8900±×500÷√35=( )
3) 总体不服从正态分布,σ未知,n = 35, =8900,s =500,置信水平为90%。
解:为大样本总体非正态分布,且σ未知,1-=90%,。
2α()
28.109,44.10192.336.10525
10
96.136.1052=±=⨯±=±n
z x σ
αx x 2α()
28.109,44.10192.336.10525
10
96.136.1052=±=⨯±=±n
z x σ
αx