统计典型例题

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

统计典型例题

2.1.1简单随机抽样

例题:某学校有学生1200人,为了调查教师授课情况,打算抽取一个容量为50的样本,问此样本若采用简单随机抽样将如何获取?

点拨:简单随机抽样有两种:抽签法和随机数法。尽管此题的总体中的个体数不算少,但依题意其操作却是等可能的。

解析:(方法一)首先,把学生编号0001,0002,…..1200.如果抽签法,则做1200个形状、大小相同的号签,然后将这些号签放在同一个箱子里,进行搅拌均匀。抽签时,每次从中抽出1个号签,连续抽取50次,就得到一个容量为50的样本。

(方法二)首先把学生编号0001,0002,…..1200.如果用随机数法,使用各个5位数的前四位,任意取,如9038,1212,6404,5940,1321…所取得大于1200的为无效号吗,小于等于1200的为有效号码。一直取够50人为止。

2.1.2系统抽样

例题:某工厂有1003名工人,从中抽取10人参加体检,试用系统抽样进行具体检验。

点拨:由于总体容量不能被样本容量整除,需要先剔除3名工人,使得总体容量能被样本容量整除,取K=1000/10=100,然后再利用

系统抽样的方法进行。

解析:(1)利用随机数法剔除3名工人

(2)将剩余的1000名工人编号0001---1000

(3)分段,取间隔K=1000/10=100,将总体均分为10组,每组含100个工人

(4)从第一组即编号为0001---0100中随机抽取一个号L

(5)按编号将L,100+L,200+L,…900+L共10个号选出。这10个号所对应的工人组成样本。

能力提升:一般的,从N个编号中抽取 n个号码入样,若采用系统抽样,分段间隔为:

A.当N/n为整数时,间隔为K=N/n

B.当N/n不是整数时,从N中随机剔除m个个体,使得(N- m)/n 是个整数,间隔为K=(N- m)/n

C.综上所述,抽样的间隔为K=[N/n]

2.1.3分层抽样

例题:一个单位有职工160人,其中有业务员112人,管理人员16人,后勤服务人员32人,为了解职工的工作效率,要从中抽取容量为20的样本,用分层抽样的方法进行抽样,写出过程。

点拨:分层抽样中各层抽取的个体数依据各层个体数之比来分配,确定各层抽取的个体数之后,可采用简单随机抽样或者系统随机抽样在各层中抽取个体。

解析:首先,三部分所含个体数之比为112:16:32=7:1:2,设三部分各抽个体数为7X,X,2X,则由7X+X+2X=20得X=2。故业务人员、管理人员、后勤服务人员抽取的个数分别为:14,2和4.然后,对三部分人员分别按照系统抽样或者随机抽样的办法选出相应的人,这样就得到了一个容量为20的样本。

拓展提升:解决此类问题的关键在于对概念的正确理解以及在每一次抽样的步骤中所采用的抽样方法,应注意语言叙述的完整性。

2.2.1用样本的频率分布估计总体分布

例题1:有一容量为50的样本,数据的分组及各组的频率数如下:

[)[)[)[)10154303591520535408,;,;,;,;[)[)[)20251040453253011,;,;,

. (1) 列出样本的频率分布表; (2) 画出频率分布直方图.

(3) 估计总体数据出现在[10,25)的概率 数据段 [)1015,

[)1520, [)2025, [)2530, [)3035, [)3540, [)4045, 总计 频数 4 5 10 11 9 8 3 50 频率 0.08

0.10

0.20

0.22

0.18

0.16

0.06

1.00

(2)频率分布直方图:

(3)由频率分布直方表可以看出,数据出现在[10,25)的频率是0.38,所以我们估计总体出现在这段范围的概率为0.38

能力提升:总体分布反映了总体在各个范围内取值的概率,利用样本的频率分布,可以近似地估计总体分布,利用样本在某一范围的频率,可以近似地估计总体在这一范围的概率。对每一组样本取其一代表值,一般去其中值,近似的看成离散型变量,可以近似的估计出其总体的均值。

例题2:. 某赛季甲、乙两个篮球运动员每场比赛的得分情况如下:

甲:11,15,24,26,31,31,36,36,37,39,44,49,50

乙:7,13,14,16,23,26,27,33,38,39,51

(1)请你用茎叶图表示上面的数据;

(2)将这两组数据进行比较分析,得到什么结论?

解析:(1)用茎叶图表示如下:

(2)从茎叶图中可看到甲运动员每场比赛的得分情况大致对称,中位数为36;乙运动员每场比赛的得分情况除一个特殊得分外,也大致对称,中位数为26.因此甲运动员的得分发挥比较稳定,总体得分高于乙运动员.

2.2.2用样本的数字特征估计总体数字特征

例1:甲、乙两种冬小麦试验品连续5年的平均单位面积产量见表

(1) 求两种小麦的平均年产量

(2) 试根据这组数据估计哪一种小麦品种产量较稳定

答案:(1)10,10(2)20.02s =甲,2

0.244s =乙22s s <乙甲∴即甲稳定.

点拨:方差(标准差)体现了一组数据的波动大小。方差越大,样本数据的波动就越大,稳定性就越差。本题中,比较产量的稳定性就是在比较波动的大小。

【举一反三】某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔

30分钟抽取一包产品,称其重量,分别记录抽查数据如下: 甲:102,101,99,98,103,98,99; 乙:110,115,90,85,75,115,110. (1) 这种抽样方法是哪一种? (2) 估计甲、乙两个车间产品的平均数与方差,并说明哪个车间产品较稳定? 解:(1)这种抽样方法是系统抽样; (2)甲车间的平均数为11(10210199981039899)1007

x =++++++=, 甲车间的方差

222222

11

[(102100)(101100)(99100)(98100)(103100)7s =-+-+-+-+-22(98100)(99100)] 3.43+-+-≈

乙车间的平均数为21

(110115908575115110)1007

x =++++++=, 乙车间的方差为

2

22222

21[(110100)(115100)(90100)(85100)(75100)7s =-+-+-+-+-22(115100)(110100)]228.57+-+-≈

12x x =∵,22

12s s <,所以甲车间产品较稳定.

相关文档
最新文档