1抽样方法(1)简单随机抽样(抽签法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计
1.抽样方法:(1)简单随机抽样(抽签法、随机数表法)常常用于总体个数较少时,它的特征是从总体中逐个抽取;(2)系统抽样也叫等距离抽样,常用于总体个数较多时,它的主要特征是均衡成若干部分,每部分只取一个;(3)分层抽样,主要特征是分层按比例抽样,主要用于总体中有明显差异,它们的共同点:每个个体被抽到
的概率都相等n
N
,体现了抽样的客观性和平等
性。
如(1)某社区有500个家庭,其中高收入家庭125户,中等收入家庭280户,低收入家庭95。为了调查社会购买力的某项指标,要从中抽取一个容量为100户的样本,把这种抽样记为A;某中学高中一年级有12名女排运动员,要从中选取3人调查学习负担的情况,把这种抽样记为B,那么完成上述两项调查应分别采用的抽样方法:A为_______,B为_____。(答:分层抽样,简单随机抽样);
(3)某中学有高一学生400人,高二学生300人,高三学生300人,现通过分层抽样抽取一个容量为n的样本,已知每个学生被抽到的概率为0.2,则n= _______(答:200);
(4)容量为100的样本拆分成10组,前7组的频率之和为0.79,而剩下的三组的频数组成等比数列,且其公比不为1,则剩下的三组中频数最大的一组的频率是______(答:0.16);
(5)用简单随机抽样的方法从含有10个个体的总体中,抽取一个容量为2的样本,则某一个体a“第一次被抽到的概率”,“第一次未被抽到,第二次被抽到的概率”,“在整个抽样过程中被抽到的概率”分别是______________(答:111
,,
10105
);
2.总体分布的估计:用样本估计总体,是研究统计问题的一个基本思想方法,即用样本平均数估计总体平均数(即总体期望值――描述一个总体的平均水平);用样本方差估计总体方差(方差和标准差是描述一个样本和总体的波动大小的特征数,方差或标准差越小,表示这个样本或总体的波动越小,即越稳定)。一般地,样本容量越大,这种估计就越精确。总体估计要掌握:(1)“表”(频率分布表);(2)“图”(频率分布直方图)。
频率分布直方图的特征:
(1)从频率分布直方图可以清楚的看出数据分布的总体趋势。
(2)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。
频率直方图的作法:
(1)算数据极差();
min
max
x
x-
(2)决定组距和组数;
(3)决定分点;
(4)列频率分布表;
(5)画频率直方图。
提醒:直方图的纵轴(小矩形的高)一般是频率除以组距的商(而不是频率),横轴一般是数据的大小,小矩形的面积表示频率。组数的决定方法是:设数据总数目为n,50
≤
n时,分为8
~
5组;
100
50≤
~ 8组. 如(1)一个容量为20的样本数据,分组后组距与频数如下:(10,20],2;(20,30],3;(30,40],4;(40,50],5;(50,60],4;(60,70],2;则样本在区间] 50 , 50 (-上的频率为 A.5%B.25%C.50%D.70%(答:D); (2)已知样本:10 8 6 10 13 8 10 12 11 7 8 9 11 9 12 9 10 11 12 12 ,那么频率为0.3的范围是 A.5.5~7.5 B.7.5~9.5 C.9.5~11.5 D.11.5~13.5(答:B); (3)观察新生儿的体重,其频率分布直方图如图所示,则新生儿的体重在[2700,3000]的频率 为_______(答:0.3); (4)如图,是一次数学考试成绩的样本频率分布直方图(样本容量n=200),若成绩不低于60分为及格,则样本中的及格人数是_____(答:120); (5) 有同一型号的汽车100辆,为了解这种 汽车每蚝油1L所行路程的情况,现从中随即抽出10辆在同一条件下进行蚝油1L所行路程实验,得到如下样本数据(单位:km):13.7,12.7,14.4,13.8, 13.3,12.5,13.5,13.6,13.1,13.4,其分组如下: (2)根据上表,在给定坐标系中画出频率分布直线图,并根据样本估计总体数据落在[12.95,13.95)中的概率; (3)根据样本,对总体的期望值进行估计 解:(1)频率分布表: 分组 频数 频率 [12.45,12.95) 2 0.2 [12.95,13.45) 3 0.3 [13.45,13.95) 4 0.4 [13.95,14.45) 1 0.1 合计 10 1.0 (2)频率分布直方图: 估计总体数据落在[12.95,13.95)中的概率为0.7 (3) 0.7(0.3) 1.40.80.3(0.5)0.50.60.10.4 1310 x - +-++++-++++=+ Q =13.4 因此,总体的期望值进行估计约为13.4. (6)为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12. (1) 第二小组的频率是多少?样本容量是多少? (2) 若次数在110以上(含110次)为达标,试估 计该学校全体高一学生的达标率是多少? (3) 在这次测试中,学生跳绳次数的中位数落在哪 个小组内?请说明理由。 分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1。 解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小, 因此第二小组的频率为: 4 0.0824171593 =+++++ 又因为频率=第二小组频数样本容量, 所以 12 1500.08 ===第二小组频数样本容量第二小组频率 (2)由图可估计该学校高一学生的达标率约为 171593 100%88%24171593 +++⨯=+++++ (3)由已知可得各小组的频数依次为6,12,51, 45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内。 分组 频数 频率 [12.45,12.95) [12.95,13.45) [13.45,13.95) [13.95,14.45) 合计 10 1.0 90 101112131415 o 0.000.000.010.010.020.020.02频率/组距 0.030.03