总体样本和抽样方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例2 作出例1中数据的频率分布直方图
频率分布直方图
一般地,作频率分布直方图的方法为:把横轴分 成若干段,每一线段对应一个组的组距,然后以
此线段为底作一矩形,它的高等于该组的 频率 ,这 组距
样得出一系列的矩形,每个矩形的面积恰好是该组上 和频率,这些矩形就构成了频率分布直方图。
频率分布直方图比频率分布表更直观、形象地反映 了样本的分布规律。
第一步,将1000名学生按(000,001,…,999进行编 号。 第二步,将整个的编号分成100段。 第三步,在第一段的10个编号中随机抽取起始号m,
确定k的值,k=1000/100=10 第四步,抽样,将编号为
m,m+10,m+20,m+30,…,m+990 r的个体抽出
思考交流
职业学校一年级有1000名学生,二年级 有900名学生,三年级有600名学生,为了了 解该校文化课教学质量,从中抽取容量为100 的样本进行质量揣测。如何抽测较为合理?
第四步,抽样,将编号为
m,m+k,m+2k,m+3k,…,m+(n-1)k
例4 某职业学校一年级共有20个班,每班有50 名学生,为了了解一年级学生语文、数学和英语的 学习情况,从这1000人中抽取容量为100的样本进行 质量抽测,如果运用简单随机抽样方法,抽取的样 本会出现什么现象?应该怎样抽取?
第一步,编号。将总体的N个个体编号。
第二步,分段。将整个编号按顺序平均分成段, 当N除以n的余数为r(0<r<n)时,从总体中剔除r个 个体,并将剩下的(N-r)个个体重新编号。
第三步,定规。第一段中随机确定起始的个 体编号m,然后按照逐次加k的原则确定后续要抽的 编号。当N 被n整除时,取k=N/n;当N除以 n的余数 为r时,取k=(N-n)/n。
解 城市的交通状况直接影响着生活在这个城 市中的每个人的生活质量,为了调查这个问题, 在抽样时应当关注到各种人群,既要。既要调查 拥有私家车的市民,也要调查没有私家车的市民, 还要调查进城的外地人员。如果只对拥有私家车 的市民进行调查,结果一定上片面的。
思考交流
你认为普查与抽样调查各有什么优缺点? 举例说明。
西安 54.4 128.9 62.9 73.6 26.2 10.6 桂林 67.5 228.5 201.4 147.3 28.0 19.1
填写表10-7,试分析两地一年中降水量偏大(大 于100mm)的状况
总月数
降水量偏大朋数(频数)
频率
西安 桂林
频率分布表
当总体很大或不便获得时,可以用样本 的频率分布估计总体的频率分布。我们把反 映总体频率分布的表格称为频率分布表。
普查准确性高,工作量大、成本高,涉及人 员广;抽样调查工作量小、成本低、涉及人员少, 准确性没有普查的准确性高。
练习
1、下列调查是普查还是抽查?如果是抽查, 请指出总体、个体、样本和样本容量。
1)调查你班级每位同学家庭每月的总 收入;
2)从一批电视机中抽取10台,调查 这批电视机的使用寿命。
1)是普查。 2)是抽查。班级人数是总体,班级学生家的 电视机是个体,被抽取的10台电视机是样本, 样本容量是10。
如用抽签法安排10名班级学生到敬老院打 扫卫生。但从全校学生中安排学生去敬老院打扫 卫生就不宜用抽签法。
练习 1、从100个二极管中。抽取一个容量为25的样 本进行检测。 1)试用随机数表示抽样样本; 2)试用计算器抽取样本。
2、某职业学校一年级新生有240名,为了了解 他们喜爱的运动项目,试用简单随机抽样从中抽取 一个容量为40的样本。
从容量为N的总体中,用系统抽样抽取容量 为n的样本,步骤如下:
第一步,编号。将总体的N个个体编号。
第二步,分段。将整个编号按顺序平均分 成段,当N除以n的余数为r(0<r<n)时,从总体 中剔除r个个体,并将剩下的(N-r)个个体重新 编号。
从容量为N的总体中,用系统抽样抽取容量 为n的样本,步骤如下:
解 第一步,分层。按血型将总体分成4 个部分。
第二步,计算各层的个体数与总体个数的比:
O型占
200 500
=
2 5
,A型占
125 500
=
1 4
,
B型占
125 500
=
1 4
,AB型占
50 500
=
1 10
.
第三步,计算出各层应抽取的样本容量:
O型应抽40
2 5
=16,A型应抽40
1 =10, 4
O型占
200 500
=
2 5
,A型占
125 500
=
1 4
,
B型占
125 = 500
1 4
,AB型占
50 500
=1 10
.
因此,采用简单随机抽样即分层抽样方法, 应从O,A,B,AB型的职工中分别抽取16人, 10 人,10人,4人,组成要抽取的样本。
以上三种抽样方法的适用范围及优点归纳如表
类类型 简单随机抽样 系统抽样 分层抽样
7.6 总体分布估计
1、列频率分布表 表10-6给出了2000年西安和桂林各月降水量(单位:mm)
1月 2月 3月 4月 5月
6月
西安 桂林
9.2 4.9 5.4 18.6 38.0 41.4 53.3 178.8 273.5 384.9
106.3 432.4
7月 8月 9月 10月 11月 12月
第一步,计算极差。
第二步,决定组距(即分成的区间的长度)和组数。
第三步,确定各组分点。
第四步,列频率分布表(如表10-8)。
思考交流
若将例1分组改为6组,列出频率分布表, 并说在编制频率分布表时,分的组数过多或 过少各有何利弊。
2、频率分布直方图
为了更直观地体现数据的分布规律,我们 可以利用直方图反映样本分布规律,这样的 直方图称为频率分布直方图
2、要调查某种药物的疗效,请你思考 如何进行抽样。在抽样的过程中应当注意什 么问题?
答
2、简单随机抽样
假定一个团小组有6名团员,要通过逐过抽取的 办法从中抽取2名团员参加一项活动。如果第一次抽 取时每个抽到的概率是1/6,第二次抽取时,余下的 每个抽到的概率是1/5,那么,在整个抽样中,这个 团小组的任意一名团员被抽到的概率是多少?
谢谢!
10.5 总体、样本和抽样方法
1、总体与样本
探究 要获取下列信息应采取普查还是抽查?试说明理由。
1、某职业学校一年级机械专业500名学生的 视力状况;
2、某灯泡厂生产 的1000只灯泡的使用寿命;
3、某城市大型、中型与小型企业有15000家, 这三类企业数之比为1:5:9,该城市上个月企业 的销售收入。
团小组的任意一名团员被抽到的概率是1/6。
简单随机抽样
一般地,从元素个数为N的总体中不放回地抽取 容量为n的样本,如果每一次抽取时各个个体被抽到 的概率相等,这种抽样方法称为简单随机抽样。
常用的简单随机抽样方法有抽签法、随机数表 法和计算器(或计算机)产生随机数法
例3 为了了解某班50名学生的视力状况, 从中随机抽取10名学生进行视力检查,如何 抽取?
总体 把考察的对象的某一项指标值的全体作为总
体。 个体
构成总体的每一个指标值作为个体。 样本
从总体中抽出若干个个体组成的集合叫做样本。 样本容量
样本中包含的个体数量叫做样本的容量。
例1 要了解某城市12岁男孩的身高状况, 从这个城市中随机选取120名12岁男孩测量出 他们的身高。请指出其中的总体、个体、样 本和样本容量。
解 该城市所有12岁男孩的身高是总体,每 一位12岁男孩的身高是个体,被抽取的120名12 岁男孩的身高是样本,样本容量是120。
例2 为了缓解城市的交通拥堵情况,某城 市准备出台限制车辆进出该城市的通行办法, 为此要进行民意调查。某调查小组调查了一 些拥有私家车的市民,你认为这样的调查结 果会怎样?
例1 一位植物学家想要研究某植物生长一年后的 高度,他随机地抽取了60棵此种植物,测得它们生长一年 后的高度如下(单位:cm):
73 84 91 68 72 83 75 58 87 41 48 61 65 72 92 68 73 43 57 78 80 59 84 42 67 69 64 73 51 65 63 82 90 54 63 76 61 68 66 78 55 81 94 79 45 67 70 99 76 72 72 91 86 75 76 50 69 69 56 74
3、系统抽样、分层抽样
探究 某职业学校一年级共有20个班,每班有 50名学生,为了了解一年级学生语文、数学 和英语的学习情况,从这1000人中抽取容量 为100的样本进行质量抽测,如果运用简单随 机抽样方法,抽取的样本会出现什么现象? 应该怎样抽取?
机械抽样或系统抽样
当总体所含的个体较多时,可将总体分成均 衡的几个部分,然后按照预先制定的规则,从每 个部分中抽取一个个体,得到所需的样本,这样 的抽样方法称为机械抽样或系统抽样。
适用范围 总体中个体个数较少 总体中个体个数较多
总体由差异明显的几 个部分组成
优点 简单易行 样本分布均匀
样本有较强的 代表性
问题解决
本节“总体与样本”中探究题采用怎样的 抽样方法较为合理?
1、某职业学校一年级机械专业500名学生的 视力状况;
2、某灯泡厂生产 的1000只灯泡的使用寿命;
3、某城市大型、中型与小型企业有15000家, 这三类企业数之比为1:5:9,该城市上个月企业 的销售收=10,AB型应抽40
1 =4. 10
解 第一步,分层。按血型将总体分成4 个部分。
第二步,计算各层的个体数与总体个数的比:
O型占
200 500
=
2 5
,A型占
125 500
=
1 4
,
B型占
125 500
=
1 4
,AB型占
50 500
=
1 10
.
第三步,计算出各层应抽取的样本容量:
分层抽样
一般地,当总体由差别明显的几个部分组 成时,为了使抽出样本更客观地反映总体情 况,可先将总体中各个个体按差别特征,分 成层次分明且互不重叠的几个部分,然后按 各个部分在总体中所占比例进行简单随机抽 样,这种抽样方法叫做分层抽样,其中所分 成的各个部分称为称为“层”。
例5 某单位500名职工中,血型为O,A,B,AB型 的人数分别为200,125,125,50。为了研究职工健 康教育的内容,要抽取一个容量为40的样本进行访谈, 应如何抽样?
1、抽签法; 2、随机数表法;
3、用计算机产生随机数法。
思考交流
抽签法有何优缺点?请举例说明。
优点:简单易行,当总体的个数不多时,使 总体处于“搅拌均匀”的状态比较容易,这时, 每个个体都有均等的机会被抽中,从而能够保证 样本的代表性.
缺点:仅适用于个体数较小的总体,当总体 容量非常大时,费时费力又不方便,况且,如果 号签搅拌的不均匀,可能导致抽样不公平.