基本统计方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基本统计方法
3.1总体和样本
知识梳理
1.总体与个体:在统计问题中,我们把研究对象的全体叫做总体,总体中的每一个成员
叫做个体.总体的情况可用数据表表示,也可用各种图表表示,有条形图、线形图、频数图、圆形(饼)图和散点图等等.
(1)总体平均数:设总体有N个个体,它们的值分别为,则总体平均数
.
(2)总体中位数:将N个个体从小到大排列,如果N为奇数,则位于正中位置的数叫做总体中位数;如果N为偶数,位于该数列正中位置的两个数的平均数叫做总体中位数.
(3)总体方差:
(4)总体标准差:
2. 样本:从总体中抽出的一部分个体所组成的集合叫做样本(也叫做子样),样本中所含个体的个数叫做样本容量,抽取样本的过程叫做抽样.
(1)样本平均数:设样本中有个元素,分别为,则样本平均数
.
(2)样本中位数:将个样本从小到大排列,如果为奇数,则位于该数列正中位置的数叫做样本中位数;如果为偶数,位于该数列正中位置的两个数的平均数叫做样本中位数.
(3)样本方差:
(4)样本标准差:
例题点拨
【例1】已知总体的各个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为10.5。若要使该总体的方差最小,则的取值分别是 .
〖思路分析〗本题考查中位数、方差的意义,会用相关公式分析问题、解决问题.
〖解〗由中位数意义,可知,依题意,总体中个体的数量为,
∴总体平均数,
于是总体方差,当且仅当时等号成立。所以。
事实上方差是描述全体数据偏离平均值的程度的量,要使方差最小,只须各数据大小应尽可能地接近,故.
〖点评〗本题关键是建立总体的方差关于的关系,因为总体的平均值是常数,要使方差最小,只要最小,其实本题如果理解了方差的本质,根本无需求最小值,而只需要找到方差最小时的条件即可。
【例2】某居民小区所有263户家庭族人口数分组列表如下:
求总体平均数,总体中位数,总体方差和标准差.
〖思路分析〗该题通过表格给出总体中各个体的数值,即家庭人口数数,从中可知,如果将263户家庭的人口数从小到大排列,可得数列:
共263个个体数值,由此根据各统计量的定义求解.
〖解〗(1)总体平均数,即平均每户家庭人口数为人.
(2)N=263是奇数,,
那么132为数列的正中位置.
因为,
所以第132个数属于每户4人的那个组.故总体中位数
(3)总体方差:
(4)总体标准差:.
〖点评〗求中位数时注意先将按从小到大的顺序排成一数列,总体的个体是偶数或奇数,再根据中位数的定义求解.本题中的中位数,并不是表格中间位置上的数“5”和“6”的平均数,这是最容易错的地方;至于方差和标准差的计算,可直接在计算器上输入
,利用计算器的功能求出.
3.2抽样技术
知识梳理
1.简单随机抽样:设一个总体的个体数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.
⑴用简单随机抽样从含有N个个体的总体中抽取一个容量为的样本时,每次抽取一个个体时任一个体被抽到的概率为;在整个抽样过程中各个个体被抽到的概率为;
⑵简单随机抽样的特点是,逐个抽取,且各个个体被抽到的概率相等,是不放回抽样.
⑶简单随机抽样方法,体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础.
2.抽签法:先将总体中的所有个体(共有N个)编号(号码可从1到N),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n次,就得到一个容量为n的样本.
适用范围:总体的个体数不多时.
优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法.
3.随机数表法:随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码.
4.系统抽样:当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样叫做系统抽样.
系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样;
与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的.
总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个体数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的个体数能被样本容量整除在进行系统抽样.
5.分层抽样: 当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样,所分成的部分叫做层.
6.常用的抽样方法及它们之间的联系和区别:
7.不放回抽样和放回抽样:在抽样中,如果每次抽出个体后不再将它放回总体,称这样的抽样为不放回抽样;如果每次抽出个体后再将它放回总体,称这样的抽样为放回抽样.
随机抽样、系统抽样、分层抽样都是不放回抽样.
例题点拨
【例1】在下列问题中,各采用什么抽样方法抽取样本较为妥当?
(1)从30件产品中抽取5件进行质量检验;
(2)某文化宫共有35排座位,每排有42个座位(座位号为1~42),一次报告会坐满了听众,会后为听取意见留下了所有座位号为13的35名听众进行座谈;
(3)某公司有200名员工,其中有业务人员135人,管理人员25人,后勤服务人员40人,从中抽取一个容量为5的样本.
〖思路分析〗本题考察随机抽样的有关概念,每一选项须仔细斟酌、辨别.
〖解〗(1)总体中个体数较小,采用简单随机抽样较为妥当.
(2)因为总体中个数较多,又是“等距离”抽取,所以采用系统抽样较为妥当.
(3)因为总体中个体差异较大,所以采用分层抽样较为妥当.
〖点评〗本例虽小,但其中概念性很强,尤其第3小题,使用分层抽样,最敏感的字就是“层”,它源于“样本”差异,差异大了,就要考虑分层了.