人教版高中数学必修三 第二章 统计第三章简单随机抽样-知识点
简单随机抽样-高中数学知识点讲解
![简单随机抽样-高中数学知识点讲解](https://img.taocdn.com/s3/m/0e94fb264693daef5ff73d16.png)
简单随机抽样1.简单随机抽样【知识点的认识】1.定义:一般地,设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.2.特点:(1)有限性:总体个体数有限;(2)逐个性:每次只抽取一个个体;(3)不放回:抽取样本不放回,样本无重复个体;(4)等概率:每个个体被抽到的机会相等.(如果从个体数为N 的总体中抽取一个容量为n 的样本,则每个个体푛被抽取的概率等于푁)3.适用范围:总体中个数较少.4.注意:随机抽样不是随意或随便抽取,随意或随便抽取都会带有主观或客观的影响因素.【常用方法】1.抽签法(抓阄法)一般地,从个体总数为N 的总体中抽取一个容量为k 的样本,步骤为:(1)编号:将总体中所有个体编号(号码可以为 1﹣N);(2)制签:将编号写在形状、大小相同的号签上(可用小球、卡片、纸条等制作);(3)搅匀:将号签放在同一个箱子中进行均匀搅拌;(4)抽签:每次从箱中取出 1 个号签,连续抽取k 次;(5)取样:从总体中取出与抽到号签编号一致的个体.2.随机数表法.○随机数表:由 0﹣9 十个数字所组成,其中的每个数都是用随机方法产生的,这样的表称为随机数表.实现步骤:(1)编号:对总体中所有个体编号(每个号码位数一致);(2)选数:在随机数表中任选一个数作为开始;(3)取数:从选定的起始数沿任意方向取数(不在号码范围内的数、重复出现的数不取),直到取满为止;(4)取样:根据所得的号码从总体中抽取相应个体.【命题方向】以基本题(中、低档题)为主,多以选择题、填空题的形式出现,以实际问题为背景,综合考查学生学习基础知识、应用基础知识、解决实际问题的能力.(1)考查简单随机抽样的特点例:用简单随机抽样的方法从含有 100 个个体的总体中依次抽取一个容量为 5 的样本,则个体m 被抽到的概率为()1111A.100B.20C.99D.50分析:依据简单随机抽样方式,总体中的每个个体被抽到的概率都是一样的,再结合容量为 5,可以看成是抽 5 次,从而可求得概率.1解答:一个总体含有 100 个个体,某个个体被抽到的概率为,100∴以简单随机抽样方式从该总体中抽取一个容量为 5 的样本,1则指定的某个个体被抽到的概率为100× 5 =1.20故选:B.点评:不论用哪种抽样方法,不论是“逐个地抽取”,还是“一次性地抽取”,总体中的每个个体被抽到的概率都是一样的,体现了抽样方法具有客观公平性.(2)判断抽样方法是否为简单随机抽样常见与分层抽样、系统抽样对比,注意掌握各种抽样方法的区分.例:下面的抽样方法是简单随机抽样的是()A.在某年明信片销售活动中,规定每 100 万张为一个开奖组,通过随机抽取的方式确定号码的后四位为 2709 的2/ 4B.某车间包装一种产品,在自动包装的传送带上,每隔 30 分钟抽一包产品,称其重量是否合格C.某学校分别从行政人员、教师、后勤人员中抽取 2 人、14 人、4 人了解学校机构改革的意见D.用抽签法从 10 件产品中选取 3 件进行质量检验.分析:从所给的四个选项里观察因为抽取的个体间的间隔是固定的;得到A、B 不是简单随机抽样,因为总体的个体有明显的层次,C 不是简单随机抽样,D 是简单随机抽样.解答:A、B 不是简单随机抽样,因为抽取的个体间的间隔是固定的;C 不是简单随机抽样,因为总体的个体有明显的层次;D 是简单随机抽样.故选D.点评:本题考查简单随机抽样,考查分层抽样,考查系统抽样,是一个涉及到所学的所有抽样的问题,注意发现各种抽样的特点,分析清楚抽样的区别.(3)考查简单随机抽样的抽样方法操作例:利用随机数表法对一个容量为 500 编号为 000,001,002,…,499 的产品进行抽样检验,抽取一个容量为 10 的样本,若选定从第 12 行第 5 列的数开始向右读数,(下面摘取了随机数表中的第 11 行至第 15 行),根据下图,读出的第 3 个数是()A.841B.114C.014D.146分析:从随机数表 12 行第 5 列数开始向右读,最先读到的 1 个的编号是 389,再向右三位数一读,将符合条件的选出,不符合的舍去,继续向右读取即可.解答:最先读到的 1 个的编号是 389,向右读下一个数是 775,775 它大于 499,故舍去,再下一个数是 841,舍去,再下一个数是 607,舍去,再下一个数是 449,再下一个数是 983.舍去,再下一个数是 114.读出的第 3 个数是 114.故选B.点评:本题主要考查了抽样方法,随机数表的使用,在随机数表中每个数出现在每个位置的概率是一样的,所以每个数被抽到的概率是一样的,属于基础题.。
高中数学高考统计知识点总结
![高中数学高考统计知识点总结](https://img.taocdn.com/s3/m/f63d718652d380eb62946dee.png)
第二章:统计 1、抽样方法:①简单随机抽样(总体个数较少) ②系统抽样(总体个数较多) ③分层抽样(总体中差异明显)注意:在N 个个体的总体中抽取出n 个个体组成样本, 每个个体被抽到的机会(概率)均为Nn。
2、总体分布的估计: ⑴一表二图:①频率分布表——数据详实 ②频率分布直方图——分布直观③频率分布折线图——便于观察总体分布趋势 注:总体分布的密度曲线与横轴围成的面积为1。
⑵茎叶图:①茎叶图适用于数据较少的情况, 从中便于看出数据的分布, 以及中位数、众位数等。
②个位数为叶, 十位数为茎, 右侧数据按照从小到大书写, 相同的数据重复写。
3、总体特征数的估计:⑴平均数:nx x x x x n++++=Λ321; 取值为n x x x ,,,21Λ的频率分别为n p p p ,,,21Λ, 则其平均数为n n p x p x p x +++Λ2211; 注意:频率分布表计算平均数要取组中值。
⑵方差与标准差:一组样本数据n x x x ,,,21Λ方差:212)(1∑=-=ni ix xns ;标准差:21)(1∑=-=ni ix xns注:方差与标准差越小, 说明样本数据越稳定。
平均数反映数据总体水平;方差与标准差反映数据的稳定水平。
⑶线性回归方程①变量之间的两类关系:函数关系与相关关系; ②制作散点图, 判断线性相关关系 ③线性回归方程:a bx y +=∧(最小二乘法)1221ni i i ni i x y nx y b x nx a y bx==⎧-⎪⎪=⎪⎨-⎪⎪=-⎪⎩∑∑注意:线性回归直线经过定点),(y x 。
第三章:概率1、随机事件及其概率:⑴事件:试验的每一种可能的结果, 用大写英文字母表示;⑵必然事件、不可能事件、随机事件的特点; ⑶随机事件A 的概率:1)(0,)(≤≤=A P nmA P . 2、古典概型:⑴基本事件:一次试验中可能出现的每一个基本结果;⑵古典概型的特点: ①所有的基本事件只有有限个; ②每个基本事件都是等可能发生。
新课标高中数学必修3第二章知识点总结
![新课标高中数学必修3第二章知识点总结](https://img.taocdn.com/s3/m/33dbc2ff915f804d2b16c1f4.png)
第二章 统计1.简单随机抽样:一般地,设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本()n N ≤,如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。
2.简单随机抽样的特点:①被抽取样本的总体个数较少;②从总体中逐个地抽取;③不放回抽取;④每一次抽取时,总体中各个个体被抽到的可能性相同,在整个抽样过程中各个个体被抽到的机会也都相等(即等可能性)。
从而保证了抽样方法的公平性。
3.两种简单随机抽样方法:①抽签法(抓阄法);②随机数法4.随机数法步骤:①编号;②随机确定开始数字;③从选定的数开始读数;④根据号码得到样本。
5.系统抽样:将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样。
6分层抽样:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样。
7.三种抽样方法的比较:1.两种估计方式:①用样本的频率分布估计总体的分布;②用样本的数字特征估计总体的数字特征。
2.分析数据的两种基本方法:①作图②画表格3.频率分布直方图:在频率分布直方图中,纵轴表示频率组距,数据落在各小组内的频率用各小长方形的面积表示。
各小长方形的面积的总和等于1【=⨯=频率小长方形的面积组距频率组距】。
4.茎叶图:当样本数据较少时,用茎叶图表示数据的效果较好。
它不但可以保留原始数据,而且能够展示数据的分布情况,给数据的记录和表示都带来了方便。
5.众数:在一组数据中,出现次数最多的数据叫做这组数据的众数。
7.中位数:将一组数据按大小依次排列,把处在中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数。
6.平均数:如果有n 个数12,,,n x x x ,那么12,,,nx x x x n=叫做这n 个数的平均数。
人教版高二数学必修3统计知识点:简单随机抽样
![人教版高二数学必修3统计知识点:简单随机抽样](https://img.taocdn.com/s3/m/0804205a3a3567ec102de2bd960590c69ec3d804.png)
人教版高二数学必修 3 统计知识点:简单随机抽样数学,是研究数目、构造、变化、空间以及信息等观点的一门学科,查词典数学网为大家介绍了人教版高二数学必修 3 统计知识点,请大家认真阅读,希望你喜爱。
1:简单随机抽样(1)整体和样本①在统计学中 , 把研究对象的全体叫做整体 .②把每个研究对象叫做个体 .③把整体中个体的总数叫做整体容量 .④为了研究整体的相关性质,一般从整体中随机抽取一部分: x1,x2 , ....,xx 研究,我们称它为样本.此中个体的个数称为样本容量.(2)简单随机抽样,也叫纯随机抽样。
就是从整体中不加任何分组、划类、排队等,完整随机地抽取检查单位。
特色是:每个样本单位被抽中的可能性同样 (概率相等 ),样本的每个单位完整独立,相互间无必定的关系性和排挤性。
简单随机抽样是其余各样抽样形式的基础。
往常不过在整体单位之间差别程度较小和数目较少时,才采纳这类方法。
(3)简单随机抽样常用的方法:①抽签法②随机数表法③计算机模拟法③使用统计软件直接抽取。
在简单随机抽样的样本容量设计中,主要考虑:①整体变异状况 ;②同意偏差范围;③概率保证程度。
(4)抽签法 :①给检核对象集体中的每一个对象编号;②准备抽签的工具,实行抽签 ;③对样本中的每一个个体进行丈量或检查唐宋或更早以前,针对“经学”“律学”“算学”和“书学”各科目,其相应教授者称为“博士”,这与现在“博士”含义已经相去甚远。
而对那些特别解说“武事”或解说“经籍”者,又称“讲课老师”。
“教授”和“助教”均原为学官称呼。
前者始于宋,乃“宗学”“律学”“医学”“武学”等科目的解说者;尔后者则于西晋武帝时代即已建立了,主要辅助国子、博士培育生徒。
“助教”在古代不单要作入流的学识,其教书育人的职责也十分清晰。
唐朝国子学、太学等所设之“助教”一席,也是当朝打眼的学官。
至明清两代,只设国子监(国子学)一科的“助教”,其身价不谓显赫,也称得上朝廷要员。
(完整版)人教版高中数学必修3各章知识点总结,推荐文档
![(完整版)人教版高中数学必修3各章知识点总结,推荐文档](https://img.taocdn.com/s3/m/504415d55727a5e9856a61f7.png)
高中数学必修3知识点第一章算法初步i.i.i 算法的概念算法的特点:(i)有限性:一个算法的步骤序列是有限的,必须在有限操作之后停止,不能是无限的^(2)确定性:算法中的每一步应该是确定的并且能有效地执行且得到确定的结果,而不应当是模棱两可.(3)顺序性与正确性:算法从初始步骤开始,分为若干明确的步骤,每一个步骤只能有一个确定的后继步骤,前一步是后一步的前提,只有执行完前一步才能进行下一步,并且每一步都准确无误,才能完成问题^(4)不唯一性:求解某一个问题的解法不一定是唯一的,对于一个问题可以有不同的算法^(5)普遍性:很多具体的问题,都可以设计合理的算法去解决,如心算、计算器计算都要经过有限、事先设计好的步骤加以解决.1.1.2 程序框图1、程序框图基本概念:(一)程序构图的概念:程序框图又称流程图,是一种用规定的图形、指向线及文字说明来准确、直观地表示算法的图形。
一个程序框图包括以下几部分:表示相应操作的程序框;带箭头的流程线;程序框外必要文字说明。
(二)构成程序框的图形符号及其作用学习这部分知识的时候,要掌握各个图形的形状、作用及使用规则,画程序框图的规则如下:1、使用标准的图形符号。
2、框图一般按从上到下、从左到右的方向画。
3、除判断框外,大多数流程图符号只有一个进入点和一个退出点。
判断框具有超过一个退出点的唯一符号。
4、判断框分两大类,一类判断框“是”与“否”两分支的判断,而且有且仅有两个结果;另一类是多分支判断,有几种不同的结果。
5、在图形符号内描述的语言要非常简练清楚。
(三)、算法的三种基本逻辑结构:顺序结构、条件结构、循环结构。
1、顺序结构:顺序结构是最简单的算法结构,语句与语句之间,框与框之间是按从上到下的顺序进行的,它是由若1个依次执行的处理步骤组成的,它是任何一个算法都离不开的一种基本算法结构。
顺序结构在程序框图中的体现就是用流程线将程序框自上而下地连接起来,按顺序执行算法步骤。
人教版高中数学必修三 2.1《随机抽样》知识梳理+跟踪检测
![人教版高中数学必修三 2.1《随机抽样》知识梳理+跟踪检测](https://img.taocdn.com/s3/m/758264feaf45b307e97197cc.png)
人教版高中数学必修三 第二章 统计2.1《随机抽样》知识梳理知识点一:简单随机抽样1.简单随机抽样的定义设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.2.简单随机抽样的分类简单随机抽样⎩⎨⎧随机数法抽签法 3.简单随机抽样的优点及适用类型简单随机抽样有操作简便易行的优点,在总体个体数不多的情况下是行之有效的.知识点二:系统抽样1.系统抽样的概念先将总体中的个体逐一编号,然后按号码顺序以一定的间隔k 进行抽取,先从第一个间隔中随机地抽取一个号码,然后按此间隔依次抽取即得到所求样本.2.系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本,步骤为:(1)先将总体的N 个个体编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等.(2)确定分段间隔k ,对编号进行分段.当N n(n 是样本容量)是整数时,取k =N n; (3)在第1段用简单随机抽样确定第一个个体编号l(l ≤k);(4)按照一定的规则抽取样本.通常是将l 加上间隔k 得到第2个个体编号(l +k),再加k 得到第3个个体编号(l +2k),依次进行下去,直到获取整个样本.知识点三:简单随机抽样1.分层抽样的概念 在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.2.分层抽样的适用条件分层抽样尽量利用事先所掌握的各种信息,并充分考虑保持样本结构与总体结构的一致性,这对提高样本的代表性非常重要.当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.人教版高中数学必修三第二章统计2.1《随机抽样》跟踪检测一、选择题1.下列哪种工作不能使用抽样方法进行()A.测定一批炮弹的射程B.测定海洋水域的某种微生物的含量C.高考结束后,国家高考命题中心计算数学试卷中每个题目的难度D.检测某学校全体高三学生的身高和体重的情况2.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,200个零件的长度是()A.总体B.个体C.总体的一个样本D.样本容量3.某工厂质检员每隔10分钟从传送带某一位置取一件产品进行检测,这种抽样方法是()A.分层抽样B.简单随机抽样C.系统抽样D.以上都不对4.在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本:①采用随机抽样法,将零件编号为00,01,02,,99,抽出20个;②采用系统抽样法,将所有零件分成20组,每组5个,然后每组中随机抽取1个;③采用分层抽样法,随机从一级品中抽取4个,二级品中抽取6个,三级品中抽取10个.则()A.不论采取哪种抽样方法,这100个零件中每个被抽到的概率都是1 5B.①②两种抽样方法,这100个零件中每个被抽到的概率都是15,③并非如此C.①③两种抽样方法,这100个零件中每个被抽到的概率都是15,②并非如此 D.采用不同的抽样方法,这100个零件中每个被抽到的概率各不相同5.一个田径队,有男运动员56人,女运动员42人,比赛后,立即用分层抽样的方法,从全体队员中抽出一个容量为28的样本进行尿样兴奋剂检查,其中男运动员应抽的人数为( )A .16B .14C .28D .126.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则,x y 的值分别为( )A. 2,5B. 5,5C. 5,8D. 8,87.某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是( )A .简单随机抽样法B .抽签法C .随机数法D .分层抽样法[答案] D[解析] 由分层抽样的定义可知,该抽样为按比例的抽样.8.某公司10位员工的月工资(单位:元)为1210,,,x x x ,其均值和方差分别为x 和2s ,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( )A. 22,100x s +B. 22100,100x s ++C. 2,x sD. 2100,x s +9.对于简单随机抽样,下列说法中正确的命题为( )①它要求被抽取样本的总体的个数有限,以便对其中各个个体被抽取的概念进行分析;②它是从总体中逐个进行抽取,以便在抽样实践中进行操作;③它是一种不放回抽样;④它是一种等可能抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的可能性相等,而且在整个抽样过程中,各个个体被抽取的可能性也相等,从而保证了这种抽样方法的公平性.A.①②③B.①②④C.①③④D.①②③④10.下列抽样实验中,最适宜用系统抽样的是()A.某市的4个区共有2 000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样B.某厂生产的2 000个电子元件中随机抽取5个入样C.从某厂生产的2 000个电子元件中随机抽取200个入样D.从某厂生产的20个电子元件中随机抽取5个入样11.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.93B.123C.137D.16712.一段高速公路有300个太阳能标志灯,其中进口的有30个,联合研制的有75个,国产的有195个,为了掌握每个标志灯的使用情况,要从中抽取一个容量为20的样本,若采用分层抽样的方法,抽取的进口的标志灯的数量为()A.2个B.3个C.5个D.13个13.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是()A.12,24,15,9 B.9,12,12,7C.8,15,12,5 D.8,16,10,614.对某商店一个月(30天)内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A.46,45,56B.46,45,53C.47,45,56D.45,47,5315.某单位有职工100人,不到35岁的有45人,35岁到49岁的25人,剩下的为50岁以上的人,现在用分层抽样法抽取20人,则各年龄段人数分别是()A.7,4,6 B.9,5,6 C.6,4,9 D.4,5,916.某单位共有老、中、青职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍.为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为()A.9 B.18 C.27 D.36二、填空题17.在学生人数比例为2∶3∶5的A,B,C三所学校中,用分层抽样的方法招募n名志愿者,若在A学校恰好选出了6名志愿者,那么n=________. 18.博才实验中学共有学生1 600名,为了调查学生的身体健康状况,采用分层抽样法抽取一个容量为200的样本.已知样本容量中女生比男生少10人,则该校的女生人数是________人.19.某地有居民100 000户,其中普通家庭99 000户,高收入家庭1 000户,从普通家庭中以简单随机抽样方法抽取990户,从高收入家庭中以简单随机抽样方法抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是________.20.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本、用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是__________.若用分层抽样方法,则40岁以下年龄段应抽取________人.21.从某地区15 000位老人中随机抽取500人,其生活能否自理的情况如下表所示.人.三、解答题22.某电台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12 000人,其中持各种态度的人数如下表:60人进行更为详细的调查,应当怎样进行抽样?23.某单位在岗职工共624人,为了调查工人用于上班途中的时间,该单位工会决定抽取10%的工人进行调查,请问如何采用系统抽样法完成这一抽样?24.为调查小区平均每户居民的月用水量,下面是3名学生设计的调查方案:学生A:我把这个用水量调查表放在互联网上,只要登录网址的人就可以看到这张表,他们填表的信息可以很快地反馈到我的电脑中.这样,我就可以很快估计出小区平均每户居民的月用水量.学生B:我给我们居民小区的每一个住户发一个用水量调查表,只要一两天就可以统计出小区平均每户居民的月用水量.学生C:我在小区的电话号码本上随机地选出一定数量的电话号码,然后逐个给他们打电话,问一下他们的月用水量,然后就可以估计出小区平均每户居民的月用水量.请问:对上述3种学生设计的调查方案能够获得平均每户居民的月用水量吗?为什么?你有什么建议?2.1《随机抽样》跟踪检测解答一、选择题1.下列哪种工作不能使用抽样方法进行()A.测定一批炮弹的射程B.测定海洋水域的某种微生物的含量C.高考结束后,国家高考命题中心计算数学试卷中每个题目的难度D.检测某学校全体高三学生的身高和体重的情况[答案] D2.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,200个零件的长度是()A.总体B.个体C.总体的一个样本D.样本容量[答案] C3.某工厂质检员每隔10分钟从传送带某一位置取一件产品进行检测,这种抽样方法是()A.分层抽样B.简单随机抽样C.系统抽样D.以上都不对[答案] C[解析]按照一定的规律进行抽取为系统抽样.4.在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本:①采用随机抽样法,将零件编号为00,01,02,,99,抽出20个;②采用系统抽样法,将所有零件分成20组,每组5个,然后每组中随机抽取1个;③采用分层抽样法,随机从一级品中抽取4个,二级品中抽取6个,三级品中抽取10个.则()A.不论采取哪种抽样方法,这100个零件中每个被抽到的概率都是15B.①②两种抽样方法,这100个零件中每个被抽到的概率都是15,③并非如此 C.①③两种抽样方法,这100个零件中每个被抽到的概率都是15,②并非如此 D.采用不同的抽样方法,这100个零件中每个被抽到的概率各不相同[答案] A[解析] 无论采用哪种抽样,每个个体被抽到的概率相等.5.一个田径队,有男运动员56人,女运动员42人,比赛后,立即用分层抽样的方法,从全体队员中抽出一个容量为28的样本进行尿样兴奋剂检查,其中男运动员应抽的人数为( )A .16B .14C .28D .12[答案] A[解析] 运动员共计98人,抽取比例为2898=27,因此男运动员56人中抽取16人.6.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则,x y 的值分别为( )A. 2,5B. 5,5C. 5,8D. 8,8[答案] C[解析] 由题意得x =15,16.8=51(9+15+10+y +18+24) y =8,选C. 7.某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是( )A .简单随机抽样法B .抽签法C .随机数法D .分层抽样法[答案] D[解析] 由分层抽样的定义可知,该抽样为按比例的抽样.8.某公司10位员工的月工资(单位:元)为1210,,,x x x ,其均值和方差分别为x 和2s ,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( ) A. 22,100x s + B. 22100,100x s ++ C. 2,x s D. 2100,x s +[答案] D[解析] 设增加工资后10位员工下月工资均值为'x ,方差为2's , 则平均数()()()12101'10010010010x x x x =++++⋅⋅⋅++⎡⎤⎣⎦ ()1210110010010x x x x =++++=+; ()()()222212101'100'100'100'10s x x x x x x ⎡⎤=+-++-+⋅⋅⋅++-⎣⎦ ()()()22221210110x x x x x x s ⎡⎤=-+-+⋅⋅⋅+-=⎣⎦.故选D . 9.对于简单随机抽样,下列说法中正确的命题为( )①它要求被抽取样本的总体的个数有限,以便对其中各个个体被抽取的概念进行分析;②它是从总体中逐个进行抽取,以便在抽样实践中进行操作;③它是一种不放回抽样;④它是一种等可能抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的可能性相等,而且在整个抽样过程中,各个个体被抽取的可能性也相等,从而保证了这种抽样方法的公平性.A .①②③B .①②④C .①③④D .①②③④[答案] D10.下列抽样实验中,最适宜用系统抽样的是( )A .某市的4个区共有2 000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样B .某厂生产的2 000个电子元件中随机抽取5个入样C .从某厂生产的2 000个电子元件中随机抽取200个入样D .从某厂生产的20个电子元件中随机抽取5个入样[答案] C[解析] A 中总体有明显层次,不适用系统抽样法;B 中样本容量很小,适宜用简单随机抽样法中的随机数法;D 中总体数很小,故适宜用抽签法,只有C 比较适用系统抽样法.11.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )A.93B.123C.137D.167[答案] C[解析] 由图可知该校女教师的人数为()11070%150160%7760137⨯+⨯-=+= 故选C12.一段高速公路有300个太阳能标志灯,其中进口的有30个,联合研制的有75个,国产的有195个,为了掌握每个标志灯的使用情况,要从中抽取一个容量为20的样本,若采用分层抽样的方法,抽取的进口的标志灯的数量为( )A .2个B .3个C .5个D .13个[答案] A[考点]分层抽样方法[分析]由题意,设抽取的进口的标志灯的数量为x 个,则30030=20x ,即可得出结论.解:由题意,设抽取的进口的标志灯的数量为x 个,则30030=20x , ∴x=2,故选A .[点评]本题考查分层抽样,抽样过程中每个个体被抽到的可能性相同,这是解决抽样问题的依据,样本容量、总体个数、每个个体被抽到的概率,这三者可以做到知二求一.13.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是()A.12,24,15,9 B.9,12,12,7C.8,15,12,5 D.8,16,10,6[答案] D[解析]由题意,各种职称的人数比为160∶320∶200∶120=4∶8∶5∶3,所以抽取的具有高、中、初级职称的人数和其他人员的人数分别为40×4 20=8,40×820=16,40×520=10,40×320=6.14.对某商店一个月(30天)内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A.46,45,56B.46,45,53C.47,45,56D.45,47,53[答案] A[解析]样本中共有30个数据,中位数为4547462+=;显然样本中数据出现次数最多的为45,故众数为45;极差为68-12=56,故选A.15.某单位有职工100人,不到35岁的有45人,35岁到49岁的25人,剩下的为50岁以上的人,现在用分层抽样法抽取20人,则各年龄段人数分别是()A.7,4,6 B.9,5,6 C.6,4,9 D.4,5,9[答案] B[解析]各年龄段所选分别为20100×45=9,20100×25=5,20100×30=6.16.某单位共有老、中、青职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍.为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为()A.9 B.18 C.27 D.36[答案] B[解析]设该单位老年职工有x人,从中抽取y人.则160+3x=430⇒x=90,即老年职工有90人,则90160=y32⇒y=18.故选B.二、填空题17.在学生人数比例为2∶3∶5的A,B,C三所学校中,用分层抽样的方法招募n名志愿者,若在A学校恰好选出了6名志愿者,那么n=________. [答案]30[解析]由题意,知22+3+5×n=6,∴n=30.18.博才实验中学共有学生1 600名,为了调查学生的身体健康状况,采用分层抽样法抽取一个容量为200的样本.已知样本容量中女生比男生少10人,则该校的女生人数是________人.[答案]760[解析]设该校女生人数为x,则男生人数为(1 600-x).由已知,2001 600×(1 600-x)-2001 600·x=10,解得x=760.故该校的女生人数是760人.19.某地有居民100 000户,其中普通家庭99 000户,高收入家庭1 000户,从普通家庭中以简单随机抽样方法抽取990户,从高收入家庭中以简单随机抽样方法抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是________.[答案] 5.7%[解析]∵990∶99 000=1∶100,∴普通家庭中拥有3套或3套以上住房的大约为50×100=5 000(户).又∵100∶1 000=1∶10,∴高收入家庭中拥有3套或3套以上住房的大约为70×10=700(户).∴3套或3套以上住房的家庭约有5 000+700=5 700(户).故5 700100 000=5.7%.20.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本、用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是__________.若用分层抽样方法,则40岁以下年龄段应抽取________人.[答案]3720[解析]由分组可知,抽号的间隔为5,又因为第5组抽出的号码为22,所以第6组抽出的号码为27,第7组抽出的号码为32,第8组抽出的号码为37.40岁以下的年龄段的职工数为200×0.5=100,则应抽取的人数为40200×100=20(人).21.从某地区15 000位老人中随机抽取500人,其生活能否自理的情况如下表所示.生活能否自理人数性别男女能178 278不能23 21人.[答案]60[解析]由表知500人中生活不能自理的男性比女性多2人,所以该地区15 000位老人生活不能自理的男性比女性多2×15 000500=60(人).三、解答题22.某电台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12 000人,其中持各种态度的人数如下表:很喜爱喜爱一般不喜爱2 435 4 5673 926 1 07260人进行更为详细的调查,应当怎样进行抽样?解:可用分层抽样方法,其总体容量为12 000.“很喜爱”占2 43512 000,应取60×2 43512 000≈12(人);“喜爱”占4 56712 000,应取60×4 56712 000≈23(人);“一般”占3 92612 000,应取60×3 92612 000≈20(人);“不喜爱”占1 07212 000,应取60×1 07212 000≈5(人).因此采用分层抽样在“很喜爱”、“喜爱”、“一般”和“不喜爱”的2 435人、4 567人、3 926人和1 072人中分别抽取12人、23人、20人和5人.23.某单位在岗职工共624人,为了调查工人用于上班途中的时间,该单位工会决定抽取10%的工人进行调查,请问如何采用系统抽样法完成这一抽样?解:(1)将624名职工用随机方式编号由000至623.(2)利用随机数法从总体中剔除4人.(3)将剩下的620名职工重新编号由000至619.(4)分段,取间隔k=62062=10,将总体分成62组,每组含10人.(5)从第一段,即为000到009号随机抽取一个号l.(6)按编号将l,10+l,20+l,…,610+l,共62个号码选出,这62个号码所对应的职工组成样本.24.为调查小区平均每户居民的月用水量,下面是3名学生设计的调查方案:学生A:我把这个用水量调查表放在互联网上,只要登录网址的人就可以看到这张表,他们填表的信息可以很快地反馈到我的电脑中.这样,我就可以很快估计出小区平均每户居民的月用水量.学生B:我给我们居民小区的每一个住户发一个用水量调查表,只要一两天就可以统计出小区平均每户居民的月用水量.学生C:我在小区的电话号码本上随机地选出一定数量的电话号码,然后逐个给他们打电话,问一下他们的月用水量,然后就可以估计出小区平均每户居民的月用水量.请问:对上述3种学生设计的调查方案能够获得平均每户居民的月用水量吗?为什么?你有什么建议?解:学生A的方法得到的样本不能够反映不上网的居民情况,是一种方便样本,所得的结果代表性差,不能很准确地获得平均每户居民的月用水量;学生B 的方法实际上是普查,花费的人力物力要多一些,但是如果统计过程不出错,可以准确地得到平均每户居民的月用水量;在小区的每户居民都装有电话的情况下,学生C的方法是一种随机抽样方法,所得的样本具有代表性,可以比较准确地获得平均每户居民的月用水量.在小区的每户居民都装有电话的情况下,建议用随机抽样的方法获取数据,即用学生C的方法,以节省人力物力,并且可以得到比较精确的结果.5、已知变量x 与y 正相关,且由观测数据算得样本平均数3x =, 3.5y =,则由该观测数据算得的线性回归方程可能为( )A. 0.4.3ˆ2yx =+ B. 2 2.4ˆy x =- C. 9ˆ2.5yx =-+ D. 0.3 4.4ˆy x =-+ [答案] A[解析] 变量x 与y 正相关,可以排除C,D;样本平均数代入可求这组样本数据的回归直线方程.∵变量x 与y 正相关,∴可以排除C,D;样本平均数3x =, 3.5y =,代入A 符合,B 不符合,故选A.。
高中数学概率统计知识点总结大全
![高中数学概率统计知识点总结大全](https://img.taocdn.com/s3/m/b18771f8a58da0116c1749ce.png)
概率统计一,统计初步1.简单随机抽样简单随机抽样是不放回抽样,被抽取样本的个体数有限,从总体中逐个地进行抽取,使抽样便于在实践中操作.每次抽样时,每个个体等可能地被抽到,保证了抽样的公平性.实施方法主要有抽签法和随机数法.2.系统抽样(1)定义:当总体元素个数很大时,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体得到所需要的样本,这种抽样方法叫做系统抽样,也称作等距抽样.(2)系统抽样的步骤:①编号.采用随机的方式将总体中的个体编号.②分段.先确定分段的间隔k.当Nn(N为总体中的个体数,n为样本容量)是整数时,k=Nn;当Nn不是整数时,通过从总体中随机剔除一些个体使剩下的总体中个体总数N′能被n整除,这时k=N′n.③确定起始个体编号.在第1段用简单随机抽样确定起始的个体编号S.④按照事先确定的规则抽取样本.通常是将S加上间隔k,得到第2个个体编号S +k,再将(S+k)加上k,得到第3个个体编号S+2k,这样继续下去,获得容量为n 的样本.其样本编号依次是:S,S+k,S+2k,…,S+(n-1)k.3.分层抽样(1)定义:当总体由有明显差别的几部分组成时,按某种特征在抽样时将总体中的各个个体分成互不交叉的层,然后按照各层在总体中所占的比例,从各层独立地抽取一定数量的个体合在一起作为样本,这种抽样的方法叫做分层抽样.分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体中所占比例抽取.分层抽样要求对总体的内容有一定的了解,明确分层的界限和数目,分层要恰当.(2)分层抽样的步骤①分层;②按比例确定每层抽取个体的个数;③各层抽样(方法可以不同);④汇合成样本.(3)分层抽样的优点分层抽样充分利用了己知信息,充分考虑了保持样本结构与总体结构的一致性.使样本具有较好的代表性,而且在各层抽样时,可以根据具体情况采取不同的抽样方法,因此分层抽样在实践中有着非常广泛的应用.4.绘制频率分布直方图把横轴分成若干段,每一段对应一个组距,然后以线段为底作一矩形,它的高等于该组的频率组距,这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率.这些矩形就构成了频率分布直方图.在频率分布直方图中,纵轴表示“频率/组距”,数据落在各小组内的频率用小矩形的面积表示,各小矩形的面积总和等于1.5.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图.茎是指中间的一列数,叶是从茎的旁边生长出来的数.在样本数据较少、较为集中,且位数不多时,用茎叶图表示数据的效果较好,它较好的保留了原始数据信息,方便记录与表示,但当样本数据较多时,茎叶图就不太方便.6.平均数、中位数和众数(1)平均数:一组数据的总和除以数据的个数所得的商就是平均数.(2)中位数:如果将一组数据按从小到大的顺序依次排列,当数据有奇数个时,处在最中间的一个数是这组数据的中位数;当数据有偶数个时,处在最中间两个数的平均数,是这组数据的中位数.(3)众数:出现次数最多的数(若有两个或几个数据出现得最多,且出现的次数一样,这些数据都是这组数据的众数;若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众数).(4)在频率分布直方图中,最高小长方形的中点所对应的数据值即为这组数据的众数.而在频率分布直方图上的中位数左右两侧的直方图面积应该相等,因而可以估计其近似值.平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.7.方差、标准差(1)设样本数据为x1,x2,…,x n样本平均数为x-,则s2=1n[(x1-x-)2+(x2-x-)2+…+(x n-x-)2]=1n[(x12+x22+…+x n2)-n x2]叫做这组数据的方差,用来衡量这组数据的波动大小,一组数据方差越大,说明这组数据波动越大.把样本方差的算术平方根叫做这组数据的样本标准差.(2)数据的离散程度可以通过极差、方差或标准差来描述,其中极差反映了一组数据变化的最大幅度.方差则反映一组数据围绕平均数波动的大小.8.两个变量的线性相关(1)散点图将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中,表示具有相关关系的两个变量的一组数据的图形叫做散点图.利用散点图可以判断变量之间有无相关关系.(2)正相关、负相关如果散点图中各点散布的位置是从左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.反之,如果两个变量的散点图中点散布的位置是从左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.9.回归分析对具有相关关系的两个变量进行统计分析的方法叫回归分析.其基本步骤是:①画散点图,②求回归直线方程,③用回归直线方程作预报.(1)回归直线:观察散点图的特征,如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归直线方程的求法——最小二乘法.设具有线性相关关系的两个变量x、y的一组观察值为(x i,y i)(i=1,2,…,n),则回归直线方程y^=a^+b^x的系数为:⎩⎪⎪⎪⎪⎨⎪⎪⎪⎪⎧ b ^=∑i =1n x i y i -n x ·y ∑i =1n x i 2-n x 2=∑i =1n (x i -x -)(y i -y -)∑i =1n (x i -x -)2a^=y --b ^x 其中x -=1n ∑i =1n x i ,y -=1n ∑i =1n y i ,(x -,y -)称作样本点的中心. a ^,b ^表示由观察值用最小二乘法求得的a ,b 的估计值,叫回归系数.10.独立性检验(1)若变量的不同“值”表示个体所属的不同类别,则这些变量称为分类变量.(2)两个分类变量X 与Y 的频数表,称作2×2列联表.二.随机事件的概率1.随机事件和确定事件:在一定的条件下所出现的某种结果叫做事件.(1)在条件S 下,一定会发生的事件叫做相对于条件S 的必然事件.(2)在条件S 下,一定不会发生的事件叫做相对于条件S 的不可能事件.(3)必然事件与不可能事件统称为确定事件.(4)在条件S 下可能发生也可能不发生的事件,叫做随机事件.(5)确定事件和随机事件统称为事件,一般用大写字母,,,A B C 表示. 2.频率与概率(1)在相同的条件S 下重复n 次试验,观察某一事件A 是否出现,称n 次试验中事件A 出现的次数A n 为事件A 出现的频数,称事件A 出现的比例()A n n f A n=为事件A 出现的频率. (2)对于给定的随机事件A ,如果随着试验次数的增加,事件A 发生的频率()n f A 稳定在某个常数上,把这个常数记作()p A ,称为事件A 的概率,简称为A 的概率.3.互斥事件与对立事件互斥事件的定义:在一次试验中,不可能同时发生的两个事件叫做互斥事件.即A B 为不可能事件(A B φ=),则称事件A 与事件B 互斥,其含义是:事件A 与事件B 在任何一次试验中不会同时发生.一般地,如果事件12,,,n A A A 中的任何两个都是互斥的,那么就说事件12,,,n A A A 彼此互斥.对立事件:若不能同时发生,但必有一个发生的两个事件叫做互斥事件;即A B 为不可能事件,而A B 为必然事件,那么事件A 与事件B 互为对立事件,其含义是:事件A 与事件B 在任何一次试验中有且仅有一个发生.互斥事件和对立事件的区别和联系:对立事件是互斥事件,但是互斥事件不一定是对立事件.两个事件互斥是两个事件对立的必要非充分条件.4.事件的关系与运算 B 或A B +) B (或AB ) B 为不可能事件B φ= B 为不可能事件B 为必然事件与事件B 互为对立事件 B φ=且B =Ω5.随机事件的概率事件A 的概率:在大量重复进行同一试验时,事件A 发生的频率nm 总接近于某个常数,在它附近摆动,这时就把这个常数叫做事件A 的概率,记作()p A . 由定义可知()01p A ≤≤,显然必然事件的概率是1,不可能事件的概率是0.5.概率的几个基本性质(1)概率的取值范围:()01p A ≤≤.(2)必然事件的概率:()1p A =.(3)不可能事件的概率:()0p A =.(4)互斥事件的概率加法公式:①()()()p A B p A p B =+(,A B 互斥),且有()()()1p A A p A p A +=+=. ②()()()()1212n n p A A A p A p A p A =+++ (12,,,n A A A 彼此互斥).(5)对立事件的概率:()()1P A P A =-.三.古典概型1. 一次试验连同其中可能出现的每一个结果称为一个基本事件,通常此试验中的某一事件A 由几个基本事件组成.如果一次试验中可能出现的结果有n 个,即此试验由n 个基本事件组成,而且所有结果出现的可能性都相等,那么每一基本事件的概率都是n 1.如果某个事件A 包含的结果有m 个,那么事件A 的概率P (A )=n m . 基本事件的特点(1)任何两个基本事件是互斥的.(2)任何事件都可以表示成基本事件的和(除不可能事件).2.古典概型:具有以下两个特点的概率模型称为古典概率模型,简称古典概型. ①试验中所有可能出现的基本事件只有有限个,即有限性.②每个基本事件发生的可能性相等,即等可能性.概率公式:P (A )=A 包含的基本事件的个数基本事件的总数.四.几何概型1.(1)随机数的概念:随机数是在一定范围内随机产生的数,并且得到这个范围内任何一个数的机会是均等的.(2)随机数的产生方法①利用函数计算器可以得到0~1之间的随机数;②在Scilab 语言中,应用不同的函数可产生0~1或a~b 之间的随机数.2.几何概型(1)定义:如果某个事件发生的概率只与构成该事件区域的长度(面积或体积等)成比例,则称这样的概率模型为为几何概率模型,简称几何概型.(2)特点:①无限性:在一次试验中,可能出现的结果有无限多个; ②等可能性:每个结果的发生具有等可能性.(3)几何概型的解题步骤:首先是判断事件是一维问题还是二维、三维问题(事件的结果与一个变量有关就是一维的问题,与两个变量有关就是二维的问题,与三个变量有关就是三维的问题);接着,如果是一维的问题,先确定试验的全部结果和事件A 构成的区域长度(角度、弧长等),最后代公式()p A =构成事件A 的区域长度面积或体积试验的全部结果所构成的区域长度面积或体积;如果是二维、三维的问题,先设出二维或三维变量,再列出试验的全部结果和事件A 分别满足的约束条件,作出两个区域,最后计算两个区域的面积或体积代公式.(4)求几何概型时,注意首先寻找到一些重要的临界位置,再解答.一般与线性规划知识有联系.3.几种常见的几何概型(1)设线段l 是线段L 的一部分,向线段L 上任投一点.若落在线段l 上的点数与线段L 的长度成正比,而与线段l 在线段l 上的相对位置无关,则点落在线段l 上的概率为:P=l 的长度/L 的长度(2)设平面区域g 是平面区域G 的一部分,向区域G 上任投一点,若落在区域g 上的点数与区域g 的面积成正比,而与区域g 在区域G 上的相对位置无关,则点落在区域g 上概率为:P=g 的面积/G 的面积(3)设空间区域上v 是空间区域V 的一部分,向区域V 上任投一点.若落在区域v 上的点数与区域v 的体积成正比,而与区域v 在区域v 上的相对位置无关,则点落在区域V 上的概率为:P=v 的体积/V 的体积。
(完整版)高中数学概率统计知识点总结
![(完整版)高中数学概率统计知识点总结](https://img.taocdn.com/s3/m/235e40c65a8102d277a22f28.png)
高中数学概率统计知识点总结一、抽样方法1.简单随机抽样 2.简单随机抽样常用的方法:(1)抽签法;⑵随机数表法.3.系统抽样:K (抽样距离)=N (总体规模)/n (样本规模)4.分层抽样:二、样本估计总体的方式1、用样本的频率分布估计总体分布(1)频率分布直方图的画法;(2)频率的算法;(3)频率分布折线图;(4)总体密度曲线;(5)茎叶图。
化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少。
2、用样本的数字特征估计总体的数字特征(1)众数、中位数、平均数的算法;(2)标准差、方差公式.3、样本均值:nx x x x n +++= 21 4、.样本标准差:n x x x x x x s s n 222212)()()(-++-+-==三、两个变量的线性相关1、正相关2、负相关正相关:自变量增加,因变量也同时增加(即单调递增) 负相关:自变量增长,因变量减少(即单调递减)四、概率的基本概念(1)必然事件(2)不可能事件(3)确定事件(4)随机事件(5)频数与频率(6)频率与概率的区别与联系必然事件和不可能事件统称为确定事件1他们都是统计系统各元件发生的可能性大小;2、频率一般是大概统计数据经验值,概率是系统固有的准确值; 3频率是近似值,概率是准确值4、频率值一般容易得到,所以一般用来代替概率进行定量分析,首先要知道系统各元件发生故障的频率或概率.事件的频率与概率是度量事件出现可能性大小的两个统计特征数.频率是个试验值,或使用时的统计值,具有随机性,可能取多个数值。
因此,只能近似地反映事件出现可能性的大小概率是个理论值,是由事件的本质所决定的,只能取唯一值,它能精确地反映事件出现可能性的大小虽然概率能精确反映事件出现可能性的大小,但它通过大量试验才能得到,这在实际工作中往往是难以做到的.所以,从应用角度来看,频率比概率更有用,它可以从所积累的比较多的统计资料中得到需要指出的是用频率代替概率,并不否认概率能更精确、更全面地反映事件出现可能性的大小,只是由于在目前的条件下,取得概率比取得频率更为困难。
人教版高中数学必修三 第二章 统计第三章简单随机抽样-知识点
![人教版高中数学必修三 第二章 统计第三章简单随机抽样-知识点](https://img.taocdn.com/s3/m/401ff71cb52acfc789ebc9f0.png)
第三章 简单随机抽样第一节 简单随机抽样概述一、简单随机抽样的概念简单随机抽样也叫作纯随机抽样。
其概念可有两种等价的定义方法:定义之一:简单随机抽样就是从总体N 个抽样单元中,一次抽取n 个单元时,使全部可能的)(Nn A 种不同的样本被抽到的概率均相等,即都等于1/A 。
按简单随机抽样,抽到的样本称为简单随机样本。
按上述定义,在抽取简单随机样本之前,应将所有可能的互不相同的样本一一列举出来。
但当N 与n 都比较大时,要列出全部可能的样本是不现实的。
因此,按上述定义进行抽样是不太方便的。
定义之二:简单随机抽样是从总体的N 个抽样单元中,每次抽取一个单元时,使每一个单元都有相等的概率被抽中,连续抽n 次,以抽中的n 个单元组成简单随机样本。
由于定义二无需列举全部可能的样本,故比较便于组织实施。
但按这个定义进行抽样时,仍然需要掌握一个可以赖以实施抽样的抽样框。
二、简单随机抽样的具体实施方法常用的有抽签法和随机数法两种。
(一)抽签法抽签法是先对总体N 个抽样单元分别编上1到N 的号码,再制作与之相对应的N 个号签并充分摇匀后,从中随机地抽取n 个号签(可以是一次抽取n 个号签,也可以一次抽一个号签,连续抽n 次),与抽中号签号码相同的n 个单元即为抽中的单元,由其组成简单随机样本。
抽签法在技术上十分简单,但在实际应用中,对总体各单元编号并制作号签的工作量可能会很繁重,尤其是当总体容量比较大时,抽签法并不是很方便,而且也往往难以保证做到等概率。
因此,实际工作中常常使用随机数法。
(二)随机数法随机数法就是利用随机数表、随机数骰子或计算机产生的随机数进行抽样。
由于计算机产生的随机数实际上是伪随机数,不是真正的随机数,特别是直接采用一般现成程序时,产生的随机数往往不能保证其随机性。
因此,一般使用随机数表,或用随机数骰子产生的随机数,特别在n 比较大时。
1、随机数表及其使用方法随机数表是由0到9的10个阿拉伯数字进行随机排列组成的表。
高二数学必修3第二章统计知识点归纳-word文档
![高二数学必修3第二章统计知识点归纳-word文档](https://img.taocdn.com/s3/m/98cb0edcaeaad1f346933f4f.png)
2019-2019高二数学必修3第二章统计知识点归纳我们要振作精神,下苦功学习。
聪明出于勤奋,天才在于积累。
小编准备了高二数学必修3第二章统计知识点,希望能帮助到大家。
一.简单随机抽样1.总体和样本在统计学中 , 把研究对象的全体叫做总体.把每个研究对象叫做个体.把总体中个体的总数叫做总体容量. 为了研究总体的有关性质,一般从总体中随机抽取一部分研究,我们称它为样本.其中个体的个数称为样本容量.2.简单随机抽样,也叫纯随机抽样。
就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。
特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。
简单随机抽样是其它各种抽样形式的基础。
通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。
3.简单随机抽样常用的方法:(1)抽签法; ⑵随机数表法; ⑶计算机模拟法; ⑷使用统计软件直接抽取。
在简单随机抽样的样本容量设计中,主要考虑:①总体变异情况;②允许误差范围;③概率保证程度。
4.抽签法: (1)给调查对象群体中的每一个对象编号; (2)准备抽签的工具,实施抽签(3)对样本中的每一个个体进行测量或调查例:请调查你所在的学校的学生做喜欢的体育活动情况。
5.随机数表法:例:利用随机数表在所在的班级中抽取10位同学参加某项活动。
二.系统抽样1.系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。
第一个样本采用简单随机抽样的办法抽取。
K(抽样距离)=N(总体规模)/n(样本规模)前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。
可以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。
如果有明显差别,说明样本在总体中的分布承某种循环性规律,且这种循环和抽样距离重合。
2.系统抽样,即等距抽样是实际中最为常用的抽样方法之一。
高中数学必修三
![高中数学必修三](https://img.taocdn.com/s3/m/5a4af81f4431b90d6c85c75a.png)
2.1随机抽样
(3)系统抽样的特征
a.适用于总体容量较大的情况;
b. 剔除多余个体及第一段抽样都用简单的简 单随机抽样,因而与简单随机抽样有密切 联系;
c. 等可能抽样,每个个体被抽到的可能性相 等。
2.1随机抽样
例题:( 10 湖北文)将参见夏令营的 600 名学生编 号为: 001 , 002 , 003 ,···, 600. 采用系统 抽样的方法抽取一个容量为 50的样本,且随机抽 到的号码为 003。这 600 个学生分住在三个营区, 从001到300在第一营区,从301到495在第二营区, 从 496到 600 在第三营区,三个营被抽取的人数依 次为 ( )
4、列频率分布表
2.2.用样本估计总体
5、绘制频率分布直方图
女生身高频率直方图
0.1 0.09 0.0.03 0.02 0.01 0
14 9)
15 2)
15 5)
15 8)
16 1)
16 4)
16 7) 64 , [1
46 ,
49 ,
52 ,
55 ,
58 ,
d)列频率分布表:
2.2.用样本估计总体
落在各个小组内的数据的个数叫做频数,每小组的 频数与数据总数的比值叫做这一小组的频率。算 出各小组的频率,填入表中:
2.2.用样本估计总体
3.频率直方图的重要结论: ① 小长方形的面积=
组 距 频率 组距
=频率;
②
③
各小长方形的面积之和等于1,各组的频率之和 等于1;
D
D.01
解析:
2.1随机抽样
解:从第5列和第6列选出的两位数依次 为 65 , 72 , 08 , 02 , 63 , 14 , 07 , 02 , 43 , 69 , 97 , 28 , 01 , 98 ,但编号必 须不大于 20 的且不和前面重复的只能 是08,02,14,07,01,选D
人教A版高中数学必修三笔记(全册)
![人教A版高中数学必修三笔记(全册)](https://img.taocdn.com/s3/m/0ab50cc1be23482fb5da4c0c.png)
第一章 算法初步(略)第二章 统计2.1 随机抽样1、总体和样本(1)总体:在统计学中 , 把研究对象的全体叫做总体. (2)个体:把每个研究对象叫做个体.(3)总体容量:把总体中个体的总数叫做总体容量.(4)样本容量:为了研究总体x 的有关性质,一般从总体中随机抽取一部分:1x ,2x ,3x , ……,n x 研究,我们称它为样本...其中个体的个数称为样本容量..... 2、简单随机抽样(1)定义:一般地,设一个总体包含有N 个个体,从中逐个不放回地抽取n 个个体作为样本)(N n ≤,如果每次抽取时总体内的各个个体被抽到的机会相等,就称这样的抽样方法为简单随机抽样.(2)特点:① 被抽取样本的总体个数N 是有限的;② 样本是从总体中逐个抽取的; ③ 是一种不放回抽样;④ 每个样本被抽中的可能性相同(概率相等);⑤ 总体单位之间差异程度较小和数目较少时,采用简单随机抽样. (3)常用的方法⎩⎨⎧.②;①随机数法抽签法3、系统抽样(等距抽样或机械抽样):(1)定义:当总体中的个体较多时,可将总体分为均衡的几个部分,然后按照预先定出的规则,从每一部分抽取一个个体,得到所需的样本,这种抽样叫做系统抽样.(2)步骤:① 编号:先将总体的N 个个体编号;② 分段:确定分段间隔k ,对编号进行分段,当n N 是整数时,取n N k =(当nN 不是整数时,要先剔除零头);③ 确定第1个编号:在第1段用简单随机抽样确定第一个个体编号l ;④ 成样:按照一定的规则抽取样本.通常是将l 加上间隔k 得到第2个个体编号(k l +),再加k 得到第3个个体编号(k l 2+),依次进行下去,直到获取整个样本.4、分层抽样:(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法就叫做分层抽样.(2)步骤:① 分层:根据题意,将总体分成互不交叉的层;② 定抽样比:根据总体中的个体数N 和样本容量n 计算抽样比Nn k =; ③ 定各层抽取的数目:确定第i 层应该抽取的个体数目k N n i i ⨯=; ④ 抽取个体:在各层中随机抽取该层确定的个体数目.5、三种抽样方法的异同点:2.2 用样本估计总体1、频率、样本容量、频数的关系2、作频率分布直方图的步骤(1) 求极差,即计算最大值与最小值的差; (2) 决定组距与组数; (3) 将数据分组;(4) 计算各小组的频率,列频率分布表; (5) 画频率分布直方图.3、众数、中位数、平均数4、平均数、方差、标准差(1)平均数:nx x x x x n++++=321(2)方 差:nx x x x x x x x s n 22322212)()()()(-++-+-+-=(3)标准差:[]22322212)()()()(1x x x x x x x x ns s n -++-+-+-==. 5、从频率分布直方图中估计众数、平均数、中位数(1)众 数:最高矩形所在组的组中值即为众数的估计值. (2)平均数:每个小矩形的面积乘以小矩形底边中点的横坐标之和. (3)中位数:中位数左边和右边直方图的面积相等.2.3 变量间的相关关系1、散点图将样本中的n 个数据点),(11y x ,),(22y x ,…,),(n n y x 描在直角坐标系中,所得到的图形叫做散点图.2、正相关与负相关(1)正相关:从散点图上看,点分布在从左下角到右上角的区域内. (2)负相关:从散点图上看,点分布在从左上角到右下角的区域内.3、回归直线如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.【重要结论】散点可能在回归直线上,也可能不再回归直线上,但样本点的中心),(y x 必在回归直线上.(其中x 、y 分别为变量x 和y 的平均数.)4、最小二乘法(1)定义:使得样本数据的点到回归直线的距离的平方和最小...............的方法叫做最小二乘法. (2)求法:设线性回归方程为a x b yˆˆˆ+=,则 ⎪⎪⎩⎪⎪⎨⎧-=--=---=∑∑∑∑====.ˆˆ,)())((ˆ1221121x b y ax n x yx n y x x x y y x x b ni i ni ii n i i ni i i例1:根据上表得到回归直线方程为a x yˆ7.0ˆ+=,据此可预测,当x =15时,y 的值为( ) A . 7.8 B . 8.2 C . 9.6 D . 8.5例2:为了研究某大型超市开业天数与销售额的情况,随机抽取了5天,其开业天数与每天根据上表得到回归直线方程为9.5467.0ˆ+=x y,由于表中一个数据模糊不清,请你推断该数据的值为( )A . 67B . 68C . 68.3D . 71 例3:【2014全国2卷理18】某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表:(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘法估计公式分别为:∑∑==---=ni ini iix x y yx x b121)())((ˆ,x b y aˆˆ-=. 解:(1)方法一(利用第一个bˆ的公式):根据题意,列表如下:所以,∑∑==---=ni ii iix x y yx x b121)())((ˆ5.02814==,x b y aˆˆ-=3.245.03.4=⨯-=. 所以,线性回归方程为3.25.0ˆ+=x y. 方法二(利用第二个bˆ的公式):根据题意,列表如下: 所以,∑∑==--=ni ii ii x n xyx n yx b1221ˆ5.0471403.4474.1342=⨯-⨯⨯-=,x b y a ˆˆ-=3.245.03.4=⨯-=. 所以,线性回归方程为3.25.0ˆ+=x y.(2)由于线性回归方程3.25.0ˆ+=x y是增函数,所以,2007年至2013年该地区农村居民家庭人均纯收入逐年增加.2015年对应的x =9,此时8.63.295.0ˆ=+⨯=y,即该地区2015年农村居民家庭人均纯收入约为6.8千元.第三章 概率3.1 随机事件的概率1、基本概念:(1)必然事件:在条件S 下,一定会发生的事件,叫相对于条件S 的必然事件; (2)不可能事件:在条件S 下,一定不会发生的事件,叫相对于条件S 的不可能事件; (3)确定事件:必然事件和不可能事件统称为相对于条件S 的确定事件;(4)随机事件:在条件S 下可能发生也可能不发生的事件叫相对于条件S 的随机事件; (5)频数与频率:在相同的条件S 下重复n 次试验,观察某一事件A 是否出现,称n 次试验中事件A 出现的次数n A 为事件A 出现的频数;称事件A 出现的比例nn A f An =)(为事件A 出现的概率:对于给定的随机事件A ,如果随着试验次数的增加,事件A 发生的频率)(A f n 稳定在某个常数上,把这个常数记作)(A P ,称为事件A 的概率.(6)频率与概率的关系:频率是概率的近似值,概率是频率的稳定值.2、事件的关系与运算【注】:互斥事件不一定是对立事件,但对立事件一定是互斥事件.3、概率的基本性质(1)任何事件的概率0≤P (A )≤1;(2)必然事件的概率为1,不可能事件的概率为0;(3)当事件A 与B 互斥时,满足加法公式:P (A ∪B )= P (A )+ P (B );(4)若事件A 与B 为对立事件,则A ∪B 为必然事件,所以P (A ∪B )=1,P (A )=1—P (B ).3.2 古典概型 3.3 几何概型1、基本事件(1)概念:一次试验中可能出现的每一个结果称为一个基本事件,它是试验中不可再分的最简单的随机事件,在一次试验中只能有一个基本事件发生.(2)特点 ⎩⎨⎧.基本事件的和件)都可以表示成几个任何事件(除不可能事②斥的;任何两个基本事件是互①2、古典概型(1)定义:我们将具有以下两个特点的概率模型称为古典概率模型,简称为古典概型. ① 试验中所有可能出现的基本事件只有有限个; ② 每个基本事件出现的可能性都相等. (2)古典概型概率公式 基本事件的总数包含的基本事件的个数事件A A P =)(.3、几何概型(1)定义:如果每个事件发生的概率只与构成该事件区域的长度(面积或体积)成比例,则称这样的概率模型为几何概率模型,简称为几何概型.(2)特点 ⎩⎨⎧.事件发生的概率都相等等可能性,即每个基本②限个;结果(基本事件)有无无限性,即每次试验的①(3)计算公式: 积)的区域长度(面积或体试验的全部结果所构成积)的区域长度(面积或体构成事件A A P =)(.。
高中必修三统计知识点整理
![高中必修三统计知识点整理](https://img.taocdn.com/s3/m/199be406b14e852459fb5719.png)
高中数学必修3知识点总结第二章统计2.1.1 简单随机抽样1.简单随机抽样,也叫纯随机抽样。
就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。
特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。
简单随机抽样是其它各种抽样形式的基础。
通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。
2.简单随机抽样常用的方法:(1)抽签法;⑵随机数表法;⑶计算机模拟法;⑷使用统计软件直接抽取。
在简单随机抽样的样本容量设计中,主要考虑:①总体变异情况;②允许误差范围;③概率保证程度。
3.抽签法:(1)给调查对象群体中的每一个对象编号;(2)准备抽签的工具,实施抽签(3)对样本中的每一个个体进行测量或调查例:请调查你所在的学校的学生做喜欢的体育活动情况。
4.随机数表法:例:利用随机数表在所在的班级中抽取10位同学参加某项活动。
2.1.2系统抽样1.系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。
第一个样本采用简单随机抽样的办法抽取。
K(抽样距离)=N(总体规模)/n(样本规模)前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。
可以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。
如果有明显差别,说明样本在总体中的分布承某种循环性规律,且这种循环和抽样距离重合。
2.1.3分层抽样1.分层抽样(类型抽样):先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。
两种方法:1.先以分层变量将总体划分为若干层,再按照各层在总体中的比例从各层中抽取。
2.先以分层变量将总体划分为若干层,再将各层中的元素按分层的顺序整齐排列,最后用系统抽样的方法抽取样本。
人教高一数学重难点 (人教版必修3):第二章 抽样含解析
![人教高一数学重难点 (人教版必修3):第二章 抽样含解析](https://img.taocdn.com/s3/m/5d57ef4487c24028905fc355.png)
重点列表:重点 名称 重要指数 重点1 简单随机抽样 ★★★ 重点2分层抽样★★★★重点详解:1.简单随机抽样(1)简单随机抽样:一般地,设一个总体含有N 个个体,从中逐个________地抽取n 个个体作为样本(n ≤N ),如果每次抽取时总体内的各个个体被抽到的机会________,就把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样方法有两种:________法和________法.抽签法(抓阄法):一般地,抽签法就是把总体中的N 个个体________,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取______个号签,连续抽取________次,就得到一个容量为n 的样本.随机数法:随机数法就是利用______________、随机数骰子或计算机产生的随机数进行抽样.简单随机抽样有操作简便易行的优点,在总体个数不多的情况下是行之有效的. 2.系统抽样(1)一般地,假设要从容量为N 的总体中抽取容量为n 的样本,我们可以按下列步骤进行系统抽样:①先将总体的N 个个体________.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等;②确定分段间隔k ,对编号进行分段.当N n (n 是样本容量)是整数时,取k =N n ,如果遇到N n不是整数的情况,可以先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量整除;③在第1段用______________抽样方法确定第一个个体编号l (l ≤k );④按照一定的规则抽取样本.通常是将l 加上________得到第2个个体编号________,再________得到第3个个体编号________,依次进行下去,直到获取整个样本.(2)当总体中元素个数较少时,常采用____________,当总体中元素个数较多时,常采用______________.3.分层抽样(1)分层抽样的概念:一般地,在抽样时,将总体分成________的层,然后按照一定的________,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)当总体是由__________的几个部分组成时,往往选用分层抽样的方法.(3)分层抽样时,每个个体被抽到的机会是________的.【答案】1.(1)不放回都相等(2)抽签随机数编号 1 n随机数表2.(1)①编号③简单随机④间隔k(l+k) 加k(l+2k)(2)简单随机抽样系统抽样3.(1)互不交叉比例(2)差异明显(3)均等重点1:简单随机抽样【要点解读】1、简单随机抽样对于总体比较少的情况比较适用2、要注意“搅拌均匀”3、用随机数表法要注意编号的方法【考向1】抽签法【例题】某大学为了支援我国西部教育事业,决定从应届毕业生报名的18名志愿者中选取6名组成志愿小组.请用抽签法和随机数表法设计抽样方案.解:(抽签法)第一步:将18名志愿者编号,编号为1,2,3, (18)第二步:将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签;第三步:将18个号签放入一个不透明的盒子里,充分搅匀;第四步:从盒子中逐个抽取6个号签,并记录上面的编号;第五步:所得号码对应的志愿者就是志愿小组的成员.(随机数表法)第一步:将18名志愿者编号,编号为01,02,03, (18)第二步:在随机数表中任选一数作为开始,按任意方向读数,比如从第8行第29列的数7开始,向右读;第三步:从数7开始,向右读,每次取两位,凡不在01~18中的数或已读过的数,都跳过去不作记录,依次可得到12,07,15,13,02,09;第四步:找出以上号码对应的志愿者,即是志愿小组的成员.【评析】考虑到总体中个体数较少,利用抽签法或随机数表法很容易获取样本,但须按这两种抽样方法的操作步骤进行.注意掌握随机数表的使用方法.【考向2】随机数表法【例题】有一批机器,编号为1,2,3,…,112,为调查机器的质量问题,打算抽取10台入样,请写出用简单随机抽样方法获得样本的步骤.解法一:将112个外形完全相同的号签(编号001,002,…,112)放入一个不透明的盒子里,充分搅拌均匀后,每次不放回地从盒子中抽取1个号签,连续抽取10次,就得到1个容量为10的样本.解法二:第一步,将机器编号为001,002,003, (112)第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比如选第9行第7个数“3”,向右读;第三步,从“3”开始,向右读,每次读取三位,凡不在001~112中的数跳过去不读,前面已经读过的数也跳过去不读,依次可得到074,100,094,052,080,003,105,107,083,092,这样就得到一个容量为10的样本;第四步,找出以上号码对应的机器,即是要抽取的样本.重点2:分层抽样【要点解读】分层抽样对于个体差异比较明显的情况比较适用特别注意抽样比的应用【考向1】分层抽样的步骤【例题】某企业共有5个分布在不同区域的工厂,职工3万人,其中职工比例为3∶2∶5∶2∶3.现从3万人中抽取一个300人的样本,分析员工的生产效率.已知生产效率与不同的地理位置的生活习俗及文化传【评析】分层抽样的实质为按比例抽取,当总体由差异明显的几部分组成时,多用分层抽样.应认识到,在各层抽取样本时,又可能会用到简单随机抽样,系统抽样,甚至分层抽样来抽取样本.【考向2】分层抽样的应用【例题】某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取________所学校,中学中抽取________所学校.解:设从小学、中学、大学分别抽取x,y,z所,且x∶y∶z=150∶75∶25=6∶3∶1,则x=30×610=18(所),y=30×310=9(所).故填18;9.难点列表:难点名称难度指数难点1 系统抽样★★★★难点2 抽样方法的选择与计算★★★★难点详解:抽样方法经常交叉使用,比如系统抽样中均匀分段后的第一段,可采用简单随机抽样;分层抽样中,若每层中个体数量仍很大时,则可辅之以系统抽样等.三种抽样方法的比较【要点解读】系统抽样又称等距抽样,号码序列一旦确定,样本即确定好了.但要注意,如果编号的个体特征随编号的变化呈现一定的周期性,那么样本的代表性是不可靠的,甚至会导致明显的偏向.【考向1】系统抽样步骤【例题】从某厂生产的10002辆汽车中随机抽取100辆测试某项性能,请合理选择抽样方法进行抽样,并写出抽样过程.解:因为总体容量和样本容量都较大,可用系统抽样.抽样步骤如下:第一步,将10002辆汽车用随机方式编号;第二步,从总体中剔除2辆(剔除法可用随机数表法),将剩下的10000辆汽车重新编号(分别为00001,00002,…,10000),并分成100段;第三步,在第一段00001,00002,…,00100这100个编号中用简单随机抽样方法抽出一个作为起始号码(如00006);第四步,把起始号码依次加上间隔100,可获得样本.【评析】①总体容量和样本容量都较大时,选用系统抽样比较合适;②系统抽样的号码成等差数列,公差为每组的容量.【考向2】系统抽样的应用【例题】某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2, … , 840随机编号, 则抽取的42人中, 编号落入区间481, 720]的人数为( ) A .11 B .12 C .13 D .14难点2:抽样方法的选择与计算 【要点解读】分层抽样和系统抽样中的计算 (1)系统抽样总体容量为N ,样本容量为n ,则要将总体均分成n 组,每组N n个(有零头时要先去掉). 若第一组抽到编号为k 的个体,则以后各组中抽取的个体编号依次为k +N n ,…,k +(n -1)N n. (2)分层抽样按比例抽样,计算的主要依据是:各层抽取的数量之比=总体中各层的数量之比. 【考向1】系统抽样的计算【例题】采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间1,450]的人做问卷A ,编号落入区间451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为( ) A .7 B .9 C .10 D .15【解析】 由题意,可知系统抽样中每一组的样本数为96032=30,因为第一组抽取的样本号码为9,所以第k 组抽取的号码为9+30×(k -1).由451≤9+30×(k -1)≤750,得16≤k ≤25(k ∈Z ),所以k =16,17,…,25,共10个,即应该有10人做问卷B. 【答案】 C【考向2】分层抽样的计算已知某地区中小学生人数和近视情况分别如图1和图2所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )A.200,20 B.100,20 C.200,10 D.100,10【答案】 A【名师点睛】解题(1)的关键是掌握系统抽样的原理及步骤;题(2)在扇形统计图中,根据抽取的比例计算样本容量,根据条形统计图计算抽取的高中生近视人数.【趁热打铁】1.某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是( )A.抽签法B.随机数法C.系统抽样法D.分层抽样法2.现要完成下列3项抽样调查:①从10盒酸奶中抽取3盒进行食品卫生检查.②科技报告厅有32排,每排有40个座位,有一次报告会恰好坐满了听众,报告会结束后,为了听取意见,需要请32名听众进行座谈.③东方中学共有160名教职工,其中一般教师120名,行政人员16名,后勤人员24名.为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本.较为合理的抽样方法是( )A.①简单随机抽样;②系统抽样;③分层抽样B.①简单随机抽样;②分层抽样;③系统抽样C.①系统抽样;②简单随机抽样;③分层抽样D.①分层抽样;②系统抽样;③简单随机抽样3.从2006名学生中选取50名组成参观团,若采用下面的方法选取:先用简单随机抽样从2006人中剔除6人,剩下的2000人再按系统抽样的方法进行,则每人入选的概率( ) A.不全相等B.均不相等C.都相等,且为251003D.都相等,且为1404.要从10名女生和5名男生中选出6名学生组成课外兴趣小组,如果按性别依比例分层随机抽样,则选取的男生人数是( )A.4 B.6 C.2 D.1255.总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )A. 08 B.6.将参加夏令营的600名学生编号为001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区.三个营区被抽中的人数依次为( )A.25,17,8 B.25,16,9C.26,16,8 D.24,17,97.一支田径运动队有男运动员56人,女运动员42人.现用分层抽样的方法抽取若干人,若抽取的男运动员有8人,则抽取的女运动员有________人.8.将参加数学竞赛的1000名学生编号如下:0001,0002,0003,…,1000,打算从中抽取一个容量为50的样本,按系统抽样的方法分成50个部分,如果第一部分编号为0001,0002,…,0020,从第一部分随机抽取一个号码0015,则第40个号码为________.9.为了考察某校的教学水平,将抽查该校高三年级部分学生本学年的考试成绩进行考察.为了全面地反映实际情况,采用以下三种方式进行抽样(已知该校高三年级共有20个教学班,并且每个班内的学生已经按随机方式编好了学号,假定该校每班学生人数都相同):①从全年级20个班中任意抽取一个班,再从该班中任意抽取20人,考察他们的学习成绩;②每个班都抽取1人,共计20人,考察这20个学生的成绩;③把学生按成绩分成优秀、良好、普通三个级别,从中抽取100名学生进行考察(已知若按成绩分,该校高三学生中优秀生共150人,良好生共600人,普通生共250人).根据上面的叙述,回答下列问题:(1)上面三种抽取方式中,其总体、个体、样本分别指什么?每一种抽取方式抽取的样本中,其样本容量分别是多少?(2)上面三种抽取方式中各自采用了何种抽取样本的方法?10.某公司有1000名员工,其中:高层管理人员为50名,属于高收入者;中层管理人员为150名,属于中等收入者;一般员工为800名,属于低收入者.要对这个公司员工的收入情况进行调查,欲抽取100名员工,应当怎样进行抽样?第二章1解:由题意,男、女生需要按比例抽样,所以需要分层抽样.故选D.2解:由各抽样方法的适用范围可知较为合理的抽样方法是:①用简单随机抽样,②用系统抽样,③用分层抽样.故选A.3解:抽样过程中每个个体被抽取的机会均等,概率相等,题中的抽取过程与从2006人中抽取50人,每人入选的概率相同,其概率为502006=251003.故选C . 4解:依题意得从10名女生和5名男生中选出6名学生,按性别分层抽样时,女生选4名,男生选2名,故选A .5解:从选定的两位数字开始向右读,剔除不合题意及与前面重复的编号,得到符合题意的编号分别为08,02,14,07,01,…,因此选出来的第5个个体的编号为01.故选D. 6解:依题意及系统抽样的意义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k (k ∈N *)组抽中的号码是3+12(k -1).令3+12(k -1)≤300得k ≤1034,因此第Ⅰ营区被抽中的人数是25;令300<3+12(k -1)≤495得1034<k ≤42,因此第Ⅱ营区被抽中的人数是42-25=17;同理可知第Ⅲ营区被抽中的人数是8.故选A .8解:系统抽样号码构成一个等差数列,公差为每组编号个数,所以第40个号码为0015+(40-1)×100050=0795.故填0795.9解:(1)这三种抽取方式中,其总体都是指该校高三全体学生本学年的考试成绩,个体都是指高三年级每个学生本学年的考试成绩.其中第一种抽取方式中样本为所抽取的20名学生本学年的考试成绩,样本容量为20;第二种抽取方式中,样本为所抽取的20名学生本学年的考试成绩,样本容量为20;第三种抽取方式中,样本为所抽取的100名学生本学年的考试成绩,样本容量为100.(2)第一种采用简单随机抽样法;第二种采用系统抽样法和简单随机抽样法;第三种采用分层抽样法和简单随机抽样法.10解:可以采用分层抽样的方法,按照收入水平分成三层:高收入者、中等收入者、低收入者.从题中数据可以看出,高收入者为50名,占所有员工的比例为501000=5%,为保证样本的代表性,在所抽取的100名员工中,高收入者所占的比例也应为5%,数量为100×5%=5,所以应抽取5名高层管理人员.同理,抽取15名中层管理人员、80名一般员工,再对收入状况分别进行调查.。
人教版高中数学必修三第二章统计简单的随机抽样(3)
![人教版高中数学必修三第二章统计简单的随机抽样(3)](https://img.taocdn.com/s3/m/33c571130a4c2e3f5727a5e9856a561253d32151.png)
人教版高中数学必修三第二章统计简单的随机抽样(3)简单的随机抽样教学目标:1、知识与技能:(1)正确理解随机抽样的概念,掌握抽签法、随机数表法的一般步骤;2、过程与方法:(1)能够从现实生活或其他学科中提出具有一定价值的统计问题;(2)在解决统计问题的过程中,学会用简单随机抽样的方法从总体中抽取样本。
3、情感态度与价值观:通过对现实生活和其他学科中统计问题的提出,体会数学知识与现实世界及各学科知识之间的联系,认识数学的重要性。
4、重点与难点:正确理解简单随机抽样的概念,掌握抽签法及随机数法的步骤,并能灵活应用相关知识从总体中抽取样本。
教学过程【问题提出】1. 我们生活在一个数字化时代,时刻都在和数据打交道,例如,产品的合格率,农作物的产量,商品的销售量,电视台的收视率等.这些数据常常是通过抽样调查而获得的,如何从总体中抽取具有代表性的样本,是我们需要研究的课题.2. 要判断一锅汤的味道需要把整锅汤都喝完吗?应该怎样判断?3. 将锅里的汤“搅拌均匀”,品尝一小勺就知道汤的味道,这是一个简单随机抽样问题,对这种抽样方法,我们从理论上作些分析知识探究(一):简单随机抽样的基本思想思考1. 从5件产品中任意抽取一件,则每一件产品被抽到的概率是多少?一般地,从N个个体中任意抽取一个,则每一个个体被抽到的概率是多少?2. 从6件产品中随机抽取一个容量为3的样本,可以分三次进行,每次从中随机抽取一件,抽取的产品不放回,这叫做逐个不放回抽取.在这个抽样中,某一件产品被抽到的概率是多少?3. 一般地,从N个个体中随机抽取n个个体作为样本,则每一个个体被抽到的概率是多少?4. 食品卫生工作人员,要对校园食品店的一批小包装饼干进行卫生达标检验,打算从中抽取一定数量的饼干作为检验的样本.其抽样方法是,将这批小包装饼干放在一个麻袋中搅拌均匀,然后逐个不放回抽取若干包,这种抽样方法就是简单随机抽样.那么简单随机抽样的含义如何?简单随即抽样的含义一般地,设一个总体有N个个体, 从中逐个不放回地抽取n个个体作为样本(n≤N), 如果每次抽取时总体内的各个个体被抽到的机会都相等, 则这种抽样方法叫做简单随机抽样.思考5. 根据你的理解,简单随机抽样有哪些主要特点?(1)总体的个体数有限;(2)样本的抽取是逐个进行的,每次只抽取一个个体;(3)抽取的样本不放回,样本中无重复个体;(4)每个个体被抽到的机会都相等,抽样具有公平性.6. 在1936年美国总统选举前,一份颇有名气的杂志的工作人员对兰顿和罗斯福两位候选人做了一次民意测验.调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查表.调查结果表明,兰顿当选的可能性大(57%),但实际选举结果正好相反,最后罗斯福当选(62%).你认为预测结果出错的原因是什么?知识探究(二):简单随机抽样的方法思考:1. 假设要在我们班选派5个人去参加某项活动,为了体现选派的公平性,你有什么办法确定具体人选?2. 用抽签法(抓阄法)确定人选,具体如何操作?用小纸条把每个同学的学号写下来放在盒子里,并搅拌均匀,然后随机从中逐个抽出5个学号,被抽到学号的同学即为参加活动的人选.3. 一般地,抽签法的操作步骤如何?第一步,将总体中的所有个体编号,并把号码写在形状、大小相同的号签上.第二步,将号签放在一个容器中,并搅拌均匀第三步,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.4. 你认为抽签法有哪些优点和缺点?优点:简单易行,当总体个数不多的时候搅拌均匀很容易,个体有均等的机会被抽中,从而能保证样本的代表性.缺点:当总体个数较多时很难搅拌均匀,产生的样本代表性差的可能性很大.5. 假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时应如何操作?第一步,将800袋牛奶编号为000,001,…第二步,在随机数表中任选一个数作为起始数(例如选出第8行第7列的数7为起始数). 第三步,从选定的数7开始依次向右读(读数的方向也可以是向左、向上、向下等),将编号范围内的数取出,编号范围外的数去掉,直到取满60个号码为止,就得到一个容量为60的样本.6. 如果从100个个体中抽取一个容量为10的样本,你认为对这100个个体进行怎样编号为宜?7. 一般地,利用随机数表法从含有N个个体的总体中抽取一个容量为n的样本,其抽样步骤如何?第一步,将总体中的所有个体编号.第二步,在随机数表中任选一个数作为起始数.第三步,从选定的数开始依次向右(向左、向上、向下)读,将编号范围内的数取出,编号范围外的数去掉,直到取满n个号码为止,就得到一个容量为n的样本.【课堂练习】P57面1、2、3、4【课堂小结】1、简单随机抽样是一种最简单、最基本的抽样方法,简单随机抽样有两种选取个体的方法:放回和不放回,我们在抽样调查中用的是不放回抽样,常用的简单随机抽样方法有抽签法和随机数法.2、抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型.3、简单随机抽样每个个体入样的可能性都相等,均为n/N,但是这里一定要将每个个体入样的可能性、第n次每个个体入样的可能性、特定的个体在第n 次被抽到的可能性这三种情况区分开来,避免在解题中出现错误.。
人教版高中数学必修三2.简单随机抽样PPT课件
![人教版高中数学必修三2.简单随机抽样PPT课件](https://img.taocdn.com/s3/m/c3faea30ba0d4a7302763ad9.png)
在相同条件S下重复n次试验,观察
某一事件A是否出现,称n次试验中事
件A出现的次数nA为事件A出现的频数,
称事件A出现的比例 出现的频率。
fn
( A)
nA n
为事件A
人 教 版 高 中 数学必 修三2. 简单随 机抽样 PPT课件
人 教 版 高 中 数学必 修三2. 简单随 机抽样 PPT课件
概率的定义:
环节三:试验
做抛掷一枚硬币的试验,观察它落地时 哪一个面朝上 第一步: 每人各取一枚同样的硬币,做10次掷硬币试 验,记录正面向上的次数和比例,填入下表中:
姓名
试验总次数 正面朝上总次数
正面朝上的比例
第二步 :试验结果与其他同学比较,你的结果和他们 一致吗?为什么?
第三步: 由组长把本小组同学的试验结果统计一下, 填入下表:
1061 2048 6019 12012 14984 36124
人 教 版 高 中 数学必 修三2. 简单随 机抽样 PPT课件
频率(m) n
0.5181 0.5069 0.5016 05005 0.4996 0.5011
人 教 版 高 中 数学必 修三2. 简单随 机抽样 PPT课件
频数,频率的定义:
人 教 版 高 中 数学必 修三2. 简单随 机抽样 PPT课件
概率与频率的区别与联系:
(1)频率本身是随机的,在试验前不能确定 。(2)概率是一个确定的数,是客观存在的, 与每次试验无关。
(3)随着试验次数的增加,频率会越来越接 近概率。概率是频率的稳定值.
人 教 版 高 中 数学必 修三2. 简单随 机抽样 PPT课件
人 教 版 高 中 数学必 修三2. 简单随 机抽样 PPT课件
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章 简单随机抽样第一节 简单随机抽样概述一、简单随机抽样的概念简单随机抽样也叫作纯随机抽样。
其概念可有两种等价的定义方法:定义之一:简单随机抽样就是从总体N 个抽样单元中,一次抽取n 个单元时,使全部可能的)(Nn A 种不同的样本被抽到的概率均相等,即都等于1/A 。
按简单随机抽样,抽到的样本称为简单随机样本。
按上述定义,在抽取简单随机样本之前,应将所有可能的互不相同的样本一一列举出来。
但当N 与n 都比较大时,要列出全部可能的样本是不现实的。
因此,按上述定义进行抽样是不太方便的。
定义之二:简单随机抽样是从总体的N 个抽样单元中,每次抽取一个单元时,使每一个单元都有相等的概率被抽中,连续抽n 次,以抽中的n 个单元组成简单随机样本。
由于定义二无需列举全部可能的样本,故比较便于组织实施。
但按这个定义进行抽样时,仍然需要掌握一个可以赖以实施抽样的抽样框。
二、简单随机抽样的具体实施方法常用的有抽签法和随机数法两种。
(一)抽签法抽签法是先对总体N 个抽样单元分别编上1到N 的号码,再制作与之相对应的N 个号签并充分摇匀后,从中随机地抽取n 个号签(可以是一次抽取n 个号签,也可以一次抽一个号签,连续抽n 次),与抽中号签号码相同的n 个单元即为抽中的单元,由其组成简单随机样本。
抽签法在技术上十分简单,但在实际应用中,对总体各单元编号并制作号签的工作量可能会很繁重,尤其是当总体容量比较大时,抽签法并不是很方便,而且也往往难以保证做到等概率。
因此,实际工作中常常使用随机数法。
(二)随机数法随机数法就是利用随机数表、随机数骰子或计算机产生的随机数进行抽样。
由于计算机产生的随机数实际上是伪随机数,不是真正的随机数,特别是直接采用一般现成程序时,产生的随机数往往不能保证其随机性。
因此,一般使用随机数表,或用随机数骰子产生的随机数,特别在n 比较大时。
1、随机数表及其使用方法随机数表是由0到9的10个阿拉伯数字进行随机排列组成的表。
所谓随机排列,即每个数字都是按等概和重复独立抽取的方式排定的。
在编制时,使用一种特制的电器或用计算机,将0至9的10个数字随机地自动摇出,每个摇出的数字就是一个随机数字。
为使用方便,可依其出现的次序,按行或按列分成几位一组进行排列。
根据不同的需要,它们所含数字的多少以及分位和排列的方式尽可以不同。
目前,世界上已编有许多种随机数表。
其中较大的有兰德公司编制,1955年出版的100万数字随机数表,它按五位一组排列,共有20万组;肯德尔和史密斯编制,1938年出版的10万数字随机数表,它也按五位一组排列,共有25000组。
我国常用的是中国科学院数学研究所概率统计室编印的《常用数理统计表》中的随机数表。
随机数表的用途很多,不仅可以组织等概样本,也可组织不等概样本。
简单随机抽样属等概率抽样,在使用随机数表时,要注意以下几点:①每次使用时,确定使用哪页及哪行哪列的数字为起点,必须是随机的。
②设总体容量为N,若N的位数为r,则一定要从r位数中抽取。
遇到1至N的数可直接使用;遇到其它的数不能直接使用。
③当r≥2时,可从含有起点数字左边的r位数开始,也可从右边的r位数开始。
可从起点开始向下抽取,也可向右抽取。
但一经确定使用哪一种方式,就必须用一种方式抽取全部单元号,中途不能变更。
④在重复抽样时,遇到重复的数字应重复使用;在不重复抽样时,遇到重复的数字应舍去不用。
随机数表法一般分下述几步:第一步:确定起点页码,如用笔尖在随机数表上随机指定一点,若落点数字(或距落点最近的数字)为奇数,则确定起点在第1页;否则,起点在第二页。
第二步:确定起点的行数与列数,先在表上随机指定一点,由落点处的两位数确定起点的行数。
由于每页只有50行,所以当落点处的两位数大于50时,则取其减去50的差数为行数。
为保证等概性,当落点处的数为“00”时,则行数应取作50。
然后依同样的方法再确定起点的列数。
第三步:确定所抽样本单元的号码。
从上述确定的起点开始向下(或向右),每次取一个r位数。
通常,若所需抽的数是一位数或两位数(即r=1或2),则由起点开始,依次向右抽取较方便,达到该行右端时,从下一行左端开始继续向右抽取;若所需抽的数是三位及以上(即r≥3)则由起点开始依次向下抽取较方便,达到最后一行时,向右移10位(或r位),再从第一行开始向下继续抽取,直到取足所需的n个r位数为止,以这n个r位数所对应的总体单元组成样本。
然而,按上述步骤抽样,由于每个总体单元只对应一个数字,因此,所读取随机数的放弃比例可能很高,这在大样本时将使抽样过程变得很费事。
为避免这种现象,可以在不违反等概率原则的条件下令每个总体单元同时对应多个数字,以加快抽样的速度。
一般说来,当N为一个r位数字时,要取一个从一到N间的随机数字,可以随机取1至N'的一个数字,其中N'为N的最大r倍的整倍数。
如果N'为kN,总体内每一单元便配上1到N'的k个数,符合随机数字的单元算是中选,此时放弃的随机数字比例便是(10r-N')/10r。
这时的N'也不一定要取r位,如果能取r'位(r'>r),而使N的r'位整位数与N'相差极小即可。
快速抽取的常用方法有:余数法。
如果N是个r位数,由1到N'随机取一个数R,而N'是N的最大r位整倍数,则编号等于R除N所得余数的单元便被选中。
商数法。
如果N是个r位数,由0到N'-1随机取出一个数R而使N'是N的最大整倍数,只要R除k的商是(i-1),则第i个单元便被选中。
其中k=N'/N。
由于k远比N小,所以此法的计算过程较余数法简便。
修正余数法。
如果总体内单元个数N是个r位数,且N'是个不小于N而适于用作除数的较大r位数,而N''为N'的最大r位整倍数,则如果R是用r位随机数字取得的数字,待选单元的号码便会是R除N'的余数,其中只要R不大于N''而余数不是0也不大于N就可以。
在其他情形时,被抽中数字必须放弃而重复进行。
如果N'=N,本法便简化成余数法;如果这时的余数是0,等选单元的号码便选N。
这时的放弃比例是[(N'-N)/10r](N''/N')。
此外也可以用修正商数法或独立选择数位法等以加速抽样。
2、随机数骰子及其使用方法随机数骰子是由均匀材料制成的正二十面体(通常的骰子是正六面体,即正方体),面上刻有0-9的数字各2个。
每盒骰子由盒体、盒盖、泡沫塑料垫及若干个(通常是3-6个)不同颜色的骰子组成。
使用随机数骰子时可以像普通骰子那样用投掷的方法。
但正规的方法是将一个或n个骰子放在盒中,拿去泡沫塑料垫,水平地摇动盒子,使骰子充分旋转,最后打开盒子,读出骰子表示的数字。
一个骰子一次产生一个0-9的随机数。
要产生一个m位数字的随机数,就需要同时使用m个骰子(事先规定好每种颜色所代表的位数,例如红色表示百位数,蓝色表示十位数,黄色表示个位数等),或将一个骰子使用m次(规定第一次产生的数字为最高位数,最后一次产生的数字为最末位即个位数字等)。
特别规定m个骰子的数字(或一个骰子m次产生的数字)都为0时,表示10m。
当使用随机数骰子进行抽样时,特别是如何根据摇随机数骰子方法获得的随机数R0来读取所要求的随机数R有多种方法。
下面是我国国家标准GB10111《利用随机数骰子进行随机抽样的方法》中规定的适用于简单随机抽样的读取随机数的方法。
方法之一:若骰子表示的R0≤N,则取R=R0;若R0>N,则舍弃不用,另行重摇。
重复上述过程,直到取得n个不同的随机数为止。
方法之二:如果骰子表示的R0≤N,则取R=R0;如果R0>N,设R0=K1N+R1(0≤R1<N),当(K1+1)N>10m时,舍弃,重摇。
而当(K1+1)N≤10m时,取R=R1,或R=N(若R1=0)。
重复上述过程,直到获得n个不同的随机数为止。
方法之三:若骰子表示的随机数R0≤N,则取R R0;若R0>N则取一个大于N的适当整数M(一般为方便起见取M=2×10m-1,2.5×10m-1,3×10m-1或5×10m-1等),设R0=K2M+R2(K2为整数,0≤R2<N),则当(K2+1)M>10m时,舍弃,重摇;当(K2+1)M≤10m时,取R=R2或R=N(若R2=0)。
重复上述过程,直到获得n个不同的随机数为止。
例:N=4562,m=4,取M=5000若R0=3150,取R=R0若R0=6897=1×5000+1897, K2=1,( K2+1)M=104则:R2=1897,故取R=R2=1897方法三和方法二都是为提高效率,减少舍弃重摇次数所采取的措施,尤其是方法三在适当选用M时,既方便又快速。
也许有人会认为,在抽样时不用随机数表,而采取随意抽选的办法也可以达到预期的抽样效果。
表面上看,这种想法似乎有一定道理,但实际试验的结果证明随意抽样不等于随机抽样。
以下是两个有名的试验:试验一:随意数试验。
让六个人写下100个自己随意想到的三位数,将这些数内的0、1、2、…、9数字列成次数分布表如下(表3.1):表3.1 六个人的0、1、2、…9的次数分布可以看出,六个人都对数字存在偏好,如第一个人更加偏好数字4、3、0;第二个人则偏好数字1、8、4;等等。
这种由于数字偏好所引起的偏估类型可称之为数字偏误。
试验二:着色试验。
让四个人将10×10方格的纸板着色,可供选择的颜色有蓝、绿、红、白和黄色五种,对每一个四分象限来说,规定每种颜色只能在每行和每列出现一次。
每个方格以其所在的列号与行号表示,如(4,6)代表第四列第六行的方格。
请四个人对这100个方格随意选择行列号,而对其着色。
将这些由这四个人着色所得到的资料形成次数分布表如下(表3.2):表3.2 四个人对方格着色的次数分布可见四个人都对颜色存在偏好,如第一个人偏爱绿色,第二个人偏爱蓝色等。
这种由于对颜色偏好所引起的偏估类型,可称之为颜色偏误。
从上述两个试验可以发现,利用人为的随意抽样方法都会产生偏差。
每个试验者均有较为喜欢的数字和颜色,因此,使得样本变成非随机的,进而给抽样估计带来困难。
三、简单随机抽样的方法评估简单随机抽样对总体不加任何限制,等概率地从总体中直接抽取样本,是最简单、最单纯的抽样技术,它具有计算简便的优点,是研究其它复杂抽样技术的基础,也是比较各种抽样技术之间估计效率的标准,同时,从理论上讲简单随机抽样在各种抽样技术中是贯彻随机原则最好的一种,并且数学性质很简单,是等概率抽样的特殊类型。
另一方面,因为是等概率抽取样本,所以要求总体在所研究的主要标志上同质性或齐性(共性)较好,也即总体要比较均匀;要求样本容量要比较大,以保证样本对总体具有充分的代表性。