2017-2018版高中数学第一章统计章末复习提升学案北师大版必修3
2017_2018版高中数学第一章统计2_1简单随机抽样学案北师大版必修3

2.1 简单随机抽样学习目标 1.体会随机抽样的必要性和重要性.2.明白得随机抽样的目的和大体要求.3.把握简单随机抽样中的抽签法、随机数法的一样步骤.知识点一简单随机抽样试探1 从含有甲、乙的9件产品中随机抽取一件,整体内的各个个体被抽到的机遇相同吗?什么缘故?甲被抽到的机遇是多少?试探2 被抽取的样本整体的个数有限定条件吗?试探3 简单随机抽样是不放回抽样,关于放回的抽样能够是简单随机抽样吗?梳理 1.一样地,从一个整体中,________地抽取一些个体,然后对抽取的对象进行调查,在抽取进程中,要保证每一个对象被抽到的____________.如此的抽样方式叫作简单随机抽样.2.简单随机抽样的四个特点(1)它要求被抽取样本的整体的个数有限,如此便于通过随机抽取的样本对整体进行分析.(2)它是从整体中逐个抽取,如此便于在抽样实践中进行操作.(3)它是一种不放回抽样,由于抽样实践中多采纳不放回抽样,使其具有较普遍的有效性,而且由于所抽取的样本中没有被重复抽取的个体,便于进行有关的分析和计算.(4)它是一种等机遇抽样,不仅每次从整体中抽取一个个体时,各个个体被抽到的机遇相等,而且在整个抽样的进程中,各个个体被抽取的机遇也相等,从而保证了这种抽样方式的公平性.知识点二抽签法和随机数法试探1 采纳抽签法抽取样本时,什么缘故将编号写在形状、大小相同的号签上,而且将号签放在同一个箱子里搅拌均匀?试探2 在什么条件下利用随机数法?梳理 1.一样地,抽签法是简单随机抽样的一种,其操作步骤是(1)给调查对象群体中的每一个对象________;(2)预备“抽签”的工具,实施“________”;(3)对样本中每一个个体进行______________.2.一样地,随机数法也是简单随机抽样的一种,把整体中的N个个体依次编上0,1,…,N-1的号码,然后利用工具(转盘或摸球、随机数表、科学计算器或运算机)产生0,1,…,N-1中的随机数,产生的随机数是几,就选几号个体,直至抽到预先规定的样本数.类型一简单随机抽样的判定例1 下面的抽样是简单随机抽样吗?什么缘故?(1)小乐从玩具箱中的10件玩具中随意拿出一件玩,玩后放回,再拿出一件,持续拿出四件;(2)某学校从300名学生中一次性抽取20名学生调查睡眠情形.反思与感悟当抽样具有:(1)整体中个体数是有限的,(2)逐个抽取,(3)不放回抽取,(4)每一个个体被抽到的机遇等可能时,为简单随机抽样,不然不是简单随机抽样.跟踪训练1 下面的抽样方式是简单随机抽样的是( )A.盒子中有80个零件,从当选出5个零件进行质量查验,在抽样操作时,从中任意拿出一个零件进行质量查验后再把它放回盒子里B.某车间包装一种产品,在自动包装传送带上,每隔5分钟抽一包产品,称其重量是不是合格C.某校别离从行政人员、教师、后勤人员中抽取2人,14人,4人了解对他们学校机构改革的意见D.从8台电脑中不放回地随机抽取2台进行质量查验(假设8台电脑已编好号,对编号随机抽取)类型二简单随机抽样等可能性应用例2 一个布袋中有10个一样质地的小球,从中不放回地依次抽取3个小球,那么某一特定小球被抽到的可能性是________,第三次抽取时,剩余每一个小球被抽到的可能性是________.反思与感悟简单随机抽样,每次抽取时,整体中各个个体被抽到的概率相同,在整个抽样进程中各个个体被抽到的机遇也都相等.跟踪训练2 从整体容量为N的一批零件中,抽取一个容量为30的样本,假设每一个零件被抽到的可能性为0.25,那么N的值为( )A.120 B.200 C.150 D.100类型三抽签法与随机数法命题角度1 抽签法例3 某卫生单位为了支援抗震救灾,要在18名志愿者当选取6人组成医疗小组去参加救治工作,请用抽签法设计抽样方案.反思与感悟一个抽样实验可否用抽签法,关键看两点:一是制签是不是方便;二是个体之间不同不明显.一样地,当样本容量和整体容量较小时,可用抽签法.跟踪训练3 从20架钢琴中抽取5架进行质量检查,请用抽签法确信这5架钢琴.命题角度2 随机数法例4 假设咱们要考察某公司生产的500克袋装牛奶的质量是不是达标,现从800袋牛奶中抽取60袋进行查验,利用随机数表抽取样本时,应如何操作?反思与感悟抽签法和随机数法对个体的编号是不同的,抽签法能够利用个体已有的编号,如学生的学籍号、产品的记数编号等,也能够从头编号,例如整体个数为100,编号能够为1,2,3,…,100.随机数法对个体的编号要看整体的个数,整体数为100,一样为00,01,…,99.整体数大于100小于1 000,从000开始编起,然后是001,002,….跟踪训练4 某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采纳简单随机抽样的方式抽取样本?1.在简单随机抽样中,某一个个体被抽中的可能性( )A.与第几回抽样有关,第1次的可能性要大些B.与第几回抽样无关,每次的可能性都相等C.与第几回抽样有关,最后1次的可能性要大些D.以上都不正确2.下面抽样方式是简单随机抽样的是( )A.从平面直角坐标系中抽取5个点作为样本B.可口可乐公司从仓库中的1 000箱可乐中一次性抽取20箱进行质量检查C.某连队从200名战士中,挑选出50名最优秀的战士去参加抢险救灾活动D.从10个电话中逐个不放回地随机抽取2个进行质量查验(假设10个电话已编好号,对编号随机抽取) 3.一个整体中含有100个个体,以简单随机抽样方式从该整体中抽取一个容量为5的样本,那么指定的某个个体被抽到的可能性为________.4.某地有2 000人参加自学考试,为了了解他们的成绩,从中抽取一个样本,假设每一个考生被抽到的概率都是0.04,那么那个样本的容量是________.5.齐鲁风度“七乐彩”的中奖号码是从别离标有1,2,…,30的三十个小球中逐个不放回地摇出7个小球来按规那么确信中奖情形,这种从30个号码当选7个号码的抽样方式是________.1.简单随机抽样是一种简单、大体、不放回的抽样方式,经常使用的简单随机抽样方式有抽签法和随机数法.2.抽签法的优势是简单易行,缺点是当整体的容量大时,费时、费力,而且标号的签不易搅拌均匀,如此会致使抽样不公平;随机数法的优势也是简单易行,缺点是当整体容量大时,编号不方便.两种方式只适合整体容量较少的抽样类型.3.简单随机抽样每一个个体入样的可能性都相等,均为n N,但要将每一个个体入样的可能性与第n 次抽取时每一个个体入样的可能性区分开,幸免在解题中显现错误.答案精析问题导学知识点一试探1 整体内的各个个体被抽到的机遇是相同的.因为是从9件产品中随机抽取一件,这9件产品每件产品被抽到的机遇都是1/9,甲也是1/9.试探2 被抽取的样本整体的个数必需有限,便于分析.试探3 不能够.简单随机抽样是从整体中逐个抽取的是一种不放回抽样,也确实是每次从整体中掏出元素后不放回整体,假设放回,那么必然不是简单随机抽样.梳理1.随机 概率相同知识点二试探1 为了使每一个号签被抽取的可能性相等,保证抽样的公平性.试探2 在整体容量不大的情形下利用.梳理1.(1)编号 (2)抽签 (3)测量或调查题型探讨例1 解 (1)不是简单随机抽样,因为玩具被放回了,不符合“不放回抽样”这一特点.(2)不是简单随机抽样,因为一次性抽取不符合“逐个抽取”这一特点.跟踪训练1 D [依据简单随机抽样的特点知,只有D 符合.]例2 310 18解析 因为简单随机抽样进程中每一个个体被抽到的可能性均为n N ,因此第一个空填310.因为此题中的抽样是不放回抽样,因此第一次抽取时,每一个小球被抽到的可能性为110,第二次抽取时,剩余9个小球,每一个小球被抽到的可能性为19,第三次抽取时,剩余8个小球,每一个小球被抽到的可能性为18. 跟踪训练2 A [因为从含有N 个个体的整体中抽取一个容量为30的样本时,在每次抽取一个个体的进程中任意一个个体被抽到的可能性为1N ,在整个抽样进程中每一个个体被抽到的可能性为30N ,因此30N=0.25,从而有N =120.应选A.]例3 解 方案如下:第一步,将18名志愿者编号,号码为01,02,03, (18)第二步,将号码别离写在相同的纸条上,揉成团,制成号签.第三步,将取得的号签放到一个不透明的盒子中,充分搅匀.第四步,从盒子中依次掏出6个号签,并记录上面的编号.第五步,与所得号码对应的志愿者确实是医疗小组成员.跟踪训练3 解第一步,将20架钢琴编号,号码是01,02, (20)第二步,将号码别离写在相同的纸条上,揉成团,制成号签.第三步,将取得的号签放入一个不透明的袋子中,并充分搅匀.第四步,从袋子中逐个不放回地抽取5个号签,并记录上面的编号.第五步,与所得号码对应的5架钢琴确实是要进行质量检查的对象.例4 解第一步,将800袋牛奶编号为000,001, (799)第二步,在随机数表中任选一个数作为起始数(例如选出第8行第2列的数7).第三步,从选定的数7开始依次向右读(读数的方向也能够是向左、向上、向劣等),将编号范围内的数掏出,编号范围外的数去掉,直到取满60个号码为止,就取得一个容量为60的样本.跟踪训练4 解方式一(抽签法)将100件轴编号为1,2,…,100,并做好大小、形状相同的号签,别离写上这100个数,将这些号签放在一路,搅拌均匀,接着持续不放回地抽取10个号签,然后测量这10个号签对应的轴的直径.方式二(随机数法)将100件轴编号为00,01,…,99,在随机数表当选定一个起始位置,如取第21行第1个数开始,向右选取10个为93,12,47,79,57,37,89,18,45,50,这10件即为所要抽取的样本.当堂训练1.B 2.D 3.1204.805.抽签法。
北师大版2017-2018学年高中数学必修3全册教学案含解析

北师大版2017-2018学年高中数学必修3全册教学案目录第一章§1 从普查到抽样第一章§2 2.1简单随机抽样第一章§2 2.2分层抽样与系统抽样第一章§3 统计图表第一章§4 4.1 - 4.2平均数、中位数、众数、极差、方差标准差第一章§5 5.1 - 5.2估计总体的分布估计总体的数字特征第一章§7 相关性第一章§8 最小二乘估计复习课(一)统计第二章§1 算法的基本思想第二章§2 2.2变量与赋值第二章§2 2.3循环结构第二章§3 3.1条件语句第二章§3 3.2循环语句复习课(二)算法初步第三章§1 1.1 1.2频率与概率生活中的概率第三章§2 2.1古典概型的特征和概率计算公式第三章§2 2.2建立概率模型第三章§2 2.3互斥事件第三章§3 模拟方法——概率的应用复习课(三)概率从普查到抽样预习课本P3~6,思考并完成以下问题(1)普查的含义是什么?有什么特点?(2)抽样调查的含义是什么?有什么特点?(3)在统计学中,什么是总体和个体?(4)什么是样本和样本容量?[新知初探]1.普查(1)定义:普查是指一个国家或一个地区专门组织的一次性大规模的全面调查,目的是为了详细地了解某项重要的国情、国力.(2)特点:①所取得的资料更加全面、系统;②主要调查在特定时段的社会经济现象总体的数量.2.抽样调查(1)定义:通常情况下,从调查对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此对调查对象的某项指标作出推断,这就是抽样调查.其中,调查对象的全体称为总体,被抽取的一部分称为样本.(2)特点:①迅速、及时;②节约人力、物力和财力.[点睛]当调查的对象量很大,或调查过程具有破坏性时,采取普查就行不通,此时应采用抽样调查的方式.[小试身手]1.判断正误.(正确的打“√”,错误的打“×”)(1)高考考生的身体检查,是抽样调查.()(2)某养鱼专业户要了解鱼塘中鱼的平均质量,是抽样调查.()(3)商检人员在某超市检查出售的饮料的合格率,是普查.()(4)某班拟组织一次春游活动,为了确定春游的地点,向全班同学进行调查,是普查.()答案:(1)×(2)√(3)×(4)√2.下面问题可以用普查的方式进行调查的是()A.检验一批钢材的抗拉强度B.检验海水中微生物的含量C.检验10件产品的质量D.检验一批汽车的使用寿命解析:选C A不能用普查的方式调查,因为这种试验具有破坏性;B用普查的方式无法完成;C可以用普查的方式进行调查;D该试验具有破坏性,且需要耗费大量的时间,在实际生产中无法应用.3.从一批零件中抽取10个,测得它们的长度(单位:cm)如下:22.3622.3522.3322.3522.3722.3422.3822.3622.3222.35由此估计这批零件的平均长度.在此统计活动中:(1)总体为:______________________;(2)个体为:______________________;(3)样本为:______________________;(4)样本容量为:______________________.答案:(1)这批零件的长度(2)每个零件的长度(3)抽取的10个零件的长度(4)10[典例]100名运动员进行调查,下面说法正确的是()A.1 000名运动员是总体B.每个运动员是个体C.抽取的100名运动员是样本D.样本容量是100[解析]根据调查目的可知,总体是这1 000名运动员的年龄,个体是每个运动员的年龄,样本是抽取的100名运动员的年龄,样本容量为100.故答案为D.[答案] D此类题目要正确理解总体与个体的概念,要弄明白概念的实质,并注意样本与样本容量的不同,其中样本容量为数目,无单位.[活学活用]为了了解全年级240名学生的身高情况,从中抽取40名学生进行测量,下列说法正确的是()A.总体是240B.个体是每一个学生C.样本容量是40名学生D.样本容量是40解析:选D本题调查的对象是“学生的身高”这一项指标,故A、B不正确.而样本容量是数量,故C不正确.由此可见,研究此类问题首先要弄清楚所要调查的对象是什么.普查及其应用[典例]听力设备的质量,是全部检查还是抽取部分检查?谈谈你的想法和理由.[解]必须全部检查(采用普查).因为高考是一件非常严肃、责任重大的事件,高考是一场公平竞争,要求十分严格,所配设备必须全部合格,且这批设备数量较少,全部检查是可行的,这样可确保万无一失.判断是否采用普查获取有关信息的方法(1)分析调查对象的性质,判断是否必须了解每一个个体的相关信息;(2)确定总体个数,依此来判断采取普查是否可行.[活学活用]下列调查中,适合采用普查方式的是()A.调查某品牌电视机的市场占有率B.调查某品牌电视机的使用寿命C.调查七年级一班的男女同学的比例D.调查某型号炮弹的射程解析:选C A中的调查对象很多,B、D中的调查对象具有破坏性,都不能采用“普查”.而C选项中男女同学的比例是需要“普查”的.抽样调查及其应用[典例]某校高一男女生比例大约为1∶1.体育老师要调查高一全体学生的平均身高,采用什么方法既省力又合理,应注意什么问题?[解]最好是男女生按1∶1分类抽样调查.因为男女生在身高上有一定的差异,随意抽样调查有可能导致样本代表性不足.判断是否采用抽样调查获取有关信息的方法(1)分析调查目的,确定是需要每个个体情况还是总体情况.若只是关心总体的某项指标(如本例中的平均身高),一般采用抽样调查.(2)若采用普查,是否必要?是否具有破坏性?若不必要或有一定的破坏性,就采用抽样调查.[活学活用]下面的四个问题中,可以用抽样调查方法的是()A.检验10名参加计算机水平测试学生的成绩B.银行对公司10万元存款的现钞的真假检验C.跳伞运动员检查20个伞包及伞的质量D.检验一批汽车的防碰撞性能解析:选D根据抽样调查与普查的概念可知A、B、C一般采用普查的方法,只有D 是采用抽样调查的方法.抽样调查设计[典例]学者,谈他们对高考落榜的看法.这些名人所讲的都是大同小异,不外乎“我也有过落榜的沮丧,但从长远看,它有益于我的人生”,“我是因祸得福,落榜使我走了另一条成功之路”等等.小明据此得出一条结论,上大学不如高考落榜.他的结论正确吗?[解]小明的结论是错误的,在众多的高考落榜生中,走出另外一条成功之路的是少数,小明通过研究一些期刊杂志社报道过的一些成功人士就得出结论是片面的,因为他的抽样不具有代表性.根据调查问题的特点设计抽样调查的不同方案,应遵循以下原则:(1)要考虑如何合理地获取样本,以确保其典型性、代表性.即抽取的部分个体具有广泛的代表性,能很好地代表总体.(2)要考虑如何保证调查内容的真实性.[活学活用]为了缓解城市的交通拥堵情况,某城市准备出台限制私家车的政策,为此要进行民意调查,某个调查小组调查了一些拥有私家车的市民,你认为这样的调查结果会怎样?解:由于要出台限制私家车的政策,抽样调查的市民又是拥有私家车的市民,因此调查结果倾向于反对出台限制私家车的政策.如果要调查出社会公民对政策的真实意见,需要对市民的各个群体进行抽样调查,还包括对一些社会团体(比如公交公司、消防、医院等)的运营状况进行调查,这样才能比较真实地反映出社会的实际情况,获得市民的心声.[层级一学业水平达标]1.医生要检验人血液中血脂的含量,采取的调查方法应该是()A.普查B.抽样调查C.既不能普查也不能抽样调查D.普查与抽样调查都可以答案:B2.下列调查工作适合采用普查的是()A.环保部门对淮河水域的水污染情况的调查B.电视台对某电视节目收视率的调查C.质检部门对各厂家生产的电池使用寿命的调查D.企业在给职工做工作服前进行的尺寸大小的调查解析:选D A、B中的调查,从理论上来说采用普查是可行的,但是普查会费时费力;C中,质检部门对各厂家生产的电池使用寿命的调查不能采用普查,因为调查时的检验对电池具有破坏性;D中,企业在给职工做工作服前进行的尺寸大小的调查必须采用普查,否则工人的工作服会不合体.故选D.3.现从80件产品中随机抽出20件进行质量检验.下列说法正确的是()A.80件产品是总体B.20件产品是样本C.样本容量是80 D.样本容量是20解析:选D总体是80件产品的质量;样本是抽取的20件产品的质量;总体容量是80;样本容量是20.4.国家统计局、国家残联决定对国家残疾人生活、就业等情况进行调查,小明设计的调查方案是在国家残联的网站上设立一个调查表,根据网站上的数据进行分析.你认为小明的方案________(填“合理”或“不合理”).解析:很多残疾人不具有上网条件,因此获取的数据不具有代表性.答案:不合理[层级二应试能力达标]1.若对某校1 200名学生的耐力做调查,抽取其中120名学生,测试他们1 500米跑的成绩,得出相应的数值,在这项调查中,样本是指()A.120名学生B.1 200名学生C.120名学生的成绩D.1 200名学生的成绩解析:选C本题抽取的是120名学生的成绩,因此每个学生的成绩是个体,这120名学生的成绩构成一个样本.2.在古代,我国的科学技术发展水平是否居于世界领先位置呢?为了说明这一问题应该()A.列举我国的文化遗产B.列举我国古代的著名科学家C.列举外国人对我国科技成就的赞扬D.列举全世界古代所有重大科技成果,统计其中有百分之多少是中国人创造的答案:D3.为了了解高一年级学生的视力情况,特别是近视率问题,抽测了其中100名同学的视力情况.在这个过程中,100名同学的视力情况(数据)是()A.总体B.个体C.总体的一个样本D.样本容量解析:选C100名同学的视力情况(数据)是从总体中抽取的一部分个体所组成的集合,所以是总体的一个样本.4.下列调查方案中,抽样方法合适、样本具有代表性的是()A.用一本书第1页的字数估计全书的字数B.为调查某校学生对航天科技知识的了解程度,上学期间,在该校门口,每隔2分钟随机调查一位学生C.在省内选取一所城市中学,一所农村中学,向每个学生发一张卡片,上面印有秦始皇、毛泽东、周恩来、保尔、比尔·盖茨、邓亚萍、刘德华等一些名人的名字,要求每个学生只能在一个名字下面画“√”,以了解全省中学生最崇拜的人物是谁D.为了调查我国小学生的健康状况,共抽取了100名小学生进行调查解析:选B A中样本缺少代表性(第1页的字数一般较少);B中抽样保证了随机性原则,样本具有代表性;对于C,城市中学与农村中学的规模往往不同,学生崇拜的人物也未必在所列的名单之中,这些都会影响数据的代表性;D中总体数量很大,而样本容量太少,不足以体现总体特征.5.给出以下调查:①了解一批汽车驾校训练班学员的训练成绩是否达标;②了解一批炮弹的杀伤力;③某饮料厂对一批产品质量进行检查;④调查对2014年南京青奥会的满意度;⑤检验飞天设备中各零件产品的质量.其中适宜用抽样调查的是________(将正确答案的序号全填上).解析:若调查的目的必须通过普查才能实现,一般用普查,但若存在一定的破坏性则用抽样调查,关键还是看实际需要.驾校训练的司机直接影响驾驶安全,必须普查;炮弹的杀伤力调查具有破坏性,只能采用抽样调查;饮料质量的调查也具有破坏性,应该采用抽样调查;青奥会满意度调查比较复杂,普查成本高,也没必要,适宜用抽样调查;飞天设备不能有一点疏忽,每一个零件的质量都需要检查.答案:②③④6.普查是一项非常艰巨的工作,当总体中的对象很少时,往往采用的调查方式是________;当总体中的对象很多时,普查工作量就很大,这时通常采用的调查方式是________.但是如果调查具有破坏性,那么无论总体数目的多少,只能采用的调查方式是________.答案:普查抽样调查抽样调查7.为制定本市初中七、八、九年级学生校服的生产计划,有关部门准备对180名初中男生的身高做调查,现有三种调查方案:①测量少年体校中180名男子篮球、排球队员的身高;②查阅有关外地180名男生身高的统计资料;③在本市的市区和郊县各任选一所完全中学、两所初级中学,在这六所学校有关的年级(1)班中,用抽签的方法分别选出10名男生,然后测量他身高.为了达到估计本市初中这三个年级男生身高分布的目的,则上述调查方案比较合理的是________.解析:①中,少年体校的男子篮球、排球的运动员的身高一定高于一般的情况,因此无法用测量的结果去估计总体的结果;②中,用外地学生的身高也不能准确地反映本地学生身高的实际情况;而③中的调查方案比较合理,能达到估计本市初中这三个年级男生身高分布的目的.答案:③8.要调查中央电视台《新闻联播》的收视情况,某同学到某一大型商场调查了所有的顾客和售货员的收视情况,得出数据并进行分析,你认为他的调查结果可靠吗?为什么?解:因为某一商场的顾客和售货员的收视情况不具有代表性,不能反映该时间内工人、农民、学生等人员的收视情况,故调查结果不可靠.9.某年春季,某著名的全国性连锁服装店进行了一项关于当年秋季服装流行色的民意调查,调查者通过向顾客发放饮料,并让顾客通过挑选饮料瓶的颜色来对自己喜欢的服装颜色“投票”.这次调查结果显示,某大城市服装颜色的众数(大多数人的选择)为红色,而当年全国服装协会发布的秋季服装流行色是咖啡色.这个结果是否意味着该城市的人比其他城市的人较少倾向于选择咖啡色?你认为这两种调查结果的差异是由什么引起的?解:这个结果意味着该城市光顾这家连锁店的人比其他城市的人较少倾向于选择咖啡色,由于光顾这家连锁店的人是一种比较容易得到的样本(方便样本),不一定能代表该城市其他人的想法.而该城市的调查结果来自于该城市光顾这家连锁店的人,这个样本也不能很好地代表全国民众的观点,从而带来了调查结果的差异.抽样方法2.1简单随机抽样预习课本P8~11,思考并完成以下问题(1)什么样的抽样是简单随机抽样?(2)简单随机抽样有什么特点?(3)简单随机抽样的常用方法有哪些?(4)抽签法和随机数表法的概念是什么?它们的实施步骤是什么?各有什么优缺点?[新知初探]1.简单随机抽样(1)定义:根据实际需要有时需从总体中随机地抽取一些对象,然后对抽取的对象进行调查.在抽取的过程中,要保证每个个体被抽到的概率相同.这样的抽样方法叫作简单随机抽样.(2)特点:①总体个数有限:简单随机抽样要求被抽取样本的总体个数有限,这样便于通过样本对总体进行分析.②逐个抽取:简单随机抽样是从总体中逐个进行抽取,这样便于实际操作.③无放回抽样:简单随机抽样是一种无放回抽样,这样便于样本的获取和一些相关的计算.④等可能抽样:不仅每次从总体中抽取一个个体时各个个体被抽取的可能性相等,而且在整个抽样过程当中,各个个体被抽取的可能性相等,从而保证了这种抽样方法的公平性.2.抽签法(1)定义:抽签法就是先把总体中的N个个体编号,并把编号写在形状、大小相同的签上,然后将这些号签放在同一个箱子里均匀搅拌.每次随机地从中抽取一个,然后将号签均匀搅拌,再进行下一次抽取.如此下去,直至抽到预先设定的样本数.(2)优缺点:①优点:简单易行,当总体个数不多时,号签搅拌均匀很容易,个体有均等的机会被抽取,从而能保证样本的代表性.②缺点:当总体个数较多时,费时、费力,且号签很难被搅拌均匀,产生的样本代表性差,导致抽样的不公平.3.随机数法(1)定义:把总体中的N个个体依次编上0,1,…,N-1的号码,然后利用工具(转盘或摸球、随机数表、科学计算器或计算机)产生0,1,…,N-1中的随机数,产生的随机数是几,就选几号个体,直至抽到预先规定的样本数.(2)优缺点:优点:简单易行,它很好地解决了抽签法中遇到的当总体个数较多时制签难、号签很难被搅拌均匀的问题.缺点:总体个数很多,需要的样本容量较大时,不太方便.[点睛]当随机地选定开始读取的数字之后,读数的方向可以向右,也可以向左、向上、向下等.因为随机数表中每个位臵上各个数字出现的概率是相等的,因此不论采用什么方式读数,我们都能保证各个个体被抽到的概率相同.[小试身手]1.判断正误.(正确的打“√”,错误的打“×”)(1)从无数个个体中抽取20个个体作为样本,是简单随机抽样.()(2)从50台冰箱中一次性抽取5台冰箱进行质量检测,是简单随机抽样.()(3)某班有40名学生,指定个子最高的5名同学参加学校组织的篮球赛,是简单随机抽样.()(4)彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地抽出6个号签,是简单随机抽样.()答案:(1)×(2)×(3)×(4)√2.在简单随机抽样中,某一个个体被抽中的可能性()A.与第几次抽样有关,第一次抽中的可能性要大些B.与第几次抽样无关,每次抽中的可能性都相等C.与第几次抽样有关,最后一次抽中的可能性要大些D.每个个体被抽中的可能性无法确定解析:选B在简单随机抽样中,每一个个体被抽中的可能性都相等,与第几次抽样无关.3.下列抽样中,用抽签法方便的是()A.从某厂生产的3 000件产品中抽取600件进行质量检验B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验D.从某厂生产的3 000件产品中抽取10件进行质量检验解析:选B根据抽签法的特点可知,B选项用抽签法比较方便.4.在容量为100的总体中用随机数表法抽取5个样本,总体编号为00,01,02, (99)给出下列几组号码:①00,01,02,03,04;②10,30,50,70,90;③49,19,46,04,67;④11,22,33,44,55则可能成为所得样本编号的是________(将所有正确结论的序号全填上).解析:随机数表法是一种简单随机抽样方法,因此每一个个体都有可能被抽到,且被抽到的可能性相同,因此所列几组都可能成为所得样本的编号.故填①②③④.答案:①②③④简单随机抽样的概念[典例](1)从无数个个体中抽取50个个体作为样本;(2)仓库中有1万支奥运火炬,从中一次性抽取100支火炬进行质量检查;(3)某连队从200名党员官兵中,挑选出50名最优秀的官兵赶赴灾区开展救灾工作.[解](1)不是简单随机抽样.因为简单随机抽样要求被抽取的样本总体的个数是有限的.(2)不是简单随机抽样.虽然“一次性抽取”和“逐个抽取”不影响个体被抽到的可能性,但简单随机抽样要求的是“逐个抽取”.(3)不是简单随机抽样.因为这50名官兵是从中挑选出来的,是最优秀的,每个个体被抽到的可能性不同,不符合简单随机抽样中“等可能抽样”的要求.要判断所给的抽样方法是否是简单随机抽样,关键是看它们是否符合简单随机抽样的定义,即简单随机抽样的四个特点.[活学活用]下面的抽样方法是简单随机抽样吗?为什么?①某工厂的质检员从一袋30个螺母中一次性取出5个进行质量检测;②某商品的市场调查员为了了解该商品在某日某超市的销售情况,在超市出口处随机向10个顾客询问是否购买了该商品;③某班级有4个小组,每组共有12个同学.班主任指定每组坐在第一张桌子的8位同学为班干部;④中国福利彩票30选7,得到7个彩票中奖号码.解:简单随机抽样要求:被抽取的样本的总体个数确定且较少,抽取样本时要求逐个抽取,每个个体被抽取的可能性一样.所以①不是,因为是一次性抽取不是逐个抽取;②不是,被抽取的样本的总体个数不确定;③不是,班主任的指定不能保证班级里的每一个学生被抽取的可能性一样;④是,它属于简单随机抽样中的随机数法.抽签法的应用[典例]某班有50抽取该样本的过程.[解]利用抽签法步骤如下:第一步:将这50名学生编号,编号为01,02,03, (50)第二步:将50个号码分别写在纸条上,并揉成团,制成号签.第三步:将得到的号签放在一个不透明的容器中,搅拌均匀.第四步:从容器中逐一抽取6个号签,并记录上面的号码.对应上面6个号码的学生就是参加该项活动的学生.利用抽签法抽取样本时应注意以下问题:(1)编号时,如果已有编号(如学号、标号等)可不必重新编号.(例如该题中这50名同学,可以直接利用学号)(2)号签要求大小、形状完全相同.(3)号签要搅拌均匀.(4)要逐一、不放回抽取.[活学活用]上海某中学从40名学生中选1名学生作为上海男篮拉拉队成员,采用下面两种方法选取.方法一:将40名学生按1~40进行编号,相应制作1~40的40个号签,把这40个号签放在一个暗箱中搅拌均匀,最后随机地从中抽取1个号签,与这个号签号码一致的学生幸运入选;方法二:将39个白球与1个红球混合放在一个暗箱中搅匀,让40名学生逐一从中摸取1个球,摸到红球的学生成为拉拉队成员.试问这两种方法是否都是抽签法?为什么?解:抽签法抽样时给总体中的N个个体编号各不相同,由此可知方法一是抽签法,因为抽签法要求所有的号签编号互不相同,而方法二中39个白球无法相互区分,故方法二不是抽签法.这两种方法的相同之处在于每名学生被选中的机会都相等.随机数法[典例]设某校共有12名教师组成暑期西部讲师团,请写出利用随机数法抽取该样本的步骤.[解]其步骤如下:第一步,将100名教师进行编号:00,01,02, (99)第二步,在随机数表(见教材第9页表1-2)中任取一数作为开始,如从第12行第9列开始,依次向右读取两位的数,可以得到31,70,05,00,25,93,45,53,78,14,28,89.与这12个编号对应的教师组成样本.随机数法解题策略(1)选定初始数字读数方向,向左、向右、向上或向下都可以,方向不同可能导致不同结果,但这一点不影响样本的公平性.(2)读数时,编号为两位,两位读取,编号为三位,则三位读取,如果出现重号,则跳过,接着读取.(3)当题目所给的编号位数不一致时,不便于直接从随机数表中读取,这时需要对号码作适当的调整使新编号位数相同.[活学活用]假设我们要检验某公司生产的袋装牛奶的质量是否达标,需从800袋袋装牛奶中抽取50袋进行检验.利用随机数法抽取样本,写出抽样过程.解:第一步:将800袋袋装牛奶编号为000,001, (799)第二步:从随机数表(见教材第9页表1-2)中任意一个位臵,如从第1行的第8列,第9列和第10列开始选数,向右读,抽得第1个样本号码208,依次得到样本号码:026,314,070,243,…,其中超出000~799范围的数和前面已出现的数舍去,一直到选出50个样本号码为止;第三步:所选出的50个号码对应的50袋袋装牛奶即为所要抽取的样本.简单随机抽样的灵活应用[典例]道物理题中随机抽3道;从20道化学题中随机抽3道;从12道生物题中随机抽2道.选用合适的方法确定这个学生所要回答的三门学科的题的序号(物理题的编号为1~15,化学题的编号为16~35,生物题的编号为36~47).。
2018版高中数学北师大版必修三学案:第一章 统计 4-1 平均数、中位数、众数、极差、方差-4-2 标准差 精品

4.1 平均数、中位数、众数、极差、方差4.2 标准差[学习目标] 1.掌握各种基本数字特征的概念、意义以及它们各自的特点.2.要重视数据的计算,体会统计思想.知识点一 众数、中位数、平均数 1.众数、中位数、平均数定义(1)众数:一组数据中重复出现次数最多的数.(2)中位数:把一组数据按从小到大的顺序排列,处在中间位置(或中间两个数的平均数)的数称为这组数据的中位数.(3)平均数:如果n 个数x 1,x 2,…,x n ,那么x =1n (x 1+x 2+…+x n )称为这n 个数的平均数.2.三种数字特征与频率分布直方图的关系1.标准差(1)平均距离与标准差标准差是样本数据到平均数的一种平均距离,一般用s 表示.假设样本数据是x 1,x 2,…,x n ,x 表示这组数据的平均数.x i 到x 的距离是|x i -x |(i =1,2,…,n ),则用如下公式来计算标准差: s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. (2)计算标准差的步骤 ①求样本数据的平均数x ;②求每个样本数据与样本平均数的差x i -x (i =1,2,…,n ); ③求(x i -x )2(i =1,2,…,n );④求s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2];⑤求s =s 2,即为标准差. 2.方差标准差的平方s 2叫作方差.s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中,x i (i =1,2,…,n )是样本数据,n 是样本容量,x 是样本平均数.题型一 众数、中位数、平均数的简单运用 例1 某公司的33名职工的月工资(以元为单位)如下表:(1)(2)假设副董事长的工资从5 000元提升到20 000元,董事长的工资从5 500元提升到30 000元,那么新的平均数、中位数、众数又是多少?(精确到元)(3)你认为哪个统计量更能反映这个公司员工的工资水平?结合此问题谈一谈你的看法. 解 (1)平均数是:x =1 500+4 000+3 500+2 000×2+1 500+1 000×5+500×3+0×2033≈1 500+591=2 091(元),中位数是1 500元,众数是1 500元. (2)新的平均数是x ′=1 500+28 500+18 500+2 000×2+1 500+1 000×5+500×3+0×2033≈1 500+1 788=3 288(元),新的中位数是:1 500元,新的众数是1 500元.(3)在这个问题中,中位数或众数均能反映该公司员工的工资水平,因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司员工的工资水平.反思与感悟 1.众数、中位数及平均数都是描述一组数据集中趋势的量,当一组数据中个别数据较大时,可用中位数描述其集中趋势,当一组数据中有不少数据重复出现时,其众数往往更能反映问题.2.在求平均数时,可采用新数据法,即当所给数据在某一常数a 的左右摆动时,用简化公式:x =x ′+a .跟踪训练1 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:解 在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.上面表格里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是 1.70;这组数据的平均数是x =117(1.50×2+1.60×3+…+1.90×1)=28.7517≈1.69(m).答 17名运动员成绩的众数、中位数、平均数依次为1.75 m ,1.70 m,1.69 m. 题型二 平均数和方差的运用例2 甲、乙两机床同时加工直径为100 cm 的零件,为检验质量,各从中抽取6件测量,数据为甲:99 100 98 100 100 103 乙:99 100 102 99 100 100 (1)分别计算两组数据的平均数及方差;(2)根据计算结果判断哪台机床加工零件的质量更稳定. 解 (1)x 甲=16(99+100+98+100+100+103)=100,x 乙=16(99+100+102+99+100+100)=100.s 2甲=16[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=73,s 2乙=16[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1. (2)两台机床所加工零件的直径的平均值相同,又s 2甲>s 2乙,所以乙机床加工零件的质量更稳定.反思与感悟 1.极差、方差与标准差的区别与联系: 数据的离散程度可以通过极差、方差或标准差来描述.(1)极差是数据的最大值与最小值的差,它反映了一组数据变化的最大幅度,它对一组数据中的极端值非常敏感.(2)方差则反映了一组数据围绕平均数波动的大小,为了得到以样本数据的单位表示的波动幅度通常用标准差,即样本方差的算术平方根,是样本数据到平均数的一种平均距离. 2.在实际问题中,仅靠平均数不能完全反映问题,还要研究方差,方差描述了数据相对平均数的离散程度,在平均数相同的情况下,方差越大,离散程度越大,数据波动性越大,稳定性越差;方差越小,数据越集中,质量越稳定.跟踪训练2 某化肥厂有甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其质量,分别记录抽查数据如下(单位:kg): 甲:102 101 99 98 103 98 99 乙:110 115 90 85 75 115 110 (1)这种抽样方法是哪一种方法?(2)试计算甲、乙两个车间产品质量的平均数与方差,并说明哪个车间产品比较稳定. 解 (1)采用的抽样方法是:系统抽样.(2)x 甲=17(102+101+99+98+103+98+99)=100;x 乙=17(110+115+90+85+75+115+110)=100;x 2甲=17[(102-100)2+(101-100)2+(99-100)2+(98-100)2+(103-100)2+(98-100)2+(99-100)2]=17(4+1+1+4+9+4+1)≈3.43; s 2乙=17[(110-100)2+(115-100)2+(90-100)2+(85-100)2+(75-100)2+(115-100)2+(110-100)2]=17(100+225+100+225+625+225+100) ≈228.57.所以s 2甲<s 2乙,故甲车间产品较稳定.题型三 数据的数字特征的综合应用例3在一次科技知识竞赛中,两组学生的成绩如下表:次竞赛中的成绩谁优谁劣,并说明理由.解(1)甲组成绩的众数为90,乙组成绩的众数为70,从成绩的众数比较看,甲组成绩好些.(2)x甲=12+5+10+13+14+6(50×2+60×5+70×10+80×13+90×14+100×6)=150×4 000=80,x乙=14+4+16+2+12+12(50×4+60×4+70×16+80×2+90×12+100×12)=150×4 000=80.s2甲=12+5+10+13+14+6[2×(50-80)2+5×(60-80)2+10×(70-80)2+13×(80-80)2+14×(90-80)2+6×(100-80)2]=172,s2乙=14+4+16+2+12+12[4×(50-80)2+4×(60-80)2+16×(70-80)2+2×(80-80)2+12×(90-80)2+12×(100-80)2]=256.∵s2甲<s2乙,∴甲组成绩较乙组成绩稳定,故甲组好些.(3)甲、乙两组成绩的中位数、平均数都是80分.其中,甲组成绩在80分以上(包括80分)的有33人,乙组成绩在80分以上(包括80分)的有26人.从这一角度看,甲组的成绩较好.(4)从成绩统计表看,甲组成绩大于等于90分的有20人,乙组成绩大于等于90分的有24人,所以乙组成绩集中在高分段的人数多.同时,乙组得满分的人数比甲组得满分的人数多6人.从这一角度看,乙组的成绩较好.反思与感悟要正确处理此类问题,首先要抓住问题中的关键词语,全方位地进行必要的计算、分析,而不能习惯性地仅从样本方差的大小去决定哪一组的成绩好,像这样的实际问题还得从实际的角度去分析,如本例的“满分人数”;其次要在恰当地评估后,组织好正确的语言作出结论.跟踪训练3甲、乙两人同时生产内径为25.40 mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm):甲25.4625.3225.4525.3925.3625.34 25.42 25.45 25.38 25.42 25.39 25.43 25.39 25.40 25.44 25.40 25.42 25.35 25.41 25.39 乙25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.49 25.36 25.34 25.33 25.43 25.43 25.32 25.47 25.31 25.32 25.32 25.32 25.48从生产的零件内径的尺寸看,谁生产的质量较高?(结果保留小数点后3位) 解 用计算器计算可得 x 甲≈25.405,x 乙≈25.406; s 甲≈0.037,s 乙≈0.068.从样本平均数看,甲生产的零件内径比乙的更接近内径标准(25.40mm),差异很小;从样本标准差看,由于s 甲<s 乙,因此甲生产的零件内径尺寸比乙的稳定程度高得多.于是,可以作出判断,甲生产的零件的质量比乙的高一些.分类讨论思想例4 某班有四个学习小组,各小组人数分别为10,10,x,8,已知这组数据的中位数与平均数相等,求这组数据的中位数.分析 由于x 未知,因此中位数不确定,需讨论.解 该组数据的平均数为14(10+10+x +8)=14(28+x ),中位数是这4个数按从小到大的顺序排列后处在最中间两个数的平均数.(1)当x ≤8时,原数据从小到大排序为x,8,10,10,中位数是9,由14(28+x )=9,得x =8,符合题意,此时中位数是9;(2)当8<x ≤10时,原数据从小到大排序为8,x,10,10,中位数是12(x +10),由14(28+x )=12(10+x ),得x =8,与8<x ≤10矛盾,舍去;(3)当x >10时,原数据从小到大排序为8,10,10,x ,中位数是10,由14(28+x )=10,得x =12,符合题意,此时中位数是10.综上所述,这组数据的中位数是9或10.解后反思 当题目中含有参数,且参数的不同取值影响求解结果时,需对参数的取值分类讨论.1.下列选项中,能反映一组数据的离散程度的是( ) A .平均数 B .中位数 C .方差 D .众数答案 C解析 由方差的定义,知方差反映了一组数据的离散程度.2.一组样本数据按从小到大的顺序排列为13,14,19,x,23,27,28,31,其中位数为22,则x 等于( ) A .21 B .22 C .20 D .23 答案 A解析 根据题意知,中位数22=x +232,则x =21.3.一次选拔运动员的测试中,测得7名选手中的身高(单位:cm)分布的茎叶图如图所示.记录的平均身高为177 cm ,有一名候选人的身高记录不清楚,其末位数记为x ,则x 等于( )A .5B .6C .7D .8答案 D解析 由题意知,10+11+0+3+x +8+9=7×7,解得x =8.4.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________. 答案 0.1解析 x -=4.7+4.8+5.1+5.4+5.55=5.1,则方差s 2=15[(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)2]=0.1.5.某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4 则:(1)平均命中环数为________; (2)命中环数的标准差为________. 答案 (1)7 (2)2解析 (1)x =7+8+7+9+5+4+9+10+7+410=7.(2)∵s 2=110[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4,∴s =2.1.一组数据中的众数可能不止一个,中位数是唯一的,求中位数时,必须先排序. 2.利用直方图求数字特征: (1)众数是最高的矩形的底边的中点. (2)中位数左右两边直方图的面积应相等.(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.3.标准差的平方s 2称为方差,有时用方差代替标准差测量样本数据的离散程度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.。
2017-2018版高中数学第一章统计7相关性学案北师大版必修3

7 相关性[学习目标] 1.掌握相关关系的判断.2.会作散点图.3.体会化归思想的应用.知识点一变量间的相关关系1.变量之间常见的关系2.1.散点图在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.2.曲线拟合从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这样近似的过程称为曲线拟合.3.相关关系的分类(1)线性相关:若两个变量x和y的散点图中,所有点看上去都在一条直线附近波动,则称变量间是线性相关的.(2)非线性相关:若所有点看上去都在某条曲线(不是一条直线)附近波动,则称此相关为非线性相关的.此时,可以用一条曲线来拟合.4.不相关如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的.思考任意两个统计数据是否均可以作出散点图?答可以,不管这两个统计量是否具备相关性,以一个变量值作为横坐标,另一个作为纵坐标,均可画出它的散点图.题型一变量间相关关系的判断例1 在下列两个变量的关系中,哪些是相关关系?①正方形边长与面积之间的关系;②作文水平与课外阅读量之间的关系;③农作物产量与施肥量之间的关系;④降雪量与交通事故的发生率之间的关系.解两变量之间的关系有两种:函数关系与带有随机性的相关关系.①正方形的边长与面积之间的关系是函数关系.②作文水平与课外阅读量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.③一块农田的农作物产量与施肥量之间的关系是一种不确定的相关关系.④降雪量与交通事故的发生率之间具有相关关系.综上,②③④中的两个变量具有相关关系.反思与感悟函数关系是一种确定的关系,而相关关系是非随机变量与随机变量的关系.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.跟踪训练1 下列两个变量间的关系不是函数关系的是( )A.正方体的棱长与体积B.角的度数与它的正弦值C.单产为常数时,土地面积与粮食总产量D.日照时间与水稻的单位产量答案 D解析函数关系与相关关系都是指两个变量之间的关系,但是这两种关系是不同的,函数关系是指当自变量一定时,函数值是确定的,是一种确定性的关系.因为A项V=a3,B项y=sinα,C项y=ax(a>0,且a为常数),所以这三项均是函数关系.D项是相关关系.题型二散点图例2 5名学生的数学和物理成绩(单位:分)如下:解以x轴表示数学成绩,y轴表示物理成绩,得相应的散点图如图所示.由散点图可知,各点分布在一条直线附近,故两者之间具有线性相关关系.反思与感悟 1.判断两个变量x和y间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果图上发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.2.画散点图时应注意合理选择单位长度,避免图形过大或偏小,或者是点的坐标在坐标系中画不准,使图形失真,导致得出错误结论.跟踪训练2 (1)如图是两个变量统计数据的散点图,判断两个变量之间是否具有相关关系?(2)某男孩的年龄与身高的统计数据如下.解(1)不具有相关关系,因为散点图散乱地分布在坐标平面内.(2)散点图如图:由图可见,具有线性相关关系.题型三散点图的应用例3 下面是水稻产量与施化肥量的一组观测数据:(1)(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增加吗?解(1)散点图如下:(2)从图中可以发现施化肥量与水稻产量具有线性相关关系,当施化肥量由小到大变化时,水稻产量也由小变大,图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化肥施用量的增加而增加,不会一直随施化肥量的增加而增加.反思与感悟利用散点图判断不同变量的相关性时,其关键是正确画出散点图,然后观察分布规律:是在一条直线附近波动还是在一条曲线附近波动,还是没有任何规律,从而得出线性相关、非线性相关或不相关的结论.跟踪训练3 对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图1;对变量u,v 有观测数据(u i,v i)(i=1,2,…,10),得散点图2.由这两个散点图可以判断( )A.变量x与y,u与v都有线性相关关系B.变量x与y,u与v都没有线性相关关系C.变量x与y有线性相关关系,u与v没有线性相关关系D.变量x与y没有线性相关关系,u与v有线性相关关系答案 A数形结合思想例4 以下是在某地搜集到的不同楼盘房屋的销售价格y(单位:万元)和房屋面积x(单位:m2)的数据:关还是负相关?分析作出散点图,利用散点图进行判断.解数据对应的散点图如图所示.通过以上数据对应的散点图可以判断,房屋的销售价格和房屋面积之间具有线性相关关系,且是正相关.解后反思判断两个变量x和y是否具有线性相关关系,常用的简便方法就是绘制散点图.如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就具有线性相关关系.注意不要受个别点的位置的影响.1.下列所给出的两个变量之间存在相关关系的为( )A.学生的座号与数学成绩B.学生的学号与身高C.曲线上的点与该点的坐标之间的关系D.学生的身高与体重答案 D解析A与B中的两个变量之间没有任何关系;C中的两个变量之间具有函数关系.2.下列各图中所示两个变量具有相关关系的是( )A.①②B.①③C.②④D.②③答案 D解析具有相关关系的两个变量的数据所对应的图形是散点图,②③能反映两个变量的变化规律,它们之间是相关关系.3.下面是四个散点图中的点的分布状态,直观上判断两个变量之间具有线性相关关系的是( )答案 C解析散点图A中的点无规律的分布,范围很广,表明两个变量之间的相关程度很小;B中所有的点都在同一条直线上,是函数关系;C中点的分布在一条带状区域上,即点分布在一条直线的附近,是线性相关关系;D中的点也分布在一条带状区域内,但不是线性的,而是一条曲线附近,所以不是线性相关关系,故选C.4.下列变量之间的关系是函数关系的是( )A.已知二次函数y=ax2+bx+c,其中a、c是已知常数,取b为自变量,因变量是这个函数的判别式Δ=b2-4acB.果树剪枝和果树产量C.闯红灯和交通事故发生率D.每亩施用肥料量和粮食的亩产量答案 A5.命题:①路程与时间、速度的关系是相关关系;②同一物体的加速度与作用力是函数关系;③产品的成本与产量之间的关系是函数关系;④圆的周长与面积的关系是相关关系;⑤广告费用与销售量之间的关系是相关关系.其中正确的命题序号是________.答案②⑤两个变量间的关系有两种:一种是函数关系,另一种是相关关系.另外要会画散点图,并会根据散点图判断两个变量间是何种关系.。
2017_2018版高中数学第一章统计5.1估计总体的分布5.2估计总体的数字特征学案北师大版必修3

5.1 估计总体的分布5.2 估计总体的数字特征[学习目标] 1.学会列频率分布表,会画频率分布直方图.2.会用频率分布表或频率分布直方图估计总体分布,并作出合理解释.3.在解决问题过程中,进一步体会用样本估计总体的思想,认识统计的实际作用,初步经历收集数据到统计数据的全过程.知识点一 频率分布表与频率分布直方图 1.用样本估计总体的两种情况 (1)用样本的频率分布估计总体的分布. (2)用样本的数字特征估计总体的数字特征. 2.作频率分布直方图的步骤(1)求极差:即一组数据中最大值和最小值的差;(2)决定组距与组数:将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.这时应注意:①一般样本容量越大,所分组数越多;②为方便起见,组距的选择应力求“取整”;③当样本容量不超过120时,按照数据的多少,通常分成5~12组. (3)将数据分组:按组距将数据分组,分组时,各组均为左闭右开区间,最后一组是闭区间. (4)列频率分布表:一般分四列:分组、频数累计、频数、频率,最后一行是合计.其中频数合计应是样本容量,频率合计是1.(5)画频率分布直方图:画图时,应以横轴表示分组,纵轴表示频率/组距.其相应组距上的频率等于该组上的小长方形的面积.即每个小长方形的面积=组距×频率组距=频率.思考 为什么要对样本数据进行分组?答 不分组很难看出样本中的数字所包含的信息,分组后,计算出频率,从而估计总体的分布特征.知识点二 频率折线图在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.随着样本量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图就会越来越接近于一条光滑曲线.题型一频率分布直方图的绘制例1 调查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)如下:171 163 163 166 166 168 168 160 168 165171 169 167 169 151 168 170 168 160 174165 168 174 159 167 156 157 164 169 180176 157 162 161 158 164 163 163 167 161(1)作出频率分布表;(2)画出频率分布直方图.解(1)最低身高151 cm,最高身高180 cm,它们的差是180-151=29,即极差为29;确定组距为4,组数为8,列表如下:(2)反思与感悟 1.组数的决定方法是:设数据总数目为n,一般地,当n≤50,则分为5~8组;当50≤n≤120时,则分为8~12组较为合适.2.分点数的决定方法是:若数据为整数,则分点数据减去0.5;若数据是小数点后一位的数,则分点减去0.05,以此类推.3.画频率分布直方图小长方形高的方法是:假设频数为1的小长方形的高为h,则频数为k 的小长方形高为kh.跟踪训练1 美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51 ,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.解(1)以4为组距,列表如下:(2)从频率分布表中可以看出60%左右的美国总统就任时的年龄在50岁至60岁之间,45岁以下以及65岁以上就任的总统所占的比例相对较小. 题型二 频率分布直方图的应用例2 为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率约是多少? 解 (1)频率分布直方图是以面积的形式来反映数据落在各小组内的频率大小的, 因此第二小组的频率为42+4+17+15+9+3=0.08.因为第二小组的频率=第二小组的频数样本容量,所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由直方图可估计该校全体高一年级学生的达标率约为17+15+9+32+4+17+15+9+3×100%=88%.反思与感悟 1.频率分布直方图的性质:(1)因为小矩形的面积=组距×频率组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小. (2)在频率分布直方图中,各小矩形的面积之和等于1. (3)频数相应的频率=样本容量. 2.频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性.跟踪训练2 如图所示是总体的一个样本频率分布直方图,且在[15,18)内频数为8. (1)求样本在[15,18)内的频率; (2)求样本容量;(3)若在[12,15)内的小矩形面积为0.06,求在[18,33)内的频数.解 由样本频率分布直方图可知组距为3.(1)由样本频率分布直方图得样本在[15,18)内的频率等于475×3=425.(2)样本在[15,18)内频数为8, 由(1)可知,样本容量为8425=8×254=50.(3)∵在[12,15)内的小矩形面积为0.06,∴样本在[12,15)内的频率为0.06,故样本在[15,33)内的频数为50×(1-0.06)=47,又在[15,18)内频数为8,故在[18,33)内的频数为47-8=39.题型三 频率分布与数字特征的综合应用例 3 已知一组数据:125 121 123 125 127 129 125 128 130 129 126 124 125 127 126 122 124 125 126 128 (1)填写下面的频率分布表:(2)作出频率分布直方图;(3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数. 解 (1)(2)(3)在[125,127)中的数据最多,取这个区间的中点值作为众数的近似值,得众数126,事实上,众数的精确值为125.(2)图中虚线对应的数据是125+2×58=126.25,事实上中位数为125.5.使用“组中值”求平均数:x =122×0.1+124×0.15+126×0.4+128×0.2+130×0.15=126.3,平均数的精确值为x =125.75. 反思与感悟 1.利用频率分布直方图估计数字特征: (1)众数是最高的矩形的底边的中点; (2)中位数左右两侧小矩形的面积相等;(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和. 2.利用直方图求众数、中位数、平均数均为估计值,与实际数据可能不一致.跟踪训练3 某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30、0.40、0.15、0.10、0.05.求:(1)高一参赛学生成绩的众数、中位数. (2)高一参赛学生的平均成绩. 解 (1)由图可知众数为65, 又∵第一个小矩形的面积为0.3, ∴设中位数为60+x ,则0.3+x ×0.04=0.5,得x =5,∴中位数为60+5=65.(2)依题意,x=55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67,∴平均成绩约为67分.1.用样本频率分布估计总体频率分布的过程中,下列说法正确的是( )A.总体容量越大,估计越精确B.总体容量越小,估计越精确C.样本容量越大,估计越精确D.样本容量越小,估计越精确答案 C解析由用样本估计总体的性质可得.2.频率分布直方图中,小矩形的面积等于( )A.组距B.频率C.组数D.频数答案 B解析根据小矩形的宽及高的意义,可知小矩形的面积为一组样本数据的频率.3.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )A.56 B.60C.120 D.140答案 D解析设所求人数为N,则N=2.5×(0.16+0.08+0.04)×200=140,故选D.4.某中学举办电脑知识竞赛,满分为100分,80分以上为优秀(含80分).现将高一两个班参赛学生的成绩进行整理后分成5组,绘制成频率分布直方图如下图所示.已知图中从左到右的第一、三、四、五小组的频率分别为0.30、0.15、0.10、0.05,而第二小组的频数是40,则参赛的人数是________,成绩优秀的频率是________. 答案 100 0.15解析 设参赛的人数为n ,第二小组的频率为1-(0.30+0.15+0.10+0.05)=0.4, 依题意40n=0.4,∴n =100,优秀的频率是0.10+0.05=0.15.1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律,通常用样本的频率分布表或频率分布直方图去估计总体的分布.2.用同样的方法先后从总体中抽取两个大小相同的样本,但两次得到的样本频率分布表、样本频率分布直方图、样本的平均数和标准差仍然可能互不相同.如果抽样的方法比较合理,那么样本可以反映总体的信息,样本容量越大,越接近总体的真实情况.。
2017-2018学年高中数学北师大版必修3 ppt课件 第一章 统计第一章章末复习提升课(35张)

n
Hale Waihona Puke ^ ,^ (3)代入公式计算b a的值. (4)写出回归直线方程.
3.学习变量的相关性时: (1)注意通过实例辨析确定性关系(函数关系)与相关关系.根据 散点图分析两个变量间的相关关系是正相关还是负相关. (2)学会用最小二乘法求已知样本数据的回归直线方程.用回 归直线方程对总体进行估计时,得到的结果不是准确值.
5.在用样本的数字特征估计总体的数字特征时应注意: (1)任何一个样本数据的改变都会引起平均数的改变.特殊情况 下,平均数可能受某几个极端值的影响,而偏离一般情况. (2) 标准差的平方是方差 , 标准差的单位与样本数据的单位一 致. (3)用样本的平均数和标准差估计总体的平均数和标准差时,样 本的平均数和标准差只是总体的平均数和标准差的近似.
能力挑战1 某工厂有1 003名工人,从中抽取10人参加体检, 试采用简单随机抽样和系统抽样进行具体实施.
解析:(1)简单随机抽样: ①将每一个人编一个号由0 001至1 003. ②制作大小相同的号签,并写上号码. ③放入一个大容器内,均匀搅拌. ④依次抽取10个号签. 具有这10个编号的人组成一个样本.
三、变量的相关关系 1.两个随机变量x和y之间相关关系的判断方法有: (1)散点图法:通过散点图,观察它们的分布是否存在一定规 律,直观地判断. (2)表格、关系式法:结合表格或关系式进行判断. (3)经验法:借助积累的经验进行分析判断. 2.用公式求回归方程的一般步骤是: (1)列表.
n 2 (2)计算- x ,- y , xi , xiyi. i =1 i =1
对于上述问题,下面说法是否正确,说明理由. ①不论采用哪一种抽样方法,这100个零件中每一个被抽到的 机会都相等; ②(1)(2)两种抽法,这100个零件中每一个被抽到的机会相等, 而(3)并非如此; ③采用不同的抽样方法,这100个零件中每一个被抽到的机会 是不相等的.
2017-2018学年高中数学第1章统计章末小结与测评教学案北师大版必修3

O 要点整合再现O1 .抽样方法(1) 用随机数表法抽样时,对个体所编号码位数要相等,当问题所给位数不等时,以位数 较多的为准,在位数较少的数前面添"0”,凑齐位数.(2) 用系统抽样法时,如果总体容量N 能被样本容量n 整除,抽样间隔为k =N 如果总体n容量N 不能被样本容量 n 整除,先用简单随机抽样剔除多余个体,抽样间隔为k = .[Nl.(3) 应用三种抽样方法时需要搞清楚它们的使用原则. ① 当总体容量较小,样本容量也较小时,可采用抽签法. ② 当总体容量较大,样本容量较小时,可用随机数表法. ③ 当总体容量较大,样本容量也较大时,可用系统抽样法. ④ 当总体由差异明显的几部分组成时,常用分层抽样. 2 •用样本估计总体(1) 用样本频率分布估计总体频率分布时, 通常要对给定的一组数据进行列表、 作图处理,作频率分布表与频率分布直方图时要注意其方法步骤.(2) 茎叶图刻画数据有两个优点: 一是所有信息都可以从图中得到, 二是便于记录和表示.但数据较多时不方便.(3) 平均数反映了样本数据的平均水平,而标准差反映了样本数据相对平均数的波动程 度. 3 •变量间的相关关系除了函数关系这种确定性的关系外,还大量存在因变量的取值带有一定随机性的两个变 量之间的关系——相关关系,对于一元线性相关关系,通过建立线性回归方程就可以根据其 部分观测值,获得对这两个变量之间的整体关系的了解,主要是作出散点图、写出线性回归 方程.O 高频考点例桁O[典例1]某工厂有1 003名工人,从中抽取10人参加体检,试采用简单随机抽样和系 统抽样进行具体实施.[解](1)简单随机抽样:①将每一个人编一个号由 ② 制作大小相同的号签,并写上号码.第1章统计]章康小结与测评要点整合再现 高據考点例析阶段质量检测0001 至 1003.③放入一个大容器内,均匀搅拌.④依次抽取10个号签.具有这十个编号的人组成一个样本.(2)系统抽样:①将每个人编一个号由0001至1003.②利用随机数表抽取3个号,将这3个人剔除.③重新编号0001至1000.④分段耳00= 100,所以0001至0100为第一段.⑤在第一段内由简单随机抽样方法抽得一个号I •⑥按编号将I, 100 + I,…,900 + I,共10个号选出,这10个号所对应的人组成样本.N [借题发挥]1.当总体容量N能被样本容量n整除时,分段间隔k=孑利用系统抽样的方法抽样.2 •当总体容量不能被样本容量整除时,可先从总体中随机剔除n个个体.3 •要注意三种抽样方法的使用条件.[对点训练]1.将参加夏令营的600名学生编号为:001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第I营区,从301到495在第H营区,从496到600在第川营区,三个营区被抽中的人数依次为( )A. 26,16,8B. 25,17,8 C . 25,16,9 D . 24,17,9一600解析:选B由题意知间隔为而=12,故抽到的号码为12k + 3( k = 0,1,…,49),列出不等式可解得:第I营区抽25人,第H营区抽17人,第川营区抽8人.[典例2] 有一容量为200的样本,数据的分组以及各组的频数如下:[—20,- 15) , 7; [ —15,- 10) , 11; [ —10,- 5) , 15; [ —5,0) , 40;[0,5) , 49; [5,10) , 41; [10,15) , 20; [15,20] , 17.(1) 列出样本的频率分布表;(2) 画出频率分布直方图和频率分布折线图;(3) 求样本数据不足0的频率.[解](1)频率分布表如下:分组 频数 频率 [—20,- 15) 7 0.035 [—15,— 10) 11 0.055 [—10,— 5) 15 0.075 [—5,0) 40 0.2 [0,5) 49 0.245 [5,10) 41 0.205 [10,15) 20 0.1 [15,20] 17 0.085 合计2001.00(2)如图是频率分布直方图和频率分布折线图:0. 035+ 0.055 + 0.075 + 0.2 = 0.365. [借题发挥]1.频率分布直方图的绘制方法与步骤 (1) 先制作频率分布表,然后作直角坐标系,横轴表示总体,纵轴表示(2)把横轴分成若干段,每一段对应一个组•以每个组距为底,以各频率除以组距的商为高,分别画成矩形.这样得到的直方图就是频率分布直方图.2 •频率分布折线图反映的是数据的变化趋势,可用来对数据进行估计和预测. [对点训练]2 •从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方 图(如图所示)•由图中数据可知 a= __________ .若要从身高在[120,130) ,[130,140) ,[140,150] 三组内的学生中,用分层抽样的方法选取 18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为 __________ .频率 组距.(3)样本数据不足解析:••• 0.005 x 10+ 0.035 x 10+ a x 10+ 0.020 x 10+ 0.010 x 10= 1 a = 0.030. 设身高在[120,130) , [130,140) , [140,150]三组的学生各有 x , y , z 人,x则而=0.030 x 10,解得 x = 30.同理,y = 20, z = 10.答案:0.030 33 •某棉纺厂为了了解一批棉花的质量,从中随机抽测了 100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标)•所得数据均在区间[5,40]中,其频率分布直方图如图所示,则在抽测的100根中,有 _________ 根棉花纤维的长度小于 20 mm.解析:(0.04 x 5+ 0.01 x 5+ 0.01 x 5) x 100= 30.答案:30考点三用样本的数字特征估计总体的数字特征[典例3]川、乙两位同学进行投礙比赛*毎人玩5局.毎局 在指定线外投傭,若第一次不进丫再投第二次,依此类 推.但彊装!!能投S 次*半投进时.该局姑朿、井记下投 篮次数•当6投不进:该局也结束.记为“X:当第一次 投进得賂分・第二次投进得$分•书三次投进得4分.依 此类推.第6次没投进•得0分•两人投谨悄况如下:第1局 第2周 第3 W 第4局 第5局甲 5次 X 4次 5次 1次 乙X2次4次2次X故从[140,150]中抽取的学生人数为 1030+ 20+ 10 x 18= 3.诸通过汁算.判断淞投篮的水平高.解]依题意因为甲帶分平览数乙得分平览数=2.氏甲得分的标准差^1. 96,乙得分的标准差=2, 24.所以甲得分平览数=乙得分平览数. 甲耀分的标准差< 乙得分的标准遴• 故甲投篮的水平高.[借题发挥]在实际问题中,仅靠平均数不能完全反映问题,还要研究数据偏离平均数 的离散程度(即方差或标准差)•标准差越大,说明数据的离散性越大;标准差越小,说明数 据的离散性越小或数据越集中、稳定.[对点训练]4•甲、乙两位学生参加数学竞赛培训,在培训期间他们参加 5项预赛,成绩记录如下:甲:78 76 74 90 82 乙:90 70 75 8580(1) 用茎叶图表示这两组数据;(2) 现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合 适?说明理由.解:(1)用茎叶图表示如下:甲4 6 8 2 0(2) x 甲=80, x 乙=80,2 1 2 2 2 2 2而 s ? = 5X [(78 — 80) + (76 — 80) + (74 — 80) + (90 — 80) + (82 — 80) ] = 32,212 2 2 2 2s z = 5X [(90 — 80) + (70 — 80) + (75 — 80) + (85 — 80) + (80 — 80) ] = 50.— — 2 2x 甲=x 乙,s 甲<s 乙,•••从统计学的角度考虑,选甲参加更合适•[典例4]某个体服装店经营某种服装在某周内获纯利y (元)与该周每天销售这种服装件乙0 5 5 0 0数x之间有如下一组数据:x 3456789y66697381899091已知:二=280, = 45 309 , = 3 487.(1) 求x , y ;(2) 求纯利y与每天销售件数x之间的线性回归方程;⑶估计每天销售10件这种服装时纯利润为多少元?1[解](1)由已知得x = 7(3 + 4 + 5+ 6+ 7+ 8 + 9) = 6, + 69+ 73 + 81 + 89 + 90 + 91) ~ 79.86.(2)设线性回归方程为y = bx+ a,则迟眄片―7亍歹—7JC2b =~ 4.75 ,3 487 —7X 6X 79.862280 —7X6a= y —b x = 79.86 —4.75 X 6~51.36.•••所求线性回归方程为y= 4.75 x+ 51.36.(3) 当x = 10时,y= 98.86,估计每天销售这种服装10件可获纯利98.86元.[借题发挥]要对y与x进行线性相关检验,只要画出散点图,看各数据是否集中在某一条直线附近即可,采用数形结合思想,若线性相关,则根据公式求出回归方程.[对点训练]5•炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时,钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间)的一列数据如下表所示:⑵求回归方程;(3)预测当钢水含碳量为160时,应冶炼多少分钟.解:(1)用x表示含碳量,y表示冶炼时间,可作散点图如下图所示.18016014th120'覺肚'伽do 伽曲加吃琵)从上图中可以看出,各点散布在一条直线附近,即它们线性相关. (2)10召X i y i — 10x y b =~ 1.267 ,E x 2— 10 x 2i = 1a = y —b x ~ — 30.47.即所求的回归方程为 y = 1.267 x — 30.47. (3)当 x = 160 时,y = 1.267 x 160 — 30.47 〜172(min),即大约冶炼172 min.O 盼段质量检测{ —)0(时间:90分钟满分:120分)一、选择题(本大题共10小题,每小题5分,共50分•在每小题给出的四个选项中,只 有一项是符240- 220^ 200冶炼时间(min)合题目要求的)1 •为了了解1 200名学生对学校某项教改试验的意见,打算从中抽取一个容量为 样本,考虑用系统抽样,则分段的间隔 k 为( )A . 40B . 30C . 20D . 12解析:选B 系统抽样也叫间隔抽样,抽多少个就分成多少组,总数十组数=间隔数,即2 •某学校为了调查高一年级的200名学生完成课后作业所需时间,采取了两种抽样调查的方式:第一种由学生会的同学随机抽取20名同学进行抽查;第二种由教务处对该年级的学生进行编号,从001到200,抽取学号最后一位为 2的同学进行调查•则这两种抽样的方法依 次是()A. 分层抽样,简单随机抽样B. 简单随机抽样,分层抽样C. 分层抽样,系统抽样D. 简单随机抽样,系统抽样解析:选D 由抽样方法的概念知选 D. 3•一个容量为80的样本中数据的最大值是140,最小值是51,组距是10,则应将样本数据分为( )A. 10 组 B . 9 组 C . 8 组 D . 7 组极差 140 — 51解析:选B 根据列频率分布表的步骤,组距=—10 = 8.9,所以分9组.4.(陕西高考)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将 840人按1,2,…,840随机编号,则抽取的 42人中,编号落入区间[481,720]的人数为()A . 11B . 12C . 13D . 14解析:选B 依据系统抽样为等距抽样的特点,分 42组,每组20人,区间[481,720]包含25组到36组,每组抽1人,则抽到的人数为 12.5 .某大学数学系共有本科生5 000人,其中一、二、三、四年级的人数比为4: 3 : 2 : 1,要用分层抽样的方法从所有本科生中抽取一个容量为 200的样本,则应抽取三年级的学生人数为()A . 80B . 40C . 60D . 20解析::选B 应抽取三年级的学生人数为200X 盒=40.6.已知200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,时速在[60,70)40的1 20040 =30.的汽车辆数为()81解析:选A •••甲同学的成绩为 78,77,72,86,92,乙同学的成绩为 78,82,88,91,9578+ 82+ 88+ 91 + 95586.8解析:选B 时速在[60,70)的汽车频率为0.04 X 10= 0.4,时速在[60,70)的汽车大约有 200X 0.4 = 80(辆).7. 已知回归直线斜率的估计值为1.23,样本点的中心为(4,5),则回归方程为()A. y = 1.23 x + 4B. y = 1.23 x + 5C. y = 1.23 x + 0.08D. y = 0.08 x + 1.23解析:选C 回归直线的斜率就是 b ,则回归方程为y = 1.23x + a ,将(4,5)代入方程得a =0.08.8•某班的数学考试成绩的平均分为70分,方差为S 2.后来发现成绩记录有误,同学甲得2 2 280分却误记为50分,同学乙得70分却误记为100分,更正后计算得方差为 S 1,贝U S 与S 1的大小关系是()A . s 2>s 1B . S 2= s 1C . S 2<S 2D .无法判断解析:选A 根据方差的计算公式,S 2的算式中含有(50 — 70)2 + (100 — 70)2, S 2的算式中 含有(80 — 70) 2+ (70 — 70) 2,而两算式的其他部分完全相同,故易知 S 2>S1.9.甲、乙两名同学在 5次体育测试中的成绩统计如图的茎叶图所示,若甲、乙两人的平均成绩分别是 X 甲, X 乙,则下列结论正确的是( )I"乙A. X 甲<X 乙;乙比甲成绩稳定B. X 甲〉X 乙;甲比乙成绩稳定C. X 甲>X 乙;乙比甲成绩稳定D. X 甲<X 乙;甲比乙成绩稳定78+ 77+ 72 + 86+ 925A . 8B .80C . 65 D••• X 甲<X 乙.从茎叶图中数据的分布情况看,乙同学的成绩更集中于平均数附近,这说明乙比甲成绩稳定.10. 在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人” •根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是()A. 甲地:总体平均值为3,中位数为4B. 乙地:总体平均值为1,总体方差大于0C. 丙地:中位数为2,众数为3D. 丁地:总体平均值为2,总体方差为3解析:选D根据信息可知,连续10天内,每天的新增疑似病例不能有超过7的数,选项A中,中位数为4,可能存在大于7的数;同理,在选项C中也有可能;选项B中的总体方差大于0,叙述不明确,如果数目太大,也有可能存在大于7的数;选项D中,根据方差公式, 如果有大于7的数存在,那么方差不会为 3.、填空题(本大题共4小题,每小题5分,共20分•把答案填写在题中的横线上)11. 某社区对居民进行2017天津全运会知晓情况的分层抽样调查. 已知该社区的青年人、中年人和老年人分别有800人、1 600人、1 400人.若在老年人中的抽样人数是70,则在中年人中的抽样人数应该是__________ .70 1 1解析:抽取的比例为k= =齐,故在中年人中应该抽取的人数为 1 6 00X = 80.1 400 20 20答案:80 Array12若已求得它们的回归方程的斜率为 6.5,则这条直线的回归方程为___________解析:设回归方程为y= 6.5 x + a.,“ —1由已知,x (2 + 4+ 5 + 6 + 8)= 5.5—=(30 + 40+ 60 + 50+ 70) = 50.•- a= y —6.5 x = 50 —6.5 X 5= 17.5.•y = 6.5 x+ 17.5.答案:y = 6.5 x + 17.513. 从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1) 直方图中x 的值为 __________; (2) 在这些用户中,用电量落在区间[100,250)内的户数为 _________ .解析:(1)根据频率和为 1,得(0.002 4 + 0.003 6 + 0.006 0 + x + 0.002 4+ 0.001 2) X 50 =1,解得 x = 0.004 4 ;(2)(0.003 6+ 0.006 0 + 0.004 4) X 50X 100= 70.答案:(1) 0.004 4(2) 7014. 甲、乙两位同学某学科连续五次考试成绩用茎叶图表示,如图所示,则平均数较高 的是__________ ,成绩较为稳定的是 ________ .2 107 1为s 2= 7.2,故甲的平均分高于乙,甲的成绩比乙稳定.答案:甲 甲三、解答题(本大题共4小题,共50分•解答应写出必要的文字说明、证明过程或演算 步骤)15. (12分)某车间有189名职工,现要按1 : 21的比例选质量检查员,采用系统抽样的 方式进行,写出抽样过程.解:以随机方式对 189名职工编号(比如可直接采用工资表上号码编号),设其分别为1,2,3 (189)1 1由已知样本容量是总体个数的刃,故样本容量为189X 21= 9(个),将1,2,3,…,189编 9段,解析:甲的平均分为殳68+ 69+ 70+ 71+ 725 70 ,乙的平均分为丫 = 63+ 68+ 69+ 69+ 715=68; 甲的方差能—汁2+曲—礼I 2+罚—汁2+52-=2,同理乙的方差2每段21个号.如1〜21为第一段,22〜42为第二段,…,169〜189为第九段,在第段1〜21个号码中随机抽样产生一个号码,如设为 I ,则I ,1 + 21, l + 42,…,I + 168就是 所产生的9个样本号码,对应的就是质量检查员.16. (12分)农科院的专家为了了解新培育的甲、乙两种麦苗的长势情况,从甲、乙两种 麦苗的试验田中各抽取 6株麦苗测量麦苗的株高,数据如下:(单位:cm)甲:9,10,11,12,10,20 乙:8,14,13,10,12,21.(1) 绘出所抽取的甲、乙两种麦苗株高的茎叶图;(2) 分别计算所抽取的甲、乙两种麦苗株高的平均数与方差,并由此判断甲、乙两种麦苗 的长势情况.解:(1)茎叶图如图所示:8 0 2 34— 9+ 10 + 11 + 12+ 10+ 20 — x 甲= =12, x 乙=s 甲^ 13.67 , 16.67.因为x 甲< x 乙,所以乙种麦苗平均株高较高,又因为s 甲<s 乙,所以甲种麦苗长的较为整齐.17. (12分)为了了解中学生的身体发育情况, 对某一中学同年龄的50名男生的身高进行了测量,结果如下:[157,161)3 人;[161,165)4 人;[165,169)12 人; [169,173)13 人;[173,177)12 人;[177,181]6 人. (1)列出频率分布表; (2)画出频率分布直方图;⑶ 估计总体在[165,177)间的比例.解:(1)列出频率分布表:8+ 14+ 13+ 10 + 12 + 21= 13,(3)因 0.24 + 0.26 + 0.24 = 0.74 , 所以总体在[165,177)间的比例为74%.18. (14分)某学校高一(3)班甲、乙两名同学的最近5次数学测验成绩(单位:分)统计如下:甲 65 98 94 98 95 乙62989910071(1) 分别写出甲、乙成绩的平均数和中位数;(2) 分别用平均数和中位数分析甲、乙两位同学中,哪位同学成绩较好; (3) 又知同班同学丙的最近 5次数学测验成绩(单位:分)如下:丙8090869995分别从平均数、中位数和方差等方面分析甲与丙的成绩谁好谁坏,并说明理由.— 1解:⑴ 平均分:x 甲=5X (65 + 98 + 94 + 98+ 95) = 90, — 1x 乙=一乂 (62 + 98+ 99 + 100+ 71) = 86.5 甲的中位数是95,乙的中位数是 98.(2) 从平均分看,甲的平均分高,甲的成绩较好;从中位数看,乙的中位数大,乙的成绩 较好. ― 1(3) x 丙= X (80 + 90 + 86 + 99 + 95) = 90,丙的中位数为 90.521 2 2 2 2 2$丙= X [(80 — 90) + (90 — 90) + (86 — 90) + (99 — 90) + (95 — 90) ] = 44.4 ;51s 甲=&X [(65 — 90) + (98 — 90) + (94 — 90) + (98 — 90) + (95 — 90) ] = 158.8.由于两人的平均分相同,所以从平均分看,甲、丙成绩同样好;从中位数看,甲的中位 数高,甲的成绩好;从方差看,丙的方差小,丙的成绩较稳定,所以丙的成绩好.(2)画出频率分布直方图如图:合计501.00。
2017_2018版高中数学第一章统计3统计图表学案北师大版必修3

3 统计图表学习目标 1.明白得统计图表的作用与意义.2.把握茎叶图的概念与应用.3.通过实例体会条形统计图、折线统计图、扇形统计图和茎叶图的各自特点,从而恰本地选择上述方式分析样本的散布,准确地做出整体估量.知识点一统计图表的作用与意义试探通过抽样取得的原始数据有什么缺点?梳理数据分析的大体方式:(1)借助于图形分析数据的一种大体方式是用图将它们画出来,此方式能够达到两个目的,一是从数据中________信息,二是利用图形________信息.(2)借助于表格分析数据的另一种方式是用紧凑的________改变数据的排列方式,此方式是通过改变数据的________,为咱们提供说明数据的新方式.知识点二常见统计图的特点类型一条形图的制作及读图例1 某人统计了一本书中的100个句子的字数,得出以下结果:1~5个字的15句,6~10个字的27句,11~15个字的32句,16~20个字的15句,21~25个字的8句,26~30个字的3句.(1)试作出条形统计图;(2)统计出1~15个字及16~30个字的句子个数所占百分比,作出条形统计图;(3)统计出1~10个字,11~20个字,21~30个字的句子个数所占百分比,作出条形统计图.反思与感悟条形图的制作一样可分为以下几步:(1)依照统计资料整理数据,一样整理成表格形式;(2)画出横轴、纵轴,确信它们表示的项目;(3)画直条,条形的高与数据的大小成比例.跟踪训练1 有100名学生,每人只能参加一个运动队,其中参加足球队的有30人,参加篮球队的有27人,参加排球队的有23人,参加乒乓球队的有20人.(1)列出学生参加运动队的频率散布表;(2)画出频率散布条形图.类型二折线统计图与扇形统计图例2 某市是我国西部的一个多民族城市,总人口数为370万(2000年普查统计).如图1和图2所示的是2000年该市各民族人口的统计图,请你依照统计图提供的信息回答以下问题.(1)2000年该市少数民族的总人口数是多少?(2)2000年该市总人口中的苗族所占的百分比是多少?(3)假设2000年该市参加中考的学生有40 000人,那么参加中考的少数民族的学生人数约为多少?反思与感悟用统计图来表示百分比时,咱们能够用条形统计图、折线统计图和扇形统计图,但最适宜用扇形统计图来表示.在解题进程中要看清楚题目的要求,依照不同的要求选择不同的统计图.统计图的功能确实是将数据信息通过图表的形式恰本地表示出来.跟踪训练2 如图是某保险公司提供的资料,在1万元以上的保险单中,有821少于2.5万元,那么很多于2.5万元的保险单有________万元.类型三茎叶图例3 某赛季甲、乙两名篮球运动员每场竞赛的得分情形如下:甲的得分12,15,24,25,31,31,36,36,37,39,44,49,50;乙的得分8,13,14,16,23,26,28,33,38,39,51.(1)画出甲、乙两名运动员得分数据的茎叶图;(2)依照茎叶图分析甲、乙两名运动员的水平.反思与感悟当数据较少时,用茎叶图分析问题的突出优势是(1)保留原始信息;(2)随时记录.用茎叶图分析数据能够运用数据散布的对称情形、集中分散情形来分析整体情形.跟踪训练3 在某电脑杂志的一篇文章中,每一个句子所含的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17;在某报纸的一篇文章中,每一个句子所含的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,取得什么结论?1.当搜集到的数据量专门大或有多组数据时,用哪一种统计图表示较适合( )A.茎叶图B.条形统计图C.折线统计图D.扇形统计图2.如下图是从一批产品中抽样取得的数据的条形统计图,由图可看出数据显现机遇最大的范围是( )A.(8.1,8.3) B.(8.2,8.4)C.(8.4,8.5) D.(8.6,8.7)3.如下图是某校高一年级学生到校方式的条形统计图,依照图形可得出骑自行车人数占高一年级学生总人数的( )A.20% B.30%C.50% D.60%4.甲、乙两人在相同条件下各射靶10次,每次射靶的成绩情形如下图:从折线图上两人射击命中环数的走势看,最有潜力的是________.1.条形统计图及折线统计图专门适用于数据量专门大的情形,但却损失了数据的部份信息.扇形统计图适合表示整体的各个部份所占比例的问题,但不适用于整体分成部份较多的问题.2.茎叶图表示数据有两个突出优势:(1)统计图上没有原始信息的损失.(2)茎叶图能够随时记录,方便表示与比较.缺点:当数据量专门大或有多组数据时,茎叶图就不那么直观、清楚了.答案精析问题导学知识点一试探因为通过抽样取得的原始数据多而且杂乱,无法直接从中明白得它们的含义,并提取信息,也不便于咱们用它来传递信息.梳理(1)提取传递(2)表格组成形式知识点二直观准确具体数量折线统计图扇形统计图原始数据题型探讨例1 (1)条形统计图如图(1)所示.(2)1~15个字的句子个数为1~5个字,6~10个字,11~15个字的句子个数之和:15+27+32=74,所占百分比为74%;16~30个字的句子个数为16~20个字,21~25个字,26~30个字的句子个数之和:15+8+3=26,所占百分比为26%.条形统计图如图(2)所示.(3)1~10个字的句子个数为15+27=42,所占百分比为42%;11~20个字的句子个数为32+15=47,所占百分比为47%;21~30个字的句子个数为8+3=11,所占百分比为11%.条形统计图如图(3)所示.跟踪训练1 解(1)参加足球队记为1,参加篮球队记为2,参加排球队记为3,参加乒乓球队记为4,得频率散布表如下:试验结果频数频率参加足球队(记为1)300.30参加篮球队(记为2)270.27参加排球队(记为3)230.23参加乒乓球队(记为4)200.20合计100 1.00(2)由上表可知频率散布条形图如图.例2 解 (1)15%×370=55.5(万人),即2000年该市少数民族的总人口数是55.5万人. (2)40%×15%=6%,∴2000年该市总人口中的苗族所占的百分比是6%. (3)40 000×15%=6 000(人),即2000年该市参加中考的少数民族的学生约有6 000人. 跟踪训练2 91解析 很多于1万元的占700万元的21%,为700×21%=147万元.1万元以上的保险单中,超过或等于2.5万元的保险单占1321,金额为1321×147=91万元,故很多于2.5万元的保险单有91万元.例3 解 (1)作出茎叶图如图.(2)由上面的茎叶图能够看出,甲运动员的得分情形是大致对称的;乙运动员的得分情形除一个特殊得额外,也大致对称.因此甲运动员的发挥比较稳固,整体得分情形比乙运动员好. 跟踪训练3 解 (1)茎叶图如下图:(2)电脑杂志上每一个句子的字数集中在10~30之间,报纸上每一个句子的字数集中在20~40之间,说明电脑杂志上每一个句子的平均字数要比报纸上每一个句子的平均字数少.说明电脑杂志作为科普读物需要通俗易懂、简明. 当堂训练1.B 2.B 3.B 4.乙。
高中数学 第1章 统计章末复习课学案 北师大版必修3-北师大版高一必修3数学学案

第1章 统计抽样方法的选择与应用【例1】 (1)在下列问题中,分别可以采用什么方法抽取样本?a .从20台液晶电视中抽取4台进行检验;b .某学校有300名教职员工,其中教师210人,行政人员35人,后勤服务人员55人,为了解教职工对学校工作的满意度,需要抽取一个容量为60的样本;c .从800辆车中抽取8辆进行检测.(2)一汽车厂生产A ,B ,C 三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量(单位:辆)如下表:轿车A 轿车B 轿车C舒适型 100 150 z标准型300450600按类用分层抽样的方法在这个月生产的轿车中抽取50辆,其中有A 类轿车10辆. ①求z 的值;②用分层抽样的方法在C 类轿车中抽取一个容量为5的样本. [解] (1)a .用简单随机抽样抽取样本即可.b .用分层抽样的方法抽取样本,不同职位的人的满意度是不同的.c .用系统抽样比较合适,因为样本容量较大.(2)①设该厂本月生产轿车n 辆,由题意得50n=10100+300,所以n =2 000,则z =2 000-100-300-150-450-600=400.②设所抽取的样本中有m 辆舒适型轿车,因为用分层抽样的方法在C 类轿车中抽取一个容量为5的样本,所以4001 000=m5,解得m =2,即在C 类轿车中抽取2辆舒适型轿车,3辆标准型轿车.1.进行系统抽样时,必须满足总体容量可以被样本容量整除.当不能整除时,应用简单随机抽样的方法从总体中剔除部分个体,其中剔除的个体数是总体中的个体数除以样本容量的余数.2.进行分层抽样时,每层中所抽取的个数应按各层个体数在总体中所占的比例抽取,即抽样比=样本容量总体容量.在实际操作中,应先计算出抽样比=样本容量总体容量,再按抽样比确定每层需要抽取的个体数:样本容量总体容量×该层个体数目.1.某高级中学有学生270人,其中一年级108人,二、三年级各81人.现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样、分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270;使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段.如果抽得号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250; ②5,9,100,107,111,121,180,195,200,265; ③11,38,65,92,119,146,173,200,227,254; ④20,57,84,111,138,165,192,219,246,270. 关于上述样本的下列结论中,正确的是( ) A .②③都不能为系统抽样 B .②④都不能为分层抽样 C .①④都可能为系统抽样 D .①③都可能为分层抽样D [按分层抽样时,在一年级抽取108×10270=4(人),在二年级、三年级各抽取81×10270=3(人),则在号码段1,2,…,108中抽取4个号码,在号码段109,110,…,189中抽取3个号码,在号码段190,191,…,270中抽取3个号码,①②③符合,所以①②③可能是分层抽样,④不符合,所以④不可能是分层抽样;如果按系统抽样时,抽取出的号码应该是“等距”的,①③符合,②④不符合,所以①③都可能为系统抽样,②④都不能为系统抽样.]用样本的频率分布估计总体分布【例2】有1个容量为100的样本,数据的分组及各组的频数如下:[12.5,15.5),6;[15.5,18.5),16;[18.5,21.5),18;[21.5,24.5),22;[24.5,27.5),20;[27.5,30.5),10;[30.5,33.5],8.(1)列出样本的频率分布表(含累积频率);(2)画出频率分布直方图;(3)估计数据小于30.5的数据约占多大百分比.[解] (1)样本的频率分布表如下:分组频数频率累积频率[12.5,15.5)60.060.06[15.5,18.5)160.160.22[18.5,21.5)180.180.40[21.5,24.5)220.220.62[24.5,27.5)200.200.82[27.5,30.5)100.100.92[30.5,33.5]80.08 1.00合计100 1.00(2)频率分布直方图如下图.(3)小于30.5的数据约占92%.1.绘制频率分布直方图应注意的四个问题(1)计算全距,需要找出这组数的最大值和最小值.当数据很多时,可选一个数当参照.(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目.一般来说,数据越多,分组越多.(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且使第一组的起点比最小值稍微小一点.(4)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率.2.频率分布直方图中,纵坐标的含义是频率比组距.2.有一容量为200的样本,数据的分组以及各组的频数如下:[-20,-15),7;[-15,-10),11;[-10,-5),15;[-5,0),40;[0,5),49;[5,10),41;[10,15),20;[15,20],17.(1)列出样本的频率分布表;(2)画出频率分布直方图和频率分布折线图;(3)求样本数据不足0的频率.[解] (1)频率分布表如下:分组频数频率[-20,-15)70.035[-15,-10)110.055[-10,-5)150.075[-5,0)400.2[0,5)490.245[5,10)410.205[10,15)200.1[15,20]170.085合计200 1.00(2)如图是频率分布直方图和频率分布折线图:(3)样本数据不足0的频率为:0.035+0.055+0.075+0.2=0.365.用样本的数字特征估计总体的数字特征【例3】 某工厂甲、乙两个车间包装同一种产品,在自动包装传送带上每隔一小时抽一包产品,称其重量(单位:克)是否合格,分别记录抽查数据,获得重量数据茎叶图如图.(1)写出甲的众数和乙的中位数;(2)根据样本数据,计算甲、乙两个车间产品重量的均值与方差,并说明哪个车间的产品的重量相对稳定.[解] (1)甲的众数是111,乙的中位数是111.(2)设甲、乙两个车间产品重量的均值分别为x 甲、x 乙,方差分别为s 2甲、s 2乙, 则x 甲=122+114+113+111+111+1076=113,x 乙=124+110+112+115+108+1096=113,s 2甲=16[(122-113)2+(114-113)2+(113-113)2+(111-113)2+(111-113)2+(107-113)2]=21,s 2乙=16[(124-113)2+(110-113)2+(112-113)2+(115-113)2+(108-113)2+(109-113)2]≈29.33,由于s 2甲<s 2乙,所以甲车间的产品的重量相对稳定.在实际问题中,仅靠平均数不能完全反映问题,还要研究数据偏离平均数的离散程度(即方差或标准差).标准差越大,说明数据的离散性越大;标准差越小,说明数据的离散性越小或数据越集中、稳定.3.要从甲、乙两名工人中选出一名参加机床技术表演,先对甲、乙两名工人进行测试,使用同一台机床,甲、乙两人各在10天内每天出的次品数如下:甲:2,1,0,2,3,1,0,4,2,0; 乙:1,2,0,3,1,1,2,1,0,1.分别计算这两个样本的平均数与方差,从计算结果看,应选哪一名工人参加技术表演? [解] x 甲=2+1+0+2+3+1+0+4+2+010=1.5;x 乙=110(1+2+0+3+1+1+2+1+0+1)=1.2;s2甲=110[(2-1.5)2+(1-1.5)2+(0-1.5)2+(2-1.5)2+(3-1.5)2+(1-1.5)2+(0-1.5)2+(4-1.5)2+(2-1.5)2+(0-1.5)2]=110(0.52×5+1.52×4+2.52)=1.65;s2乙=110[(1-1.2)2+(2-1.2)2+(0-1.2)2+(3-1.2)2+(1-1.2)2+(1-1.2)2+(2-1.2)2+(1-1.2)2+(0-1.2)2+(1-1.2)2]=0.76,∵x甲>x乙,s2甲>s2乙,∴应选乙工人参加比赛.线性回归分析【例4】已知10只狗的血细胞体积及红细胞数的测量值如下表:血细胞体积x(mm3)45424648423558403950 红细胞数y(百万)6.53 6.309.527.50 6.99 5.909.49 6.20 6.558.72(1)根据上表画出散点图;(2)根据散点图,判断血细胞体积x与红细胞数y之间是否具有相关关系;(3)求回归方程.[解] (1)散点图如下图所示.(2)从散点图可以看出,两个变量的对应点都集中在一条直线的附近,且y随x的增大而增大,因此血细胞体积x与红细胞数y之间具有相关关系.(3)x=110×(45+42+46+48+42+35+58+40+39+50)=44.50,y=110×(6.53+6.30+9.52+7.50+6.99+5.90+9.49+6.20+6.55+8.72)=7.37,∑10i =1x i y i =3 346.32,∑10i =1x 2i =20 183,设回归方程为y =a +bx , 则b ≈0.175,a =y -b x ≈-0.418.∴回归方程为y =0.175x -0.418.解答回归分析问题的五个注意点 1.先用散点图确定是否线性相关; 2.准确计算回归方程中的各个系数; 3.回归直线必过样本中心点;4.利用线性回归方程求出的值只是估计值,会与实际值有一定的误差; 5.回归直线必定经过样本的中心点,样本的数据点不一定在回归直线上.4.某个体服装店经营某种服装在某周内获纯利y (元)与该周每天销售这种服装件数x 之间有如下一组数据:x 3 4 5 6 7 8 9 y66697381899091已知:∑i =1x 2i =280,∑i =1x i y i =3 487.(1)求x ,y ;(2)求纯利y 与每天销售件数x 之间的线性回归方程; (3)估计每天销售10件这种服装时纯利润为多少元? [解] (1)由已知得x =17(3+4+5+6+7+8+9)=6,y =17(66+69+73+81+89+90+91)≈79.86.(2)设线性回归方程为y =bx +a ,则b =∑7i =1x i y i -7x y∑7i =1x 2i -7x2=3 487-7×6×79.86280-7×62≈4.75, a =y -b x =79.86-4.75×6=51.36.∴所求线性回归方程为y =4.75x +51.36.(3)当x =10时,y =98.86,估计每天销售这种服装10件可获纯利98.86元.。
2017_2018版高中数学第一章统计疑难规律方式学案北师大版必修3

40岁以下年龄段的职工数为200×0.5=100,那么应抽取的人数为 ×100=20.
答案 37 20
点评 简单随机抽样是基础,系统抽样与分层抽样是补充和进展,三者相辅相成,对立统一.保证每一个个体等可能入样是简单随机抽样、系统抽样、分层抽样一起的特点,为了保证这一点,分层时用同一抽样比是必不可少的.
4 浅析3种抽样方式的合理选取
一、简单随机宜少量
例1 据报导,2020年7月22日的“日全食”较为理想的观测地址有上海、重庆、苏州、杭州、合肥、武汉、宜昌、成都、乐山、嘉兴这10个城市.某天文小组从这10个城市中随机抽取4个城市进行观测,宜采纳的抽样方式是______________,每一个城市被选中的可能性是______________.
综上:x∈{21,22,23,54,55,56,87,88,89,90}.
点评 此题是系统抽样法的逆向综合问题,表现了知识间的联系和数学思想的运用.
3 辨析分层抽样的解题方式
假设整体由不同明显的几部份组成,抽样时,先将整体分成互不交叉的层,然后依照必然的比例,从各层独立地抽取必然数量的个体,再将各层掏出的个体合在一路作为样本.这种抽样方式确实是分层抽样.分层抽样尽可能利用事前把握的信息,并充分考虑了维持样本结构和整体结构的一致性,这对提高样本的代表性是很重要的.
解析 依照样本容量为30,将1 200名学生分为30段,每段人数即距离k= =40.
答案 40
点评 将整体号码平均分组时,应先考虑整体容量N是不是能被样本容量n整除.
三、抽取的个数问题
例3 为了了解参加一次知识竞赛的1 252名学生的成绩,决定采纳系统抽样的方式抽取一个容量为50的样本,那么整体中应随机剔除的个体数量是( )
2017_2018学年高中数学第1章统计3统计图表教学案北师大版必修3

企业管理
164 200
法律硕士
95 500
MBA
139 200
英语语言文学
126 600
金融
128 000
计算机应用技术
81 400
会计学
76 300
管理科学与工程
72 300
设计艺术
72 100
2020年全国硕士研究生招生报考人数为127.5万,你能用不同的方式别离表示2020年各热点专业的报考情形吗?
你能用哪些方式表示上面的数据?你以为甲、乙两个商店哪个更受顾客欢迎?
[解] 法一:列频数统计表如下:
法二:画出茎叶图如下图.
由以上方式,比较各自的好坏可见,甲商店的中位数是56.5,且在此处波动,乙商店的中位数是28.5,波动较大,因此甲商店更受顾客欢迎.
1.如下图是某校高一年级学生到校方式的条形统计图,依照图形可得出骑自行车人数占高一年级学生总人数的( )
品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454;
品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430.
(2)本次调查中,最喜爱篮球活动的有18人, ×100%=36%.
即最喜爱篮球活动的人数占被调查人数的36%.
(3)1-(30%+26%+24%)=20%,
200÷20%=1 000(人),
×1 000=160(人).
高中数学第一章统计1从普查到抽样学案北师大版必修3(1)(2021学年)

2017-2018版高中数学第一章统计 1 从普查到抽样学案北师大版必修3(1)编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2017-2018版高中数学第一章统计 1 从普查到抽样学案北师大版必修3(1))的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2017-2018版高中数学第一章统计 1 从普查到抽样学案北师大版必修3(1)的全部内容。
1 从普查到抽样[学习目标]1。
了解普查与抽样调查的概念。
2。
明确两种调查的优缺点.知识点一普查的概念1.普查的定义普查是指一个国家或一个地区专门组织的一次性大规模的全面调查,目的是为了详细地了解某项重要的国情、国力.2.普查的主要特点(1)所取得的资料更加全面、系统;(2)主要调查在特定时段的社会经济现象总体的数量;(3)当普查的对象很少时,普查无疑是一项非常好的调查方式.思考我国常进行的普查有哪些?(举例)答人口普查、工业普查、农业普查等.知识点二抽样调查1.抽样调查的定义:通常情况下,从调查对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此对调查对象的某项指标作出推断,这就是抽样调查,其中,调查对象的全体称为总体,被抽取的一部分称为样本.2.抽样调查最突出的优点(1)迅速、及时;(2)节约人力、物力和财力.知识点三统计的相关概念名称定义总体调查对象的全体称为总体样本被抽取的一部分称为样本个体构成总体的每一个对象称为个体样本容量样本中个体的数目叫作样本容量思考答样本与样本容量是两个不同的概念.样本是从总体中抽取的个体组成的集合,是对象;样本容量是样本中个体的数目,是一个数.题型一抽样调查与普查辨析例1下列调查中哪些是用普查方式,哪些是用抽样方法收集数据的?(1)为了了解我们班级的每个学生穿几号鞋,向全班同学做调查;(2)为了了解我们学校高一年级学生穿几号鞋,向我们所在班的全体同学做调查;(3)为了了解我们班的同学们每天睡眠时间,在每个小组中各选取2名学生做调查;(4)为了了解我们班的同学们每天的睡眠时间,选取班级中学号为双数的所有学生做调查.解 (1)因为调查的是班级的每个学生,所以用的是普查.(2)通过我们班的全体同学穿几号鞋来了解学校高一年级学生穿几号鞋,这是抽样调查,样本是我们班的全体同学所穿的鞋号,总体是学校高一年级学生所穿的鞋号.(3)、(4)也都是抽样调查,样本分别是每小组中选取的2名学生的睡眠时间,学号为双数的所有学生的睡眠时间;总体都是我们班的同学每天的睡眠时间.反思与感悟 1.在抽样调查中要注意以下事项:(1)样本抽取具有随机性:即在抽取样本时总体的每个个体被抽到的可能性相等.(2)样本抽取具有代表性:当总体数目较大且个体有明显差异时,要特别注意样本的代表性. 2.普查与抽样调查的特点:方式抽样调查普查特点节省人力、物力和财力需要大量的人力、物力和财力可以用于带有破坏性的检查不能用于带有破坏性的检查结果与实际情况之间有误差在操作正确的情况下,能得到准确结果A.检验10件产品的质量B.银行对公司10万元存款的现钞的真假检验C.跳伞运动员检查20个伞包及伞的质量D.检验一批汽车的防碰撞性能答案D解析根据抽样调查与普查的概念可知A,B,C一般采用普查的方法,只有D是采用抽样调查的方法.题型二普查与抽样调查的选用例2一些期刊杂志社经常会请一些曾经高考落榜而在某方面的事业上取得成就的著名专家、学者,谈他们对高考落榜的看法,这些名人所讲的都是大同小异,不外乎“我也有过落榜的沮丧,但从长远看,它有益于我的人生",“我是因祸得福,落榜使我走了另一条成功之路"等等.小明据此得出一条结论,上大学不如高考落榜,他的结论正确吗?解小明的结论是错误的,在众多的高考落榜生中,走出另外一条成功之路的是少数,小明通过研究一些期刊杂志社报道过的一些成功人士就得出结论是片面的,因为他的抽样不具有代表性.反思与感悟普查是专门组织的一次性的全面调查,用来调查属于一定时间上或一定时期内的社会现象总量.普查具有资料包括的范围全面、详尽、系统的优点,但是普查的工作量大,耗资也多,一般不宜经常举行.抽样调查是一种非全面调查,它是按照随机原则从总体中抽取一部分单位作为样本进行观察研究,以抽样样本的指标去推算总体指标.抽查既能节省人力物力财力,而且取得比较正确的资料,具有很多优点.跟踪训练2为了创建“和谐平安”校园,某校决定在开学前将学校的电灯电路使用情况进行检查,以便排除安全隐患,此检查能否进行普查,为什么?解由于一个学校的电灯电路数目不算大,且对创建“和谐平安"校园来说,必须排除任一潜在或已存在的安全隐患,故必须用普查的方式.题型三总体与样本例3 为了了解全校240名高一学生的身高情况,从中抽取40名学生进行测量.下列说法正确的是()A.总体是240名B.个体是每一个学生C.样本是40名学生D.样本容量是40答案 D解析在这个问题中,总体是240名学生的身高,个体是每个学生的身高,样本是40名学生的身高,样本容量是40.因此选D。
高中数学第一章统计2.1简单随机抽样学案北师大版必修3(1)(2021学年)

2017-2018版高中数学第一章统计2.1 简单随机抽样学案北师大版必修3(1)编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2017-2018版高中数学第一章统计 2.1 简单随机抽样学案北师大版必修3(1))的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2017-2018版高中数学第一章统计 2.1简单随机抽样学案北师大版必修3(1)的全部内容。
2.1简单随机抽样[学习目标] 1。
理解并掌握简单随机抽样的概念、特点和步骤。
2。
掌握简单随机抽样的两种方法.知识点一简单随机抽样1.简单随机抽样的定义在抽取的过程中,要保证每个对象被抽到的概率相同,这样的抽样方法叫作简单随机抽样. 2.简单随机抽样的特点特点说明个体数有限要求总体的个体数有限,这样便于通过随机抽取的样本对总体进行分析逐个抽取从总体中逐个进行抽取,这样便于在抽取过程中进行操作等可能抽样在整个抽样过程中,各个个体被抽取的机会都相等,从而保证了这种抽样方法的公平性1.抽签法(1)先把总体中的N个个体编号,并把编号写在形状、大小相同的签上(签可以是纸条、卡片或小球等),然后将这些号签放在同一个箱子里均匀搅拌.每次随机地从中抽取一个,然后将号签均匀搅拌,再进行下一次抽取.如些下去,直到抽到预先设定的样本数.(2)抽签法的实施步骤:①给调查对象群体中的每个对象编号;②准备“抽签”的工具,实施“抽签”;③对样本中每一个个体进行测量或调查.2.随机数法(1)随机数法:把总体中的N个个体依次编制上0,1…,N-1的号码,然后利用工具(转盘或摸球、随机数表、科学计算器或计算机)产生0,1…,N-1中的随机数,产生的随机数是几,就选几号个体,直至抽到预先规定的样本数.(2)随机数表法的一般步骤:①编号:将总体中的每个个体进行编号;②选定初始值(数);为保证所选数字的随机性,在面对随机数表之前就指出开始数字的位置;③选号:从选定的数字开始按照一定的方向读下去,若得到的号码不在编号中或已被选用,则跳过,直到选满所需号码为止;④确定样本:从总体中找出按步骤③选出的号码所对应的个体,组成样本.3.抽签法与随机数法的异同点抽签法随机数表法不同点①抽签法比随机数法简单;②抽签法适用于总体中的个体数相对较少的情况①随机数法要求编号的位数相同;②随机数法适用于总体中的个体数相对较多的情况相同点都是简单随机抽样,并且要求被抽取样本的总体的个数有限题型一简单随机抽样的判断例1下列5个抽样中,简单随机抽样的个数是( )①从无数个个体中抽取50个个体作为样本;②仓库中有1万支奥运火炬,从中一次性抽取100支火炬进行质量检查;③某连队从200名党员官兵中,挑选出50名最优秀的官兵赶赴青海参加抗震救灾工作;④一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地抽出6个号签.A.0 B.1C.2 ﻩD.3答案 B解析根据简单随机抽样的特点逐个判断.①不是简单随机抽样.因为简单随机抽样要求被抽取的样本总体的个数是有限的.②不是简单随机抽样.虽然“一次性抽取”和“逐个抽取"不影响个体被抽到的可能性,但简单随机抽样要求的是“逐个抽取".③不是简单随机抽样.因为50名官兵是从中挑出来的,是最优秀的,每个个体被抽到的可能性不同,不符合简单随机抽样中“等可能抽样"的要求.④是简单随机抽样.因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,等可能的抽样.综上,只有④是简单随机抽样.反思与感悟简单随机抽样必须具备下列特点:(1)被抽取样本的总体中的个体数N是有限的;(2)抽取的样本是从总体中逐个抽取的;(3)简单随机抽样是一种等可能的抽样.如果3个特征有一个不满足,就不是简单随机抽样.跟踪训练1 在简单随机抽样中,某一个体被抽到的可能性( )A.与第几次抽样有关,第一次抽到的可能性大一些B.与第几次抽样无关,每次抽到的可能性都相等C.与第几次抽样有关,最后一次抽到的可能性要大些D.与第几次抽样无关,每次都是等可能的抽取,但各次抽取的可能性不一定答案B解析在简单随机抽样中,每一个个体被抽到的可能性都相等,与第几次抽样无关,故A,C,D不正确,B正确.题型二抽签法的应用例2 为迎接2016年里约热内卢奥运会,奥委会现从报名的某高校20名志愿者中选取5人组成奥运志愿小组,请用抽签法设计抽样方案.解 (1)将20名志愿者编号,号码分别是01,02,…,20;(2)将号码分别写在20张大小、形状都相同的纸条上,揉成团儿,制成号签;(3)将所得号签放在一个不透明的袋子中,并搅拌均匀;(4)从袋子中依次不放回地抽取5个号签,并记录下上面的编号;(5)所得号码对应的志愿者就是志愿小组的成员.反思与感悟 1.一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是个体之间差异不明显.2.应用抽签法时应注意以下几点:(1)编号时,如果已有编号可不必重新编号;(2)号签要求大小、形状完全相同;(3)号签要均匀搅拌;(4)根据实际需要采用有放回或无放回抽取.跟踪训练2 从20架钢琴中抽取5架进行质量检查,请用抽签法确定这5架钢琴.解第一步,将20架钢琴编号,号码是01,02, (20)第二步,将号码分别写在一张纸条上,揉成团,制成号签.第三步,将得到的号签放入一个不透明的袋子中,并充分搅匀.第四步,从袋子中逐个不放回地抽取5个号签,并记录上面的编号.第五步,所得号码对应的5架钢琴就是要抽取的对象.题型三随机数法例3 为了检验某种药品的副作用,从编号为1,2,3,…,120的服药者中用随机数法抽取10人作为样本,写出抽样过程.解第一步,将120名服药者重新进行编号,分别为001,002,003,…,120;第二步,在随机数表中任选一数作为初始数,如选第9行第7列的数2;第三步,从选定的数2开始向右读,每次读取三位,凡不在001~120中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到055,035,093,177,094,034,050,073,139,072;第四步,以上这10个号码所对应的服药者即是要抽取的对象.反思与感悟 1.当总体容量较大,样本容量不大时,可用随机数法抽取样本.2.用随机数法抽取样本,为了方便,在编号时需统一编号的位数.3.将总体中的个体进行编号时,可以从0开始,也可以从1开始.跟踪训练3总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法:从随机数表第1行的第5列和第6列数字开始由左到右一次选取两个数字,则选出来的第5个个体的编号为( )7816657208026314070243699728019832049234493582003623486969387481A.08C.02 D.01答案D解析从随机数表第1行的第5列和第6列数字开始由左到右一次选取两个数字开始向右读,第一个数为65,不符合条件;第二个数为72,不符合条件;第三个数为08,符合条件,以下符合条件的数字依次为02,14,07,01,故第5个数为01.故选D.编号不一致致错例4 某工厂的质检人员对生产的100件产品,采用随机数法抽取10件进行检查,对100件产品采用下面的编号方法:①1,2,3,…,100;②001,002,003,…,100;③00,01,02,03,…,99.其中最恰当的序号是________.错解因为是对100件产品进行编号,则编号为1,2,3,…,100,所以①最恰当.错解分析用随机数法抽样时,如果所编号码的位数不相同,那么无法在随机数表中读数,因此,所编号码的位数要相同.自我矫正只有编号时数字位数相同,才能达到随机等可能抽样,所以①不恰当.②③的编号位数相同,都可以采用随机数法.但②中号码是三位数,读数费时,所以③最恰当.答案③1.某学校为了解高一800名新入学同学的数学学习水平,利用简单随机抽样随机抽取100名同学的中考数学成绩进行分析,在这个问题中,下列说法正确的是()A.800名同学是总体B.100名同学是样本C.每名同学是个体ﻩD.样本容量是100答案D解析据题意,总体是指800名新入学同学的中考数学成绩,样本是指抽取的100名同学的中考数学成绩,个体是指每名同学的中考数学成绩,样本容量是100,故只有D正确.2.抽签法确保样本代表性的关键是( )A.制签B.搅拌均匀C.逐一抽取 D.抽取不放回答案 B解析若样本具有很好的代表性,则每一个个体被抽取的机会相等,故需要对号签搅拌均匀.3.对于简单随机抽样,下列说法正确的是( )①它要求总体中的个体数有限,以便对其中各个个体被抽取的概率进行分析;②它是从总体中逐个地进行抽取,以便在抽取实践中进行操作;③它是一种等可能抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的机会相等,而且在整个抽样过程中,各个个体被抽取的机会也相等,从而保证了这种抽样方法的公平性.A.①②③ ﻩB.①②C.①③ ﻩD.②③答案A解析由简单随机抽样的概念,知①②③都正确.4.从某批零件中抽取50个,然后再从50个中抽出40个进行合格检查,发现合格品有36个,则该产品的合格率约为()A.36%ﻩB.72%C.90%D.25%答案 C解析错误!×100%=90%。
2017_2018版高中数学第一章统计1从普查到抽样学案北师大版必修3

试探 你对“武汉一人口普查员劳累过度以身殉职”的报导有何观点?
梳理 一样地,普查是指一个________或一个________专门组织的________大规模的全面调查,目的是为了详细地了解________重要的国情、国力.
普查的要紧特点:①所取得的资料加倍全面、________;②要紧调查在特按时段的社会经济现象整体的________.
反思与感悟 设计合理的调查方案是调查的基础,是统计活动中超级重要的环节.假设对大量量且有破坏性的查验问题,只能进行抽样调查,如此查验是科学、合理的.在抽样调查中应注意:抽取的样本要具有全面性、代表性、随机性.
跟踪训练1 以下调查中哪些是用普查方式,哪些是用抽样方式来搜集数据的?
(1)为了了解咱们班级的每一个学生穿几号鞋,向全班同窗做调查;
反思与感悟 在统计活动中,尤其是大型的统计活动,为幸免一些外界因素的干扰,通常需要确信调查的对象、调查的方式与策略,需要精心设计前期的预备工作和搜集数据的方式,然后对数据进行分析,得出统计推断.
跟踪训练2 中央电视台希望在春节联欢晚会播出后一周内获适昔时春节联欢晚会的收视率.下面是三名同窗为电视台设计的调查方案.
B.调查某电视持续剧在全国的收视率
C.调查某校七年级一班的男女同窗的比例
D.调查某型号炮弹的射程
2.以下说法不正确的选项是( )
A.普查是要对所有的对象进行调查
B.样本不必然是从整体中抽取的,没抽取的个体也是样本
C.当调查的对象很少时,普查是专门好的调查方式,但当调查的对象很多时,那么要花费大量的人力、物力和财力
A.②③B.①④
C.③④D.①②
5.“非典”期间,我国每日发布非典疫情,其中有关数据的搜集所采纳的调查方式是________.
2017-2018版高中数学 第一章 统计 5 用样本估计总体学案 北师大版必修3

5 用样本估计总体学习目标 1.学会列频率分布表,会画频率分布直方图.2.会用频率分布表或分布直方图估计总体分布,并作出合理解释.3.在解决问题过程中,进一步体会用样本估计总体的思想,认识统计的实际作用,初步经历收集数据到统计数据的全过程.知识点一总体的分布思考如果把我国初生婴儿的性别作为总体,那么它的分布是指什么?梳理一般地,总体分布是指总体中个体所占的比例.知识点二用频率分布表或频率分布直方图估计总体分布思考1 要做频率分布表,需要对原始数据做哪些工作?思考2 如何决定组数与组距?思考3 同样一组数据,如果组距不同,得到的频率分布直方图也会不同吗?梳理1.频率分布直方图在频率分布直方图中,纵轴表示f iΔx i,数据落在各小组内的频率用频率分布直方图的________来表示,各小长方形的面积的总和等于____.2.频率折线图在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的________开始,用线段依次连接各个矩形的____________,直至右边所加区间的________,就可以得到一条折线,我们称之为频率折线图.3.随着样本容量不断增大,样本中落在每个区间内的样本数的________会越来越稳定于总体在相应区间内取值的________.随着样本量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小.相应的频率折线图就会越来越接近于一条光滑曲线.知识点三总体的数字特征思考如果想知道某一历史时期黄河流域男性平均身高,有可能获得总体数据吗?怎么办?梳理一般地,1.现实中的总体所包含的个体数往往很难获得,总体的平均数与标准差是未知的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.2.在抽样过程中,抽取的样本是具有随机性的,因此样本的数字特征也有随机性.用样本的数字特征估计总体的数字特征,是一种统计思想,没有唯一答案.类型一用频率分布表及频率分布直方图估计总体分布例1 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位:cm).(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计身高小于134 cm的人数占总人数的百分比.反思与感悟频率分布表和频率分布直方图之间的密切关系是显然的,它们只不过是相同的数据的两种不同的表达方式,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚地看到整个样本数据的频率分布情况,并由此估计总体的分布情况.跟踪训练1 为了了解中学生身体发育情况,对某中学17岁的60名女生的身高(单位:cm)进行了测量,结果如下:154 159 166 169 159 156 166 162 158 159156 166 160 164 160 157 151 157 161 162158 153 158 164 158 163 158 153 157 168162 159 154 165 166 157 155 146 151 158160 165 158 163 163 162 161 154 165 161162 159 157 159 149 164 168 159 153 160列出样本的频率分布表;绘出频率分布直方图和频率折线图.类型二估计总体数字特征例2 为了解A,B两种轮胎的性能,某汽车制造厂分别从这两种轮胎中随机抽取了8个进行测试,下面列出了每种轮胎行驶的最远里程数(单位:1 000 km)轮胎A96,112,97,108,100,103,86,98轮胎B108,101,94,105,96,93,97,106(1)分别计算A,B两种轮胎行驶的最远里程的平均数、中位数;(2)分别计算A,B两种轮胎行驶的最远里程的极差、标准差;(3)根据以上数据你认为哪种型号的轮胎性能更加稳定?反思与感悟平均数、中位数、众数、极差、方差等统计量是将多个数据“加工”成一个数据,能更清楚地反映这组数据的某些重要特征,要理解这些统计量表达的信息.跟踪训练2 为迎接5月31日世界无烟日的到来,小华对10名戒烟成功者戒烟前和戒烟5个星期后的体重(单位:kg)作了认真统计,并记录如下表所示:(1)求这10人在戒烟前和戒烟后的体重的平均数;(2)求这10人在戒烟前和戒烟后的体重的方差;(3)通过上述数据,你能得到什么结论?1.用样本频率分布估计总体频率分布的过程中,下列说法正确的是( )A.总体容量越大,估计越精确B.总体容量越小,估计越精确C.样本容量越大,估计越精确D.样本容量越小,估计越精确2.下列说法不正确的是( )A.频率分布直方图中每个小矩形的高就是该组的频率B.频率分布直方图中各个小矩形的面积之和等于1C.频率分布直方图中各个小矩形的宽一样大D.频率分布折线图是从所加的左边区间的中点开始,用线段依次连接频率分布直方图的每个小矩形上端中点,直至右边所加区间的中点得到的3.某校为了了解高三学生的身体状况,抽取了100名女生的体重.将所得的数据整理后,画出了如图的频率分布直方图,则所抽取的女生中体重在40~45 kg的人数是( )A.10 B.2 C.5 D.154.一个容量为20的样本数据,分组后组距与频数如下表:则样本在[10,50)上的频率为( )A.0.5 B.0.24C.0.6 D.0.75.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(2)在这些用户中,用电量落在区间[100,250)内的户数为________.1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律,我们通常用样本的频率分布表或频率分布直方图去估计总体的分布.2.用同样的方法先后从总体中抽取两个大小相同的样本,但两次得到的样本频率分布表、样本频率分布直方图、样本的平均数和标准差仍然可能互不相同,是样本的随机性造成的,是不可避免的.只要抽样的方法比较合理,就能反映总体的信息,当样本量很大时,就比较接近总体的真实情况.答案精析问题导学 知识点一思考 是指男女性别的比例. 知识点二思考1 分组,频数累计,计算频数和频率. 思考2 若极差组距为整数,则极差组距=组数.若极差组距不为整数,则⎣⎢⎡⎦⎥⎤极差组距+1=组数.注意:[x ]表示不大于x 的最大整数.思考3 不同.对于同一组数据分析时,要选好组距和组数,不同的组距与组数对结果有一定的影响. 梳理1.面积 1 2.中点 顶端中点 中点 3.频率 概率 知识点三思考 时代变迁,已经不可能获得所有数据,但可以根据出土的同时期样本数据计算平均身高来估计. 题型探究例1 解 (1)样本频率分布表如下:(2)频率分布直方图如下:(3)由样本频率分布表可知身高小于134 cm 的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm 的人数占总人数的19%.跟踪训练1 解 第一步,求极差:上述60个数据中最大为169,最小为146.故极差为169-146=23(cm).第二步,确定组距和组数,可取组距为3 cm , 则组数为233=723,可将全部数据分为8组.第三步,确定区间界限:[145.5,148.5),[148.5,151.5),[151.5,154.5),[154.5,157.5),[157.5,160.5),[160.5,163.5),[163.5,166.5),[166.5,169.5). 第四步,列频率分布表:第五步,根据上述数据绘制频率分布直方图:第六步,在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线即为频率折线图.例2 解 (1)A 轮胎行驶的最远里程的平均数为 96+112+97+108+100+103+86+988=100,中位数为100+982=99;B 轮胎行驶的最远里程的平均数为108+101+94+105+96+93+97+1068=100,中位数为101+972=99.(2)A 轮胎行驶的最远里程的极差为112-86=26, 标准差为s = -2+122+-2+82+0+32+-2+-28=2212≈7.43;B 轮胎行驶的最远里程的极差为108-93=15,标准差为s = 82+12+-2+52+-2+-2+-2+628=1182≈5.43.(3)由于A 和B 的最远行驶里程的平均数相同,而B 轮胎行驶的最远里程的极差和标准差较小,所以B 轮胎性能更加稳定.跟踪训练2 解 (1)将数据按从小到大的顺序重新排列; 戒烟前:52,52,55,55,60,60,64,67,69,80; 戒烟后:52,54,55,57,58,62,67,68,70,81. 求得x戒烟前=61.4(kg),x戒烟后=62.4(kg).(2)s 2戒烟前=110[(67-61.4)2+(80-61.4)2+…+(60-61.4)2]=70.44,s2戒烟后=110[(70-62.4)2+(81-62.4)2+…+(58-62.4)2]=73.84.(3)从戒烟前后两组数据的统计量知:从平均数看,戒烟后这10人的平均体重增加了1 kg;从方差看,戒烟后数据的波动比戒烟前数据的波动大,说明戒烟对不同的人所发生的变化程度是不同的,通过对这两组数据的统计分析,得出结论:吸烟有害健康,戒烟对身体健康是有益的.当堂训练1.C 2.A 3.A 4.D5.(1)0.004 4 (2)70解析(1)(0.002 4+0.003 6+0.006 0+x+0.002 4+0.001 2)×50=1,∴x=0.004 4.(2)(0.003 6+0.004 4+0.006 0)×50×100=70.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章 统计1.关于抽样方法(1)用随机数法抽样时,对个体所编号码位数要相同,当问题所给位数不同时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数.(2)用系统抽样法时,如果总体容量N 能被样本容量n 整除,抽样间隔为k =N n;如果总体容量N 不能被样本容量n 整除,先用简单随机抽样剔除多余个体,抽样间隔为k =K n(其中K =N -多余个体数). (3)三种抽样方法的异同点类别 共同点各自特点 相互联系适用范围 简单随机抽样抽样过程中每个个体被抽到的可能性相同 从总体中逐个抽取总体中的个体数较少系统抽样将总体平均分成几部分,按事先确定的规则分别在各部在起始部分抽样时,采用简单随机抽样总体中的个体数较多分中抽取分层抽样将总体分成几层,按各层个体数之比抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成(1)用样本频率分布估计总体频率分布时,通常要对给定的一组数据进行列表、作图处理,作频率分布表与频率分布直方图时要注意其方法步骤.(2)茎叶图刻画数据有两个优点:一是所有信息都可以从图中得到;二是茎叶图中的数据可以随时记录,随时添加,便于记录和表示.(3)平均数反映了样本数据的平均水平,而标准差反映了样本数据的波动程度.3.变量间的相关关系(1)除了函数关系这种确定性的关系外,还大量存在因变量的取值带有一定随机性的两个变量之间的关系——相关关系,对于一元线性相关关系,通过建立回归方程就可以根据其部分观测值,获得对这两个变量之间的整体关系的了解,主要是作出散点图,写出回归方程.(2)求回归方程的步骤:①先把数据制成表,从表中计算出x,y,∑i=1nx2i,∑i=1nx i y i;②计算回归系数a^,b^.公式为⎩⎪⎨⎪⎧b^=∑i=1nx i y i-n x y∑i=1nx2i-n x2,a^=y-b^x;③写出回归方程y^=b^x+a^.题型一抽样方法的运用1.抽样方法有:简单随机抽样、系统抽样、分层抽样.2.三种抽样方法比较例1 (1)某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名,现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为( ) A .6 B .8 C .10D .12(2)问题:①某小区有800户家庭,其中高收入家庭200户,中等收入家庭480户,低收入家庭120户,为了了解有关家用轿车购买力的某个指标,要从中抽取一个容量为100的样本;②从10名学生中抽取3人参加座谈会.方法:(1)简单随机抽样;(2)系统抽样;(3)分层抽样.则问题与方法配对正确的是( ) A .①(1),②(2) B .①(3),②(2) C .①(2),②(3) D .①(3),②(1)答案 (1)B (2)D解析 (1)分层抽样的原理是按照各部分所占的比例抽取样本.设从高二年级抽取的学生数为n ,则3040=6n,得n =8. (2)问题①中的总体是由差异明显的几部分组成的,故可采用分层抽样方法;问题②中总体的个数较少,故可采用简单随机抽样.故匹配正确的是D.跟踪训练1 某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( ) A .11 B .12 C .13 D .14答案 B解析 抽样间隔为84042=20.设在1,2,…,20中抽取号码x 0(x 0∈[1,20]).在[481,720]之间抽取的号码记为20k +x 0,则481≤20k +x 0≤720,k ∈N +. 所以24120≤k +x 020≤36.因为x 020∈⎣⎢⎡⎦⎥⎤120,1,所以k =24,25,26,…,35, 所以k 的值共有35-24+1=12(个),即所求人数为12. 题型二 用样本的频率分布估计总体分布此类问题通常要对样本数据进行列表、作图处理.这类问题采取的图表主要有:条形图、直方图、茎叶图、频率折线图、扇形图等.它们的主要优点是直观,能够清楚表示总体的分布走势.除茎叶图外,其他几种图表法的缺点是原始数据信息有丢失.例2 如图所示的是某学校抽取的学生体重的频率分布直方图,已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为10,则抽取的学生人数为( )A .20B .30C .40D .50答案 C解析 前3组的频率之和等于1-(0.012 5+0.037 5)×5=0.75,第2小组的频率是0.75×21+2+3=0.25,设样本容量为n ,则10n =0.25,则n =40.故选C.跟踪训练2 有1个容量为100的样本,数据的分组及各组的频数如下: [12.5,15.5),6;[15.5,18.5),16;[18.5,21.5),18; [21.5,24.5),22;[24.5,27.5),20;[27.5,30.5),10; [30.5,33.5],8.(1)列出样本的频率分布表(含累积频率); (2)画出频率分布直方图;(3)估计小于30的数据约占多大百分比. 解 (1)样本的频率分布表如下:分组 频数 频率 累积频率 [12.5,15.5) 6 0.06 0.06 [15.5,18.5) 16 0.16 0.22 [18.5,21.5) 18 0.18 0.40 [21.5,24.5)220.220.62[24.5,27.5)200.200.82[27.5,30.5)100.100.92[30.5,33.5]80.08 1.00合计100 1.00(2)频率分布直方图如图.(3)小于30的数据约占90%.题型三用样本的数字特征估计总体的数字特征为了从整体上更好地把握总体的规律,我们还可以通过样本数据的众数、中位数、平均数和标准差等数字特征对总体相应的数字特征作出估计.众数就是样本数据中出现次数最多的那个值;中位数就是把样本数据按照由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,处于中间位置的数,如果数据的个数是偶数,中间两个的数据的平均数;平均数就是所有样本数据的平均值,用x表示;标准差是反映样本数据离散程度大小的最常用统计量,其计算公式是s=1n[x1-x2+x2-x2+…+x n-x2].有时也用标准差的平方(s2-方差)来代表标准差.例3 (1)若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是(单位:分)( )A.91.5和91.5 B.91.5和92C.91和91.5 D.92和92(2)从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为( )分数5432 1人数2010303010A.3B.210C .3D.85答案 (1)A (2)B解析 (1)将这组数据从小到大排列,得87,89,90,91,92,93,94,96(单位:分).故平均数x =18×(87+89+90+91+92+93+94+96)=91.5(分),中位数为91+922=91.5(分).故选A.(2)∵x =100+40+90+60+10100=3,∴s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]=1100(20×22+10×12+30×12+10×22) =160100=85⇒s =2105. 跟踪训练3 为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如图.(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为x 1,x 2,估计x 1-x 2的值. 解 (1)设甲校高三年级学生总人数为n . 由题意,知30n=0.05,解得n =600.样本中甲校高三年级学生数学成绩不及格的人数为5,据此估计甲校高三年级这次联考数学成绩的及格率为1-530=56.(2)设甲、乙两校样本平均数分别为x ′1,x ′2.根据样本茎叶图知,30(x ′1-x ′2)=30x ′1-30x ′2 =2+49-53-77+2+92=15.因此x ′1-x ′2=0.5,所以x 1-x 2的估计值为0.5分. 题型四 变量间的相关关系1.分析两个变量间的相关关系时,我们可根据样本数据散点图确定两个变量之间是否存在相关关系,还可利用最小二乘法求出回归方程.把样本数据表示的点在直角坐标系中作出,构成的图叫做散点图.从散点图上,我们可以分析出两个变量是否存在相关关系.如果这些点大致分布在通过散点图中心的一条直线附近,那么就说这两个变量之间具有线性相关关系,这条直线称为回归直线,直线方程称为回归方程. 2.回归方程的应用利用回归方程可以对总体进行预测,虽然得到的结果不是准确值,但我们是根据统计规律得到的,因而所得结果的正确率是最大的,所以可以大胆地利用回归方程进行预测. 例4 某地连续十年粮食需求量逐年上升,下表是部分统计数据:年份 2006 2008 2010 2012 2014 需求量(万吨)236246257276286(1)利用所给数据求年需求量与年份之间的回归方程y =b x +a ; (2)利用(1)中所求出的直线方程预测该地2016年的粮食需求量.解 (1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求回归方程.为此对数据预处理如下:年份-2010 -4 -2 0 2 4 需求量-257-21-111929对预处理后的数据,容易算得x =0,y =3.2,b ^=-4×-21+-2×-11+2×19+4×29-42+-22+22+42=26040=6.5,a ^=y -b ^x =3.2. 由上述计算结果,知所求回归方程为y ^-257=b ^(x -2 010)+a ^=6.5(x -2 010)+3.2.即y ^=6.5(x -2 010)+260.2.①(2)利用直线方程①,可预测2016年的粮食需求量为6.5×(2 016-2 010)+260.2=6.5×6+260.2=299.2(万吨)≈299(万吨). 跟踪训练4 理论预测某城市2020到2024年人口总数与年份的关系如下表所示:年份202x(年)0123 4人口数y(十万)5781119(1)(2)指出x与y是否线性相关;(3)若x与y线性相关,请根据上表提供的数据,用最小二乘法求出y关于x的回归方程y^=bx^+a^;(4)据此估计2025年该城市人口总数.(参数数据:0×5+1×7+2×8+3×11+4×19=132,02+12+22+32+42=30)解(1)数据的散点图如图:(2)由散点图可知,样本点基本上分布在一条直线附近,故x与y呈线性相关.(3)由表知x=15×(0+1+2+3+4)=2,y=15×(5+7+8+11+19)=10.∴b^=∑i=15x i y i-5x y∑i=15x2i-5x2=3.2,a^=y-b^x=3.6,∴回归方程为y^=3.2x+3.6.(4)当x=5时,y^=19.6(十万)=196万.故2025年该城市人口总数约为196万.题型五数形结合思想名称数形结合频率分布直方图数据分组及频数:[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8①可求众数:最高小长方形的中点所对应的数据;②可求中位数:中位数左边和右边的直方图面积相等;③可求平均数:每个小长方形的面积乘以小长方形底边中点的横坐标之和;④可求落在各个区域内的频率茎叶图甲的数据:95,81,75,89,71,65,76,88,94;乙的数据:83,86,93,99,88,103,98,114,98①茎是十位和百位数字,叶是个位数字;②可以帮助分析样本数据的大致频率分布;③可用来求数据的一些数字特征,如中位数、众数等散点图n个数据点(x i,y i)可以判断两个变量之间有无相关关系例5 甲、乙两人在相同的条件下各射靶10次,每次射靶成绩(单位:环)如下图所示.(1)填写下表:平均数方差中位数命中9环及以上甲7 1.2 1乙 5.4 3(2)请从四个不同的角度对这次测试进行分析: ①从平均数和方差结合分析偏离程度; ②从平均数和中位数结合分析谁的成绩好些;③从平均数和命中9环以上的次数相结合看谁的成绩好些; ④从折线图上两人射击命中环数及走势分析谁更有潜力. 解 (1)乙的射靶环数依次为2,4,6,8,7,7,8,9,9,10. 所以x乙=110(2+4+6+8+7+7+8+9+9+10)=7;乙的射靶环数从小到大排列为2,4,6,7,7,8,8,9,9,10,所以中位数是7+82=7.5;甲的射靶环数从小到大排列为5,6,6,7,7,7,7,8,8,9,所以中位数为7. 于是填充后的表格如下表所示:平均数 方差 中位数 命中9环及以上甲 7 1.2 7 1 乙75.47.53(22甲2乙数的程度大.②甲、乙的平均水平相同,而乙的中位数比甲大,说明乙射靶环数的优秀次数比甲多. ③甲、乙的平均水平相同,而乙命中9环以上(包含9环)的次数比甲多2次,可知乙的射靶成绩比甲好.④从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,更有潜力.跟踪训练5 甲、乙两名同学在五次数学测试中的成绩统计用茎叶图表示如下,若甲、乙两人的平均成绩分别用X 甲,X 乙表示,则下列结论正确的是( )A .X 甲>X 乙,甲比乙成绩稳定B .X 甲>X 乙,乙比甲成绩稳定C .X 甲<X 乙,甲比乙成绩稳定D .X 甲<X 乙,乙比甲成绩稳定 答案 A解析 由茎叶图知,X 甲=15×(68+69+70+71+72)=70,X 乙=15×(63+68+69+69+71)=68,∴X 甲>X 乙,且甲比乙成绩稳定.1.对于频率分布直方图,要记住以下几点:(1)每个小矩形面积=这组的频率;(2)所有小矩形面积的和为1;(3)纵轴表示的数为频率组距. 2.在研究两个变量是否存在某种关系时,必须从散点图入手,通过散点图,可以做出判断.。