高中数学 第二章《统计》复习教学设计 新人教A版必修3
高中数学第二章统计23变量间的相关关系课件新人教A版必修3(2)
总费用y/万元 2.2 3.8 5.5 6.5 7.0
(1)根据表格数据,画出散点图;
(2)求线性回归方程y^=b^x+a^的系数a^,b^; (3)估计使用年限为 10 年时,车的使用总费用是多少?
【解题探究】(1)利用描点法作出散点图; (2)把数据代入公式,可得回归方程的系数; (3)把x=10代入回归方程得y值,即为总费用的估计 值.
【答案】A 【解析】在A中,若b确定,则a,b,c都是常数,Δ= b2-4ac也就唯一确定了,因此,这两者之间是确定性的函数 关系;一般来说,光照时间越长,果树亩产量越高;降雪量越 大,交通事故发生率越高;施肥量越多,粮食亩产量越高,所 以B,C,D是相关关系.故选A.
两个变量x与y相关关系的判断方法 1.散点图法:通过散点图,观察它们的分布是否存在 一定规律,直观地判断.如果发现点的分布从整体上看大致在 一条直线附近,那么这两个变量就是线性相关的,注意不要受 个别点的位置的影响. 2.表格、关系式法:结合表格或关系式进行判断. 3.经验法:借助积累的经验进行分析判断.
变量之间的相关关系的判断
【 例 1】 下 列 变 量 之 间 的 关 系 不 是 相 关 关 系 的 是 ()
A.二次函数y=ax2+bx+c中,a,c是已知常数,取b 为自变量,因变量是判别式Δ=b2-4ac
B.光照时间和果树亩产量 C.降雪量和交通事故发生率 D.每亩田施肥量和粮食亩产量
【解题探究】判断两个变量之间具有相关关系的关键是 什么?
①反映^y与 x 之间的函数关系;
②反映 y 与 x 之间的函数关系;
③表示^y与 x 之间的不确定关系;
④表示最接近 y 与 x 之间真实关系的一条直线.
A.①②
人教a版必修3第二章统计教案资料
第二章统计初步授课课题:2.1.1简单随机抽样一、教学目标:1、知识与技能:正确理解随机抽样的概念,掌握抽签法、随机数表法的一般步骤;2、过程与方法:(1)能够从现实生活或其他学科中提出具有一定价值的统计问题;(2)在解决统计问题的过程中,学会用简单随机抽样的方法从总体中抽取样本。
3、情感态度与价值观:通过对现实生活和其他学科中统计问题的提出,体会数学知识与现实世界及各学科知识之间的联系,认识数学的重要性。
二、重点与难点:重点:正确理解简单随机抽样的概念,掌握抽签法及随机数法的步骤,难点:能灵活应用相关知识从总体中抽取样本。
三、教学用具:电脑,计算器,图形计算器四、教学方法:尝试,探究五、教学手段(教学用具):课件六、课时安排:一课时七、学情分析:一、授课课题:2.1.2 系统抽样一、教学目标:1、知识与技能:(1)正确理解系统抽样的概念;(2)掌握系统抽样的一般步骤;(3)正确理解系统抽样与简单随机抽样的关系;2、过程与方法:通过对实际问题的探究,归纳应用数学知识解决实际问题的方法,理解分类讨论的数学方法,3、情感态度与价值观:通过数学活动,感受数学对实际生活的需要,体会现实世界和数学知识的联系。
二、重点与难点:重点是正确理解系统抽样的概念难点是能够灵活应用系统抽样的方法解决统计问题。
三、教学用具:电脑,计算器,图形计算器四、教学方法:尝试,探究五、教学手段(教学用具):课件六、课时安排:两课时七、学情分析:一、授课课题:2.1.3 分层抽样二、教学目标(三维目标):1、知识与技能(1)正确理解分层抽样的概念;(2)掌握分层抽样的一般步骤;(3)区分简单随机抽样、系统抽样和分层抽样,并选择适当正确的方法进行抽样。
2、过程与方法:通过对现实生活中实际问题进行分层抽样,感知应用数学知识解决实际问题的方法。
3、情感、态度与价值观:通过对统计学知识的研究,感知数学知识中“估计与“精确”性的矛盾统一,培养学生的辩证唯物主义的世界观与价值观。
必修三第二章统计复习教案
必修三第二章统计复习教学设计必修三第二章《统计》复习专题一、基础知识回首1:简单随机抽样( 1)整体和样本①在统计学中,把研究对象的全体叫做整体.②把每个研究对象叫做个体.③把整体中个体的总数叫做整体容量.④为了研究整体的有关性质,一般从整体中随机抽取一部分:,,,研究,我们称它为样本.此中个体的个数称为样本容量.(2)简单随机抽样:就是从整体中不加任何分组、划类、排队等,完整随机地抽取检查单位。
特色是:每个样本个体被抽中的可能性同样(概率相等),样本的每个个体完整独立,相互间无必定的关系性和排挤性且为逐一不放回抽取,简单随机抽样是其余各样抽样形式的基础。
往常不过在整体个体之间差别程度较小和数量较少时,才采纳这类方法。
(3)简单随机抽样常用的方法:①抽签法②随机数表法③计算机模拟法(4)抽签法 :①给检核对象集体中的每一个对象编号;②准备抽签的工具,实行抽签;③对样本中的每一个个体进行丈量或检查(5)随机数表法:①给检核对象集体中的每一个对象编号(编号位数同样);②获得样本编号2:系统抽样(1)系统抽样(等距抽样或机械抽样):把整体的单位进行排序,再计算出抽样距离,而后依照这一固定的抽样距离抽取样本。
第一个样本采纳简单随机抽样的方法抽取。
K (抽样距离)=N/n(若 N/n 不是整数,则需先用简单随机抽样剔除数量最少的个体后再进行)2(2)系统抽样,即等距抽样是实质中最为常用的抽样方法之一。
由于它对抽样框的要求较低,实行也比较简单。
更为重要的是,假如有某种与检查指标有关的协助变量可供使用,整体单元按协助变量的大小次序排队的话,使用系统抽样能够大大提升预计精度。
3:分层抽样(1)分层抽样(种类抽样):先将整体中的全部单位依照某种特色或标记(性别、年纪等)区分红若干种类或层次,而后再在各个种类或层次中采纳简单随机抽样或系用抽样的方法抽取一个子样本,最后,将这些子样本合起来组成整体的样本。
两种方法:①先以分层变量将整体区分为若干层,再依照各层在整体中的比率从各层中抽取。
高中数学 第二章 统计教案 新人教A版必修3
第二章统计本章教材分析现代社会是信息化的社会,数字信息随处可见,因此专门研究如何收集、整理、分析数据的科学——统计学就备受重视.统计学是研究如何收集、整理、分析数据的科学,它可以为人们制定决策提供依据.在客观世界中,需要认识的现象无穷无尽.要认识某现象的第一步就是通过观察或试验取得观测资料,然后通过分析这些资料来认识此现象.如何取得有代表性的观测资料并能够正确地加以分析,是正确地认识未知现象的基础,也是统计所研究的基本问题.本章主要介绍最基本的获取样本数据的方法,以及几种从样本数据中提取信息的统计方法,其中包括用样本估计总体分布、数字特征和线性回归等内容.从义务教育阶段来看,统计知识的教学从小学到初中分为三个阶段,在每个阶段都要学习收集、整理、描述和分析数据等处理数据的基本方法,教学目标随着学段的升高逐渐提高.在义务教育阶段的统计与概率知识的基础上,《课程标准》要求通过实际问题及情境,进一步介绍随机抽样、样本估计总体、线性回归的基本方法,了解用样本估计总体及其特征的思想,体会统计思维与确定性思维的差异;通过实习作业,较为系统地经历数据收集与处理的全过程,进一步体会统计思维与确定性思维的差异.本章教学时间约需7课时,具体分配如下(仅供参考):2.1.1 简单随机抽样约1课时2.1.2 系统抽样约1课时2.1.3 分层抽样约1课时2.2.1 用样本的频率分布估计总体分布约1课时2.2.2 用样本的数字特征估计总体的数字特征约1课时2.3 变量间的相关关系约1课时本章复习约1课时2.1 随机抽样2.1.1 简单随机抽样整体设计教学分析教材是以探究一批小包装饼干的卫生是否达标为问题导向,逐步引入简单随机抽样概念.并通过实例介绍了两种简单随机抽样方法:抽签法和随机数法.值得注意的是为了使学生获得简单随机抽样的经验,教学中要注意增加学生实践的机会.例如,用抽签法决定班里参加某项活动的代表人选,用随机数法从全年级同学中抽取样本计算平均身高等等.三维目标1.能从现实生活或其他学科中推出具有一定价值的统计问题,提高学生分析问题的能力. 2.理解随机抽样的必要性和重要性,提高学生学习数学的兴趣.3.学会用抽签法和随机数法抽取样本,培养学生的应用能力.重点难点教学重点:理解随机抽样的必要性和重要性,用抽签法和随机数法抽取样本.教学难点:抽签法和随机数法的实施步骤.课时安排1课时教学过程导入新课抽样的方法很多,某个抽样方法都有各自的优越性与局限性,针对不同的问题应当选择适当的抽样方法.教师点出课题:简单随机抽样.推进新课新知探究提出问题(1)在1936年美国总统选举前,一份颇有名气的杂志(Literary Digest)的工作人员做了一次民意测验.调查兰顿(ndon)(当时任堪萨斯州州长)和罗斯福(F.D.Roosevelt)(当时的总统)中谁将当选下一届总统.为了了解公众意向,调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查表(注意在1936年电话和汽车只有少数富人拥有).通过分析收回的调查表,显示兰顿非常受欢迎,于是此杂志预测兰顿将在选举中获胜.实际选举结果正好相反,最后罗斯福在选举中获胜,其数据如下:候选人预测结果% 选举结果%Roosevelt 43 62Landon 57 38 你认为预测结果出错的原因是什么?由此可以总结出什么教训?(2)假设你作为一名食品卫生工作人员,要对某食品店内的一批小包装饼干进行卫生达标检验,你准备怎样做?显然,你只能从中抽取一定数量的饼干作为检验的样本.那么,应当怎样获取样本呢?(3)请总结简单随机抽样的定义.讨论结果:(1)预测结果出错的原因是:在民意测验的过程中,即抽取样本时,抽取的样本不具有代表性.1936年拥有电话和汽车的美国人只是一小部分,那时大部分人还很穷.其调查的结果只是富人的意见,不能代表穷人的意见.由此可以看出,抽取样本时,要使抽取出的样本具有代表性,否则调查的结果与实际相差较大.(2)要对这批小包装饼干进行卫生达标检查,只能从中抽取一定数量的饼干作为检验的样本,用样本的卫生情况来估计这批饼干的卫生情况.如果对这批饼干全部检验,那么费时费力,等检查完了,这批饼干可能就超过保质期了,再就是会破坏这批饼干的质量,导致无法出售.获取样本的方法是:将这批小包装饼干,放入一个不透明的袋子中,搅拌均匀,然后不放回地摸取(这样可以保证每一袋饼干被抽到的可能性相等),这样就可以得到一个样本.通过检验样本来估计这批饼干的卫生情况.这种抽样方法称为简单随机抽样.(3)一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.最常用的简单随机抽样方法有两种:抽签法和随机数法.提出问题(1)抽签法是大家最熟悉的,也许同学们在做某种游戏,或者选派一部分人参加某项活动时就用过抽签法.例如,高一(2)班有45名学生,现要从中抽出8名学生去参加一个座谈会,每名学生的机会均等.我们可以把45名学生的学号写在小纸片上,揉成小球,放到一个不透明袋子中,充分搅拌后,再从中逐个抽出8个号签,从而抽出8名参加座谈会的学生.请归纳抽签法的定义.总结抽签法的步骤.(2)你认为抽签法有什么优点和缺点?当总体中的个体数很多时,用抽签法方便吗?(3)随机数法是利用随机数表或随机骰子或计算机产生的随机数进行抽样.我们仅学习随机数表法即利用随机数表产生的随机数进行简单随机抽样的方法.怎样利用随机数表产生样本呢?下面通过例子来说明.假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验.利用随机数表抽取样本时,可以按照下面的步骤进行.第一步,先将800袋牛奶编号,可以编为000,001, (799)第二步,在随机数表中任选一个数.例如选出第8行第7列的数7(为了便于说明,下面摘取了附表1的第6行至第10行.)16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64 84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76 63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54 57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28第三步,从选定的数7开始向右读(读数的方向也可以是向左、向上、向下等),得到一个三位数785,由于785<799,说明号码785在总体内,将它取出;继续向右读,得到916,由于916>799,将它去掉.按照这种方法继续向右读,又取出567,199,507,…,依次下去,直到样本的60个号码全部取出.这样我们就得到一个容量为60的样本.请归纳随机数表法的步骤.(4)当N=100时,分别以0,3,6为起点对总体编号,再利用随机数表抽取10个号码.你能说出从0开始对总体编号的好处吗?(5)请归纳随机数表法的优点和缺点.讨论结果:(1)一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.抽签法的步骤是:1°将总体中个体从1—N编号;2°将所有编号1—N写在形状、大小相同的号签上;3°将号签放在一个不透明的容器中,搅拌均匀;4°从容器中每次抽取一个号签,并记录其编号,连续抽取n次;5°从总体中将与抽取到的签的编号相一致的个体取出.(2)抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,如果标号的签搅拌得不均匀,会导致抽样不公平.因此说当总体中的个体数很多时,用抽签法不方便.这时用随机数法.(3)随机数表法的步骤:1°将总体中个体编号;2°在随机数表中任选一个数作为开始;3°规定从选定的数读取数字的方向;4°开始读取数字,若不在编号中,则跳过,若在编号中则取出,依次取下去,直到取满为止;5°根据选定的号码抽取样本.(4)从0开始编号时,号码是00,01,02,…,99;从3开始编号时,号码是003,004,…,102;从6开始编号时,号码是006,007,…,105.所以以3,6为起点对总体编号时,所编的号码是三位,而从0开始编号时,所编的号码是两位,在随机数表中读数时,读取两位比读取三位要省时,所以从0开始对总体编号较好.(5)综上所述可知,简单随机抽样有操作简便易行的优点,在总体个数不多的情况下是行之有效的.但是,如果总体中的个体数很多时,对个体编号的工作量太大,即使用随机数表法操作也并不方便快捷.另外,要想“搅拌均匀”也非常困难,这就容易导致样本的代表性差.应用示例例1 某车间工人加工一种轴共100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?分析:简单随机抽样有两种方法:抽签法和随机数表法,所以有两种思路.解法一(抽签法):①将100件轴编号为1,2, (100)②做好大小、形状相同的号签,分别写上这100个号码;③将这些号签放在一个不透明的容器内,搅拌均匀;④逐个抽取10个号签;⑤然后测量这10个号签对应的轴的直径的样本.解法二(随机数表法):①将100件轴编号为00,01,…99;②在随机数表中选定一个起始位置,如取第22行第1个数开始(见教材附录1:随机数表);③规定读数的方向,如向右读;④依次选取10个为68,34,30,13,70,55,74,77,40,44,则这10个号签相应的个体即为所要抽取的样本.点评:本题主要考查简单随机抽样的步骤.抽签法的关键是为了保证每个个体被抽到的可能性相等而必须搅拌均匀,当总体中的个体无差异,并且总体容量较小时,用抽签法;用随机数表法读数时,所编的号码是几位,读数时相应地取连续的几个数字,当总体中的个体无差异,并且总体容量较多时,用抽签法.变式训练1.下列抽样的方式属于简单随机抽样的有____________.(1)从无限多个个体中抽取50个个体作为样本.(2)从1 000个个体中一次性抽取50个个体作为样本.(3)将1 000个个体编号,把号签放在一个足够大的不透明的容器内搅拌均匀,从中逐个抽取50个个体作为样本.(4)箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出一个零件进行质量检验后,再把它放回箱子.(5)福利彩票用摇奖机摇奖.解析:(1)中,很明显简单随机抽样是从有限多个个体中抽取,所以(1)不属于;(2)中,简单随机抽样是逐个抽取,不能是一次性抽取,所以(2)不属于;很明显(3)属于简单随机抽样;(4)中,抽样是放回抽样,但是简单随机抽样是不放回抽样,所以(4)不属于;很明显(5)属于简单随机抽样.答案:(3)(5)2.要从某厂生产的30台机器中随机抽取3台进行测试,写出用抽签法抽样样本的过程.分析:由于总体容量和样本容量都较小,所以用抽签法.解:抽签法,步骤:第一步,将30台机器编号,号码是01,02, (30)第二步,将号码分别写在一张纸条上,揉成团,制成号签.第三步,将得到的号签放入不透明的袋子中,并充分搅匀.第四步,从袋子中依次抽取3个号签,并记录上面的编号.第五步,所得号码对应的3台机器就是要抽取的样本.例2 人们打桥牌时,将洗好的扑克牌随机确定一张为起始牌,这时按次序搬牌时,对任何一家来说,都是从52张牌中抽取13张牌,问这种抽样方法是否是简单随机抽样?解:简单随机抽样的实质是逐个地从总体中随机抽取样本,而这里只是随机确定了起始张,其他各张牌虽然是逐张起牌,但是各张在谁手里已被确定,所以不是简单随机抽样.点评:判断简单随机抽样时,要紧扣简单随机抽样的特征:逐个、不放回抽取且保证每个个体被抽到的可能性相等.变式训练现在有一种“够级”游戏,其用具为四副扑克,包括大小鬼(又称为花)在内共216张牌,参与人数为6人并坐成一圈.“够级”开始时,从这6人中随机指定一人从已经洗好的扑克牌中随机抽取一张牌(这叫开牌),然后按逆时针方向,根据这张牌上的数字来确定谁先抓牌,这6人依次从216张牌中抓取36张牌,问这种抓牌方法是否是简单随机抽样?解:在这里只有抽取的第一张扑克牌是随机抽取的,其他215张牌已经确定,即这215张扑克牌被抽取的可能性与第一张扑克牌可能性不相同,所以不是简单随机抽样.知能训练1.为了了解全校240名学生的身高情况,从中抽取40名学生进行测量,下列说法正确的是()A.总体是240B.个体C.样本是40名学生D.样本容量是40答案:D2.为了了解所加工一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是()A.总体B.个体C.总体的一个样本D.样本容量答案:C3.一个总体中共有200个个体,用简单随机抽样的方法从中抽取一个容量为20的样本,则某一特定个体被抽到的可能性是____________.1答案:104.为了检验某种产品的质量,决定从40件产品中抽取10件进行检查,如何用简单随机抽样抽取样本?解:方法一(抽签法):①将这40件产品编号为1,2, (40)②做好大小、形状相同的号签,分别写上这40个号码;③将这些号签放在一个不透明的容器内,搅拌均匀;④连续抽取10个号签;⑤然后对这10个号签对应的产品检验.方法二(随机数表法):①将40件产品编号,可以编为00,01,02,…,38,39;②在随机数表中任选一个数作为开始,例如从第8行第9列的数5开始,;③从选定的数5开始向右读下去,得到一个两位数字号码59,由于59>39,将它去掉;继续向右读,得到16,将它取出;继续下去,又得到19,10,12,07,39,38,33,21,随后的两位数字号码是12,由于它在前面已经取出,将它去掉,再继续下去,得到34.至此,10个样本号码已经取满,于是,所要抽取的样本号码是16,19,10,12,07,39,38,33,21,34.拓展提升现有一批编号为10,11,…,99,100,…,600的元件,打算从中抽取一个容量为6的样本进行质量检验.如何用随机数法设计抽样方案?分析:重新编号,使每个号码的位数相同.解:方法一:第一步,将元件的编号调整为010,011,012,...,099,100, (600)第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比如,选第6行第7个数“9”,向右读.第三步,从数“9”开始,向右读,每次读取三位,凡不在010—600中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到544,354,378,520,384,263.第四步,以上这6个号码所对应的6个元件就是所要抽取的对象.方法二:第一步,将每个元件的编号加100,重新编号为110,111,112,…,199,200,…,700. 第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比如,选第8行第1个数“6”,向右读.第三步,从数“6”开始,向右读,每次读取三位,凡不在110—700中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到630,163,567,199,507,175.第四步,这6个号码分别对应原来的530,63,467,99,407,75.这些号码对应的6个元件就是要抽取的对象.课堂小结1.简单随机抽样是一种最简单、最基本的抽样方法,简单随机抽样有两种选取个体的方法:放回和不放回,我们在抽样调查中用的是不放回抽样,常用的简单随机抽样方法有抽签法和随机数法.2.抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点是当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较小的抽样类型.3.简单随机抽样每个个体入样的可能性都相等,均为Nn ,但是这里一定要将每个个体入样的可能性、第n 次每个个体入样的可能性、特定的个体在第n 次被抽到的可能性这三种情况区分开来,避免在解题中出现错误.作业课本本节练习2、3.设计感想本节教学设计以课程标准的要求为指导,重视引导学生参与到教学中,体现了学生的主体地位.同时,根据高考的要求,适当拓展了教材,做到了用教材,而不是教教材.。
人教A版高中数学必修3 统计 教材分析
mm.
④乙品种棉花的纤维长度基本上是对称的,而且大多集中在中间(均值附近).甲品种棉花的
纤维长度除一个特殊值 352 外,也大致对称,其分布较均匀.
2.直方图的识图要点
⑴通过直方图估计平均数——
平均数的估计值等于频率分布直方图中每个小矩形的面积
容大大的增加,这已经成为国际中小学数学课程发展的趋势。
2. “新课标”的新要求
第一部分 前言
……与时俱进地认识“双基”(摘录)
数学课程设置和实施应重新审视基础知识、基本技能和能力的内涵,形成符合时代要求
的新的"双基"。例如,为了适应信息时代发展的需要,高中数学课程应增加算法的内容,把 最基本的数据处理、统计知识等作为新的数学基础知识和基本技能;
乘以小矩形底面中点的横坐标之和. ⑵通过直方图估计中位数—— 在频率分布直方图中,中位数左边和右边的直方图的面积
应该相等.
(三)统计软件 Excel 与 SPSS.
推荐一本书——《用 Excel 与 Spss 学习统计学》毛炳寰编
1.添加“分析工具库”(平均数、中位数、众数,方差,相等)
本功能需要使用 Excel 扩展功能,如果您的 Excel 尚未安装数据分析, 请依次选择“工具”-“加载宏”,在安装光盘中加载“分析数据库”。加载成功 后,可以在“工具”下拉菜单中看到“数据分析”选项。
分析:将直方图与加权平均数结合考查
(二)重视统计思想的理解,重视结果的解释和应用.
1.茎叶图的识图要点
例 1 (2009 安徽)某良种培育基地正在培育一种小麦新品种 A.将其与原有的一个优良品
种 B 进行对照试验.两种小麦各种植了 25 亩,所得亩产数据(单位:千克)如下: A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,
高中数学 第二章 统计小结与复习教案 新人教A版必修3-新人教A版高一必修3数学教案
第二章统计教学目标重点:会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的问题.难点:能通过对数据的分析,为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异.能力点:如何利用样本对总体的分布规律、整体水平、稳定程度及相关关系等特性进行估计和预测.教育点:提高学生的认知水平,为学生塑造良好的数学认识结构.自主探究点:例题及变式的解题思路的探寻.易错点:由于学生运算能力差,因此求回归直线方程涉及的运算学生容易出错.学法与教具1.学法:讲授法、讨论法.2.教具:学案导学.(1)作样本频率分布直方图的步骤:注意:频率分布直方图纵坐标表示:____________.(2)茎叶图作图步骤:(3)直方图与茎叶图的优缺点:3.用样本的数据特征估计总体的数据特征(1)利用频率直方图中估计众数、平均数、中位数的值:估计众数______________________________________.估计平均数____________________________________.估计中位数____________________________________.(2)标准差与方差的公式:标准差____________________s=.方差2_____________________s=.(3)标准差与方差的作用:4.变量间的相关关系(1)两变量间的关系有:________________和________________.(2)两变量相关关系的确定方法:____________________________________.(3)用最小二乘法求回归直线方程的步骤:(二)基础检测1.某社区有500个家庭,其中高收入家庭125户,中等收入家庭280户,低收入家庭95户,为了调查社会购买力的某项指标,要从中抽取1个容量为100户的样本,记做①;某学校高一年级有12名女排运动员,要从中选出3个调查学习负担情况,记做②.那么完成上述2项调查应采用的抽样方法分别是________________.答案:分层抽样,简单随机抽样.2.一个总体的60个个体的编号为0,1,2,…,59,现要从中抽取一个容量为10的样本,请根据编号按被6样本,则抽取的样本号码是_______________.答案:3,9,15,21,27,33,39,45,51,3.(12山东文高考) 右图是根据部分城市某年6气温(单位:℃)数据得到的样本频率分布直方图气温的范围是[20.5,26.5],样本数据的分组为[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5℃的城市个数为11,则样本中平均气温不低于25.5℃的城市个数为_________.答案:9./第3题图4.(10山东理)样本中共有五个个体,其值分别为a ,0,1,2,3, 若该样本的平均值为1,则样本方差为_______________. 答案:2.5.(11辽宁)调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 和年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:0.2540.321y x =+.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加_______________万元.答案:0.254. 三、【范例导航】例1.一汽车厂生产A ,B ,C 三类轿车,每类轿车均有舒适型和标A 类轿车10辆.(1)求z 的值; (2)B 类,C 类轿车各应抽取多少? (3)在C 类轿车中,按型号分层抽样,应各抽取多少?【分析】按类分层或者是按型号分层,抽样比是相同的.【解答】(1)设该厂这个月共生产轿车n 辆,则由题意得5010,100300n =+所以2000n =, 则2000(100300)150450600400z =-+---=.(2)B 类轿车共有150+450=600(辆).按抽样比10400抽取,则应抽取1060015400⨯=(辆). 同理,C 类应抽取10(400600)25400+⨯=(辆).(3)在C 类轿车中,按型号抽样时抽样比仍为140.则舒适型应抽取14001040⨯=(辆);标准型应抽取16001540⨯=(辆).【点评】通过本题的具体计算可看出,无论是按类抽取还是按型号抽取,每个个体入样的概率都是140. 变式训练:为了了解参加某种知识竞赛的1000名学生的成绩,要从中抽取50名学生的成绩,采用什么抽样方法比较恰当?简述抽样过程. 答案:适宜选用系统抽样,抽样过程如下:(1)随机地将这1000名学生编号为1,2,3,,1000;(2)将总体按编号顺序均分成50部分,每部分包括20个个体; (3)在第一部分的个体编号1,2,3,,20中,利用简单随机抽样抽取一个号码,比如是18;(4) 以18为起始号码,每间隔20抽取一个号码,这样得到一个容量为50的样本:18,38,58,, 998. 小结:1.三种抽样方法的共同特点是在抽样过程中每个个体被抽取的机会相同,体现了这些抽样方法的客观性和公平性.2.当总体中的个体数较少时,常采用简单随机抽样;当总体中的个体数较多时,常采用系统抽样;当总体中的个体有明显的层次差异,层次分明时,常采用分层抽样.3.系统抽样时要注意所得样本号码的特点,而分层抽样要正确确定抽样的比例.例2.为了了解高二学生的体能情况,我校抽取部分高二学生进行一分钟跳绳次数测试,将所得数据整理后,图所示,图中左到右各小长方型的面积之比为小组频数为12.问:(1)(2)(3)求一分钟跳绳的众数,中位数和平均数.(4)若一分钟跳绳次数在110次以上(含110试估计该校全体高一学生的达标率是多少?【分析】(1)考查频率分布折线图与频率分布直方图的关系; (2)根据从左到右各小长方形的面积之比为 2:4:17:15:9:3,第二小组频数为12,用比值做出样本容量.做出的样本容量和第二小组的频率.(3)在频率分布直方图中最高的小长方形的底边的中点就是这组数据的众数的估计值,处在把频率分布直方图所有的小长方形的面积分成两部分的一条垂直与横轴的线对应的横标就是中位数的估计值,平均数的估计值是频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(4)根据上面做出的样本容量和前两个小长方形所占的比例,用所0.034 0.0180.03有的符合条件的样本个数之和,除以样本容量得到概率. 【解答】(1)如图所示(2)∵从左到右各小长方形的面积之比为 2:4:17:15:9:3,第二小组频数为12.∴样本容量是(24171593)121504+++++⨯=∴第二小组的频率是 120.08150=.(3)由图可知众数为1101201152+=,又∵前三个小矩形的面积之和为0.46.∴设中位数为120+x ,则0.460.030.5x +⨯=,得x =43,∴中位数为3643,而平均数为0.04950.081050.341150.31250.181350.06145121.8⨯+⨯+⨯+⨯+⨯+⨯=.(4)∵次数在110次以上(含110次)为达标,∴在这组数据中达标的个体数一共有17+15+9+3, ∴全体学生的达标率估计是1715930.8850+++=.【点评】本题考查频率分步直方图的应用,是一个基础题,这种题目解题的关键是看清图中所给的条件,知道小长方形的面积就是这组数据的频率. 变式训练:1.随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图为如图(1)根据茎叶图判断哪个班的平均身高较高;用茎叶图分析数据的好处?(2)分别计算甲班、乙班的样本平均数及方差;(3)根据计算结果对两班的身高用其稳定性进行比较,写出统计结论. 答案:(1)由茎叶图不难看出乙班的平均身高较高;用茎叶图处理现有的数据不但可以看出数据的分布情况, 而且可以看出每组中的具体数据.(2)由茎叶图,得甲班的10名同学的身高分别为182 179 179 171 170 168 168 163 162 158甲班 乙班 18171615 3 73 6 8 9 2 5 8 99 9 1 0 2 8 8 3 2 8183 187 173 176 178 179 162 165 168 159, 得他们的平均身高为2173x cm =,22277.2s cm =.(3)由(2)的计算结果可以发现甲班的平均身高为170cm ,乙班的平均身高为173cm .由此可知乙班的平均身高比甲班的平均身高高,但乙班的身高不够稳定,而甲班的身高比较集中在平均身高附近. 2.某次数学考试中,高一(20)班有20人成绩记录如下:(单位:分)125 121 123 125 127 129 125 128 130 129 126 124 125 127 126 122 124 125 126 128王老师想做出以上数据的频率分布直方图,他把这些数据分成5组,分组情况为[120.5,122.5),[122.5,124.5),[124.5,126.5),[126.5,128.5),[128.5,130.5].(1)请你帮他完成频率分布直方图;(2)根据画出的直方图,求这组数据的众数、中位数、平均数. 答案:(1)略. (2) 众数为125.5,中位数为125.75,平均数为125.8. 小结:1.用样本频率分布估计总体频率分布时,通常要对给定的一组数据进行列表、作图处理,列表与作图时要注意其方法步骤;对于茎叶图要正确画图,能够根据图中所给的数据进行分析.2.在频率分布直方图中能够正确估计样本数据的众数、中位数、平均数,并且知道它们给分析数据带来的不同影响,不同的数字特征代表着不同的信息.由于需要不同信息而选择不同的数字特征,对同一组数据的评价可能会相差很大.3.会计算样本数据的方差、标准差,知道它们的作用;在实际应用中当所得数据平均数不同时,须先分析平均水平,再计算标准差(方差)分析稳定情况.例3.假设关于某设备的使用年限x 和所支出的维修费用y (万元)(1)性回归方程y bx a =+的回归系数 b ,a ;(2)估计使用年限为10年时的维修费用.【分析】(1)利用散点图可直接判断两变量是否线性相关;再利用公式1122211()(),()n niii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑a y bx =-来计算回归系数.有时为了计算方便常制表对应求出2,,i i i x y x ,以利于求和.(2)获得线性回归方程后,取x =10即得所求. 【解答】(1)散点图如图所示: 由散点图可知两变量线性相关.于是有2112.3 1.23905410b -===-⨯,5 1.2340.08a y bx =-=-⨯=.(2)回归直线方程是 1.230.08y x =+,当x =10(年)时,1.23100.0812.38y =⨯+=(万元),即估计使用10年时维修费用是12.38万元. 【点评】判断两变量是否线性相关一种简便可行的方法就是绘制散点图.根据散点图可以很容易看出两个变量是否具有相关关系.只有当两个变量之间存在线性相关关系时,才能用回归直线方程对总体进行估计和预测. 变式训练:1.小王记录了产量x (吨)和能耗y (吨标准煤)对应的四组数据,用最小二乘法求出了0.70.35y x =+,不慎将一滴墨水滴于表内,表中第二行第四列的数据已无法看清,据您判断这个数据应该是多少?答案:2.某数学老师身高176cm ,他爷爷、父亲和儿子的身高分别是173cm 、170cm 和182cm .因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高是多少cm ?答案:185cm . 小结:求线性回归直线方程应注意:先画散点图判断两变量是否线性相关;若线性相关,再利用公式计算,a b 的值,进而求出回归直线方程,但要注意运算顺序;然后就可以利用回归方程进行估计和预测. 四、【解法小结】1.对于随机抽样问题:掌握三种抽样方法的区别与联系,系统抽样的样本号码的特点以及分层抽样的比例的确定.2.应用频率分布直方图时,需明确纵轴表示的是频率/组距,进而进行相关计算.3.对于标准差、方差记准公式,知道其作用.4.掌握用最小二乘法求回归直线方程的步骤,注意运算顺序. 五、【布置作业】 必做题:1.(2012山东理高考)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为 1,2,,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间 [1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为_______________.2. (2012湖北文高考)一支田径运动队有男运动员56人,女运动员42人.现用分层抽样的方法抽取若干人,若抽取的男运动员有8人,则抽取的女运动员有_______________人.3.(2013山东文高考)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91分.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示,则7个剩余分数的方差是_______________.4.(2011广东高考)为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x法,预测小李该月6号打6小时篮球的投篮命中率为___________. 5.(2012广东文高考)某校100位学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是8 9 7 74 0 1 0 x 9 10.04 0.03 0.02[70,80),[80,90),[90,100]. (1)求图中a 的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分; (3)若这100名学生的语文成绩某些分数段的人数x 与数学成绩 相应分数段的人数y 之比如下表所示,求数学成绩在[50,90) 之外的人数.6.某学校高一(3)班甲、乙两名同学的最近5次(1)(2)分别用平均数和中位数分析甲、乙两位同学中,哪位同学成绩较好;(3)(单位:分)如下:并说明理由.必做题答案:1.10 2. 6 3.3674. 0.5, 0.535. (1) a =0.005 (2)73 (3)106.(1)甲的平均分、中位数分别为90、95,乙的平均分、中位数分别为86、98;(2)从平均分看,甲的平均分高,甲的成绩较好;从中位数看,乙的中位数大,乙的成绩较好.(3)丙的平均数、中位数、方差分别为90、90、44.4,甲的方差为158.8.由于两人的平均分相同,所以从平均分看,甲、丙成绩同样好;从中位数看,甲的中位数高,甲的成绩高;从方差看,丙的方差小,丙的成绩较稳定,所以丙的成绩好. 选做题:(2012山西模拟)如下图,图甲是某市有关部门根据对当地干部的月收入情况调查后画出的样本频率分布直方图,已知图甲中从左向右第一组的频数为4000.在样本中记月收入在[1000,1500),[1500,2000),[2000,2500),[2500,3000),[3000,3500),[3500,4000)的人数依次为A1,A2,…,A6.图乙是统计图中月工资收入在一定范围内的人数的程序框图,图乙输出的S=______________.(用数字作答).0.00080.00040.00030.000250.000150.0001。
必修三第二章统计复习教案
必修三第二章《统计》复习专题一、基础知识回顾1:简单随机抽样(1)总体与样本①在统计学中 , 把研究对象得全体叫做总体.②把每个研究对象叫做个体.③把总体中个体得总数叫做总体容量.④为了研究总体得有关性质,一般从总体中随机抽取一部分:, , , 研究,我们称它为样本.其中个体得个数称为样本容量.(2)简单随机抽样:就就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。
特点就是:每个样本个体被抽中得可能性相同(概率相等),样本得每个个体完全独立,彼此间无一定得关联性与排斥性且为逐个不放回抽取,简单随机抽样就是其它各种抽样形式得基础。
通常只就是在总体个体之间差异程度较小与数目较少时,才采用这种方法。
(3)简单随机抽样常用得方法:①抽签法②随机数表法③计算机模拟法(4)抽签法:①给调查对象群体中得每一个对象编号;②准备抽签得工具,实施抽签;③对样本中得每一个个体进行测量或调查(5)随机数表法:①给调查对象群体中得每一个对象编号(编号位数相同);②获取样本编号2:系统抽样(1)系统抽样(等距抽样或机械抽样):把总体得单位进行排序,再计算出抽样距离,然后按照这一固定得抽样距离抽取样本。
第一个样本采用简单随机抽样得办法抽取。
K(抽样距离)=N/n(若N/n 不就是整数,则需先用简单随机抽样剔除数目最少得个体后再进行)(2)系统抽样,即等距抽样就是实际中最为常用得抽样方法之一。
因为它对抽样框得要求较低,实施也比较简单。
更为重要得就是,如果有某种与调查指标相关得辅助变量可供使用,总体单元按辅助变量得大小顺序排队得话,使用系统抽样可以大大提高估计精度。
3:分层抽样(1)分层抽样(类型抽样):先将总体中得所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样得办法抽取一个子样本,最后,将这些子样本合起来构成总体得样本。
两种方法:①先以分层变量将总体划分为若干层,再按照各层在总体中得比例从各层中抽取。
必修三第二章统计复习优秀教案
必修三第二章《统计》复习专题一、基础知识回顾1:简单随机抽样(1)总体和样本①在统计学中 , 把研究对象的全体叫做总体.②把每个研究对象叫做个体.③把总体中个体的总数叫做总体容量.④为了研究总体的有关性质,一般从总体中随机抽取一部分:,,,研究,我们称它为样本.其中个体的个数称为样本容量.(2)简单随机抽样:就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。
特点是:每个样本个体被抽中的可能性相同(概率相等),样本的每个个体完全独立,彼此间无一定的关联性和排斥性且为逐个不放回抽取,简单随机抽样是其它各种抽样形式的基础。
通常只是在总体个体之间差异程度较小和数目较少时,才采用这种方法。
(3)简单随机抽样常用的方法:①抽签法②随机数表法③计算机模拟法(4)抽签法:①给调查对象群体中的每一个对象编号;②准备抽签的工具,实施抽签;③对样本中的每一个个体进行测量或调查(5)随机数表法:①给调查对象群体中的每一个对象编号(编号位数相同);②获取样本编号2:系统抽样(1)系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。
第一个样本采用简单随机抽样的办法抽取。
K(抽样距离)=N/n(若N/n不是整数,则需先用简单随机抽样剔除数目最少的个体后再进行)(2)系统抽样,即等距抽样是实际中最为常用的抽样方法之一。
因为它对抽样框的要求较低,实施也比较简单。
更为重要的是,如果有某种与调查指标相关的辅助变量可供使用,总体单元按辅助变量的大小顺序排队的话,使用系统抽样可以大大提高估计精度。
3:分层抽样(1)分层抽样(类型抽样):先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。
两种方法:①先以分层变量将总体划分为若干层,再按照各层在总体中的比例从各层中抽取。
最新人教版高中数学必修3第二章《第二章统计》示范教案
示范教案整体设计教学分析本节是对第二章知识和方法的归纳和总结,从总体上把握本章,使学生的基本知识系统化和网络化,基本方法条理化,本章内容是相互独立的,随机抽样是基础,在此基础上学习了用样本估计总体和变量间的相关关系,要注意它们的联系.本章介绍了从总体中抽取样本的常用方法,并通过实例,研究了如何利用样本对总体的分布规律、整体水平、稳定程度及相关关系等特性进行估计和预测.当总体容量大或检测具有一定的破坏性时,可以从总体中抽取适当的样本,通过对样本的分析、研究,得到对总体的估计,这就是统计分析的基本过程.而用样本估计总体就是统计思想的本质.要准确估计总体,必须合理地选择样本,我们学习的是最常用的三种抽样方法.获取样本数据后,将其用频率分布表、频率直方图、频率折线图或茎叶图表示后,蕴涵于数据之中的规律得到直观的揭示.运用样本的平均数可以对总体水平作出估计,用样本的极差、方差(标准差)可以估计总体的稳定程度.对两个变量的样本数据进行相关性分析,可发现存在于现实世界中的回归现象.用最小二乘法研究回归现象,得到的线性回归方程可用于预测和估计,为决策提供依据.总之,统计的基本思想是从样本数据中发现统计规律,实现对总体的估计.三维目标1.会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.2.能通过对数据的分析,为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异.3.通过本节学习,培养学生的直觉思维和归纳能力.重点难点教学重点:会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.教学难点:能通过对数据的分析为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异.课时安排1课时教学过程导入新课思路1.为了系统掌握本章的知识,我们复习本章内容,教师直接点出课题.思路2.同一支球队,在不同的教练带领下战斗力会有很大的不同,例如达拉斯小牛队在“小将军”约翰逊的带领下攻防俱佳所向披靡,同样一张书桌有的整洁、有的凌乱,为什么呢?因为球队需要系统的训练、清晰的战术、完整的攻防体系.书桌需要不断整理,我们学习也是一样需要不断归纳整理、系统总结、升华提高,现在我们就统计这章进行归纳复习,教师点出课题.推进新课新知探究提出问题(1)随机抽样的内容包括哪些?(2)用样本估计总体包括几部分?(3)变量的相关性包括几部分?(4)画出本章知识网络.讨论结果:(1)随机抽样①简单随机抽样抽签法:将总体中的所有个体编号(号码可以从1到 N);将1到N 这N 个号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作).将号签放在同一不透明的容器中,并搅拌均匀;从箱中每次抽出1个号签,并记录其编号,连续抽取k 次;从总体中将与抽到的签的编号相一致的个体取出.抽样具有公平性原则:等可能性、随机性;抽签法适用于总体中个数N 不大的情形.随机数表法:对总体中的个体进行编号(每个号码位数一致);在随机数表中任选一个数作为开始;从选定的数开始按一定的方向读下去,得到数码.若不在编号中,则跳过;若在编号中,则取出;如果得到的号码前面已经取出,也跳过;如此继续下去,直到取满为止;根据选定的号码抽取样本.②系统抽样采用随机的方式将总体中的个体编号;将整个的编号按一定的间隔(设为k)分段,当N n (N 为总体中的个体数,n 为样本容量)是整数时,k =N n ;当N n不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数N ′能被n 整除,这时k =N ′n,并将剩下的总体重新编号;在第一段中用简单随机抽样或系统抽样确定起始的个体编号;将编号为,+k ,+2k ,…,+(n -1)k 的个体抽出. ③分层抽样将总体按一定标准分层;计算各层的个体数与总体的个体数的比;按各层个体数占总体的个体数的比确定各层应抽取的样本容量;在每一层进行抽样(可用简单随机抽样或系统抽样).适用于总体中个体有明显的层次差异.(2)用样本估计总体①用样本的频率分布估计总体分布频率分布是指一个样本数据在各个小范围内所占比例的大小;一般用频率分布直方图反映样本的频率分布.其一般步骤为:计算一组数据中最大值与最小值的差,即求极差;决定组距与组数;决定分点;列频率分布表;画频率分布直方图.频率分布直方图的特征:从频率分布直方图可以清楚地看出数据分布的总体趋势;从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.茎叶图.画茎叶图的步骤如下:a .将每个数据分为茎(高位)和叶(低位)两部分.b .将最小茎和最大茎之间的数按大小次序排成一列,写在左(右)侧;c .将各个数据的叶按大小次序写在其茎右(左)侧.用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观、清晰.②用样本的数字特征估计总体的数字特征a .利用频率分布直方图估计众数、中位数、平均数估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点)估计中位数:中位数把频率分布直方图分成左右两边面积相等.估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. 众数、中位数、平均数都是对数据中心位置的描述,可以作为总体相应特征的估计.样本众数易计算,但只能表达样本数据中的很少一部分信息,不一定唯一;中位数仅利用了数据中排在中间数据的信息,与数据的排列位置有关;平均数受样本中的每一个数据的影响,绝对值越大的数据,对平均数的影响也越大.三者相比,平均数代表了数据更多的信息,描述了数据的平均水平,是一组数据的“重心”.b .标准差考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用s 表示.s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. c .方差从数学的角度考虑,人们有时用标准差的平方s 2(即方差)来代替标准差,作为测量样本数据分散程度的工具:s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差.(3)变量间的相关关系①变量之间的相关关系自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.两个变量之间的关系分两类:a .确定性的函数关系,例如我们以前学习过的一次函数、二次函数等;b .带有随机性的变量间的相关关系,例如“身高者,体重也重”,我们就说身高与体重这两个变量具有相关关系.相关关系是一种非确定性关系.②两个变量的线性相关a .散点图:将各数据在平面直角坐标中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫作散点图.b .正相关与负相关:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.(注:散点图的点如果几乎没有什么规则,则这两个变量之间不具有相关关系)c .最小二乘法与回归直线方程:y ^=a ^+b ^x ,其中b ^=∑i =1n x i y i -n x y∑i =1n x 2i -n x 2,a ^=y -b ^x . 上述方程中的b ^,a ^是在所得样本数据的点到这条直线的距离的平方和最小的情形下得到的,这种使“偏差平方和为最小”的方法就是最小二乘法.(4)本章知识网络应用示例 思路1例1某单位有老人28人,中年人54人,青年人81人,为了调查他们的身体状况,从他们中抽取容量为36的样本,最适合抽取样本的方法是( )A .简单随机抽样B .系统抽样C .分层抽样D .先从老人中剔除1人,再用分层抽样解析:总体总人数163人,样本容量为36,由于总体由差异明显的三部分组成,考虑用分层抽样.若按36∶163分配无法得到整数解,故考虑先剔除1人,抽取比例变为36∶162=2∶9,则依次为12、18、6.答案:D点评:选择抽样方法过程中,应结合三种抽样方法的使用范围和实际情况灵活使用各种抽样方法.在现实生活中,由于资金、时间有限,人力、物力不足,加之不断变化的环境条件,普查往往不可能,因此采取抽样调查.在实际操作中,为了使样本具有代表性,通常要了其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的14,且该组中,青年人占50%,中年人占40%,老年人占10%. 为了了解各组不同的年龄层次的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样本.试确定:(1)游泳组中,青年人、中年人、老年人分别所占的比例;(2)游泳组中,青年人、中年人、老年人分别应抽取的人数.分析:本题的抽样方法属于分层抽样,根据分层抽样的方法求解.解:(1)设登山组人数为x ,游泳组中,青年人、中年人、老年人各占比例分别为a 、b 、c ,则有x ×40%+3xb 4x =47.5%,x ×10%+3xc 4x=10%,解得b =50%,c =10%. 故a =100%-50%-10%=40%,即游泳组中,青年人、中年人、老年人各占比例分别为40%、50%、10%.(2)游泳组中,抽取的青年人数为200×34×40%=60(人);抽取的中年人数为200×34×50%=75(人);抽取的老年人数为200×34×10%=15(人). 点评:分层抽样适用于数目较多且各部分之间具有明显差异的总体,由于在分层抽样中抽取样本应该在各层用同一抽样比抽取,所以应首先求出各个年级的人数分别是多少,再根据抽样比计算各层分别应该抽取的人数,另外还要注意,不论用哪一种抽样方法,在整个抽程.分析:因为1 002=20×50+2,为保证“等距”分段,应先剔除2人.对“多余”个体的剔除应不影响总体中每个个体被抽到的可能性,仍然能保证抽样的公平性.解:(1)将1 002名学生用随机方式编号;(2)从总体中剔除2人(可用随机数表法),将剩下的 1 000名学生重新编号(000,001,002,…,999),并分成20段;(3)在第一段000,001,002,…,049这50个编号中用简单随机抽样抽出一个(如003)作为起始号码;(4)将编号为003,053,103,…,953的个体抽出,组成样本.点评:选用系统抽样方法时,应着力解决N不能被n整除的问题.在剔除“多余”的思路1例1为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得的数据整理后画出频率分布直方图(如下图),已知图中从左到右的前三个小组的频率分别是0.1,0.3,0.4.第一小组的频数是5.(1)求第四小组的频率和参加这次测试的学生的总人数;(2)在这次测试中,学生跳绳次数的中位数落在第几小组内?(3)参加这次测试跳绳次数在100次以上为优秀,试估计该校此年级跳绳成绩的优秀率.解:(1)由于各小组概率的和是1,因此第四小组的频率为1-0.1-0.3-0.4=0.2;由于第一小组的频数是5,频率为0.1,因此总人数为5÷0.1=50.(2)由于第三小组的频率最大,因此学生跳绳次数的中位数落在第三小组内.(3)由于第三小组的频率和第四小组的频率和为0.6,因此该校此年级跳绳成绩的优秀率是0.6.点评:本题考查对直方图的理解及读图能力,直方图中横轴表示试验结果,纵轴表示频率与组距的比值.例2下面是关于世界20个地区受教育的人口的百分比与人均收入的散点图.(1)两个变量有什么样的相关关系?(2)利用散点图中的数据建立的回归方程为y ^=3.193x +88.193,若受教育的人口百分比相差10%,其人均收入相差多少?解:(1)散点图中的样本点基本集中在一个条型区域中,因此两个变量呈线性相关关系.(2)回归系数为3.193,因此当人口的百分比相差10%时,其人均收入相差3.193×10=知能训练1.为了了解所加工的一批零件的长度,抽测了200个零件的长度,在这个问题中,200个零件的长度是()A.总体B.个体C.总体的一个样本D.样本容量答案:C2.为了解电视对生活的影响,就平均每天看电视的时间,一个社会调查机构对某地居民调查了10 000人,并根据所得数据画出样本的频率分布直方图(如下图),为了分析该地居民平均每天看电视的时间与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人做进一步调查,则在[2.5,3](小时)时间段内应抽出的人数是()A.25 B.30C.50 D.75解析:抽出的100人中平均每天看电视的时间在[2.5,3](小时)时间内的频率是0.5×0.5=0.25,所以这10 000人中平均每天看电视的时间在[2.5,3](小时)时间内的人数是10000×0.25=2 500,抽样比是10010 000=1100,则在[2.5,3](小时)时间段内应抽出的人数是 2500×1100=25.答案:A3.某校共有师生1 600人,其中教师有100人,现用分层抽样的方法,从所有师生中抽取一个容量为80的样本,则抽取的学生数为________.解析:抽样比是801 600=120,该校有学生 1 600-100=1 500(人).则抽取的学生为 1500×120=75.答案:754.从两个班中各随机抽取10名学生,他们的数学成绩如下:通过作茎叶图,分析两个班学生的数学学习情况.解:茎叶图为:从这个茎叶图中可以看出乙班的数学成绩更好一些.5.假设要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,先将800袋牛奶按000,001,…,799进行编号,如果从下面随机数表第2行第18列的数7开始向右读,请你依次写出最先检测的5袋牛奶的编号.84 42 17 53 3157 24 55 06 8877 04 74 47 6721 76 33 50 2583 92 12 06 7663 01 63 78 5916 95 56 67 1998 10 50 71 7512 86 73 58 0744 39 62 58 7973 21 12 34 2978 64 56 07 8252 42 07 44 3815 51 06 13 4299 66 02 79 54……解:从第2行第18列的数开始向右读,是小于或等于799的数就为1个,即719,050,717,512,358是最先检测的5袋牛奶的编号.6.某电视台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为应怎样进行抽样?分析:因为总体中人数较多,所以不宜采用简单随机抽样.又由于持不同态度的人数差异较大,故也不宜用系统抽样方法,所以应采用分层抽样.解:可用分层抽样方法,其总体容量为12 000.“很喜爱”占2 43512 000=4872 400,应取60×4872 400≈12人;“喜爱”占4 56712 000,应取60×4 56712 000≈23人;“一般”占3 92612 000,应取60×3 92512 000≈20人;“不喜爱”占1 07212 000,应取60×1 07212 000≈5人.因此,采用分层抽样的方法在“很喜爱”“喜爱”“一般”和“不喜爱”的2 435人、4 567人、3 926人和1 072人中分别抽取12人、23人、20人和5人.拓展提升为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这次竞赛.为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成并有局部污损的频率分布表和频率分布直方图,解答下列问题:(Ⅰ)填充频率分布表的空格(将答案直接填在表格内);(Ⅱ)补全频率分布直方图;(Ⅲ)若成绩在75.5~85.5分的学生为二等奖,问获得二等奖的学生约为多少人?分析:(Ⅰ)利用频率分布表的第2行求出样本容量,根据频率=频数/样本容量,来填充频率分布表的空格;(Ⅱ)根据(Ⅰ)补全频率分布直方图;根据频率分布表解决.解:(1)(2)频率分布直方图如下图所示.(3)成绩在75.5~80.5分的学生占70.5~80.5分的学生的510=12,因为成绩在70.5~80.5分的学生频率为0.2,所以成绩在75.5~80.5分的学生频率为0.1,成绩在80.5~85.5分的学生占80.5~90.5分的学生的510=12,因为成绩在80.5~90.5分的学生频率为0.32,所以成绩在80.5~85.5分的学生频率为0.16.所以成绩在75.5~85.5分的学生频率为0.1+0.16=0.26,由于有900名学生参加了这次竞赛,所以该校获得二等奖的学生约为0.26×900=234(人).课堂小结本节课主要是对第二章基本知识进行系统化、网络化,并对常见题型加以巩固提高.作业本章小结Ⅲ.巩固与提高1、5.设计感想本教学设计依据高中数学课程标准,并结合高考,对本章进行了全面复习和巩固.所选题例新颖,贴近学生实际,是一节非常好的探究性复习课.备课资料广告中数据的可靠性今天已进入数字时代,各种各样的统计数字和图表充斥着媒体,由于数字给人的印象直观具体,所以让数据说话是许多广告的常用手法,但广告中的数据可靠吗?在各类广告中,你会经常遇到由“方便样本(即样本没有代表性)”所产生的结论.例如,某减肥药的广告称,其减肥的有效率为75%.见到这样的广告你会怎么想?通过学习统计这部分内容,你会提出下面的问题吗?这个数据是如何得到的;该药在多少人身上做过试验,即样本容量是多少;样本是如何选取的;等等.假设该药仅在4个人身上做过试验,样本容量为4,用这样小的样本容量来推断总体是不可信的.“现代研究证明,99%以上的人感染有螨虫……”这是一家化妆品公司的广告.第一次听到此话的人会下意识地摸一下自己的皮肤,甚至会感觉到有虫在里面蠕动,恨不得立即弄些药膏抹抹,广告的威慑作用不言而喻.但这里99%是怎么得到的?研究共检测了多少人?这些人是如何挑选的?如果检测的人都是去医院看皮肤病的人,这个数据就不适用于一般人群.某化妆品的广告声称:“它含有某种成分,可以彻底地清除脸部皱纹,只需10天,就能让肌肤得到改善.”我们看到的数字很精确,而“能让肌肤得到改善”却是很模糊的.这样的数字能相信吗?试验是在什么样的皮肤上做的?试验的人数是多少?当我们见到广告中的数据时一定要多提几个问题.。
高中数学必修三第二章《统计》学案2.3.变量间的相关关系(学生专用)(A版)
高中数学必修三第二章《统计》学案2.3.变量间的相关关系(学生专用)(A版)普通高中数学必修3(A版)学案 2.3. 变量间的相关关系2.3.1变量之间的相关关系授课时间:年月日【学习目标】通过收集现实问题中两个有关联变量的数据认识变量间的相关关系。
【重点难点】1. 通过收集现实问题中两个有关联变量的数据直观认识变量间的相关关系。
2. 变量之间相关关系的理解。
【学习过程】一、学习引导在中学校园里,有这样一种说法:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着某种关系,我们把数学成绩和物理成绩看成是两个变量,那么这两个变量之间的关系是函数关系吗?二、合作交流(教师可做点拨)相关关系的概念:两个变量之间的关系可能是确定的关系(如:函数关系),或非确定性关系。
当自变量取值一定时,因变量也确定,则为确定关系;当自变量取值一定时,因变量带有随机性,这种变量之间的关系称为相关关系。
相关关系是一种非确定性关系。
(分析:两个变量→自变量取值一定→因变量带有随机性→相关关系)三、随堂练习思考1:考察下列问题中两个变量之间的关系:(1)商品销售收入与广告支出经费;(2)粮食产量与施肥量;(3)人体内的脂肪含量与年龄.这些问题中两个变量之间的关系是函数关系吗?思考2:“名师出高徒”可以解释为教师的水平越高,学生的水平就越高,那么学生的学业成绩与教师的教学水平之间的关系是函数关系吗?你能举出类似的描述生活中两个变量之间的这种关系的成语吗?思考3:商品销售收入与广告支出经费之间的关系。
(还与商品质量,居民收入,生活环境等有关)四、能力提升1. 上述两个变量之间的关系是一种非确定性关系,称之为相关关系,那么相关关系的含义如何?2. 对于一个变量,可以控制其数量大小的变量称为可控变量,否则称为随机变量,那么相关关系中的两个变量有哪种类型?3. 相关关系与函数关系的异同点?【小结反思】1. 变量具有不确定性,需要通过收集大量的数据(通过调查或试验)在对数据进行统计分析的基础上,发现其中的规律,才能对它们之间的关系做出正确的判断。
人教A版高中数学必修3《二章统计2.2用样本估计总体阅读与思考生产过程中的质量控制图》优质课教案_4
阅读与思考:生产过程中的质量控制图》教学设计阅读与思考:生产过程中的质量控制图——正态分布[ 教材分析]本节课选自人教A 版必修3第二章“统计”第2.2节“用样本估计总体”课后的“阅读与思考”部分。
在第2.1节通过抽样收集数据之后,第2.2节给出了两种用样本估计总体的方式,一种是用样本的频率分布估计总体的分布,另一种是用样本的数字特征(如平均数、标准差等)估计总体的数字特征。
本节课是在这基础上,结合前面所学的总体密度曲线、平均数和标准差的概念,通过生产过程中的产品质量控制图引出正态分布,利用具体的生活应用介绍正态分布密度曲线的特点以及期望、标准差对整个正态分布的影响。
正态分布无论是在理论上还是应用上都是极其重要的一个分布,将正态分布的这些特点应用到质量控制中,可使学生进一步加强对标准差的认识。
由于正态分布的随机变量是连续型随机变量,这也让学生对随机变量由离散型到连续型有一个初步的认识。
从教材编排上来看,“阅读与思考”内容是对频率分布直方图、标准差认识的深化,是统计知识体系的一种承接和完善,也是后续选修2-3 中第2.4“正态分布”一课的铺垫。
[学情分析]学生在之前章节的学习中,已经掌握如何通过抽样来收集数据,能够画出所收集数据的频率分布直方图、折线图,会根据图表初步分析数据的分布规律,会计算平均数与标准差,这为本节课的探究学习打下了坚实的基础。
但学生仍存在一些知识短板和理解缺口。
其一,本节课学习的正态分布的随机变量是连续型随机变量的分布问题,学生一直以来接触的都是离散型随机变量,这在概念接受与理解上会有一定困难,可以通过信息技术辅助理解;其二,由于学生在此之前还未学习过定积分、随机事件的概率以及二项分布,只在初中接触过简单的概率定义,因而对本节课正态分布的本质理解会显得生涩;其三,正态分布的密度曲线函数较为复杂,学生对抽象且陌生的公式会存在惧怕心理,需要通过一些函数模型及实际应用帮助学生体会其参数的作用。
人教新课标A版必修3第二章《统计》教案
人教新课标A版必修3第二章《统计》教案
人教新课标A版必修3第二章《统计》全部教案
§2.1.1简单随机抽样
教学目标:
1、知识与技能:
(1)正确理解随机抽样的概念,掌握抽签法、随机数表法的一般步骤; 2、过程与方法:
(1)能够从现实生活或其他学科中提出具有一定价值的统计问题;
(2)在解决统计问题的过程中,学会用简单随机抽样的方法从总体中抽取样本。
3、情感态度与价值观:通过对现实生活和其他学科中统计问题的提出,体会数学知识与现实世界及各学科知识之间的联系,认识数学的重要性。
4、重点与难点:正确理解简单随机抽样的概念,掌握抽签法及随机数法的步骤,并能灵活应用相关知识从总体中抽取样本。
教学设想:
假设你作为一名食品卫生工作人员,要对某食品店内的一批小包装饼干进行卫生达标检验,你准备怎样做?
显然,你只能从中抽取一定数量的饼干作为检验的样本。
(为什幺?)那幺,应当怎样获取样本呢?
【探究新知】
一、简单随机抽样的概念
一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把。
[精品]新人教A版必修三高中数学数学人教A版必修3第二章《统计》教案和答案
2. 1.1简单随机抽样一、三维目标:1、知识与技能:正确理解随机抽样的概念,掌握抽签法、随机数表法的一般步骤;2、过程与方法:(1)能够从现实生活或其他学科中提出具有一定价值的统计问题;(2)在解决统计问题的过程中,学会用简单随机抽样的方法从总体中抽取样本。
3、情感态度与价值观:通过对现实生活和其他学科中统计问题的提出,体会数学知识与现实世界及各学科知识之间的联系,认识数学的重要性。
二、重点与难点:正确理解简单随机抽样的概念,掌握抽签法及随机数法的步骤,并能灵活应用相关知识从总体中抽取样本。
三、教学设想:假设你作为一名食品卫生工作人员,要对某食品店内的一批小包装饼干进行卫生达标检验,你准备怎样做?显然,你只能从中抽取一定数量的饼干作为检验的样本。
(为什么?)那么,应当怎样获取样本呢?【探究新知】一、简单随机抽样的概念一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样,这样抽取的样本,叫做简单随机样本。
【说明】简单随机抽样必须具备下列特点:(1)简单随机抽样要求被抽取的样本的总体个数N是有限的。
(2)简单随机样本数n小于等于样本总体的个数N。
(3)简单随机样本是从总体中逐个抽取的。
(4)简单随机抽样是一种不放回的抽样。
(5)简单随机抽样的每个个体入样的可能性均为n/N。
思考?下列抽样的方式是否属于简单随机抽样?为什么?(1)从无限多个个体中抽取50个个体作为样本。
(2)箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出一个零件进行质量检验后,再把它放回箱子。
二、抽签法和随机数法1、抽签法的定义。
一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。
【说明】抽签法的一般步骤:(1)将总体的个体编号。
2017-2018学年高中数学人教A版必修3教学案:复习课二
复习课(二) 统 计样本估计总体或概率问题交汇命题.属于中、低档题.[考点精要]1.简单随机抽样 (1)特征:①一个一个不放回的抽取; ②每个个体被抽到可能性相等. (2)常用方法: ①抽签法; ②随机数表法. 2.系统抽样(1)适用环境:当总体中个数较多时,可用系统抽样.(2)操作步骤:将总体平均分成几个部分,再按照一定方法从每个部分抽取一个个体作为样本.3.分层抽样(1)适用范围:当总体由差异明显的几个部分组成时可用分层抽样.(2)操作步骤:将总体中的个体按不同特点分成层次比较分明的几部分,然后按各部分在总体中所占的比实施抽样.[典例] (1)采用系统抽样方法从960人中抽取32人做问卷调查.为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为( )A .7B .9C .10D .15(2)某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取________所学校,中学中抽取________所学校.[解析] (1)从960人中用系统抽样方法抽取32人,则每30人抽取一人,因为第一组抽到的号码为9,则第二组抽到的号码为39,第n 组抽到的号码为a n =9+30(n -1)=30n -21,由451≤30n -21≤750,得23615≤n ≤25710,所以n =16,17,…,25,共有25-16+1=10人.(2)小学中抽取30×150150+75+25=18所学校;从中学中抽取30×75150+75+25=9所学校.[答案] (1)C (2)18 9 [类题通法] 1.系统抽样的特点(1)适用于元素个数很多且均衡的总体. (2)各个个体被抽到的机会均等.(3)总体分组后,在起始部分抽样时采用的是简单随机抽样. (4)如果总体容量N 能被样本容量n 整除,则抽样间隔为k =Nn .2.与分层抽样有关问题的常见类型及解题策略(1)确定抽样比.可依据各层总数与样本数之比,确定抽样比.(2)求某一层的样本数或总体个数.可依据题意求出抽样比,再由某层总体个数(或样本数)确定该层的样本(或总体)数.(3)求各层的样本数.可依据题意,求出各层的抽样比,再求出各层样本数.[题组训练]1.某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( )A .抽签法B .系统抽样法C .分层抽样法D .随机数法解析:选C 根据年级不同产生差异及按人数比例抽取易知应为分层抽样法. 2.某学校高一、高二、高三3个年级共有430名学生,其中高一年级学生160名,高二年级学生180名,为了解学生身体状况,现采用分层抽样方法进行调查,在抽取的样本中高二学生有32人,则该样本中高三学生人数为________.解析:高三年级学生人数为430-160-180=90,设高三年级抽取x 人,由分层抽样可得32180=x90,解得x =16. 答案:163.某单位有职工960人,其中青年职工420人,中年职工300人,老年职工240人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为14人,则样本容量为________.解析:因为分层抽样的抽样比应相等,所以420960=14样本容量,样本容量=960×14420=32.答案:32率分布直方图的读图问题.[考点精要]1.频率分布直方图2.茎叶图[典例](1)如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5].样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.(2)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].①求图中a的值;②根据频率分布直方图,估计这100名学生语文成绩的平均分;③若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.[数为50×0.18=9.答案:9(2)解:①由频率分布直方图可知(0.04+0.03+0.02+2a)×10=1.所以a=0.005.②该100名学生的语文成绩的平均分约为x=0.05×55+0.4×65+0.3×75+0.2×85+0.05×95=73.③由频率分布直方图及已知的语文成绩、数学成绩分布在各分数段的人数比,可得下表:100-(5+20+40+25)=10.[类题通法]与频率分布直方图有关问题的常见类型及解题策略(1)已知频率分布直方图中的部分数据,求其他数据,可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可求出其他数据.(2)已知频率分布直方图,求某种范围内的数据,可利用图形及某范围结合求解.[题组训练]1.如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为( )A .0.2B .0.4C .0.5D .0.6解析:选B 由茎叶图可知数据落在区间[22,30)内的频数为4,所以数据落在区间[22,30)内的频率为410=0.4,故选B.2.为了了解某学校学生的身体发育情况,抽查了该校100名高中男生的体重情况,根据所得数据画出样本的频率分布直方图如图所示.根据此图,估计该校2 000名高中男生中体重大于70.5公斤的人数为( )A .300B .360C .420D .450解析:选B 样本中体重大于70.5公斤的频率为: (0.04+0.034+0.016)×2=0.090×2=0.18.故可估计该校2 000名高中男生中体重大于70.5公斤的人数为:2 000×0.18=360(人). 3.某商场在庆元宵节促销活动中,对元宵节9时至14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时至12时的销售额为________万元.解析:总销售额为2.50.1=25(万元),故11时至12时的销售额为0.4×25=10(万元).答案:10题型为选择题或填空题,常与直观图、茎叶图等内容相结合命题.[考点精要]有关数据的数字特征[典例] (1)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A .46,45,56B .46,45,53C .47,45,56D .45,47,53(2)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差(3)由正整数组成的一组数据x 1,x 2,x 3,x 4,其平均数和中位数都是2,且标准差等于1,则这组数据为________.(从小到大排列)[解析] (1)从茎叶图中可以看出样本数据的中位数为中间两个数的平均数,即45+472=46,众数为45,极差为68-12=56,故选择A.(2)由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A 错;甲、乙的成绩的中位数分别为6,5,B 错;甲、乙的成绩的方差分别为15×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,15×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=125,C 对;甲、乙的成绩的极差均为4,D 错.故选C. (3)假设这组数据按从小到大的顺序排列为x 1,x 2,x 3,x 4,则⎩⎨⎧x 1+x 2+x 3+x44=2,x 2+x32=2,∴⎩⎪⎨⎪⎧x 1+x 4=4,x 2+x 3=4, 又s = 14[(x 1-2)2+(x 2-2)2+(x 3-2)2+(x 4-2)2] =12(x 1-2)2+(x 2-2)2+(x 3-2)2+(x 4-2)2 =122[(x 1-2)2+(x 2-2)2]=1, ∴(x 1-2)2+(x 2-2)2=2. 同理可求得(x 3-2)2+(x 4-2)2=2.由x 1,x 2,x 3,x 4均为正整数,且(x 1,x 2),(x 3,x 4)均为圆(x -2)2+(y -2)2=2上的点,分析知x 1,x 2,x 3,x 4应为1,1,3,3.[答案] (1)A (2)C (3)1,1,3,3 [类题通法]平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.[题组训练]1.(山东高考)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为( )A .①③B .①④C .②③D .②④解析:选B 法一:∵x 甲=26+28+29+31+315=29,x 乙=28+29+30+31+325=30,∴x 甲<x 乙, 又s 2甲=9+1+0+4+45=185,s 2乙=4+1+0+1+45=2,∴s 甲>s 乙.故可判断结论①④正确.法二:甲地该月14时的气温数据分布在26和31之间,且数据波动较大,而乙地该月14时的气温数据分布在28和32之间,且数据波动较小,可以判断结论①④正确,故选B.2.甲和乙两个城市去年上半年每月的平均气温(单位:℃)用茎叶图记录如图所示,根据茎叶图可知,两城市中平均温度较高的城市是__________,气温波动较大的城市是__________.解析:根据题中所给的茎叶图可知,甲城市上半年的平均温度为9+13+17×2+18+226=16,乙城市上半年的平均温度为12+14+17+20+24+276=19,故两城市中平均温度较高的是乙城市,观察茎叶图可知,甲城市的温度更加集中在峰值附近,故乙城市的温度波动较大.答案:乙 乙3.甲、乙两台机床同时加工直径为100 mm 的零件,为了检验产品的质量,从产品中各随机抽取6件进行测量,测得数据如下(单位:mm):甲:99,100,98,100,100,103; 乙:99,100,102,99,100,100.(1)分别计算上述两组数据的平均数和方差;(2)根据(1)的计算结果,说明哪一台机床加工的这种零件更符合要求. 解:(1)x 甲=99+100+98+100+100+1036=100(mm),x 乙=99+100+102+99+100+1006=100(mm),s 2甲=16[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=73(mm 2), s 2乙=16[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1(mm 2).(2)因为s 2甲>s 2乙,说明甲机床加工零件波动比较大,因此乙机床加工零件更符合要求.查形式为选择题、填空题、解答题,属于中低档题.[考点精要]1.两个变量的线性相关(1)散点图:将样本中n 个数据点(x i ,y i )(i =1,2,…,n )描在平面直角坐标系中得到的图形.(2)正相关与负相关:①正相关:散点图中的点散布在从左下角到右上角的区域. ②负相关:散点图中的点散布在从左上角到右下角的区域. 2.回归直线的方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)线性回归方程:方程y ^=b ^x +a ^是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的线性回归方程,其中a ,b 是待定参数.⎩⎪⎨⎪⎧b ^=∑i =1n (x i -x )(y i -y )∑i =1n (x i-x )2=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a ^=y -b x .[典例] 某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y ^=b ^x +a ^,其中b ^=-20,a ^=y -b ^x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)[解] (1)由于x =16(8+8.2+8.4+8.6+8.8+9)=8.5,y =16(90+84+83+80+75+68)=80.所以a ^=y -b ^x =80+20×8.5=250,从而回归直线方程为y ^=-20x +250. (2)设工厂获得的利润为L 元,依题意得 L =x (-20x +250)-4(-20x +250) =-20x 2+330x -1 000 =-20(x -8.25)2+361.25.当且仅当x =8.25时,L 取得最大值.故当单价定为8.25元时,工厂可获得最大利润. [类题通法](1)线性回归分析就是研究两组变量间线性相关关系的一种方法,通过对统计数据的分析,可以预测可能的结果,这就是线性回归方程的基本应用,因此利用最小二乘法求线性回归方程是关键,必须熟练掌握线性回归方程中两个重要估计量的计算.(2)回归直线方程恒过点(x ,y ).[题组训练]某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10日的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:性回归方程,再用被选取的2组数据进行检验.(1)求选取的2组数据恰好是相邻两个月的概率;(2)若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?解:(1)将6组数据按月份顺序编号为1,2,3,4,5,6,从中任取两组数据,基本事件构成的集合为Ω={(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6)}共15个基本事件,设抽到相邻两个月的事件为A ,则A ={(1,2),(2,3),(3,4),(4,5),(5,6)}共5个基本事件,∴P (A )=515=13. (2)由表中数据求得x =11,y =24,∑i =14x i y i =1 092,∑i =14x 2i =498.代入公式可得b ^=187.再由a ^=y -b ^x ,求得a ^=-307,所以y 关于x 的线性回归方程为 y ^=187x -307.(3)当x =10时,y ^=1507,⎪⎪⎪⎪1507-22=47<2; 同样,当x =6时,y ^=787,⎪⎪⎪⎪787-12=67<2. 所以该小组所得线性回归方程是理想的.1.某全日制大学共有学生5 600人,其中专科生有1 300人、本科生有3 000人、研究生有1 300人,现采用分层抽样的方法抽取280人,调查学生利用因特网查找学习资料的情况,则应在专科生、本科生与研究生这三类学生中分别抽取( )A .65人,150人,65人B .30人,150人,100人C .93人,94人,93人D .80人,120人,80人解析:选A 抽样比为2805 600=120,所以专科生应抽取120×1 300=65(人),本科生应抽取120×3 000=150(人),研究生应抽取120×1 300=65(人),故选A. 2.某学校为调查学生的学习情况,对学生的课堂笔记进行了抽样调查,已知某班级一共有56名学生,根据学号(001~056),用系统抽样的方法抽取一个容量为4的样本,已知007号、021号、049号在样本中,那么样本中还有一个学生的学号为( )A .014B .028C .035D .042解析:选C 由系统抽样的原理知抽样的间隔为564=14,故第一组的学号为001~014,所以007为第一组内抽取的学号,所以第二组抽取的学号为021;第三组抽取的学号为035;第四组抽取的学号为049.故选C.3.如图是2016年某中学举行的校园之星评选活动中,七位评委为某位同学打出的分数的茎叶图,则该组数据的中位数和众数分别为( )A.86,84 B .84,84 C .85,84D .85,93解析:选B 将打分按从小到大的顺序排列为79,84,84,84,86,87,93,则中位数为84,而众数就是出现次数最多的数,即84,故选B.4.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A. 6B. 8C. 12D. 18解析:选C 由题意,第一组和第二组的频率之和为0.24+0.16=0.4,故样本容量为200.4=50,又第三组的频率为0.36,故第三组的人数为50×0.36=18,故该组中有疗效的人数为18-6=12.5.某题的得分情况如下:其中众数是(A .37.0%B .20.2%C .0分D .4分解析:选C 根据众数的概念可知C 正确. 6.观察下列各图:其中两个变量x ,y 具有相关关系的图是( ) A .①② B .①④ C .③④D .②③解析:选C 由散点图知③④具有相关关系.7.某学生在一门功课的22次考试中,所得分数如茎叶图所示,则该学生该门功课考试分数的极差与中位数之和为________.解析:最大数为98,最小数为56,极差为98-56=42,中位数为76,所以极差与中位数之和为118.答案:1188.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x (单位:小时)与当天投篮命中率y 之间的关系:小李这5天的平均投篮命中率为________;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为________.解析:平均命中率y =15×(0.4+0.5+0.6+0.6+0.4)=0.5;而x =3,∑5 i =1x i y i =7.6,∑5i =1x 2i =55,由公式得b ^=0.01,a ^=y -b ^ x =0.5-0.01×3=0.47,∴y ^=0.01x +0.47,令x =6,得y ^=0.53.答案:0.5 0.539.某高中共有学生900人,其中高一年级240人,高二年级260人,为做某项调查,拟采用分层抽样法抽取容量为45的样本,则在高三年级抽取的人数是________.解析:高三的人数为900-240-260=400,所以在高三抽取的人数为45900×400=20.答案:2010.(重庆高考改编)20名学生某次数学考试成绩(单位:分)的频率分布直方图如图:(1)求频率分布直方图中a 的值;(2)分别求出成绩落在[50,60]与[60,70]中的学生人数.解:(1)据直方图知组距为10,由(2a +3a +7a +6a +2a )×10=1,解得a =1200=0.005. (2)成绩落在[50,60)中的学生人数为2×0.005×10×20=2. 成绩落在[60,70)中的学生人数为3×0.005×10×20=3.11.高三某班学生每周用于物理学习的时间x (单位:小时)与物理成绩y (单位:分)之间有如下关系:) 解:由已知可得 x =24+15+23+19+16+11+20+16+17+1310=17.4,y =92+79+97+89+64+47+83+68+71+5910=74.9.设回归直线方程为y =3.53x +a ^, 则74.9=3.53×17.4+a ^, 解得a ^≈13.5.12.为了比较两种治疗失眠症的药(分别称为A 药,B 药)的疗效,随机地选取20位患者服用A 药,20位患者服用B 药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A 药的20位患者日平均增加的睡眠时间: 0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4服用B 药的20位患者日平均增加的睡眠时间: 3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好? (2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?解:(1)设A 药观测数据的平均数为x ,B 药观测数据的平均数y ,由观测结果可得 x =120×(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,y =120×(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6,由以上计算结果可得x >y ,因此可以看出A 药的疗效更好. (2)由观测结果可绘制如下茎叶图从以上茎叶图可以看出,A 药疗效的试验结果有710的叶集中在茎2,3上,B 药疗效的试验结果有710的叶集中在茎0,1上,由此可以看出A 药的疗效更好.。
高中数学 第二章《统计》复习教学设计 新人教A版必修3
[40,50) 2 [50,60) 3 [60,70) 10 [70,80) 15 [80,90) 12 [90,100) 8 合计
50
(2)频率直方图如下:
(3)成绩在[60,90)内的学生比例为74%;
例3 为检查一批钢筋抗拉强度,抽样得到该指标的一个容量为20的样本: 110,120,120,125,125,125,125,130,135,135, 100,115,120,125,125,125,125,130,145,145. (1)计算平均抗拉强度系数和标准差;
(2)估计这批钢筋有多少落入平均数与2倍标准差的X 围内. 解:(1)由题意可得,x =125.25,s=.
(2)落入(2,2)x s x s -+即(104.88, 145.62)X 围内的数据为95%.
例4 一台机器由于使用时间较长,生产的零件有一些会有缺损.按不同转速生产出来的零件有缺损的统计数据如下:
转速x (转/s)
16 14 12 8
每小时生产有缺损零件数y (件) 11 9
8
5
(1)作出散点图;
(2)如果y 与x 线性相关,求线性回归方程;
(3) 如果实际生产中,允许每小时的产品中有缺损的零件最多为10个,那么机器运转速度应控制在什么X 围内?
解: (1)散点图如下:。
高中数学 复习课(二)统计教学案 新人教A版必修3-新人教A版高一必修3数学教学案
复习课(二) 统计抽样方法本估计总体或概率问题交汇命题.属于中、低档题.[考点精要]1.简单随机抽样(1)特征:①一个一个不放回的抽取;②每个个体被抽到可能性相等.(2)常用方法:①抽签法;②随机数表法.2.系统抽样(1)适用环境:当总体中个数较多时,可用系统抽样.(2)操作步骤:将总体平均分成几个部分,再按照一定方法从每个部分抽取一个个体作为样本.3.分层抽样(1)适用范围:当总体由差异明显的几个部分组成时可用分层抽样.(2)操作步骤:将总体中的个体按不同特点分成层次比较分明的几部分,然后按各部分在总体中所占的比实施抽样.[典例] (1)采用系统抽样方法从960人中抽取32人做问卷调查.为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为( )A.7 B.9C.10 D.15(2)某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取________所学校,中学中抽取________所学校.[解析] (1)从960人中用系统抽样方法抽取32人,则每30人抽取一人,因为第一组抽到的号码为9,则第二组抽到的号码为39,第n 组抽到的号码为a n =9+30(n -1)=30n -21,由451≤30n -21≤750,得23615≤n ≤25710,所以n =16,17,…,25,共有25-16+1=10人.(2)小学中抽取30×150150+75+25=18所学校;从中学中抽取30×75150+75+25=9所学校.[答案] (1)C (2)18 9 [类题通法] 1.系统抽样的特点(1)适用于元素个数很多且均衡的总体. (2)各个个体被抽到的机会均等.(3)总体分组后,在起始部分抽样时采用的是简单随机抽样. (4)如果总体容量N 能被样本容量n 整除,则抽样间隔为k =Nn. 2.与分层抽样有关问题的常见类型及解题策略(1)确定抽样比.可依据各层总数与样本数之比,确定抽样比.(2)求某一层的样本数或总体个数.可依据题意求出抽样比,再由某层总体个数(或样本数)确定该层的样本(或总体)数.(3)求各层的样本数.可依据题意,求出各层的抽样比,再求出各层样本数.[题组训练]1.某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( )A .抽签法B .系统抽样法C .分层抽样法D .随机数法解析:选C 根据年级不同产生差异及按人数比例抽取易知应为分层抽样法. 2.某学校高一、高二、高三3个年级共有430名学生,其中高一年级学生160名,高二年级学生180名,为了解学生身体状况,现采用分层抽样方法进行调查,在抽取的样本中高二学生有32人,则该样本中高三学生人数为________.解析:高三年级学生人数为430-160-180=90,设高三年级抽取x 人,由分层抽样可得32180=x90,解得x =16.答案:163.某单位有职工960人,其中青年职工420人,中年职工300人,老年职工240人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为14人,则样本容量为________.解析:因为分层抽样的抽样比应相等,所以420960=14样本容量,样本容量=960×14420=32.答案:32用样本的频率分布估计总体的频率分布分布直方图的读图问题.[考点精要]1.频率分布直方图 2.茎叶图[典例] (1)如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5].样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.(2)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].①求图中a 的值;②根据频率分布直方图,估计这100名学生语文成绩的平均分;③若这100名学生语文成绩某些分数段的人数(x )与数学成绩相应分数段的人数(y )之比如下表所示,求数学成绩在[50,90)之外的人数.分数段[50,60) [60,70) [70,80) [80,90) x ∶y1∶12∶13∶44∶5[个数为50×0.18=9.答案:9(2)解:①由频率分布直方图可知(0.04+0.03+0.02+2a )×10=1. 所以a =0.005.②该100名学生的语文成绩的平均分约为x=0.05×55+0.4×65+0.3×75+0.2×85+0.05×95=73.③由频率分布直方图及已知的语文成绩、数学成绩分布在各分数段的人数比,可得下表:分数段[50,60)[60,70)[70,80)[80,90)x 5403020x∶y 1∶12∶13∶44∶5y 5204025100-(5+20+40+25)=10.[类题通法]与频率分布直方图有关问题的常见类型及解题策略(1)已知频率分布直方图中的部分数据,求其他数据,可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可求出其他数据.(2)已知频率分布直方图,求某种范围内的数据,可利用图形及某范围结合求解.[题组训练]1.如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为( )A.0.2 B.0.4C.0.5 D.0.6解析:选 B 由茎叶图可知数据落在区间[22,30)内的频数为4,所以数据落在区间[22,30)内的频率为410=0.4,故选B.2.为了了解某学校学生的身体发育情况,抽查了该校100名高中男生的体重情况,根据所得数据画出样本的频率分布直方图如图所示.根据此图,估计该校2 000名高中男生中体重大于70.5公斤的人数为( )A.300 B.360C.420 D.450解析:选B 样本中体重大于70.5公斤的频率为:(0.04+0.034+0.016)×2=0.090×2=0.18.故可估计该校2 000名高中男生中体重大于70.5公斤的人数为:2 000×0.18=360(人).3.某商场在庆元宵节促销活动中,对元宵节9时至14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时至12时的销售额为________万元.解析:总销售额为2.50.1=25(万元),故11时至12时的销售额为0.4×25=10(万元).答案:10用样本的数字特征估计总体的数字特征[考点精要] 有关数据的数字特征[典例] (1)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A .46,45,56B .46,45,53C .47,45,56D .45,47,53(2)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差(3)由正整数组成的一组数据x 1,x 2,x 3,x 4,其平均数和中位数都是2,且标准差等于1,则这组数据为________.(从小到大排列)[解析] (1)从茎叶图中可以看出样本数据的中位数为中间两个数的平均数,即45+472=46,众数为45,极差为68-12=56,故选择A.(2)由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A 错;甲、乙的成绩的中位数分别为6,5,B 错;甲、乙的成绩的方差分别为15×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,15×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=125,C 对;甲、乙的成绩的极差均为4,D 错.故选C.(3)假设这组数据按从小到大的顺序排列为x 1,x 2,x 3,x 4,则⎩⎪⎨⎪⎧x 1+x 2+x 3+x44=2,x 2+x32=2,∴⎩⎪⎨⎪⎧x 1+x 4=4,x 2+x 3=4,又s = 14[x 1-22+x 2-22+x 3-22+x 4-22]=12x 1-22+x 2-22+x 3-22+x 4-22=122[x 1-22+x 2-22]=1,∴(x 1-2)2+(x 2-2)2=2. 同理可求得(x 3-2)2+(x 4-2)2=2.由x 1,x 2,x 3,x 4均为正整数,且(x 1,x 2),(x 3,x 4)均为圆(x -2)2+(y -2)2=2上的点,分析知x 1,x 2,x 3,x 4应为1,1,3,3.[答案] (1)A (2)C (3)1,1,3,3 [类题通法]平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.[题组训练]1.(山东高考)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为( ) A .①③ B .①④ C .②③D .②④解析:选B 法一:∵x 甲=26+28+29+31+315=29,x 乙=28+29+30+31+325=30,∴x 甲<x 乙,又s 2甲=9+1+0+4+45=185,s 2乙=4+1+0+1+45=2,∴s 甲>s 乙.故可判断结论①④正确.法二:甲地该月14时的气温数据分布在26和31之间,且数据波动较大,而乙地该月14时的气温数据分布在28和32之间,且数据波动较小,可以判断结论①④正确,故选B.2.甲和乙两个城市去年上半年每月的平均气温(单位:℃)用茎叶图记录如图所示,根据茎叶图可知,两城市中平均温度较高的城市是__________,气温波动较大的城市是__________.解析:根据题中所给的茎叶图可知,甲城市上半年的平均温度为9+13+17×2+18+226=16,乙城市上半年的平均温度为12+14+17+20+24+276=19,故两城市中平均温度较高的是乙城市,观察茎叶图可知,甲城市的温度更加集中在峰值附近,故乙城市的温度波动较大.答案:乙 乙3.甲、乙两台机床同时加工直径为100 mm 的零件,为了检验产品的质量,从产品中各随机抽取6件进行测量,测得数据如下(单位:mm):甲:99,100,98,100,100,103; 乙:99,100,102,99,100,100.(1)分别计算上述两组数据的平均数和方差;(2)根据(1)的计算结果,说明哪一台机床加工的这种零件更符合要求. 解:(1)x 甲=99+100+98+100+100+1036=100(mm),x 乙=99+100+102+99+100+1006=100(mm),s 2甲=16[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=73(mm 2),s 2乙=16[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1(mm 2).(2)因为s 2甲>s 2乙,说明甲机床加工零件波动比较大,因此乙机床加工零件更符合要求.线性回归主要考查线性相关关系的判断,回归方程的求法以及利用回归分析解决实际问题.考查形式为选择题、填空题、解答题,属于中低档题.[考点精要]1.两个变量的线性相关(1)散点图:将样本中n 个数据点(x i ,y i )(i =1,2,…,n )描在平面直角坐标系中得到的图形.(2)正相关与负相关:①正相关:散点图中的点散布在从左下角到右上角的区域. ②负相关:散点图中的点散布在从左上角到右下角的区域. 2.回归直线的方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)线性回归方程:方程y ^=b ^x +a ^是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的线性回归方程,其中a ,b 是待定参数.⎩⎪⎨⎪⎧b ^=∑i =1nx i-x y i-y ∑i =1nx i-x 2=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2,a ^=y -b x .[典例] 某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x (元) 8 8.2 8.4 8.6 8.8 9 销量y (件)908483807568(1)求回归直线方程y =b x +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)[解] (1)由于x =16(8+8.2+8.4+8.6+8.8+9)=8.5,y =16(90+84+83+80+75+68)=80.所以a ^=y -b ^x =80+20×8.5=250,从而回归直线方程为y ^=-20x +250. (2)设工厂获得的利润为L 元,依题意得L =x (-20x +250)-4(-20x +250)=-20x 2+330x -1 000 =-20(x -8.25)2+361.25.当且仅当x =8.25时,L 取得最大值.故当单价定为8.25元时,工厂可获得最大利润. [类题通法](1)线性回归分析就是研究两组变量间线性相关关系的一种方法,通过对统计数据的分析,可以预测可能的结果,这就是线性回归方程的基本应用,因此利用最小二乘法求线性回归方程是关键,必须熟练掌握线性回归方程中两个重要估计量的计算.(2)回归直线方程恒过点(x ,y ).[题组训练]某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10日的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:回归方程,再用被选取的2组数据进行检验.(1)求选取的2组数据恰好是相邻两个月的概率;(2)若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?解:(1)将6组数据按月份顺序编号为1,2,3,4,5,6,从中任取两组数据,基本事件构成的集合为Ω={(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6)}共15个基本事件,设抽到相邻两个月的事件为A ,则A ={(1,2),(2,3),(3,4),(4,5),(5,6)}共5个基本事件,∴P (A )=515=13.(2)由表中数据求得x =11,y =24,∑i =14x i y i =1 092,∑i =14x 2i =498. 代入公式可得b ^=187.再由a ^=y -b ^x ,求得a ^=-307,所以y 关于x 的线性回归方程为 y ^=187x -307.(3)当x =10时,y ^=1507,⎪⎪⎪⎪⎪⎪1507-22=47<2;同样,当x =6时,y ^=787,⎪⎪⎪⎪⎪⎪787-12=67<2.所以该小组所得线性回归方程是理想的.1.某全日制大学共有学生5 600人,其中专科生有1 300人、本科生有3 000人、研究生有1 300人,现采用分层抽样的方法抽取280人,调查学生利用因特网查找学习资料的情况,则应在专科生、本科生与研究生这三类学生中分别抽取( )A .65人,150人,65人B .30人,150人,100人C .93人,94人,93人D .80人,120人,80人解析:选A 抽样比为2805 600=120,所以专科生应抽取120×1 300=65(人),本科生应抽取120×3 000=150(人),研究生应抽取120×1 300=65(人),故选A. 2.某学校为调查学生的学习情况,对学生的课堂笔记进行了抽样调查,已知某班级一共有56名学生,根据学号(001~056),用系统抽样的方法抽取一个容量为4的样本,已知007号、021号、049号在样本中,那么样本中还有一个学生的学号为( )A .014B .028C .035D .042解析:选C 由系统抽样的原理知抽样的间隔为564=14,故第一组的学号为001~014,所以007为第一组内抽取的学号,所以第二组抽取的学号为021;第三组抽取的学号为035;第四组抽取的学号为049.故选C.3.如图是2016年某中学举行的校园之星评选活动中,七位评委为某位同学打出的分数的茎叶图,则该组数据的中位数和众数分别为( )A.86,84 B .84,84 C .85,84D .85,93解析:选B 将打分按从小到大的顺序排列为79,84,84,84,86,87,93,则中位数为84,而众数就是出现次数最多的数,即84,故选B.4.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A. 6B. 8C. 12D. 18解析:选C 由题意,第一组和第二组的频率之和为0.24+0.16=0.4,故样本容量为200.4=50,又第三组的频率为0.36,故第三组的人数为50×0.36=18,故该组中有疗效的人数为18-6=12.5.某题的得分情况如下:其中众数是(A .37.0%B .20.2%C .0分D .4分解析:选C 根据众数的概念可知C 正确. 6.观察下列各图:其中两个变量x ,y 具有相关关系的图是( ) A .①② B .①④ C .③④D .②③解析:选C 由散点图知③④具有相关关系.7.某学生在一门功课的22次考试中,所得分数如茎叶图所示,则该学生该门功课考试分数的极差与中位数之和为________.解析:最大数为98,最小数为56,极差为98-56=42,中位数为76,所以极差与中位数之和为118.答案:1188.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x (单位:小时)与当天投篮命中率y 之间的关系:小李这56号打6小时篮球的投篮命中率为________.解析:平均命中率y =15×(0.4+0.5+0.6+0.6+0.4)=0.5;而x =3,∑5i =1x i y i =7.6,∑5i =1x 2i =55,由公式得b ^=0.01,a ^=y -b ^ x =0.5-0.01×3=0.47,∴y ^=0.01x +0.47,令x =6,得y ^=0.53.答案:0.5 0.539.某高中共有学生900人,其中高一年级240人,高二年级260人,为做某项调查,拟采用分层抽样法抽取容量为45的样本,则在高三年级抽取的人数是________.解析:高三的人数为900-240-260=400,所以在高三抽取的人数为45900×400=20.答案:2010.(重庆高考改编)20名学生某次数学考试成绩(单位:分)的频率分布直方图如图: (1)求频率分布直方图中a 的值;(2)分别求出成绩落在[50,60]与[60,70]中的学生人数.解:(1)据直方图知组距为10,由(2a +3a +7a +6a +2a )×10=1,解得a =1200=0.005. (2)成绩落在[50,60)中的学生人数为2×0.005×10×20=2. 成绩落在[60,70)中的学生人数为3×0.005×10×20=3.11.高三某班学生每周用于物理学习的时间x (单位:小时)与物理成绩y (单位:分)之间有如下关系:) 解:由已知可得x =24+15+23+19+16+11+20+16+17+1310=17.4,y =92+79+97+89+64+47+83+68+71+5910=74.9.设回归直线方程为y =3.53x +a ^, 则74.9=3.53×17.4+a ^, 解得a ^≈13.5.12.为了比较两种治疗失眠症的药(分别称为A 药,B 药)的疗效,随机地选取20位患者服用A 药,20位患者服用B 药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A 药的20位患者日平均增加的睡眠时间: 0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4 服用B 药的20位患者日平均增加的睡眠时间: 3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好? (2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?解:(1)设A 药观测数据的平均数为x ,B 药观测数据的平均数y ,由观测结果可得x=120×(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,y=120×(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6,由以上计算结果可得x>y,因此可以看出A药的疗效更好.(2)由观测结果可绘制如下茎叶图从以上茎叶图可以看出,A药疗效的试验结果有710的叶集中在茎2,3上,B药疗效的试验结果有710的叶集中在茎0,1上,由此可以看出A药的疗效更好.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(1)列出样本频率分布表(含累积频率);
(2)画出频率分布直方图;
(3)估计成绩在[60,90)内学生的频率;
(2)系统抽样法:将160人从1~160编上号,按编号顺序平均分成20组(1~8号,9~16号...,153~160号),先从第一组中用抽签法抽出第 号( ),其余组的 号( )亦被抽样,即得20人的一个样本.
(3)分层抽样法:按20:160=1:8的比例,从业务人员、管理人员、后勤服务人员中分别用抽签的方式依次抽取12人、5人、3人,把他们合在一起得到20人的一个样本.
《统计》复习教学设计
【自学评价】
1.为了保证分层抽样时,每个个体等可能抽取,必须(D)
A.每层的个体数相等
B.每层中抽的个体数相等
C.不同的层中,每个个体被抽到的可能性不相等
D.每层等可能抽取的样本个数可能一样,也可能不一样,但每层被抽取的个体数与这一层中个体数的比等于样本容量与总体个数的比
2.一个容量为20的样本数据,分组后组据与频数如下:
【精典范例】
例1某单位有职工160人,其中业务人员96人,管理人员40人,后勤服务人员24人,为了了解职工的某种情况,要从中抽取一个容量为20的样本.试用三种方法分别解答.
解:(1)随机抽样法:将160人从1~160编上号,并用相同质量的材料制成160个大小完全相同的签,放进箱中搅拌,然后从中抽20个签,与签号相同的20人被选出即中.
A. 116.5与13.3%B. 120.5与10%
C. 120.5与13.3%D. 126.5与10%
所以 ,
. .
(3)令 ,得 ,故机器运转速度控制在15转/s范围内.
【追踪训练】
1.把一个容量为100的样本分成若干组,已知某组的频率为0.3,那么该组的频数为_____30___
2.经问卷调查,某班学生对摄影分别执“喜欢”、“不喜欢”和“一般”三种态度,其中执“一般”态度的比“不喜欢”态度的多 人,按分层抽样方法从全班选出部分学生座谈摄影,如果选出的 位“喜欢”摄影的同学、 位“不喜欢”摄影的同学和 位执“一般”态度的同学,那么全班学生中“喜欢”摄影的比全班人数的一半还多3人.
解:(1)频率分布0,50)
2
0.04
0.04
[50,60)
3
0.06
0.10
[60,70)
10
0.20
0.30
[70,80)
15
0.30
0.60
[80,90)
12
0.24
0.84
[90,100)
8
0.16
1.00
合计
50
1.00
(2)频率直方图如下:
(3)成绩在[60,90)内的学生比例为74%;
转速 (转/s)
16
14
12
8
每小时生产有缺损零件数 (件)
11
9
8
5
(1)作出散点图;
(2)如果 与 线性相关,求线性回归方程;
(3)如果实际生产中,允许每小时的产品中有缺损的零件最多为10个,那么机器运转速度应控制在什么范围内?
解:(1)散点图如下:
(2)设线性回归方程为 .由题意可得 , , , , .
(提示: 位执“一般”对应 位“不喜欢”,即“一般”是“不喜欢”的 倍,而他们的差为 人,即“一般”有 人,“不喜欢”的有 人,且“喜欢”是“不喜欢”的 倍,即 人,全班有 人, )
10
11
12
13
78
0234
3.已知某工厂工人某天加工的零件个数的茎叶图如右图所示,(以零件个数的前两位为茎,后一位为叶),那么工人生产零件的平均个数及生产的零件个数超过130的比例分别是(B)
[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70),2.则样本在区间 上的频率为(D)
A.5% B.25%C.50%D.70%
3.对甲、乙两所学校2005年的高考数学成绩进行统计分析,得到的样本的平均分为 , ,样本的方差为 , ,由此可知两校考生中成绩较为均衡的是甲校.
例3为检查一批钢筋抗拉强度,抽样得到该指标的一个容量为20的样本:
(1)计算平均抗拉强度系数和标准差;
(2)估计这批钢筋有多少落入平均数与2倍标准差的范围内.
解:(1)由题意可得, =125.25,s=10.182.
(2)落入 即(104.88, 145.62)范围内的数据为95%.
例4一台机器由于使用时间较长,生产的零件有一些会有缺损.按不同转速生产出来的零件有缺损的统计数据如下: