高中数学必修3复习统计的讲义与习题含答案及详细解答过程

合集下载

(完整)高一数学必修三《统计》知识点+练习+答案,推荐文档

(完整)高一数学必修三《统计》知识点+练习+答案,推荐文档

必修三统计知识点二、统计初步有关概念和公式:1、频数——落在各个小组的数据的个数叫~。

2、频率——每一个小组频数与数据的比值叫做这一组的~。

3、总体——所要考察对象的全体叫做~。

4、个体——每一个考察对象~。

5、样本——从总体中所抽取的一部分个体叫做总体的一个样本。

6、样本容量——样本中个体的数目叫做~。

7、众数——在一组数据中,出现次数最多的数据叫做这组数据的众数。

8、中位数——将一组数据按从小到大排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数。

9、总体分布——总体取值的概率分布规律通常称为~。

10、连续型总体——可以在实数区间取值的总体叫~。

11、累积频率——样本数据小于某一数值的频率,叫做~。

计算最大值与最小值的差决定组距与数据列法决定分点列表12、频率分布表试验结果频数频率表的行式分组个数累计频数频率累积频率(有时可省略)(有时可省略)横轴——实验结果纵轴频率条形图用高度表示各取值的频率适用于个体取不同值较少横轴——产品尺寸纵轴——频率/组距13、直方图用图形面积的大小表示在各个区间内取值的概率适用于个体在区间内取值横轴——产品尺寸累积频率分布图纵轴——累计频率反映一组数据的分布情况14、总体分布曲线——当样本容量无限增大、分组的组距无缩限小时、频率分布直方图就会无限趋近于一条光滑曲线,这条曲线叫总体密度曲线。

以这条曲线为图象的函数叫做总体的概率密度函数。

总体密度函数反映了总体分布,即反映总体在各个范围内取值的概率。

P(a<ξ<b)的值等于直线 x=a,x=b 与曲线、x 轴围成的图形面积。

15、累积分布曲线——当样本容量无限增大、分组的组距无缩限小时,累积频率分布图就会无限趋近于一条光滑曲线,这条曲线叫累积分布曲线。

它反映了总体的累积分布规律,即曲线上任意一点 P(a,b)纵坐标 b,表示总体取小于 a 的值的概率。

1①正态总体的概率密度函数f(x)-(x - )22 2, ∈R(其中 总体的平均数, 总体的标准差,N(μ,σ2)—正态总体,有时记作 N(μ,σ2)1)曲线在轴上方,并且关于直线 x=对称:②正态曲线的性质2)曲线在x=μ时处于最高点,由这一点向左、右两边延伸时,曲线逐渐下降:3)曲线的对称轴位置由μ确定:直线的形状由σ确定,σ越大,曲线的形状越“矮胖”反过来曲线越“高瘦”③正态曲线在几个区间上的取值:区间取值概率(μ-σ,μ+σ)68.3%(μ-2σ,μ+2σ)95.44%(μ-3σ,μ+3σ)99.7%16、质控图④小概率事件——通常指发生的概率小于5%的事件。

苏教版高中数学必修3第2章 统计 全章复习讲义(含答案解析)

苏教版高中数学必修3第2章 统计 全章复习讲义(含答案解析)

【知识梳理】知识点一:抽样方法从调查的对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此对调查对象的某项指标做出推断,这就是抽样调查.调查对象的全体称为总体,被抽取的一部分称为样本.1.简单的随机抽样简单随机抽样的概念:设一个总体的个体数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.①用简单随机抽样从含有N个个体的总体中抽取一个容量为n的样本时,每次抽取一个个体时,任一个体被抽到的概率为1N ;在整个抽样过程中各个个体被抽到的概率为nN;②简单随机抽样的特点是:不放回抽样,逐个地进行抽取,各个个体被抽到的概率相等;③简单随机抽样方法体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础.简单抽样常用方法:①抽签法:先将总体中的所有个体(共有N个)编号(号码可从1到N),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n次,就得到一个容量为n的样本.适用范围:总体的个体数不多.优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法.②随机数表法:随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码.【解析】由题意可得1011910,5x y ++++=22222(10)(10)(1010)(1110)(910)25x y -+-+-+-+-=,解得12,8.||4x y x y ==-=,故选D .例3. 对某电子元件进行寿命追踪调查,情况如下:寿命(h ) 100~200 200~300300~400400~500500~600个 数2030804030(1)列出频率分布表;(2)画出频率分布直方图和累积频率分布图; (3)估计电子元件寿命在100~400 h 以内的概率; (4)估计电子元件寿命在400 h 以上的概率.【思路点拨】 通过本题可掌握总体分布估计的各种方法和步骤. 【解析】(1)频率分布表如下:寿命(h ) 频 数 频 率 累积频率 100~200 20 0.10 0.10 200~300 30 0.15 0.25 300~400 80 0.40 0.65 400~500 40 0.20 0.85 500~600 30 0.15 1 合 计2001(2)频率分布直方图如下:(3)由累积频率分布图可以看出,寿命在100~400 h内的电子元件出现的频率为0.65,所以我们估计电子元件寿命在100~400 h内的概率为0.65.(4)由频率分布表可知,寿命在400 h以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400 h以上的概率为0.35.【总结升华】画频率分布条形图、直方图时要注意纵、横坐标轴的意义.举一反三:【变式1】为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg) ,得到频率分布直方图如下:根据上图可得这100名学生中体重在〔56.5,64.5〕的学生人数是()(A)20 (B)30 (C)40 (D)50【答案】C;【解析】根据运算的算式:体重在〔56.5,64.5〕学生的累积频率为2×0.03+2×0.05+2×0.05+2×0.07=0.4,则体重在〔56.5,64.5〕学生的人数为0.4×100=40.【变式2】某班学生在一次数学考试中成绩分布如下表:分数段[0,80)[80,90)[90,100)人数 2 5 6)分数段[100,110)[110,120 [120,130)人数8 12 6分数段[130,140)[140,150)人数 4 2那么分数在[100,110)中的频率和分数不满110分的累积频率分别是_______、_______(精确到0.01). 【答案】0.18 0.47【解析】由频率计算方法知:总人数=45.分数在[100,110)中的频率为458=0.178≈0.18. 分数不满110分的累积频率为458652+++=4521≈0.47【变式3】为检测某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品为13件,次品4件 (1)列出样本频率分布表;(2)画出表示样本频率分布的条形图;(3)根据上述结果,估计商品为二级品或三级品的概率约是多少? 【解析】(1)样本的频率分布表为产品频数频率 一级品 5 0.17 二级品 8 0.27 三级品 13 0.43 次品40.13(2)样本频率分布的条形图为:(3)此种产品为二级品或三级品的概率约为0.27+0.43=0.7.例4.甲、乙两小组各10名学生的英语口语测试成绩如下:(单位:分) 甲组 76 90 84 86 81 87 86 82 85 83 乙组 82 84 85 89 79 80 91 89 79 74 用茎叶图表示两小组的成绩,并判断哪个小组的成绩更整齐一些?【思路点拨】学会用茎叶图表示数据的方法;并会进行统计推断.【解析】用茎叶图表示两小组的成绩如图:由图可知甲组成绩较集中,即甲组成绩更整齐一些.【总结升华】对各数据是二、三位数,且数据量不是很大时,用茎叶图表示较为方便,也便于进行统计推断,否则,应改用其他方法.举一反三:【变式1】甲、乙两个学习小组各有10名同学,他们在一次数学测验中成绩的茎叶图如图所示,则他们在这次测验中成绩较好的是组.【答案】甲小组类型三:变量的相关性和回归分析例5.某产品的广告支出x(单位:万元)与销售收入y(单位:万元)之间有下表所对应的数据:广告支出x(单位:万元) 1 2 3 4销售收入y(单位:万元)12 28 42 56(1) 画出表中数据的散点图;(2)求出y对x的回归直线方程;(3)若广告费为9万元,则销售收入约为多少万元?【解析】(1)作出的散点图如下图所示(2)观测散点图可知各点大致分布在一条直线附近,由此可知散点图大致表现为线性相关.列出下表:序号 x y X 2xy 1 1 12 1 12 2 2 28 4 56 3 3 42 9 126 44 56 16 224 ∑1013830418易得569,22x y ==所以 414222156944184732255304()42i ii ii x y xyb xx ==--⨯⨯===-⨯-∑∑ 697352252a y bx =-=-⨯=- 故y 对x 的回归直线方程为73ˆ25yx =- (3)当x=9时, 73ˆ92129.45y=⨯-= 012 3 4x(万元)Y(万元)1020 30 40 50 60 .. . .08.0423.15=⨯-=-=bx y a .∴线性回归方程为:08.023.1^+=+=x a bx y .(2)当x=10时,38.1208.01023.1^=+⨯=y (万元) 即估计使用10年时维修费用是12.38万元.【变式2】一个工厂在某年里每月产品的总成本y (万元)与该月产量x (万件)之间有如下一组数据:x 1.08 1.12 1.19 1.28 1.36 1.48 y 2.25 2.37 2.40 2.55 2.64 2.75 x 1.59 1.68 1.80 1.87 1.98 2.07 y 2.92 3.03 3.14 3.26 3.36 3.50(1)画出散点图;(2)求月总成本y 与月产量x 之间的回归直线方程. 【解析】(1)画出散点图:(2)设回归直线方程a bx y+=ˆ, 利用计算a ,b ,得b ≈1.215, 974.0ˆ≈-=+=x b y a bx y,从中抽取一个容量为100的样本,较为恰当的抽样方法是( )A.简单随机抽样B.系统抽样C.分层抽样D.以上三种均可3. 从N 个编号中抽取n 个号码入样,若采用系统抽样方法进行抽取,则分段间隔应为( ) A .n N B .n C .⎥⎦⎤⎢⎣⎡n N D.1+⎥⎦⎤⎢⎣⎡n N 4.下列说法错误的是 ( )A .在统计里,把所需考察对象的全体叫做总体B .一组数据的平均数一定大于这组数据中的每个数据C .平均数、众数与中位数从不同的角度描述了一组数据的集中趋势D .一组数据的方差越大,说明这组数据的波动越大5.要从已编号(160:)的60枚最新研制的某型导弹中随机抽取6枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的6枚导弹的编号可能是( )A .5,10,15,20,25,30B .3,13,23,33,43,53C .1,2,3,4,5,6D .2,4,8,16,32,486. 某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间为( ) A.0.6 h B.0.9 h C.1.0 h D.1.5 h7.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;……;第六组,成绩大于等于18秒且小于等于19秒.下图是按上述分组方法得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为x ,成绩大于等于15秒且小于17秒的学生人数为y ,则从频率分布直方图中可分析出x 和y 分别为( )A .0.9,35B .0.9,45C .0.1,35D .0.1,458.根据某水文观测点的历史统计数据,得到某条河流水位的频率分布直方图(如图).从图中可以看出,该水文观测点平均至少一百年才遇到一次的洪水的最低水位是( ) A .48米B .49米C .50米D .51米9.用系统抽样法要从160名学生抽取容量为20的样本,将160名学生从1~160编号.按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组应抽出的号码为126,则第一组中抽签方法确定的号码是________.10.从一堆苹果中任取了20只,并得到它们的质量(单位:克)数据分布表如下:分组 [)90100, [)100110, [)110120, [)120130, [)130140, [)140150, 频数1231031则这堆苹果中,质量不小于...120克的苹果数约占苹果总数的 %.11.某校有学生2000人,其中高三学生500人,为了解学生的身体素质情况,采用按年级分层抽样的方法,从该校学生中抽取一个200人的样本,则样本中高三学生的人数为 . 12.甲,乙两人在相同条件下练习射击,每人打5发子弹,命中环数如下甲 6 8 9 9 8乙 10 7 7 7 9则两人射击成绩的稳定程度是__________________.13.为了了解初三学生女生身高情况,某中学对初三女生身高进行了一次测量,所得数据整理后列出了频率分布表如下:组别频数频率145.5~149.5 1 0.02149.5~153.5 4 0.08153.5~157.5 20 0.40157.5~161.5 15 0.30161.5~165.5 8 0.16165.5~169.5 m n合计M Nm n M N所表示的数分别是多少?(1)求出表中,,,(2)画出频率分布直方图.(3)全体女生中身高在哪组范围内的人数最多?14.从两个班中各随机的抽取10名学生,他们的数学成绩如下:甲班76 74 82 96 66 76 78 72 52 68乙班86 84 62 76 78 92 82 74 88 85画出茎叶图并分析两个班学生的数学学习情况.15.对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:问:甲、乙谁的平均成绩最好?谁的各门功课发展较平衡?16.以下是某地搜集到的新房屋的销售价格y 和房屋的面积x 的数据:(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线; (3)据(2)的结果估计当房屋面积为2150m 时的销售价格.【答案与解析】1.【答案】B 【解析】∵n40=0.125,∴n=320.故选B. 2. 【答案】C 3. 【答案】C 【解析】剔除零头 4. 【答案】B【解析】平均数不大于最大值,不小于最小值 5. 【答案】B 【解析】60106=,间隔应为10 6. 【答案】B 【解析】505.020)5.11(1025⨯++⨯+⨯=0.9.7.【答案】A【解析】由图知,成绩小于17秒的学生人数占全班总人数的频率为0.020.180.360.340.9+++=, 所以0.9x =;成绩大于等于15秒且小于17秒的的频率为0.360.340.7+=,104416461451222222=++++=)(甲s 5627313751222222=++++=)(乙s ∵ 22乙甲乙甲,s s x x >>∴ 甲的平均成绩较好,乙的各门功课发展较平衡16.【解析】(1)数据对应的散点图如图所示:(2)1095151==∑=i i x x ,1570)(251=-=∑=x x l i i xx , 308))((,2.2351=--==∑=y y x x l y i i i xy设所求回归直线方程为a bx y +=), 则1962.01570308≈==xx xyl l b 8166.115703081092.23≈⨯-=-=x b y a 故所求回归直线方程为8166.11962.0+=x y )(3)据(2),当2150x m =时,销售价格的估计值为: 2466.318166.11501962.0=+⨯=y )(万元)。

数学北师大版必修3教案:第一章统计 Word版含解析

数学北师大版必修3教案:第一章统计 Word版含解析

本章复习整体设计教学分析本节是对第一章知识和方法的归纳和总结,从总体上把握本章,使学生的基本知识系统化和网络化,基本方法条理化,本章内容是相互独立的,随机抽样是基础,在此基础上学习了用样本估计总体和变量间的相关关系,要注意它们的联系.本章介绍了从总体中抽取样本的常用方法,并通过实例,研究了如何利用样本对总体的分布规律、整体水平、稳定程度及相关关系等特性进行估计和预测.当总体容量大或检测具有一定的破坏性时,可以从总体中抽取适当的样本,通过对样本的分析、研究,得到对总体的估计,这就是统计分析的基本过程.而用样本估计总体就是统计思想的本质.要准确估计总体,必须合理地选择样本,我们学习的是最常用的三种抽样方法.获取样本数据后,将其用频率分布表、频率分布直方图、频率折线图或茎叶图表示后,蕴涵于数据之中的规律得到直观的揭示.运用样本的平均数可以对总体水平作出估计,用样本的极差、方差(标准差)可以估计总体的稳定程度.对两个变量的样本数据进行相关性分析,可发现存在于现实世界中的回归现象.用最小二乘法研究回归现象,得到的线性回归方程可用于预测和估计,为决策提供依据.总之,统计的基本思想是从样本数据中发现统计规律,实现对总体的估计.三维目标1.会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题;2.能通过对数据的分析,为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异.重点难点教学重点:会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.教学难点:能通过对数据的分析,为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异.课时安排1课时教学过程导入新课为了系统地掌握本章知识,我们复习本章内容,教师直接点出课题.推进新课新知探究提出问题1.随机抽样的内容包括几部分?2.用样本估计总体包括几部分?3.变量间的相关关系包括几部分?活动:学生思考或交流,回顾所学,教师指导学生复习的思路和方法,及时总结提炼.讨论结果:1.随机抽样的内容包括三部分:(1)简单随机抽样抽签法:一般地,用抽签法从个体个数为N的总体中抽取一个容量为k的样本的步骤为:将总体中的所有个体编号(号码可以从1到N);将1到N这N个号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作).将号签放在同一箱中,并搅拌均匀;从箱中每次抽出1个号签,并记录其编号,连续抽取k次;从总体中将与抽到的签的编号相一致的个体取出.抽样具有公平性原则:等概率、随机性;抽签法适用于总体中个数N不大的情形.随机数表法:将总体中的N个个体编号时可以从0开始,例如当N=100时,编号可以是00,01,02, …,99.这样,总体中的所有个体均可用两位数字号码表示,便于使用随机数表.当随机地选定开始的数后,读数的方向可以向右,也可以向左、向上、向下等.由此可见,用随机数表法抽取样本的步骤是:对总体中的个体进行编号(每个号码位数一致);在随机数表中任选一个数作为开始;从选定的数开始按一定的方向读下去,得到数码.若不在编号中,则跳过;若在编号中,则取出;如果得到的号码前面已经取出,也跳过;如此继续下去,直到取满为止;根据选定的号码抽取样本.(2)系统抽样系统抽样的步骤为:采用随机的方式将总体中的个体编号;将整个的编号按一定的间隔(设为k )分段,当N n (N 为总体中的个体数,n 为样本容量)是整数时,k = N n ;当N n 不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数N ′能被n 整除,这时k = N ′n,并将剩下的总体重新编号;在第一段中用简单随机抽样确定起始的个体编号1 ;将编号为1,1+k ,1+2k ,…,1+(n -1)k 的个体抽出.(3)分层抽样例:某电视台在互联网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为应怎样进行抽样?分析:因为总体中人数较多,所以不宜采用简单随机抽样.又由于持不同态度的人数差异较大,故也不宜用系统抽样方法,而以分层抽样为妥.解:可用分层抽样方法,其总体容量为12 000.“很喜爱”占2 43512 000=4872 400,应取60×4872 400≈12人; “喜爱”占4 56712 000,应取60×4 56712 000≈23人; “一般”占3 92612 000,应取60×3 92512 000≈20人; “不喜爱”占1 07212 000,应取60×1 07212 000≈5人. 因此,采用分层抽样的方法在“很喜爱”“喜爱”“一般”和“不喜爱”的2 435人、4 567人、3 926人和1 072人中分别抽取12人、23人、20人和5人.一般地,当总体由差异明显的几个部分组成时,为了使样本更客观地反映总体情况,我们常常将总体中的个体按不同的特点分成层次比较分明的几部分,然后按各部分在总体中所占的比实施抽样,这种抽样方法叫分层抽样,其中所分成的各个部分称为“层”.分层抽样的步骤是:将总体按一定标准分层;计算各层的个体数与总体的个体数的比;按各层个体数占总体的个体数的比确定各层应抽取的样本容量;在每一层进行抽样(可用简单随机抽样或系统抽样).适用于总体中个体有明显的层次差异,层次分明的特点;总体中个体数 N 较大时,系统抽样、分层抽样二者选其一.2.用样本估计总体包括:(1)用样本的频率分布估计总体分布.频率分布是指一个样本数据在各个小范围内所占比例的大小;一般用频率分布直方图反映样本的频率分布.其一般步骤为:计算一组数据中最大值与最小值的差,即求极差;决定组距与组数;将数据分组;列频率分布表;画频率分布直方图.频率分布直方图的特征:通过频率分布直方图可以清楚地看出数据分布的总体趋势;通过频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.茎叶图.画茎叶图的步骤如下:①将每个数据分为茎(高位)和叶(低位)两部分;②将最小茎和最大茎之间的数按大小次序排成一列,写在左(右)侧;③将各个数据的叶按大小次序写在其茎右(左)侧.用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两组以上的数据虽然能够记录,但是没有表示两组记录那么直观、清晰.(2)用样本的数字特征估计总体的数字特征.①众数、中位数、平均数以及利用频率分布直方图来估计众数、中位数、平均数. 利用频率分布直方图估计众数、中位数、平均数:估计众数:频率分布直方图面积最大的方条的横轴中点数字(最高矩形的中点). 估计中位数:中位数把频率分布直方图分成左右两边面积相等.估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. 总之,众数、中位数、平均数都是对数据中心位置的描述,可以作为总体相应特征的估计.样本众数易计算,但只能表达样本数据中的很少一部分信息,不一定唯一;中位数仅利用了数据中排在中间数据的信息,与数据的排列位置有关;平均数受样本中的每一个数据的影响,绝对值越大的数据,对平均数的影响也越大.三者相比,平均数代表了数据更多的信息,描述了数据的平均水平,是一组数据的“重心”.②标准差考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用s 表示. 所谓“平均距离”,其含义可作如下理解: 假设样本数据是x 1,x 2,…,x n ,x 表示这组数据的平均数,x i 到x 的距离是|x i -x |(i =1,2,…,n ).于是,样本数据x 1,x 2,…,x n 到x 的“平均距离”是s =|x 1-x |+|x 2-x |+…+|x n -x |n. 由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差s =1n[x 1-x 2+x 2-x 2+…+x n -x 2]. ③方差从数学的角度考虑,人们有时用标准差的平方s 2(即方差)来代替标准差,作为测量样本数据分散程度的工具:s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差.3.变量间的相关关系包括:(1)变量之间的相关关系相关关系的概念:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫作相关关系.两个变量之间的关系分两类:①确定性的函数关系,例如我们以前学习过的一次函数、二次函数等;②带有随机性的变量间的相关关系,例如“身高者,体重也重”,我们就说身高与体重这两个变量具有相关关系.相关关系是一种非确定性关系.(2)两个变量的线性相关①散点图的概念:将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫作散点图.②正相关与负相关的概念:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.(注:散点图的点如果几乎没有什么规则,则这两个变量之间不具有相关关系)③线性相关关系:像能用直线方程y =a +bx 近似表示的相关关系叫作线性相关关系.④线性回归方程:1122n n =a +bx 为拟合这n 对数据的线性回归方程,该方程所表示的直线称为回归直线.上述式子展开后,是一个关于a ,b 的二次多项式,应用配方法,可求出使Q 为最小值时的a ,b 的值,即⎩⎪⎨⎪⎧ b =x 1y 1+x 2y 2+…+x n y n -n x y x 21+x 22+…+x 2n -n x 2,a =y -b x .其中,x =x 1+x 2+…+x n n ,y =y 1+y 2+…+y n n. 应用示例思路11 为了了解高一(1)班50名学生的视力状况,从中抽取10名学生进行检查.如何抽取呢?解法一:通常使用抽签法,方法是:将50名学生从1到50进行编号,再制作1到50的50个号签,把50个号签集中在一起并充分搅匀,最后随机地从中抽10个号签.对编号与抽中的号签的号码相一致的学生进行视力检查.解法二:下面我们用随机数表法求解上面的问题.对50个同学进行编号,编号分别为01,02,03,…,50;在随机数表中随机地确定一个数作为开始,如从下表第3行第29列的数7开始.16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64 84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76 63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54 57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28 从数7开始向右读下去,每次读两位,凡不在01到50中的数跳过去不读,遇到已经读过的数也跳过去,便可依次得到12,07,44,39,38,33,21,34,29,42,这10个号码,就是所要抽取的10个样本个体的号码.变式训练某学校有行政人员、教学人员和教辅人员共200人,其中教学人员与教辅人员的比为10∶1,行政人员有24人.①现采取分层抽样抽取容量为50的样本,那么行政人员中应抽取的人数为( ).A .3B .4C .6D .8②教学人员和教辅人员中应抽取的人数分别为________和________.答案:①C ②40 4例2 下列问题中,采用怎样的抽样方法较为合理?(1)从10台冰箱中抽取3台进行质量检查.(2)某电影院有32排座位,每排有40个座位,座位号为1~40.有一次报告会坐满了听众,报告会结束以后为听取意见,需留下32名听众进行座谈.(3)某学校有160名教职工,其中教师120名,行政人员16名,后勤人员24名.为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本.解:(1)总体容量比较小,用抽签法或随机数表法都很方便.(2)总体容量比较大,用抽签法或随机数表法比较麻烦,由于人员没有明显差异,且刚好32排,每排人数相同,可用系统抽样法.(3)由于学校各类人员对这一问题的看法可能差异较大,故应采用分层抽样法.变式训练要从已编号(1~60)的60枚最新研制的某种导弹中随机抽取6枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的6枚导弹的编号可能是( ).A.5,10,15,20,25,30 B.3,13,23,33,43,53C.1,2,3,4,5,6 D.2,8,14,20,26,32答案:B例3 某单位在岗职工共624人,为了调查职工用于上班途中的时间,决定抽取10%的职工进行调查.如何采用系统抽样方法完成这一抽样?解:第一步:将624名职工用随机方式进行编号;第二步:从总体中剔除4人(剔除方法可用随机数表法),将剩下的620名职工重新编号(分别为000,001,002,…,619),并分成62段;第三步:在第一段000,001,002,…,009这十个编号中用简单随机抽样确定起始号码i0;第四步:将编号为i0,i0+10,i0+20, …,i0+610的个体抽出,组成样本.变式训练现有以下两项调查:①某装订厂平均每小时大约装订图书362册,要求检验员每小时抽取40册图书,检查其装订质量状况;②某市有大型、中型与小型的商店共1 500家,三者数量之比为1∶5∶9.为了调查全市商店每日零售额情况,抽取其中15家进行调查.完成①②这两项调查宜采用的抽样方法依次是( ).A.简单随机抽样法,分层抽样法B.分层抽样法,简单随机抽样法C.分层抽样法,系统抽样法D.系统抽样法,分层抽样法答案:D思路2例1 为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得的数据整理后画出频率分布直方图(如图1),已知图中从左到右的前三个小组的频率分别是0.1,0.3,0.4.第一小组的频数是5.图1(1)求第四小组的频率和参加这次测试的学生人数.(2)在这次测试中,学生跳绳次数的中位数落在第几小组内?(3)若参加这次测试跳绳次数在100次以上为优秀,试估计该校此年级跳绳成绩的优秀率是多少?解:(1)由于各小组频率的和是1,因此第四小组的频率为1-0.1-0.3-0.4=0.2;由于第一小组的频数是5,频率为0.1,因此总人数为5÷0.1=50.(2)由于第三小组的频率最大,因此学生跳绳次数的中位数落在第三小组内.(3)由第三小组的频率和第四小组的频率和为0.6,可知该校此年级跳绳成绩的优秀率是0.6.例2 下面是关于世界20个地区受教育的人口的百分比与人均收入的散点图.图2(1)图中两个变量有什么样的相关关系?(2)若利用散点图中的数据建立的回归方程为y =3.193x +88.193,且受教育的人口的百分比相差10%,其人均收入相差多少?解:(1)散点图中的样本点基本集中在一个条型区域中,因此两个变量呈线性相关关系.(2)回归方程的自变量系数为3.193,因此当受教育的人口的百分比相差10%时,其人均收入相差3.193×10=31.93.变式训练1.数据70,71,72,73的标准差是( ).A .2B .54C . 2D .52答案:D2.已知k 1,k 2,…,k 8的方差为3,则2(k 1-3),2(k 2-3),…,2(k 8-3)的方差为________. 答案:123.已知回归方程y =0.5x -0.81,则x =25时,y 的估计值为________.答案:11.69知能训练答案:乙品种 甲品种2.在一次文艺比赛中,12名专业人员和12名观众代表各组成一个评判小组,给参赛选手打分,下面是两个评判组对同一名选手的打分:小组A :42,45,48,46,52,47,49,55,42,51,47,45;小组B :55,36,70,66,75,49,46,68,42,62,58,47.通过计算说明小组A ,B 哪个更像是由专业人士组成的评判小组?答案:小组A .解:作出的茎叶图如图3.图3从这个茎叶图中可以看出乙班的数学成绩更好一些.拓展提升1.假设要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,先将800袋牛奶按000,001,…,799进行编号,如果从下面随机数表第2行第18列的数开始向右读,请你依次写出最先检测的5袋牛奶的编号.84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7663 01 63 78 59 16 95 56 67 19 98 10 50 71 75 12 86 73 58 07 44 39 62 58 7973 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 06 13 42 99 66 02 79 54…解:从第2行第18列的数7开始向右读,每次读三位,凡是小于或等于799的数就为1个,即719,050,717,512,358是最先检测的5袋牛奶的编号.2.想象一下一个人从出生到死亡,在每个生日都测量其身高,并作出这些数据的散点图.这些点将不会落在一条直线上,但在一段时间内的增长数据有时可以用线性回归来分(2)求出这些数据的回归方程.(3)对于这个例子,你如何解释回归系数的含义?(4)用下一年的身高减去当年的身高,计算他每年身高的增长数,并计算他从3~16岁身高的年均增长数.(5)解释一下回归系数与每年平均增长的身高之间的联系.解:(1)作出的数据的散点图如图4.图4(2)用y表示身高,x表示年龄,则数据的回归方程为y=6.317x+71.984.(3)在该例中,回归系数6.317表示孩子在一年中增加的高度.(4)每年身高的增长数略.3~16岁的身高年均增长约为6.323 cm.(5)回归系数与每年平均增长的身高之间近似相等.课堂小结本节介绍了从总体中抽取样本的常用方法,并通过实例,研究了如何利用样本对总体的分布规律、整体水平、稳定程度及相关关系等特性进行估计和预测.作业复习题一任选3题.设计感想本节复习了最常用的三种抽样方法.获取样本数据后,将其用频率分布表、频率分布直方图、频率折线图或茎叶图表示后,蕴涵于数据之中的规律得到直观的揭示.运用样本的平均数可以对总体水平作出估计,用样本的极差、方差(标准差)可以估计总体的稳定程度.对两个变量的样本数据进行相关性分析,可发现存在于现实世界中的回归现象.用最小二乘法研究回归现象,得到的线性回归方程可用于预测和估计,为决策提供依据.本节对第一章知识和方法进行了归纳和总结,使学生的基本知识系统化和网络化,基本方法条理化,有利于学生更好地用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.备课资料备选习题1.为了了解所加工的一批零件的长度,抽测了200个零件的长度,在这个问题中,200个零件的长度是 ( ).A.总体B.个体C.总体的一个样本D.样本容量答案:C2.用简单随机抽样方法从含有6个个体的总体中,抽取一个容量为2的样本,某一个体a“第一次被抽到的概率”“第二次被抽到的概率”“在整个抽样过程中被抽到的概率”分别是( ).A.16,16,16B.16,15,16C.16,16,13D.16,13,13答案:C3.在一个个体数目为1 003的总体中,要利用系统抽样抽取一个容量为50的样本,那么总体中每个个体被抽到的概率是( ).A.120B.150C.25D.501 003答案:D4.为了了解1 200名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样本,考虑用系统抽样,则分段的间隔k为( ).A.40 B.30 C.20 D.12答案:B5.一批热水器共有98台,其中甲厂生产的有56台,乙厂生产的有42台,用分层抽样法从中抽出一个容量为14的样本,那么甲、乙两厂各抽得的热水器的台数是( ).A.甲厂9台,乙厂5台B.甲厂8台,乙厂6台C.甲厂10台,乙厂4台D.甲厂7台,乙厂7台答案:B6.下列叙述中正确的是( ).A.通过频率分布表可以看出样本数据对于平均数的波动大小B.频数是指落在各个小组内的数据C.每小组的频数与样本容量之比是这个小组的频率D.组数是样本平均数除以组距答案:C7.某工厂生产产品,用传送带将产品送至下一个工序,质检人员每隔10分钟在传送带某一位置取一件检验,则这种抽样的方法为( ).A.简单随机抽样B.系统抽样C.分层抽样D.非上述情况答案:B8.频率分布直方图中,小长方形的面积等于( ).A.组距B.频率C.组数D.频数答案:B9.一组数据的方差为3,将这组数据中的每一个数据都扩大到原来的3倍,则所得到的这组新数据的方差是( ).A.1 B.27 C.9 D.3答案:B10.有两个样本,甲:5,4,3,2,1;乙:4,0,2,1,-2.那么样本甲和样本乙的波动大小情况是( ).A.甲、乙波动大小一样B.甲的波动比乙的波动大C.乙的波动比甲的波动大D.甲、乙的波动大小无法比较答案:C11.采用简单随机抽样从含10个个体的总体中抽取一个容量为4的样本,则个体a前两次未被抽到,第三次被抽到的概率为________.答案:11012.观察新生婴儿的体重,其频率分布直方图如图5:图5则新生婴儿体重在(2 700,3 000)的频率为________.答案:0.313.已知样本99,100,101,x ,y 的平均数是100,方差是2,则xy =________. 答案:9 99614.某中学高一年级有x 个学生,高二年级有900个学生,高三年级有y 个学生,现从这些学生中采用分层抽样抽取一个容量为370人的样本,若高一年级抽取120人,高三年级抽取100人,则全校高中部共有多少学生?解:由题意得x 120=y 100=900370-120-100,解得 x =720,y =600. 故该学校高中部共有学生2 220人.15.下图是某单位职工年龄(取正整数)的频数分布图,根据图形提供的信息,回答下列问题(直接写出答案).图6注:每组可含最低值,不含最高值.(1)该单位职工共有多少人?(2)不小于38岁但小于44岁的职工人数占职工总人数的百分比是多少?(3)如果42岁的职工有4人,那么年龄在42岁以上的职工有几人?解:(1)该单位有职工50人.(2)38~44岁之间的职工人数占职工总人数的60%.(3)年龄在42岁以上的职工有15人.解:x 甲=15(60+80+70+90+70)=74,x 乙=15(80+60+70+80+75)=73, s 2甲=15(142+62+42+162+42)=104,s 2乙=15(72+132+32+72+22)=56. ∵x 甲>x 乙,s 2甲>s 2乙,∴ 甲的平均成绩较好,乙的各门功课发展较平衡.17.下面是一个病人从4月7日起的体温记录折线图,观察图形回答下列问题:图7(1)护士每隔几小时给病人量一次体温?(2)这个病人的体温最高是多少摄氏度?最低是多少摄氏度?(3)这个病人在4月8日12时的体温是多少摄氏度?(4)这个病人的体温在哪段时间里下降得最快?在哪段时间里比较稳定?(5)图7中的横虚线表示什么?(6)从体温看,这个病人的病情是在恶化还是在好转?解:(1)6小时;(2)最高温度是39.5 ℃,最低温度是36.8 ℃;(3)4月8日12时的体温是37.5 ℃;(4)在4月7日6点到12点的体温下降得最快,4月9日12点到18点体温比较稳定;(5)虚线表示标准体温;(6)好转.18.从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如图8所示.观察图形,回答下列问题:图8(1)79.5~89.5这一组的频数、频率分别是多少?(2)估计这次环保知识竞赛的及格率(60分及以上为及格).解:(1)频率为0.025×10=0.25,频数为60×0.25=15;(2)0.015×10+0.025×10+0.03×10+0.005×10=0.75.(设计者:方诚心)。

高中数学必修3(人教B版)第二章统计2.3知识点总结含同步练习题及答案

高中数学必修3(人教B版)第二章统计2.3知识点总结含同步练习题及答案

描述:例题:高中数学必修3(人教B版)知识点总结含同步练习题及答案第二章 统计 2.3 变量的相关性一、学习任务1. 能通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系.2. 了解线性回归的方法,了解用最小二乘法研究两个变量的线性相关问题的思想方法,会根据给出的线性回归方程系数公式建立线性回归方程(不要求记忆系数公式).二、知识清单变量间的相关关系相关关系 线性相关三、知识讲解1.变量间的相关关系2.相关关系变量与变量之间的关系一类是确定性的函数关系,像正方形的边长 和面积 的关系 .另一类是变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的.例如,人的身高不能确定体重,但一般说来“身高者,体也重”.我们说身高与体重这两个变量具有相关关系.函数关系与相关关系的异同点相同点:是两者均是指两个变量的关系;不同点:①函数关系是一种确定性的关系,相关关系是一种非确定性的关系.②函数关系式一种因果关系,而相关关系不一定是因果关系,其也可能是伴随关系.a S 给出下列关系:①正方形的边长与面积之间的关系;②水稻产量与施肥量之间的关系;③降雪量与交通事故的发生率之间的关系.其中具有相关关系的是______.解:②③两个变量之间的关系有两种:函数关系与相关关系.①正方形的边长和面积之间的关系是函数关系.②水稻产量与施肥量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.③降雪量与交通事故的发生率具有相关关系.下图中的两个变量是相关关系的是( )描述:3.线性相关两个变量的线性关系对具有相关关系的两个变量进行统计分析的方法叫回归分析.将样本中的个数据点(,,,)描在平面直角坐标系中,就得到了散点图.如果两个变量的散点图中的点散步在左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大,我们将这种相关称为正相关.如果两个变量的散点图中的点散步的位置是从左上角到右下角的区域,即一个变量的值由小变大是,另一个变量的值由大变小,我们将这种相关称为负相关.如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量具有线性相关关系.回归直线方程“最贴近”已知的数据点的直线方程称之为回归直线方程,简称回归方程,方程为,叫做回归系数.刻画了实际观察值与回归直线上相应点纵坐标之间的偏离程度,个离差构成的总离差越小越好,总离差通常是用离差的平方和来表示,即作为总离差,并使之达到最小.回归直线就是所有直线中取最小的那一条.由于平方又叫二乘方,所以这种使“离差平方和最小”的方法,叫做最小二乘法.A.①② B.①③ C.②④ D.②③解:D①属于函数关系,因为每个 值对应一个 值,这是确定性的关系;②中散点图中各点分布的区域大致为从左下角到右上角,没有确定的函数关系,但是具有相关关系;③中散点图分布的区域大致在一条曲线附近,对于每个 ,其对应的 呈现出一定的规律性,因此这两个变量具有相关关系;④ 中各点的分布比较均匀,但对于每个 , 的分布没有规律,因此不属于相关关系.x y x y x y n (,)x i y i i =12⋯n =a +bx y ^b −y i y ^i y i n Q =(−a −b ∑i =1ny i x i )2Q(),得散点图2.由这两个散点图可以判断( )(,)u i v i i =12⋯10高考不提分,赔付1万元,关注快乐学了解详情。

必修3第6章统计(含单元测试)参考答案

必修3第6章统计(含单元测试)参考答案

实用文档必修3 第6章 统计 参考答案6.1.1 简单随机抽样1.C 2.C 3.A 4.抽签法,随机数表法,向上、向下、向左、向右5.21 6.60,30 7.相等,Nn 8.略 9.(1)不是简单随机抽样,由于被抽取样本的总体的个数是无限的而不是有限的。

(2)不是简单随机抽样,由于它是放回抽样10.选法二不是抽签法,因为抽签法要求所有的签编号互不相同,而选法二中39个白球无法相互区分。

这两种选法相同之处在于每名学生被选中的概率都相等,等于401。

6.1.2 系统抽样1.A 2.B 3.B 4.B 5.A 、B 、D 6. 200450 7.(一)简单随机抽样(1) 将每一个人编一个号由0001至1003;(2) 制作大小相同的号签并写上号码;(3) 放入一个大容器,均匀搅拌;(4)依次抽取10个号签具有这十个编号的人组成一个样本。

(二)系统抽样(1)将每一个人编一个号由0001至1003;(2)选用随机数表法找3个号,将这3个人排除;(3)重新编号0001至1000;(4)在编号为0001至0100中用简单随机抽样法抽得一个号L;(5)按编号将:L,100+L,…,900+L共10个号选出。

这10个号所对应的人组成样本。

8.系统抽样适用于总体中的个体数较多的情况;系统抽样与简单随机抽样之间存在着密切联系,即在将总体中的个体均分后的每一段进行抽样时,采用的是简单随机抽样;与简单随机抽样相同的是,系统抽样也属于等可能抽样。

9.是用系统抽样的方法确定的三等奖号码的,共有100个。

10.略(参考第7小题)6.1.3 分层抽样实用文档Nm1.B 2.B 3.104 4.n5.70,80 6.系统抽样,100个7.总体中的个体个数较多,差异不明显;总体由差异明显的几部分组成中年:200人;青年:120人;老年:80人8.分层抽样,简单随机抽样9.因为总体共有彩电3000台,数量较大,所以不宜采用简单随机抽样,又由于三种彩电的进货数量差异较大,故也不宜用系统方法,而以分层抽样为妥。

新版高中数学北师大版必修3习题第一章统计1.2.2.2含解析

新版高中数学北师大版必修3习题第一章统计1.2.2.2含解析

第2课时系统抽样课时过关·能力提升1.从N个编号中抽取n个号码入样,若采用系统抽样方法进行抽取,则分段间隔应为()AC答案:C2.有40件产品,编号为1~40,现在从中抽取4件检验,用系统抽样的方法确定所抽取的编号可能为()A.5,10,15,20B.2,12,22,32C.2,14,26,38D.5,8,31,36解析:由系统抽样的定义知抽样距为可以在第一组1~10号样本中取k号,1≤k≤10,则抽取到的样本编号为k,k+10,k+20,k+30.答案:B3.从编号为001,002,…,500的500个产品中用系统抽样的方法抽取一个样本,已知样本中编号最小的两个编号分别为007,032,则样本中最大的编号应该为()A.480B.481C.482D.483解析:由样本中编号最小的两个编号分别为007,032,得抽样距为32-7=25,则样本容量为每组中应抽取的号码数x=7+25(n-1)(1≤n≤20,n∈Z),当n=20时,x取得最大值为x=7+25×19=482.答案:C4.总体容量为524,采用系统抽样法抽样,若想不剔除个体,则抽样间隔可以为()A.3B.4C.5D.6解析:因为系统抽样的间隔需要能整除总体个数.故选B.答案:B5.某初级中学有学生270人,其中七年级108人,八年级、九年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按七年级、八年级、九年级依次统一编号为1,2,…,270;使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段.如果抽得号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250;②5,9,100,107,111,121,180,195,200,265;③11,38,65,92,119,146,173,200,227,254;④30,57,84,111,138,165,192,219,246,270.那么关于上述样本的下列结论,正确的是()A.②③都不能为系统抽样B.②④都不能为分层抽样C.①④都可能为系统抽样D.①③都可能为分层抽样解析:由定义可知,①③可能为分层抽样也可能为系统抽样;②可能为分层抽样;④可能为简单随机抽样.故选D.答案:D6.将高三(1)班参加体检的36名学生,编号为:1,2,3,…,36,若采用系统抽样的方法抽取一个容量为4的样本,已知样本中含有编号为6号、24号、33号的学生,则样本中剩余一名学生的编号是.答案:157.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,……,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是.若用分层抽样方法,则40岁以下年龄段应抽取人.解析:由题意可知,系统抽样时共分成40组,抽样间隔为5,第5组的号码为22,则第8组的号码为22+5×3=37.在分层抽样时,由于40岁以下年龄段人数占总数的50%,故40岁以下年龄段应抽取40×50%=20(人).答案:37208.一个总体中有100个个体,随机编号为0,1,2,…,99.依编号顺序平均分成10个小组,组号依次为1,2,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是.解析:由题设知,若m=6,则在第7组中抽取的号码个位数字与13的个位数字相同,而第7组中的编号依次为60,61,62,63,…,69.故在第7组中抽取的号码是63.答案:639.某学校有学生3 000人,现在要抽取100人组成夏令营,应该怎样抽取样本?分析:因为总体中个体数较多,且无差异,所以按系统抽样的步骤来进行抽样.解:按系统抽样抽取样本,其步骤如下.第一步:把这些学生分成100个组,因为所以每个组30名学生,这时,抽样距就是30.第二步:将3 000名学生随机编号为1,2, (3000)第三步:在第1组用简单随机抽样确定起始个体的编号l(0<l≤30).第四步:按照一定的规则抽取样本,通常是将起始编号l加上分段间隔30得到第2个个体编号l+30,再加上30得到第3个个体编号l+60,这样继续下去,直到获取整个样本.比如l=15,则抽取的编号为15,45,75,105,…,2985.这些号码对应的学生组成样本.10.为了考察某校的教学水平,将抽取这个学校本学年高三年级部分学生的考试成绩,为了全面地反映实际情况,采取以下三种方式进行抽样(已知该校高三年级共有20个教学班,并且每个班的学生都已经按随机方式编好了学号,假定该校每个班的学生人数都相同).①从全年级20个班中任意抽取一个班,再从该班中任意抽取20人,考察他们的考试成绩;②每个班都抽取1人,共计20人,考察这20个学生的考试成绩;③把学生按成绩分成优秀、良好、普通三个级别,从其中抽取100名学生进行考察(已知若按成绩分,该校高三学生中优秀生共有150人,良好生共有600人,普通生共有250人).根据上面的叙述,试回答下列问题:(1)上面三种抽取方式中,其总体、个体、样本分别指什么?每一种抽取方式所抽取的样本中,其样本容量分别是多少?(2)上面三种抽取方式中各自采用何种方法抽取样本?(3)试分别写出上面三种抽取方式各自抽取样本的步骤.解:(1)在这三种抽取方式中,其总体都是该校本学年高三全体学生的考试成绩,个体都是本学年高三年级每个学生的考试成绩.其中第一种抽取方式中样本为所抽取的本学年20名学生的考试成绩,样本容量为20;第二种抽取方式中样本为所抽取的本学年20名学生的考试成绩,样本容量为20;第三种抽取方式中样本为所抽取的本学年100名学生的考试成绩,样本容量为100.(2)在上面三种抽取方式中,第一种方式采用的是简单随机抽样;第二种方式采用的是系统抽样和简单随机抽样;第三种方式采用的是分层抽样和简单随机抽样.(3)第一种方式抽取样本的步骤如下:首先在这20个班中用抽签法任意抽取一个班,然后从这个班中按学号用随机数法或抽签法抽取20个学生,考察其考试成绩.第二种方式抽取样本的步骤如下:首先在第一个班中,用简单随机抽样法任意抽取一个学生,记其学号为a.然后在其余的19个班中,选取学号为a的学生,共计20人.第三种方式抽取样本的步骤如下:首先分层.因为若按成绩分,其中优秀生共150人,良好生共600人,普通生共250人,所以在抽取样本时,应该把全体学生分成三层.然后确定各层抽取的人数.因为样本容量与总体的个体数之比为100∶1 000=1∶10,所以在每层抽取的个体数依次为即15,60,25.最后按层分别抽取.在优秀生中用简单随机抽样抽取15人,在良好生中用简单随机抽样抽取60人,在普通生中用简单随机抽样抽取25人.。

高一数学 (人教版必修3):第三章 统计 Word版含解析

高一数学 (人教版必修3):第三章 统计 Word版含解析

重点列表:重点 名称重要指数 重点1 频率分布直方图 ★★★★ 重点2 茎叶图 ★★★ 重点3抛物线★★★★重点详解:用样本的频率分布估计总体分布(1)通常我们对总体作出的估计一般分成两种:一种是用样本的__________估计总体的__________;另一种是用样本的________估计总体的__________.(2)在频率分布直方图中,纵轴表示________,数据落在各小组内的频率用________________表示.各小长方形的面积总和等于________.(3)连接频率分布直方图中各小长方形上端的中点,就得到频率分布________.随着样本容量的增加,作图时所分的________增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称之为______________________,它能够更加精细地反映出____________________________________.(4)当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以____________________,而且可以______________,给数据的记录和表示都带来方便.【参考答案】(1)频率分布 分布 数字特征 数字特征 (2)频率组距 各小长方形的面积 1 (3)折线图 组数 总体密度曲线 总体在各个范围内取值的百分比 (4)保留所有信息 随时记录重点1:频率分布表、频率分布直方图及其应用 【要点解读】用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.【考向1】根据数据画出频率分布直方图【例题】某市2013年4月1日—4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)完成下列频率分布表、频率分布直方图;频率分布表分组频数频率41,51)51,61)61,71)71,81)81,91)91,101)101,111)频率分布直方图(2)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.解:(1)如图所示:频率分布表分组频数频率41,51) 2 230 51,61) 1 130 61,71) 4 430 71,81) 6 630 81,91) 10 1030 91,101) 5 530 101,111)2230(2)答对下述两条中的一条即可:①该市一个月中空气污染指数有2天处于优的水平,占当月天数的115,有26天处于良的水平,占当月天数的1315,处于优或良的天数共有28天,占当月天数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115,污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的1730,超过50%,说明该市空气质量有待进一步改善.【评析】首先根据题目中的数据完成频率分布表,作出频率分布直方图,根据污染指数,确定空气质量为优、良、轻微污染、轻度污染的天数;对于开放性问题的解答,要选择适当的数据特征进行考察,根据数据特征分析得出实际问题的结论.本题主要考查运用统计知识解决简单实际问题的能力、数据处理能力和应用意识. 【考向2】频率分布直方图的逆用【例题】某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[)50,60, [)60,70,[)70,80,[)80,90,[]90,100.(1)求图中a 的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生的语文成绩在某些分数段的人数(x )与数学成绩在相应分数段的人数(y )之比如下表所示,求数学成绩在[)50,90之外的人数.分数段[)50,60 [)60,70 [)70,80 [)80,90x ∶y1∶12∶13∶44∶5解:(1)由()2a +×10=1, 解得a =0.005.(2)=0.05×55+0.4×65+0.3×75+0.2×85+0.05×95=73.(3)由频率分布直方图及已知的语文成绩、数学成绩分布在各分数段的人数比,可得下表:分数段 50,60) 60,70) 70,80) 80,90)x 5 40 30 20 x ∶y 1∶1 2∶1 3∶4 4∶5 y5204025于是数学成绩在50重点2:茎叶图 【要点解读】茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作. 【考向1】根据茎叶图求方差【例题】以下茎叶图记录了甲、乙两组各四名同学的植树棵数.乙组记录中有一个数据模糊,无法确认,在图中以X 表示.如果X =8,求乙组同学植树棵数的平均数和方差;注:方差s2=1n(x1-)2+(x2-)2+…+(x n-)2],其中x为x1,x2,…,x n的平均数.解:当X=8时,由茎叶图可知,乙组同学的植树棵数是8,8,9,10,所以平均数为=8+8+9+104=354;方差为s2=14⎝⎛⎭⎪⎫8-3542+⎝⎛⎭⎪⎫8-3542+⎝⎛⎭⎪⎫9-3542+⎝⎛⎭⎪⎫10-3542]=1116.【考向2】根据茎叶图求平均数【例题】某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示,其中茎为十位数,叶为个位数.179201 530(1)根据茎叶图计算样本平均值;(2)日加工零件个数大于样本均值的工人为优秀工人,根据茎叶图推断该车间12名工人中有几名优秀工人?难点列表:难点名称难度指数难点1 用样本的数字特征估计总体的数字特征★★★★难点2导数与函数的极值、最值★★★难点详解:用样本的数字特征估计总体的数字特征(1)众数,中位数,平均数众数:在一组数据中,出现次数________的数据叫做这组数据的众数.中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或者最中间两个数据的________)叫做这组数据的中位数.平均数:样本数据的算术平均数,即=_______.在频率分布直方图中,中位数左边和右边的直方图的面积应该________. (2)样本方差,样本标准差 标准差s =])()()[(122221x x x x x x nn -+⋯+-+-,其中x n 是__________________,n 是________,是________.标准差是反映总体__________的特征数,________是样本标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差.【答案】 (1)最多 平均数 1n(x 1+x 2+…+x n ) 相等(2)样本数据的第n 项 样本容量 平均数 波动大小 样本方差难点1:用样本的数字特征估计总体的数字特征 【要点解读】能从一组数据中求出中位数、平均数和众数 【考向1】平均数、中位数【例题】某汽车制造厂分别从A ,B 两种轮胎中各随机抽取了8个进行测试,列出了每一个轮胎行驶的最远里程数(单位:1000 km): 轮胎A 96 11297108100103 86 98轮胎B 108 101 94 105 9693 97 106(1)分别计算A ,B 两种轮胎行驶的最远里程的平均数、中位数; (2)分别计算A ,B 两种轮胎行驶的最远里程的极差、标准差; (3)根据以上数据,你认为哪种型号轮胎的性能更加稳定?(2)A 轮胎行驶的最远里程的极差为:112-86=26, 标准差为:s =8)2()14(308)3(12)4(22222222-+-++++-++-=2212≈7.43; B 轮胎行驶的最远里程的极差为:108-93=15, 标准差为:s =86)3()7()4(5)6(1822222222+-+-+-++-++=1182≈5.43. (3)虽然A 轮胎和B 轮胎的最远行驶里程的平均数相同,但B 轮胎行驶的最远里程的极差和标准差相对于A 轮胎较小,所以B 轮胎性能更加稳定.【评析】在理解平均数、中位数、众数、极差、标准差、方差的统计意义和数学表达式的情况下,不难作出解答. 【考向2】平均数、标准差【例题】某学员在一次射击测试中射靶10次,命中环数如下: 7,8,7,9,5,4,9,10,7,4. 则(1)平均命中环数为____________; (2)命中环数的标准差为____________.难点2:根据频率分布直方图计算样本的数字特征【要点解读】会从频率分布直方图中求出中位数、平均数和众数【考向1】中位数【例题】如图所示是一容量为100的样本的频率分布直方图,则由图形中的数据,可知其中位数为( )A.12.5 B.13C.13.5 D.14【答案】 B【考向2】平均数【例题】某市为了节约能源,拟出台“阶梯电价”制度,即制订住户月用电量的临界值a.若某住户某月用电量不超过a度,则按平价计费;若某月用电量超过a度,则超出部分按议价计费,未超出部分按平价计费.为确定a的值,随机调查了该市100户的月用电量,工作人员已将90户的月用电量填在了下面的频率分布表中,最后10户的月用电量(单位:度)为:18,63,43,119,65,77,29,97,52,100.组别月用电量频数统计频数频率①0,20)②20,40)正正③40,60)正正正正④60,80)正正正正正⑤80,100)正正正正⑥100,120](1)完成频率分布表并绘制频率分布直方图;(2)根据已有信息,试估计全市住户的平均月用电量(同一组数据用该区间的中点值作代表);(3)若该市计划让全市75%的住户在“阶梯电价”出台前后缴纳的电费不变,试求临界值a. 解] (1)组别月用电量频数统计频数频率①0,20)40.04②20,40)正正120.12③40,60)正正正正240.24④60,80)正正正正正正300.30⑤80,100)正正正正正250.25⑥100,120]正50.05(2)由题意,用每小组的中点值代表该小组的平均月用电量,则100户住户组成的样本的平均月用电量为10×0.04+30×0.12+50×0.24+70×0.30+90×0.25+110×0.05=65(度).用样本估计总体,可知全市居民的平均月用电量约为65度.(3)计算累计频率,可得下表:分组0,20)20,40)40,60)60,80)80,100)100,120] 频率0.040.120.240.300.250.05累计频率0.040.160.400.700.95 1.00由此可知临界值a应在区间80,100)内,且频率分布直方图中,在临界值a左侧小矩形的总面积(频率)为0.75,故有0.7+(a-80)×0.012 5=0.75,解得a=84,由样本估计总体,可得临界值a为84.【趁热打铁】1.容量为20的样本数据,分组后的频数如下表:分组10,20)20,30) 30,40) 40,50) 50,60) 60,70)频数2 3 4 5 4 2A.0.35 B.0.45C.0.55 D.0.652.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为m e,众数为m o,平均值为,则( )A.m e=m o=B.m e=m o<C.m e<m o<D.m o<m e<3.某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是( )A.这种抽样方法是一种分层抽样B.这种抽样方法是一种系统抽样C.这五名男生成绩的方差大于这五名女生成绩的方差D.该班男生成绩的平均数小于该班女生成绩的平均数4.小波一星期的总开支分布如图1所示,一星期的食品开支如图2所示,则小波一星期的鸡蛋开支占总开支的百分比为( )图1图2A .30%B .10%C .3%D .不能确定5.从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示),设甲乙两组数据的平均数分别为甲,乙,中位数分别为m 甲,m 乙,则( )甲乙8 6 5 0 8 8 4 0 0 1 0 2 87 5 2 2 0 2 3 3 7 8 0 0 3 1 2 4 4 8 3 1 4 2 3 8A.甲<乙,m 甲>m 乙 B .甲乙甲乙C .甲>乙,m 甲>m 乙 D .甲>乙,m 甲<m 乙6.样本(x 1,x 2,…,x n )的平均数为,样本(y 1,y 2,…,y m )的平均数为y (≠y ),若样本(x 1,x 2,…,x n ,y 1,y 2,…,y m )的平均数=α+(1-α) y ,其中0<α<12,则n ,m 的大小关系为( ) A .n <mB .n >mC .n =mD .不能确定7.甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下.中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天中甲、乙两人日加工零件的平均数分别为________和________.甲乙9 8 1 9 7 10 1 3 2 0 2 1 4 2 41 1 5 3 02 08.如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是20.5,26.5],样本数据的分组为20.5,21.5),21.5,22.5),22.5,23.5),23.5,24.5),24.5,25.5),25.5,26.5].已知样本中平均气温低于22.5℃的城市个数为11,则样本中平均气温不低于25.5℃的城市个数为________.9.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.10.为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.23.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4服用B 药的20位患者日平均增加的睡眠时间: 3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好? (2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?第三章1解:由频率分布表可知:样本数据落在区间10,40)内的频数为2+3+4=9,样本总数为20,故样本数据落在区间10,40)的频率为920=0.45.故选B.2解:中位数为5.5,众数为5,平均值为17930.故选D.3解:这种抽样方法为简单随机抽样,该班这五名男生成绩的平均数为86+94+88+92+905=90,方差为15(86-90)2+(94-90)2+(88-90)2+(92-90)2+(90-90)2]=8;该班这五名女生成绩的平均数为 88+93+93+88+935=91,方差为15(88-91)2+(93-91)2+(93-91)2+(88-91)2+(93-91)2]=6.故选C.5解:易知甲=21.5625,乙=28.5625,m 甲=20,m 乙=29,∴甲<乙,m 甲<m 乙.故选B. 6解:∵x 1+x 2+…+x n =n ,y 1+y 2+…+y m =m y ,∴x 1+x 2+…+x n +y 1+y 2+…+y m =(m +n ) =(m +n )α+(1-α)y ] =(m +n )α+(m +n )(1-α)y , ∴n +m y =(m +n )α+(m +n )(1-α)y .∴⎩⎪⎨⎪⎧n =(m +n )α,m =(m +n )(1-α). 故n -m =(m +n )α-(1-α)]=(m +n )(2α-1). ∵0<α<12,∴2α-1<0.∴n -m <0,即n <m .故选A.7解:设甲、乙在这10天中日加工零件的平均数分别为a ,b ,则a =20+-1-2+0+1+3+2+0+11+11+1510=24,b =20+-1-3-9+1+4+2+4+10+12+1010=23.故填24;23.8解:平均气温低于22.5℃的城市所占频率为最左边两个矩形面积之和,即0.10×1+0.12×1=0.22,又其频数为11,故总城市数为110.22=50,故样本中平均气温不低于25.5℃的城市共有50×0.18=9(个). 故填9.9解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为42+4+17+15+9+3=0.08.又因为第二小组频率=第二小组频数样本容量,所以样本容量=第二小组频数第二小组频率=120.08=150.(2)由图可估计该学校高一学生的达标率约为17+15+9+32+4+17+15+9+3×100%=88%.(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.10解:(1)计算得A=2.3, B=1.6,从计算结果来看,A药的疗效更好.(2)从以上茎叶图可以看出,A药疗效的试验结果有10的叶集中在茎2,3上,而B药疗效的试验结果有710的叶集中在茎0,1上,由此可看出A药的疗效更好.。

数学同步新导学案人教B必修三讲义:第二章 统计 2.3 Word含答案

数学同步新导学案人教B必修三讲义:第二章 统计 2.3 Word含答案

2.3变量的相关性学习目标 1.了解变量间的相关关系,会画散点图.2.根据散点图,能判断两个变量是否具有相关关系.3.了解线性回归思想,会求回归直线的方程.知识点一变量间的相关关系思考1粮食产量与施肥量间的相关关系是正相关还是负相关?答案在施肥不过量的情况下,施肥越多,粮食产量越高,所以是正相关.思考2怎样判断一组数据是否具有线性相关关系?答案画出散点图,若点大致分布在一条直线附近,就说明这两个变量具有线性相关关系,否则不具有线性相关关系.梳理1.相关关系的定义变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,那么这两个变量之间的关系叫做相关关系,两个变量之间的关系分为函数关系和相关关系.2.散点图将样本中n个数据点(x i,y i)(i=1,2,…,n)描在平面直角坐标系中得到的图形叫做散点图.3.正相关与负相关(1)正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.(2)负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.知识点二两个变量的线性相关思考任何一组数据都可以由最小二乘法得出回归直线方程吗?答案用最小二乘法求回归直线方程的前提是先判断所给数据是否具有线性相关关系(可利用散点图来判断),否则求出的回归直线方程是无意义的.梳理回归直线方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归直线方程:回归直线对应的方程叫做回归直线方程. (3)最小二乘法:求回归直线方程y ^=b ^x +a ^时,使得样本数据的点到回归直线的离差平方和最小的方法叫做最小二乘法.⎩⎪⎨⎪⎧b ^=∑i =1n(x i-x )(y i-y )∑i =1n (x i-x )2=∑i =1nx i y i-n x y ∑i =1n x 2i-n x 2,a ^=y -b ^x ,其中,b ^是回归直线方程的斜率,a ^是回归直线方程在y 轴上的截距.1.人的身高与年龄之间的关系是相关关系.( × ) 2.农作物的产量与施肥量之间的关系是相关关系.( √ ) 3.回归直线过样本点中心(x ,y ).( √)题型一 变量间相关关系的判断例1 下列两个变量之间是相关关系的是( ) A .圆的面积与半径之间的关系 B .球的体积与半径之间的关系 C .角度与它的正弦值之间的关系D .降雪量与交通事故的发生率之间的关系 答案 D解析 由题意知A 表示圆的面积与半径之间的关系S =πr 2,B 表示球的体积与半径之间的关系V =4πr 33,C 表示角度与它的正弦值之间的关系y =sin α,都是确定的函数关系,只有D是相关关系,故选D.反思与感悟函数关系是一种确定的关系,而相关关系是非随机变量与随机变量的关系.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.跟踪训练1下列两个变量间的关系不是函数关系的是()A.正方体的棱长与体积B.角的度数与它的正切值C.单产为常数时,土地面积与粮食总产量D.日照时间与水稻的单位产量答案 D解析函数关系与相关关系都是指两个变量之间的关系,但是这两种关系是不同的,函数关系是指当自变量一定时,函数值是确定的,是一种确定性的关系.因为A项V=a3,B项y =tan α,C项y=ax(a>0,且a为常数),所以这三项均是函数关系.D项是相关关系.题型二散点图的应用例25名学生的数学和物理成绩(单位:分)如下:判断它们是否具有线性相关关系.解以x轴表示数学成绩,y轴表示物理成绩,得相应的散点图如图所示.由散点图可知,各点分布在一条直线附近,故两者之间具有线性相关关系.反思与感悟(1)判断两个变量x和y间具有哪种相关关系,最简便的方法是绘制散点图.变量之间可能是线性的,也可能是非线性的(如二次函数),还可能不相关.(2)画散点图时应注意合理选择单位长度,避免图形偏大或偏小,或者是点的坐标在坐标系中画不准,使图形失真,导致得出错误结论.跟踪训练2 下列图形中两个变量具有线性相关关系的是( )答案 C解析 A 是一种函数关系;B 也是一种函数关系;C 中从散点图中可看出所有点看上去都在某条直线附近波动,具有相关关系,而且是一种线性相关;D 中所有的点在散点图中没有显示任何关系,因此变量间是不相关的. 题型三 回归直线的求解与应用例3 一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器运转速度的变化而变化,下表为抽样试验的结果:(1)画出散点图;(2)如果y 对x 有线性相关关系,请画出一条直线近似地表示这种线性关系;(3)在实际生产中,若它们的近似方程为y =5170x -67,允许每小时生产的产品中有缺点的零件最多为10件,那么机器的运转速度应控制在什么范围内? 解 (1)散点图如图所示:(2)近似直线如图所示:(3)由y ≤10得5170x -67≤10,解得x ≤14.9,所以机器的运转速度应控制在14转/秒内.引申探究1.本例中近似方程不变,若每增加一个单位的转速,生产有缺点的零件数近似增加多少? 解 因为y =5170x -67,所以当x 增加一个单位时,y 大约增加5170.2.本例中近似方程不变,每小时生产有缺点的零件件数是7,估计机器的转速. 解 因为y =5170x -67,所以当y =7时,7=5170x -67,解得x ≈11.反思与感悟 求回归直线方程的一般步骤(1)收集样本数据,设为(x i ,y i )(i =1,2,…,n )(数据一般由题目给出). (2)作出散点图,确定x ,y 具有线性相关关系. (3)把数据制成表格x i ,y i ,x 2i ,x i y i . (4)计算x ,y,∑i =1nx 2i ,∑i =1nx i y i . (5)代入公式计算b ^,a ^,公式为⎩⎪⎨⎪⎧b ^=∑i =1n x i y i-n x y∑i =1n x 2i-n x2,a ^=y -b ^x .(6)写出回归直线方程y ^=b ^x +a ^.跟踪训练3 某种产品的广告费支出x (单位:百万元)与销售额y (单位:百万元)之间有如下对应数据:(1)画出散点图; (2)求回归直线方程. 解 (1)散点图如图所示.(2)列出下表,并用科学计算器进行有关计算.于是可得,b ^=∑i =15x i y i -5x y∑i =15x 2i -5x2=1 380-5×5×50145-5×52=6.5,a ^=y -b ^x =50-6.5×5=17.5.于是所求的回归直线方程是y ^=6.5x +17.5.1.设有一个回归直线方程为y ^=2-1.5x ,则变量x 增加1个单位时,y 平均( ) A .增加1.5个单位 B .增加2个单位 C .减少1.5个单位 D .减少2个单位答案 C2.工人工资y (元)与劳动生产率x (千元)的相关关系的回归直线方程为y ^=50+80x ,下列判断正确的是( )A .劳动生产率为1 000元时,工人工资为130元B .劳动生产率提高1 000元时,工人工资平均提高80元C .劳动生产率提高1 000元时,工人工资平均提高130元D .当月工资为250元时,劳动生产率为2 000元 答案 B解析 因为回归直线的斜率为80,所以x 每增加1,y 平均增加80,即劳动生产率提高1 000元时,工人工资平均提高80元.3.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归直线方程为y ^=0.85x -85.71,则下列结论中不正确的是( ) A .y 与x 具有正的线性相关关系 B .回归直线过样本点中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg 答案 D解析 当x =170时,y ^=0.85×170-85.71=58.79,体重的估计值为58.79 kg.4.已知回归直线的斜率的估计值是1.23,且过定点(4,5),则回归直线方程是________.答案 y ^=1.23x +0.08解析 回归直线的斜率的估计值为1.23,即b ^=1.23,又回归直线过定点(4,5),∴a ^=5-1.23×4=0.08,∴y ^=1.23x +0.08.5.某地区近10年居民的年收入x 与年支出y 之间的关系大致符合y ^=0.8x +0.1(单位:亿元),预计今年该地区居民收入为15亿元,则今年支出估计是________亿元. 答案 12.1解析 将x =15代入y ^=0.8x +0.1,得y ^=12.1.1.判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图.根据散点图,可以很容易看出两个变量是否具有相关关系,是不是线性相关,是正相关还是负相关. 2.求回归直线方程时应注意的问题(1)知道x 与y 成线性相关关系,无需进行相关性检验,否则应首先进行相关性检验,如果两个变量之间本身不具有相关关系,或者说,它们之间的相关关系不显著,即使求出回归直线方程也是毫无意义的,而且用其估计和预测的量也是不可信的.(2)用公式计算a ^,b ^的值时,要先计算b ^,然后才能算出a ^.3.利用回归直线方程,我们可以进行估计和预测.例如,若回归直线方程为y ^=b ^x +a ^,则x =x 0处的估计值为y ^0=b ^x 0+a ^.一、选择题1.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归直线方程可能是( )A.y ^=-10x +200B.y ^=10x +200C.y ^=-10x -200 D.y ^=10x -200答案 A解析 x 的系数为负数,表示负相关,排除B ,D ,由实际意义可知x >0,y >0,C 中,散点图在第四象限无意义,故选A.2.对变量x ,y 有观测数据(x i ,y i )(i =1,2,3,…,10),得散点图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,3,…,10),得散点图2,由这两个散点图可以断定( )A .x 与y 正相关,u 与v 正相关B .x 与y 正相关,u 与v 负相关C .x 与y 负相关,u 与v 正相关D .x 与y 负相关,u 与v 负相关答案 C解析 由图1可知,点散布在从左上角到右下角的区域,各点整体呈递减趋势,故x 与y 负相关;由图2可知,点散布在从左下角到右上角的区域,各点整体呈递增趋势,故u 与v 正相关. 3.已知x 与y 之间的一组数据:已求得关于y 与x 的回归直线方程为y ^=2.2x +0.7,则m 的值为( ) A .1 B .0.85 C .0.7 D .0.5 答案 D解析 x =0+1+2+34=1.5,y =m +3+5.5+74,将其代入y ^=2.2x +0.7,可得m =0.5,故选D.4.根据如下样本数据得到的回归直线方程为y ^=b ^x +a ^,则( )A.a ^>0,b ^>0B.a ^>0,b ^<0C.a ^<0,b ^>0 D.a ^<0,b ^<0答案 B解析 画出散点图,知a ^>0,b ^<0.5.已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的回归直线方程可能是( )A.y ^=0.4x +2.3B.y ^=2x -2.4C.y ^=-2x +9.5 D.y ^=-0.3x +4.4答案 A解析 由变量x 与y 正相关知C ,D 均错,又回归直线经过样本点的中心(3,3.5),代入验证得A 正确,B 错误. 故选A.6.已知x 与y 之间的一组数据:若y 与x 线性相关,则y 与x 的回归直线y ^=b ^x +a ^必过( ) A .点(2,2) B .点(1.5,0) C .点(1,2) D .点(1.5,4) 答案 D解析 ∵x =0+1+2+34=1.5,y =1+3+5+74=4,∴回归直线必过点(1.5,4).故选D. 7.已知x ,y 的取值如表所示:如果y 与x 线性相关,且回归直线方程为y ^=b ^x +132,则b ^等于( )A .-12 B.12 C .-110 D.110答案 A 解析 ∵x =2+3+43=3,y =6+4+53=5, ∴回归直线过点(3,5), ∴5=3b ^+132,∴b ^=-12,故选A.8.某产品的广告费用x (单位:万元)与销售额y (单位:万元)的统计数据如下表:根据上表可得回归方程y ^=b ^x +a ^中的b ^为9.4,据此模型预报广告费用为6万元时销售额为( ) A .63.6万元 B .65.5万元 C .67.7万元 D .72.0万元答案 B解析 x =4+2+3+54=3.5,y =49+26+39+544=42.因为回归直线过点(x ,y ),所以42=9.4×3.5+a ^,解得a ^=9.1.故回归方程为y ^=9.4x +9.1.所以当x =6时,y ^=6×9.4+9.1=65.5. 二、填空题9.为了研究某种细菌在特定环境下随时间变化的繁殖规律,得到了下表中的数据,计算得回归直线方程为y ^=0.85x -0.25.由以上信息,可得表中c 的值为________.答案 6 解析x =3+4+5+6+75=5,y =2.5+3+4+4.5+c 5=14+c 5,代入回归直线方程中得14+c5=0.85×5-0.25,解得c =6.10.如图所示的五组数据(x ,y )中,去掉________后,剩下的四组数据相关性增强.答案 (4,10)解析 去掉点(4,10)后,其余四点大致在一条直线附近,相关性增强. 11.在一次试验中测得(x ,y )的四组数据如下:根据上表可得回归直线方程y ^=-5x +a ^,据此模型预报当x =20时,y 的值为________. 答案 26.5 解析x =16+17+18+194=17.5,y =50+34+41+314=39,∴回归直线过点(17.5,39),∴39=-5×17.5+a ^,∴a ^=126.5, ∴当x =20时,y =-5×20+126.5=26.5.12.某工厂对某产品的产量与成本的资料分析后有如下数据:由表中数据得到的回归直线方程y ^=b ^x +a ^中b ^=1.1,预测当产量为9千件时,成本约为________万元. 答案 14.5解析 由表中数据得x =4,y =9,代入回归直线方程得a ^=4.6,∴当x =9时,y ^=1.1×9+4.6=14.5. 三、解答题13.某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)利用所给数据求两变量之间的回归直线方程y =b x +a ;(2)利用(1)中所求出的回归直线方程预测该地第6年的粮食需求量. 解 (1)由所给数据得x =3,y =5.8,b ^=∑i =15(x i -x )(y i -y )∑i =15(x i -x )2=1.1,a ^=y -b ^x =2.5,∴y ^=1.1x +2.5.故所求的回归直线方程为y ^=1.1x +2.5.(2)第6年的粮食需求量约为y ^=1.1×6+2.5=9.1(万吨).14.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i =184,∑i =110x 2i =720.(1)求家庭月储蓄y (千元)关于月收入x (千元)的回归直线方程; (2)若该居民区某家庭的月收入为7千元,预测该家庭的月储蓄. 解 (1)由题意知n =10,x =1n ∑i =110x i =110×80=8,y =1n ∑i =110y i =110×20=2,又∑i =110x 2i -n x 2=720-10×82=80, ∑i =110x i y i -n x y =184-10×8×2=24,由此得b ^=2480=0.3,a ^=y -b ^x =2-0.3×8=-0.4,故所求回归直线方程为y ^=0.3x -0.4.(2)将x =7代入回归直线方程,可以得到该家庭的月储蓄约为y ^=0.3×7-0.4=1.7(千元).。

高中数学人教A版必修三课时习题:第2章 统计 2.1.1含答案

高中数学人教A版必修三课时习题:第2章 统计 2.1.1含答案

2.1.1 简单随机抽样
课时目标
1.掌握简单随机抽样的定义及其特点.
2.能准确地应用抽签法及随机数表法解决问题.
识记强化
1.从总体中抽出的若干个个体组成的集合叫做总体的一个样本,样本中个体的数量叫做样本容量.
2.简单随机抽样的定义
一般地,设一个总体有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N ),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.
3.简单随机抽样的分类
简单随机抽样⎩⎪⎨⎪⎧
抽签法抓阄法随机数表法 4.简单随机抽样的优点及适用类型 简单随机抽样有操作简便易行的优点,在总体个数不多的情况下是行之有效的.
课时作业
一、选择题
1.为了了解全校240名高一学生的身高情况,从中抽取40名学生进行测量,下列说法正确的是( )。

高中数学必修三 计数,概率,统计与分布列知识梳理 含答案

高中数学必修三 计数,概率,统计与分布列知识梳理 含答案

计数,概率,统计与分布列知识梳理10.1分类加法计数原理与分步乘法计数原理1.分类加法计数原理完成一件事,可以有n类办法,在第一类办法中有m1种方法,在第二类办法中有m2种方法,……,在第n类办法中有m n种方法.那么,完成这件事共有_____________种方法.(也称加法原理)2.分步乘法计数原理完成一件事需要经过n个步骤,缺一不可,做第一步有m1种方法,做第二步有m2种方法,……,做第n步有m n种方法.那么,完成这件事共有__________________种方法.(也称乘法原理) 3.分类加法计数原理与分步乘法计数原理,都涉及完成一件事的不同方法的种数.它们的区别在于:分类加法计数原理与分类有关,各种方法相互独立,用其中的任一种方法都可以完成这件事;分步乘法计数原理与分步有关,各个步骤相互依存,只有各个步骤都完成了,这件事才算完成.[方法与技巧]1.分类加法和分步乘法计数原理,都是关于做一件事的不同方法的种数的问题,区别在于:分类加法计数原理针对“分类”问题,其中各种方法相互独立,用其中任何一种方法都可以做完这件事;分步乘法计数原理针对“分步”问题,各个步骤相互依存,只有各个步骤都完成了才算完成这件事.2.分类标准要明确,做到不重复不遗漏.3.混合问题一般是先分类再分步.4.要恰当画出示意图或树状图,使问题的分析更直观、清楚,便于探索规律.[失误与防范]1.切实理解“完成一件事”的含义,以确定需要分类还是需要分步进行.2.分类的关键在于要做到“不重不漏”,分步的关键在于要正确设计分步的程序,即合理分类,准确分步.3.确定题目中是否有特殊条件限制.10.2排列与组合1.排列与组合的概念2.(1)排列数的定义:从n个不同元素中取出m(m≤n)个元素的_________的个数叫作从n个不同元素中取出m个元素的排列数,用A m n表示.(2)组合数的定义:从n个不同元素中取出m(m≤n)个元素的_________的个数,叫作从n个不同元素中取出m个元素的组合数,用C m n表示.3.排列数、组合数的公式及性质1.对于有附加条件的排列、组合应用题,通常从三个途径考虑:(1)以元素为主考虑,即先满足特殊元素的要求,再考虑其他元素;(2)以位置为主考虑,即先满足特殊位置的要求,再考虑其他位置;(3)先不考虑附加条件,计算出排列数或组合数,再减去不符合要求的排列数或组合数.2.排列、组合问题的求解方法与技巧:(1)特殊元素优先安排;(2)合理分类与准确分步;(3)排列、组合混合问题先选后排;(4)相邻问题捆绑处理;(5)不相邻问题插空处理;(6)定序问题排除法处理;(7)分排问题直排处理;(8)“小集团”排列问题先整体后局部;(9)构造模型;(10)正难则反,等价条件.[失误与防范]求解排列与组合问题的三个注意点:(1)解排列与组合综合题一般是先选后排,或充分利用元素的性质进行分类、分步,再利用两个原理做最后处理.(2)解受条件限制的组合题,通常用直接法(合理分类)或间接法(排除法)来解决,分类标准应统一,避免出现重复或遗漏.(3)对于选择题要谨慎处理,注意等价答案的不同形式,处理这类选择题可采用排除法分析选项,错误的答案都有重复或遗漏的问题.10.3二项式定理1.二项式定理(1)0≤r≤n时,C r n与C n-r的关系是______n(2)二项式系数先增后减________最大当n为偶数时,第_____项的二项式系数最大,最大值为__;当n为奇数时,第____项和_______项的二项式系数最大,最大值为______和_____(3)各二项式系数和:C0n+C1n+C2n+…+C n n=____,C0n+C2n+C4n+…=C1n+C3n+C5n+…=____【知识拓展】二项展开式形式上的特点(1)项数为______(2)各项的次数都等于二项式的幂指数n,即a与b的指数的和为n.(3)字母a按_____排列,从第一项开始,次数由n逐项减1直到零;字母b按_____排列,从第一项起,次数由零逐项增1直到n.,___(4)二项式的系数从____,C1n,一直到C n-1n[方法与技巧]1.通项T r+1=C r n a n-r b r是(a+b)n的展开式的第r+1项,而不是第r项,这里r=0,1,…,n.2.二项式系数与项的系数是完全不同的两个概念.二项式系数是指C0n,C1n,…,C n n,它只与各项的项数有关,而与a,b的值无关;而项的系数是指该项中除变量外的常数部分,它不仅与各项的项数有关,而且也与a,b的值有关.3.因为二项式定理中的字母可取任意数或式,所以在解题时根据题意,给字母赋值,是求解二项展开式各项系数和的一种重要方法.4.运用通项求展开式的一些特殊项,通常都是由题意列方程求出r,再求所需的某项;有时需先求n,计算时要注意n和r的取值范围及它们之间的大小关系.[失误与防范]1.项的系数与a、b有关,二项式系数只与n有关,大于0.2.求二项式所有系数的和,可采用“赋值法”.3.关于组合式的证明,常采用“构造法”——构造函数或构造同一问题的两种算法.4.展开式中第r+1项的二项式系数与第r+1项的系数一般是不相同的,在具体求各项的系数时,一般先处理符号,对根式和指数的运算要细心,以防出错.11.1随机抽样1.抽样调查(1)抽样调查通常情况下,从调查对象中按照一定的方法抽取一部分,进行_________,获取数据,并以此对调查对象的某项指标作出_______,这就是抽样调查.(2)总体和样本调查对象的______称为总体,被抽取的_______称为样本.(3)抽样调查与普查相比有很多优点,最突出的有两点:①______________;②节约人力、物力和财力.2.简单随机抽样(1)简单随机抽样时,要保证每个个体被抽到的概率______(2)通常采用的简单随机抽样的方法:__________________3.分层抽样(1)定义:将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为类型抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.4.系统抽样系统抽样是将总体中的个体进行编号,_______分组,在第一组中按照___________抽取第一个样本,然后按____________ (称为抽样距)抽取其他样本.这种抽样方法有时也叫等距抽样或机械抽样.[方法与技巧]1.简单随机抽样的特点:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小;用简单随机抽样法抽取的个体带有随机性;个体间无固定间距.2.系统抽样的特点:适用于元素个数很多且均衡的总体;各个个体被抽到的机会均等;总体分组后,在起始部分抽样时,采用简单随机抽样.3.分层抽样的特点:适用于总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样或系统抽样.[失误与防范]进行分层抽样时应注意以下几点:(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是层内样本的差异要小,两层之间的样本差异要大,且互不重叠.(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同.\11.2统计图表,用样本估计总体1.统计图表统计图表是_____和_____数据的重要工具,常用的统计图表有____________,______________,______________,______________等.2.数据的数字特征(1)众数、中位数、平均数众数:在一组数据中,出现次数_____的数据叫作这组数据的众数.中位数:将一组数据按大小依次排列,把处在_______位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数.平均数:样本数据的算术平均数,即x=________________在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.(2)样本方差、标准差标准差s=______________________________其中x n是样本数据的第n项,n是___________,x是________标准差是刻画数据的离散程度的特征数,样本方差是标准差的____.通常用样本方差估计总体方差,当____________________时,样本方差很接近总体方差.3.用样本估计总体(1)通常我们对总体作出的估计一般分成两种,一种是用_____________________________,另一种是用____________________________(2)在频率分布直方图中,纵轴表示______,数据落在各小组内的频率用______________表示,各小长方形的面积总和等于____.(3)在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的_____开始,用线段依次连接各个矩形的__________,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图.(4)当样本数据较少时,用茎叶图表示数据的效果较好,它没有信息的缺失,而且___________,方便表示与比较.[方法与技巧]1.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.2.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.3.若取值x1,x2,…,x n的频率分别为p1,p2,…,p n,则其平均值为x1p1+x2p2+…+x n p n;若x1,x2,…,x n的平均数为x,方差为s2,则ax1+b,ax2+b,…,ax n+b的平均数为a x +b,方差为a2s2.[失误与防范]频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.11.3变量间的相关关系,统计案例1.相关性(1)通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的_______(2)从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这样近似的过程称为_______(3)在两个变量x和y的散点图中,若所有点看上去都在一条直线附近波动,则称变量间是__________的,若所有点看上去都在某条曲线(不是一条直线)附近波动,称此相关是___________的.如果所有的点在散点图中没有显示任何关系,则称变量间是__________ 2.线性回归方程(1)最小二乘法如果有n 个点(x 1,y 1),(x 2,y 2),…,(x n ,y n ),可以用[y 1-(a +bx 1)]2+[y 2-(a +bx 2)]2+…+[y n -(a +bx n )]2来刻画这些点与直线y =a +bx 的接近程度,使得上式达到最小值的直线y =a +bx 就是所要求的直线,这种方法称为最小二乘法.(2)线性回归方程方程y =bx +a 是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的线性回归方程,其中a ,b 是待定参数.⎩⎪⎨⎪⎧ b =∑n i =1 (x i -x )(y i -y )∑n i =1 (x i -x )2=∑n i =1x i y i -n x y ∑n i =1x 2i -n x 2,a =y -b x .3.回归分析(1)定义:对具有________的两个变量进行统计分析的一种常用方法.(2)样本点的中心对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )中,________称为样本点的中心.(3)相关系数①r =∑ni =1 (x i -x )(y i -y )∑n i =1 (x i -x )2∑n i =1(y i -y )2=∑ni =1x i y i -n x y(∑n i =1x 2i -n x 2)(∑n i =1y 2i -n y 2);②当r >0时,表明两个变量_______;当r <0时,表明两个变量_________当r =0时,表明两个变量_________.r 的绝对值越接近于1,表明两个变量之间的线性相关程度_______.r 的绝对值越接近于0,表明两个变量之间的线性相关程度越低.4.独立性检验设A ,B 为两个变量,每一个变量都可以取两个值,变量A :A 1,A 2=A 1;变量B :B 1,B 2=B 1;2×2列联表:构造一个随机变量χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).利用随机变量χ2来判断“两个分类变量有关系”的方法称为独立性检验.当χ2≤2.706时,没有充分的证据判定变量A,B有关联,可以认为变量A,B没有关联的;当χ2>2.706时,有90%的把握判定变量A,B有关联;当χ2>3.841时,有95%的把握判定变量A,B有关联;当χ2>6.635时,有99%的把握判定变量A,B有关联.[方法与技巧]1.回归分析是处理变量相关关系的一种数学方法.主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程.2.根据χ2的值可以判断两个分类变量有关的可信程度.[失误与防范]1.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.2.独立性检验中统计量χ2的值的计算公式很复杂,在解题中易混淆一些数据的意义,代入公式时出错,而导致整个计算结果出错.12.1随机事件的概率1.随机事件和确定事件(1)在条件S下,一定会发生的事件,叫作相对于条件S的_____________(2)在条件S下,一定不会发生的事件,叫作相对于条件S_____________(3)___________________________统称为相对于条件S的确定事件.(4)______________________________的事件,叫作相对于条件S的随机事件.(5)___________和____________统称为事件,一般用大写字母A,B,C…表示.2.频率与概率在相同的条件下,大量重复进行同一试验时,随机事件A发生的频率会在某个常数附近摆动,即随机事件A发生的频率具有_______.这时,我们把_______叫作随机事件A的概率,记作P(A).3.事件的关系与运算互斥事件:在一个随机试验中,我们把一次试验下发生的两个事件A与B称作互斥事件.事件A+B:事件A+B发生是指事件A和事件B______________________对立事件:不会______发生,并且___________发生的事件是相互对立事件.4.概率的几个基本性质(1)概率的取值范围:________________(2)必然事件的概率P(E)=____(3)不可能事件的概率P(F)=____(4)互斥事件概率的加法公式①如果事件A与事件B互斥,则P(A+B)=________________②若事件A与事件A互为对立事件,则P(A)=______________.[知识拓展]互斥事件与对立事件的区别与联系互斥事件与对立事件都是两个事件的关系,互斥事件是不能同时发生的两个事件,而对立事件除要求这两个事件不同时发生外,还要求二者之一必须有一个发生,因此,对立事件是互斥事件的特殊情况,而互斥事件未必是对立事件.[方法与技巧]1.对于给定的随机事件A,由于事件A发生的频率f n(A)随着试验次数的增加稳定于_________, 因此可以用频率f n(A)来估计概率P(A).2.从集合角度理解互斥事件和对立事件从集合的角度看,几个事件彼此互斥,是指由各个事件所含的结果组成的集合彼此的交集为______,事件A的对立事件A所含的结果组成的集合,是全集中由事件A所含的结果组成的集合的_______.[失误与防范]1.正确认识互斥事件与对立事件的关系:对立事件是互斥事件,是互斥事件中的特殊情况,但互斥事件不一定是对立事件,“互斥”是“对立”的__________条件.2.需准确理解题意,特别留心“至多……”“至少……”“不少于……”等语句的含义.12.2古典概型1.基本事件的特点(1)任何两个基本事件是_______的;(2)任何事件(除不可能事件)都可以表示成_____________的和.2.古典概型具有以下两个特点的概率模型称为古典的概率模型,简称古典概型.(1)试验的所有可能结果_____________,每次试验只出现其中的一个结果;(2)每一个试验结果出现的可能性__________3.如果一次试验中可能出现的结果有n 个,而且所有结果出现的可能性都相等,那么每一个基本事件的概率都是 1n;如果某个事件A 包括的结果有m 个,那么事件A 的概率P (A )= ________ .4.古典概型的概率公式P (A )=事件A 包含的可能结果数试验的所有可能结果数. [方法与技巧]1.古典概型计算三步曲第一,本试验是不是等可能的;第二,本试验的基本事件有多少个;第三,事件A 是什么,它包含的基本事件有多少个.2.确定基本事件的方法(1)当基本事件总数较少时,可列举计算;(2)列表法、树状图法.3.较复杂事件的概率可灵活运用互斥事件、对立事件、相互独立事件的概率公式简化运算.[失误与防范]1.古典概型的重要思想是事件发生的等可能性,一定要注意在计算基本事件总数和事件包括的基本事件个数时,它们是不是等可能的.2.概率的一般加法公式:P (A +B )=___________________.公式使用中要注意:(1)公式的作用是求A +B 的概率,当AB =∅时,A 、B 互斥,此时P (AB )=0,所以P (A +B )=P (A )+P (B );(2)要计算P (A +B ),需要求P (A )、P (B ),更重要的是把握事件AB,并求其概率;(3)该公式可以看作一个方程,知三可求一.12.3几何概型1.几何概型向平面上有限区域(集合)G内随机地投掷点M,若点M落在子区域G1G的概率与G1的面积成正比,而与G的形状、位置无关,即P(点M落在G1)=___________,则称这种模型为几何概型.2.几何概型中的G也可以是空间中或直线上的有限区域,相应的概率是_______之比或_________之比.3.借助_________可以估计随机事件发生的概率.[方法与技巧]1.区分古典概型和几何概型最重要的是看__________的个数是有限个还是无限个.2.转化思想的应用对一个具体问题,可以将其几何化,如建立坐标系将试验结果和点对应,然后利用几何概型概率公式.(1)一般地,一个连续变量可建立与_____有关的几何概型,只需把这个变量放在坐标轴上即可;(2)若一个随机事件需要用两个变量来描述,则可用这两个变量的有序实数对来表示它的基本事件,然后利用平面直角坐标系就能顺利地建立与______有关的几何概型;(3)若一个随机事件需要用三个连续变量来描述,则可用这三个变量组成的有序数组来表示基本事件,利用空间直角坐标系建立与_______有关的几何概型.[失误与防范]1.准确把握几何概型的“测度”是解题关键;2.几何概型中,线段的端点、图形的边框是否包含在事件之内_________所求结果.12.4离散型随机变量及其分布列1.离散型随机变量的分布列(1)将随机现象中试验(或观测)的每一个可能的结果都对应于________,这种_______称为一个随机变量.(2)离散型随机变量:随机变量的取值能够______________,这样的随机变量称为离散型随机变量.(3)设离散型随机变量X的取值为a1,a2,…随机变量X取a i的概率为p i(i=1,2,…),记作:_____________ (i=1,2,…),或把上式列表:称为离散型随机变量X(4)性质:①p i___0,i=1,2,…;②p1+p2+…=___.2.超几何分布一般地,设有N件产品,其中有M(M≤N)件次品.从中任取n(n≤N)件产品,用X表示取出的n件产品中次品的件数,那么P(X=k)=______________ (其中k为非负整数).如果一个随机变量的分布列由上式确定,则称X服从参数为N,M,n的超几何分布.[方法与技巧]1.对于随机变量X的研究,需要了解随机变量能取哪些值以及取这些值或取某一个集合内的值的概率,对于离散型随机变量,它的分布正是指出了随机变量X的______以及取这些值的______.2.求离散型随机变量的分布列,首先要根据具体情况确定X的取值情况,然后利用排列、组合与概率知识求出X取各个值的概率.[失误与防范]掌握离散型随机变量的分布列,须注意:(1)分布列的结构为两行,第一行为随机变量X所有可能取得的值;第二行是对应于随机变量X的值的事件发生的概率.看每一列,实际上是上为“事件”,下为“事件发生的概率”,只不过“事件”是用一个反映其结果的实数表示的.每完成一列,就相当于求一个随机事件发生的概率.(2)要会根据分布列的两个性质来检验求得的分布列的正误.12.5二项分布及其应用1.条件概率在已知B发生的条件下,事件A发生的概率叫作B发生时A发生的___________,用符号P(A|B)来表示,其公式为P(A|B)=__________ (P(B)>0).2.相互独立事件(1)一般地,对两个事件A,B,如果有________________,则称A、B相互独立.(2)如果A、B相互独立,则_________________________________也相互独立.(3)如果A1,A2,…,A n相互独立,则有:P(A1A2…A n)=_________________________.3.二项分布进行n次试验,如果满足以下条件:(1)每次试验只有两个相互对立的结果,可以分别称为“成功”和“失败”;(2)每次试验“成功”的概率均为p,“失败”的概率均为1-p;(3)各次试验是___________.用X表示这n次试验中成功的次数,则P(X=k)=_____________ (k=0,1,2,…,n)若一个随机变量X的分布列如上所述,称X服从参数为n,p的二项分布,简记为X~B(n,p).[方法与技巧]1.古典概型中,A发生的条件下B发生的条件概率公式为P(B|A)=____=_____,其中,在实际应用中P(B|A)=n(AB)n(A)是一种重要的求条件概率的方法.2.相互独立事件与互斥事件的区别相互独立事件是指两个事件发生的概率互不影响,计算式为____________.互斥事件是指在同一试验中,两个事件不会同时发生,计算公式为_______________.3.n次独立重复试验中,事件A恰好发生k次可看作是____个互斥事件的和,其中每一个事件都可看作是__个A事件与____个A事件同时发生,只是发生的次序不同,其发生的概率都是_________.因此n次独立重复试验中事件A恰好发生k次的概率为C k n p k(1-p)n-k. [失误与防范]1.运用公式P(AB)=P(A)P(B)时一定要注意公式成立的条件,只有当事件A、B相互独立时,公式才成立.2.独立重复试验中,每一次试验只有两种结果,即某事件要么发生,要么不发生,并且任何一次试验中某事件发生的概率相等.注意“恰好”与“至多(少)”的关系,灵活运用对立事件.12.6离散型随机变量的均值与方差,正态分布1.离散型随机变量的均值与方差若离散型随机变量X的分布列为P(X=a i)=p i(i=1,2,…r).(1)均值EX=________________________,EX刻画的是_____________________(2)方差DX=_______________为随机变量X的方差,它刻画了随机变量X与其均值EX的____________________2.二项分布的均值、方差若X~B(n,p),则EX=_____________,DX=______________3.正态分布(1)X~N(μ,σ2),表示X服从参数为__________的正态分布.(2)正态分布密度函数的性质:①函数图像关于___________对称;②_________________决定函数图像的“胖”“瘦”;③P(μ-σ<X<μ+σ)=__________;P(μ-2σ<X<μ+2σ)=__________;P(μ-3σ<X<μ+3σ)=__________[方法与技巧]1.均值与方差的性质(1)E(aX+b)=__________,D(aX+b)=_______(a,b为常数).(2)若X服从两点分布,则EX=___,DX=_______.(3)若X服从二项分布,即X~B(n,p),则EX=_____,DX=________.2.求离散型随机变量的均值与方差的基本方法(1)已知随机变量的分布列求它的均值、方差,按定义求解.(2)已知随机变量X的均值、方差,求X的线性函数Y=aX+b的均值、方差,可直接用X 的均值、方差的性质求解.(3)如果所给随机变量是服从常用的分布(如两点分布、二项分布等),利用它们的均值、方差公式求解.3.若X服从正态分布,即X~N(μ,σ2),要充分利用正态曲线的对称性和曲线与x轴之间的面积为____.[失误与防范]1.在没有准确判断分布列模型之前不能随便套用公式.2.对于应用问题,必须对实际问题进行具体分析,一般要将问题中的随机变量设出来,再进行分析,求出随机变量的分布列,然后按定义计算出随机变量的均值、方差.计数,概率,统计与分布列知识梳理答案10.1分类加法计数原理与分步乘法计数原理1. N=m1+m2+…+m n 2 .N=m1×m2×…×m n10.2排列与组合1. 一定的顺序2.(1) 所有排列(2) 所有组合3. (1) n(n-1)(n-2)…(n-m+1) ,n!(n-m)!(2) A m nA m m,n(n-1)(n-2)…(n-m+1)m!,n!m!(n-m)!(3) 1 , n!(4) C n-mn , C m n+C m-1n10.3二项式定理1.C0n a n+C1n a n-1b+…+C r n a n-r b r+…+C n n b n, r+12. (1) C r n=C n-rn .(2)中间项,n2+1 ,2Cnn,n+12, n+32,12Cnn-,12Cnn+.(3)2n 2n-1.【知识拓展】(1) n+1. (3) 降幂, 升幂(4) C0n, C n n.11.1随机抽样1.(1) 调查或观测, 推断(2) 全体, 一部分(3)①迅速、及时;2.(1) 相同.(2) 抽签法和随机数法.4. 等距,简单随机抽样, 分组的间隔11.2统计图表,用样本估计总体1.表达, 分析, 条形统计图、扇形统计图、折线统计图、茎叶图2.(1) 最多, 最中间, 1n(x1+x2+…+x n).(2)1n[(x1-x)2+(x2-x)2+…+(x n-x)2],, 样本容量, 平均数, 平方, 样本容量接近总体容量3.(1) 样本的频率分布估计总体的频率分布, 样本的数字特征估计总体的数字特征.(2) 频率组距, 各小长方形的面积, 1 (3)中点, 顶端中点(4) 可以随时记录11.3变量间的相关关系,统计案例1.(1)散点图.(2)曲线拟合.(3)线性相关, 非线性相关, 不相关的.3.(1) 相关关系(2) (x,y) (3)②正相关, 负相关, 线性不相关, 越高12.1随机事件的概率1.(1)必然事件(2)不可能事件(3)必然事件与不可能事件(4)在条件S下可能发生也可能不发生(5)确定事件和随机事件2.稳定性, 这个常数3.不能同时, 至少有一个发生,同时, 一定有一个4.(1)0≤P(A)≤1. (2)1. (3)0. (4)①P(A)+P(B).②1-P(A).[方法与技巧]1. 概率P(A)2. 空集, 补集[失误与防范]1.必要不充分12.2古典概型1.(1)互斥(2)基本事件2.(1)只有有限个,(2)相同3.m n.[失误与防范]2.P(A)+P(B)-P(AB) 12.3几何概型1.G1的面积G的面积2.体积,长度3.模拟方法[方法与技巧]。

高中数学必修3(人教B版)第二章统计2.2知识点总结含同步练习题及答案

高中数学必修3(人教B版)第二章统计2.2知识点总结含同步练习题及答案

4. 某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方 图,其中产品净重的范围是 [96, 106] ,样本数据分组为 [96, 98) , [98, 100) , [100, 102) ,
[102, 104) , [104, 106] ,已知样本中产品净重小于 100 克的个数是 36 ,则样本中净重大于或等于 98 克
并且小于 104 克的产品的个数是 (
).
A.90
答案: A 解析: 产品净重小于
B.75
C.60
D.45
100 克的概率为 (0.050 + 0.100) × 2 = 0.300 , 已知样本中产品净重小于 100 克的个数是 36 ,设样本容量为 n , 36 则 ,所以 n = 120 ,净重大于或等于 98 克并且小于 n 104 克的产品的概率为 (0.100 + 0.150 + 0.125) × 2 = 0.75 ,所以样本 中净重大于或等于 98 克并且小于 104 克的产品的个数是 120 × 0.75 = 90 .
).
A.2, 5
答案: C
B.5, 5
C.5, 8
D.8, 8
3. 样本中共有五个个体,其值分别为 a, 0, 1, 2, 3 ,若该样本的平均值为 1 ,则样本方差为 (
− − 6 A.√ 5
答案: D 解析:
)
B.
6 5
C.√2
D.2
a+0+1+2+3 = 1 ,得 a = −1 . 5 1 所以 s2 = [(−1 − 1)2 + (0 − 1)2 + (1 − 1)2 + (2 − 1)2 + (3 − 1)2 ] = 2 . 5

高中数学人教A版必修三课时习题:第2章统计2.3含答案

高中数学人教A版必修三课时习题:第2章统计2.3含答案

2. 3变量间的有关关系课时目标1.理解变量之间的有关关系的观点和线性回归的观点.2.认识线性回归的基本思想和方法.3.能依据两个有关关系的变量的数据作出散点图.4.认识运用最小二乘法的思想求回归直线方程的方法.识记加强1.有关关系:与函数关系不一样,有关关系是一种非确立性关系.2.从散点图上看,点分布在从左下角到右上角的地区内,两个变量的这类有关关系称为正有关;点分布在从左上角到右下角的地区内,两个变量的有关关系为负有关.3.从散点图上看,假如这些点从整体上看大概分布在经过散点图中心的一条直线邻近,我们就称这两个变量之间拥有线性有关关系,这条直线叫做回归直线.^ ^^4.回归直线方程y= b x+a,此中n nx i- xy i- y x i y i-n x · yi = 1i = 1^=,b=n n.x i- x22- n x2x ii =1i =1^^xa=y- bb 是回归方程的斜率, a 是截距.n5.经过求Q=( y i-bx i-a) 2的最小值而得出回归直线的方法,即求回归直线,使得i= 1样本数据的点到它的距离的平方和最小,这一方法叫做最小二乘法.作一、1.以下关系中,属于有关的是()A.父亲母亲的身高与儿女身高的关系B.作物量与施肥量的关系C.抽烟与健康的关系D.数学成与物理成的关系答案: C分析:抽烟有害健康,所以,抽烟与健康之的关系属于有关.2.以下有关性回的法,不正确的选项是()A.量取必定,因量的取有必定随机性的两个量之的关系叫做有关关系B.在平面直角坐系顶用描点的方法获取表示拥有有关关系的两个量的一数据的形叫做散点C.回直方程最能代表x、 y 之的关系D.任何一都能获取拥有代表意的回直方程答案: D分析:只有全部的数据点都分布在一条直邻近,才能获取拥有代表意的回直.3.量x, y 有数据( x i, y i)( i =1,2,⋯,10),得散点(1);量u, v 有数据 ( u i,v i )( i= 1,2 ,⋯, 10) ,得散点 (2) .由两个散点能够判断()A.量x与y正有关,u与v正有关B.量x与y正有关,u与v有关C.量x与y有关,u与v正有关D.量x与y有关,u与v有关答案: C分析:由图 (1) 可知,各点整体呈递减趋向,x 与 y 负有关;由图(2)可知,各点整体呈递加趋向, u 与 v 正有关.4.某商品销售量y(件)与销售价钱 x(元/件)呈负有关,则其回归方程可能是()^=- 10x+ 200^= 10x+ 200A.yB.y^=- 10x - 200^=10 -200C.yD.yx答案: A分析:∵销售量 y(件)与销售价钱x(元/件)呈负有关,∴x 的系数为负.又∵ y 不可以为负值,∴常数项一定是正当.应选 A.5.线性回归方程^) y=bx+a必过 (A.--B.-, 0) ( x, y )( xC.-(0 , y ) D . (0,0)答案: A分析:回归直线必定过样本中心--( x, y ) .6.为认识儿子身高与其父亲自高的关系,随机抽取 5 对父子的身高数据以下:父亲自高 x/cm174176176176178儿子身高 y/cm175175176177177则 y 对 x 的线性回归方程为()^^= x+1A.y= x-1B.y^= 0.5 x+ 88^= 176C.yD.y答案: A分析:分别将数据代当选项中,经考证 A 正确.二、填空题^7.关于回归方程y= 4.75 x+ 257,当x= 28 时,y的估计值是 ________.答案: 390^分析: y=4.75 ×28+ 257= 390.8.某企业的广告费支出x 与销售额 y(单位:万元)之间有以下对应数据:由资料显示y 与 x 呈线性有关关系.x24568y3040605070依据上表供给的数据获取回归方程^,展望销售额为115 万元时约y=bx+a中的b= 6.5需________万元广告费.答案: 15-1分析: y=5(30 +40+ 60+50+ 70) = 50,^^ -^-×5= 17.5 ,由 b= 6.5知, a= y- b· x = 50-6.5^^∴ y= 17.5 +6.5 x,当 y= 115 时,解得x= 15.9.若对某个地域人均薪资x 与该地域人均花费y 进行检查统计得y 与 x 拥有有关关系,^= 0.7 x+ 2.1(单位:千元 ) ,若该地域人均花费水平为10.5 ,则估计该地且回归直线方程 y区人均花费额占人均薪资收入的百分比约为________.答案: 87.5%分析:设该地域人均薪资收入为y =0.7 x +2.1,当 y =10.510.5 - 2.1= 12.时, x =0.710.5∴12×100%= 87.5%.三、解答题10.某种产品的广告费支出x 与销售额 y(单位:百万元)之间有以下对应数据:x24568y3040605070依据上表中的数据制成散点图,你能从散点图中发现广告费支出与销售额之间的近似关系吗?解:散点图如图:从散点图中,能够看出广告费支出与销售额之间的整体趋向成一条直线,它们之间是线性有关的.11.下边是两个变量的一组数据:x12345678y1491625364964请用最小二乘法求出这两个变量之间的回归直线方程.解:依据表中的数据,能够计算出:x =4.5, y =25.5,其余数据以下表:x i y i2x i y i x i1111244839927416166452525125636362167494934386464512共计362042041296从而,能够求得^1296-8×4.5 ×25.5 b=204-8×4.5 ×4.5于是,线性回归方程是^= 9, a=- 15.^y=- 15+ 9x.能力提高^12.工人月薪资y(元)与劳动生产率x(千元)变化的回归方程为y= 50+80x,以下判断正确的选项是 ()①劳动生产率为 1千元时,薪资为 130 元②劳动生产率提高 1 千元,则薪资提高80 元③劳动生产率提高 1 千元,则薪资提高130 元④当月薪资为 210元时,劳动生产率为 2 千元A.①② B .①②④C.②④ D .①②③④答案: B^分析:关于 y= 50+ 80x,当劳动生产率提高 1 千元,则薪资提高 80 元,而不是 130 元,故③错.13.某工厂为了对新研发的一种产品进行合理订价,将该产品按预先制定的价钱进行试销,获取以下数据:单价 x/元88.28.48.68.89销量 y/件908483807568(1)^ ^ ^^^^求回归直线方程 y= b x+ a,此中 b=- 20, a=y- b x;(2)估计在此后的销售中,销量与单价仍旧听从(1)中的关系,且该产品的成本是 4 元 /件,为使工厂获取最大收益,该产品的单价应定为多少元?( 收益=销售收入-成本)1解: (1) x=6(8 +8.2 + 8.4 + 8.6+8.8 + 9) =8.5,1y=6(90 + 84+ 83+ 80+ 75+ 68) =80,^又 b=- 20,^^所以 a=y- b x=80+20×8.5 = 250,从而回归直线方程为y =-20x+250.(2)设工厂获取的收益为 L 元,依题意得L= x(-20x+250)-4(-20x+250)=- 20x2+ 330x-1000=- 20( x- 8.25) 2+ 361.25.当且仅当 x=8.25时, L 获得最大值.故当单价定为8.25 元时,工厂可获取最大收益.。

2019—2020年最新苏教版高中数学必修三《统计》章末考点复习课及解析.docx

2019—2020年最新苏教版高中数学必修三《统计》章末考点复习课及解析.docx

(新课标)2019—2020学年苏教版高中数学必修三章末复习课课时目标 1.巩固本章主干知识点.2.提高知识的综合应用能力.1.某质检人员从编号为1~100这100件产品中,依次抽出号码为3,13,23,…,93的产品进行检验,则这样的抽样方法是________.2.某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为7人,则样本容量为________.3.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是____________.897931640 24.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x-y|的值为________.5.如果数据x1,x2,…,x n的平均数为x,方差为s2,则2x1+3,2x2+3,…,2x n +3的平均数和方差分别为____________.6.某棉纺厂为了了解一批棉花的质量,从中随机抽测了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据均在区间[5,40]中,其频率分布直方图如图所示,则在抽测的100根中,有______根棉花纤维的长度小于20 mm.一、填空题1.为了调查参加运动会的500名运动员的身高情况,从中抽查了50名运动员的身高,就这个问题来说,下列说法正确的是________.①50名运动员是总体;②每个运动员是个体;③抽取的50名运动员是样本;④样本容量是50.2.某高级中学高一年级有十六个班,812人,高二年级有十二个班,605人,高三年级有十个班,497人,学校为加强民主化管理,现欲成立由76人组成的学生代表会,你认为下列代表产生的办法中,最符合统计抽样原则的是________.(填序号)①指定各班团支部书记、班长为代表;②全校选举出76人;③高三选举出20人,高二选举出24人,高一选举出32人;④高三20人,高二24人,高一32人均在各年级随机抽取.3.一个容量为n的样本,分成若干组,已知某组的频数和频率分别为40和0.125,则n的值是________.4.观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿的体重在[2 700,3 000]的频率为____.5.在某项体育比赛中,七位裁判为一选手打出的分数如下:90 89 90 95 93 94 93去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为________.6.下列图形中具有相关关系的两个变量是________.7.一个总体中有100个个体,随机编号0,1,2,…,99,依从小到大的编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同,若m=8,则在第8组中抽取的号码是________.8.一个样本容量是100的频率分布如图(1)样本落在[60,70)内的频率为________;(2)样本落在[70,80)内的频数为________;(3)样本落在[90,100)内的频率是0.16,该小矩形的高是________.9.某商店统计了最近6个月某商品的进价x与售价y(单位:元)的对应数据如下表:x 3528912y 46391214假设得到的关于x和y之间的线性回归方程是=bx+a,那么该直线必过的定点是________.二、解答题10.对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:甲6080709070乙8060708075分别计算两个样本的平均数x和方差s2,并根据计算结果估计甲、乙谁的平均成绩较好?谁的各门功课发展较平衡?11.下表数据是退水温度x(℃)对黄酮延长性y(%)效应的试验结果,y是以延长度计算的,且对于给定的x,y为正态变量,其方差与x无关.x(℃)300400500600700800y(%)405055606770(1)画出散点图;(2)指出x,y是否线性相关;(3)若线性相关,求y关于x的回归方程;(4)估计退水温度是1 000℃时,黄酮延长性的情况.能力提升12.在一次中学生田径运动会上,参加跳高的17名运动员成绩如下:成绩1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90(单位m)人数2323411 1(1)分别求这些运动员成绩的众数、中位数、平均数(保留3个有效数字);(2)分析这些数据的含义.13.去年西南一地区遭遇严重干旱,某乡计划向上级申请支援,为上报需水量,乡长事先抽样调查了100户村民的月均用水量,得到这100户村民月均用水量的频率分布表如下表:(月均用水量的单位:吨)用水量分组 频数 频率 [0.5,2.5) 12[2.5,4.5)[4.5,6.5) 40 [6.5,8.5)0.18[8.5,10.5] 6 合计1001(1)请完成该频率分布表,并画出相对应的频率分布直方图和频率分布折线图;(2)估计样本的中位数是多少?(3)已知上级将按每户月均用水量向该乡调水,若该乡共有1 200户,请估计上级支援该乡的月调水量是多少吨?1.三种常用的抽样方法:简单随机抽样、系统抽样和分层抽样.在使用它们的过程中,每一个个体被抽到的可能性是一样的.应用抽样方法抽取样本时,应注意以下几点: (1)用随机数表法抽样时,对个体所编的号码位数是相等的,当问题所给位数不相等时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数.(2)用系统抽样法抽样时,如果总体容量N 能被样本容量n 整除,抽样间隔为k =N n,如果总体容量N 不能被样本容量n 整除,先用简单抽样法剔除多余个数、抽样间隔为k =[N n],([N n]表示取N n的整数部分.)(3)三种抽样方法的适用范围:当总体容量较小,样本容量也较小时,可采用抽签法;当总体容量较大,样本容量较小时,可采用随机数表法;当总体容量较大,样本容量也较大时,可采用系统抽样法;当总体由差异明显的几部分组成时,可采用分层抽样法. 2.为了从整体上更好地把握总体的规律,可以通过样本数据的众数、中位数、平均数和标准差等数字特征对总体的数字特征作出估计.众数就是样本数据中出现次数最多的那个值;中位数就是把样本数据分成相同数目的两部分,其中一部分比这个数小,另一部分比这个数大的那个数;平均数就是所有样本数据的平均值,用x 表示;标准差是反映样本数据分散程度大小的最常用统计量,其计算公式如下:s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2].有时也用标准差的平方s 2——方差来代替标准差,实质一样. 3.求线性回归方程的步骤:(1)先把数据制成表,从表中计算出x ,y ,∑ni =1x 2i ,∑ni =1y 2i ,∑ni =1x i y i ; (2)计算回归系数a ,b .公式为⎩⎪⎨⎪⎧b =∑ni =1x i y i -n x y ∑n i =1x 2i -n x 2,a =y -b x(3)写出线性回归方程 =bx +a .章末复习课双基演练 1.系统抽样 2.15解析 设样本容量为n ,则350750=7n ,∴n =15. 3.91.5和91.5 4.4解析 ∵x +y +10+11+95=10,15[(x -10)2+(y -10)2+(10-10)2+(11-10)2+(9-10)2]=2,化简得x +y =20,(x -10)2+(y -10)2=8,解得x =12,y =8或x =8,y =12,∴|x -y|=4. 5.2x +3,4s 2解析 由x 1+x 2+…+x n =n x , 所以2x 1+3+2x 2+3+…+2x n +3n=2(x 1+x 2+…+x n )+3n n =2n x n +3=2x +3.又(x 1-x )2+(x 2-x )2+…+(x n -x )2=ns 2,所以[2x 1+3-(2x +3)]2+[2x 2+3-(2x +3)]2+…+[2x n +3-(2x +3)]2=4[(x 1-x )2+(x 2-x )2+…+(x n -x )2]=4ns 2.所以方差为4s 2. 6.30解析 纤维长度小于20 mm 的频率约为p =5×0.01+5×0.01+5×0.04=0.3, ∴100×0.30=30. 作业设计 1.④解析 在这个问题中所要考察的对象是身高,另一方面,样本容量是指样本中的个体数目. 2.④解析 以年级为层,按各年级所占的比例进行抽样,为了使抽取的学生具有代表性,应在各年级进行随机抽样. 3.320解析 由40n =0.125,得n =320.4.0.3解析 频率=频率组距×组距,由图易知:频率组距=0.001,组距=3 000-2 700=300, ∴频率=0.001×300=0.3. 5.92,2.8解析 去掉95和89后,剩下5个数据的平均值 x =90+90+93+94+935=92,方差s 2=15[(90-92)2+(90-92)2+(93-92)2+(94-92)2+(93-92)2]=2.8. 6.④解析 ①和②符合函数关系,即对x 的每一个值,y 都有唯一确定的值与之对应;从③、④散点图来看,④的散点都在某一条直线附近波动,因此两变量具有相关关系. 7.76解析 由题意知:m =8,k =8,则m +k =16,也就是第8组的个位数字为6,十位数字为8-1=7,故抽取的号码为76. 8.(1)0.2 (2)30 (3)0.016解析 (1)由频率组距×组距=频率,得频率为0.2;(2)频率为0.3,又由频数=频率×样本容量,得频数为30; (3)由频率组距=高,得小矩形的高是0.016.9.(6.5,8) 解析x =16(3+5+2+8+9+12)=6.5,y =16(4+6+3+9+12+14)=8.由 =y -b x 得y =b x +a ,所以 =b x +a 恒过(x ,y ),即过定点(6.5,8). 10.解x 甲=15(60+80+70+90+70)=74,x 乙=15(80+60+70+80+75)=73,s 2甲=15(142+62+42+162+42)=104, s 2乙=15(72+132+32+72+22)=56,∵x甲>x乙,s 2甲>s 2乙; ∴甲的平均成绩较好,乙的各门功课发展较平衡. 11.解 (1)散点图如下.(2)由散点图可以看出样本点分布在一条直线的附近,可见y 与x 线性相关. (3)列出下表并用科学计算器进行有关计算.i 1 2 3 4 5 6 x i 300 400 500 600 700 800 y i 40 50 55 60 67 70 x i y i12 00020 000 27 500 36 000 46 900 56 000 2i x 90 000160 000250 000360 000490 000640 000x =550,y =57∑6i =1x2i =1 990 000,∑6i =1x i y i =198 400 于是可得b =∑6i =1x i y i -6x y ∑6i =1x 2i -6x 2=198 400-6×550×571 990 000-6×5502≈0.058 86,a =y -b x =57-0.058 86×550=24.627. 因此所求的线性回归方程为 =0.058 86x +24.627. (4)将x =1 000代入回归方程得 y =0.058 86×1 000+24.627=83.487, 即退水温度是1 000℃时,黄酮延长性大约是83.487%.12.解 (1)在17个数据中,1.75出现了4次,次数最多,即众数是1.75;把成绩从小到大排列,中间一个数即第9个数据是1.70中的一个,即中位数是1.70; 平均数x =117(1.50×2+1.60×3+…+1.90×1)≈1.69(m )因此,17名运动员成绩的众数、中位数、平均数依次为1.75 m ,1.70 m,1.69 m . (2)众数是1.75说明了跳1.75 m 的人数最多;中位数是1.70 m 说明了1.70 m 以下和1.70 m 以上的成绩个数相等;平均数是1.69 m 说明了所有参赛运动员平均成绩是1.69m .13.解 (1)频率分布表与相应的频率分布直方图和频率分布折线图如下:用水量分组频数 频率 [0.5,2.5) 12 0.12 [2.5,4.5) 24 0.24 [4.5,6.5) 40 0.40 [6.5,8.5) 18 0.18 [8.5,10.5] 6 0.06 合计1001(2)前两个矩形面积和为0.12+0.24,第三个矩形一半的面积为0.5-(0.12+0.24),则所求的中位数为:4.5+0.5-(0.12+0.24)0.2=4.5+0.7=5.2.(3)该乡每户平均月均用水量估计为(1.5×12+3.5×24+5.5×40+7.5×18+9.5×6)/100=5.14. 上级支援该乡的月调水量应为5.14×1 200=6 168. 答 上级支援该乡的月调水量是6 168吨.。

高中数学必修3(人教A版)第二章统计2.1知识点总结含同步练习及答案

高中数学必修3(人教A版)第二章统计2.1知识点总结含同步练习及答案

⑤确定样本:从总体中找出与号签上的号码对应的个体,组成样本.
随机数表法是随机数表由数字 0 ,1 ,2,3,⋯,9 这 10 个数字组成,并且每个数字在表中 各个位置上出现的机会都是一样的,通过随机数表,根据实际需要和方便使用的原则,将几个数
组成一组,然后通过随机数表抽取样本.随机数表的优点是简单易行,它很好的解决了当总体中
样.因为 50 名官兵是从中挑出来的,是最优秀的,每个个体被抽到的可能性不同,不符合简单 随机抽样中“等可能抽样”的要求.(3)是简单随机抽样.因为总体中的个体数是有限的,并且
是从总体中逐个进行抽取的,是不放回、等可能的抽取.
2013年第27届世界大学生运动会在俄罗斯举行,为了支持这次运动会,某大学从报名的 20 名大 三学生中选取 6 人组成志愿小组,请用抽签法设计抽样方案. 解:(1)将 20 名志愿者编号,编号为 1,2,3,4,⋯,20; (2)将 20 个号码分别写在 20 张形状相同的卡片上,制成号签; (3)将 20 张卡片放入一个不透明的盒子里,搅拌均匀; (4)从盒子中逐个不放回地抽取 6 个号签,并记录上面的号码;
A.2
B.3
C.6
D.7
解:C
间隔相等,所以 126 − 8 × 15 = 6.
4.分层抽样
描述: 将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在 总体中所占比例进行简单随机抽样或系统抽样,这种抽样的方法叫做分层抽样.当总体由明显差 别的几部分组成时,为了使抽取样本更好地反映总体的情况,常采用分层抽样.
③简单随机抽样是一种不放回抽样.
④简单随机抽样是一种等可能的抽样,每个个体被抽取到的可能性均为
n N

常用的简单随机抽样方法有抽签法和随机数表法.

高中数学人教A版必修三课时习题:第2章统计2.2.2.2含答案

高中数学人教A版必修三课时习题:第2章统计2.2.2.2含答案

2. 2.2用本的数字特点估体的数字特点第 2方差、准差目1. 理解方差、准差的意,会算一数据的方差和准差,掌握用本方差或准差去估体方差或体准差的方法.2.会用均匀数和方差数据行理与比.化准差及方差观察本数据的分别程度的大小,最常用的量是准差.准差是本数据到均匀数的一种均匀距离,一般用s 表示.准差的平方s2叫做方差,也量本数据分别程度的工具.若本数据是x1,x2,⋯, x n, x 表示数据的均匀数,s=1x1- x2x2- x2x n- x2n[++⋯+] ;211222n2s =n[( x- x )+ ( x-x )+⋯+ ( x-x) ] .作一、1.以下法正确的选项是()A.在两数据中,均匀大的一方差大B .均匀数反应数据的集中 ,方差 反应数据离均匀 的波 大小C .方差的求法是求出各个数据与均匀 的差的平方后再乞降D .在 两个人射 数的两 数据中,方差大的表示射 水平高答案: B分析: A 中均匀 和方差是数据的两个特点,不存在 种关系;C 中乞降后 需取均匀数; D 中方差越大,射 越不平 ,水平越低.2.一 数据的均匀数是4.8 ,方差是 3.6 ,若将 数据中的每一个数据都加上60,获得一 新数据, 所得新数据的均匀数和方差分 是()A . 55.2,3.6 B. 55.2,56.4C . 64.8,63.6 D. 64.8,3.6答案: D分析: 每一个数据都加上60 ,均匀数也加上 60,而方差不 .3. 本 101,98,102,100,99的 准差 ()A. 2B .0 C .1 D .2 答案: A分析: 本均匀数x = 1 ×(101 + 98+ 102+ 100+ 99) =100,方差 s 2= 1 ×[(101 - 100) 25 5+ (98 - 100) 2+ (102 -100) 2+ (100 - 100) 2+(99 - 100) 2] = 2.∴ s = 2.4.一个 本a, 3,5,7 的均匀数是 b ,且 a 、b 是方程 x 2- 5x + 4= 0 的两根, 个 本的方差是 ()A .3B .4C .5D .6答案: C分析: 方程 x 2- 5x + 4= 0 的两根是 1,4 ,当 a =1 , a, 3,5,7 的均匀数是 4;当 a =4 , a, 3,5,7 的均匀数不是 1.∴ a = 1, b = 4.212222方差 s =4[(4 -1) + (4 - 3) + (4 - 5) +(4 - 7)] =5.5.假如数据 x 1, x 2,⋯, x n 的均匀数-,方差2+ 3,2 x 2+ 3,⋯, 2x n + 3x s , 2x 1 的均匀数和方差分()-- + 3 和 2 A. x 和 s B. 2 x 4s-+ 3和 s 2-2C. 2 x D . 2 x+ 3 和 4s+ 12s+ 9答案: B分析:由均匀数、方差的求法可得.6.甲、乙两位同学都参加了由学校的球比,他都参加了所有的7 比,均匀得分均16 分,准差分 5.09 和 3.72 ,甲、乙两同学在次球比活中,得更定的是()A.甲 B .乙C.甲、乙同样 D .不可以确立答案: B分析:方差或准差越小,数据的失散程度越小,表示得越定.∵ 5.09>3.72 ,故 B.二、填空7.已知本9、 10、 11、x、y的均匀数是10,方差是2,xy= ________.答案: 96分析:由均匀数得9+ 10+ 11+x+y= 50,∴ x+ y=20,又由(9-10)2+(10-10)2+(11-10)2+( x-10)2+( y-10)2=(2) 2×5=10,得 x2+ y2-20( x+ y)=-192,( x+ y)2-2xy-20( x+ y)=-192, xy =96.8.如是某学校一名球运在五比中所得分数的茎叶,运在五比中得分的方差________.答案: 6.81分析: x =5(8+9+10+13+15)=11,2122+ (10 - 11)2+ (13- 11)2+(15- 11)2] = 6.8.s =[(8-11)+(9 -11)59.若k1,k2,⋯,k8的方差 3, 2( k1- 3) ,2( k2- 3) ,⋯,2( k8- 3) 的方差 ________.答案: 12分析:k1, k2,⋯, k8的均匀数122+⋯+ ( k82] k ,[( k1- k )+( k2-k )- k )8=3,而 2( k1-3) , 2( k2-3) ,⋯, 2( k8- 3) 的均匀数2( k- 3) ,1222s=8[4(k1- k )+ 4( k2-k )+⋯+ 4( k8-k ) ] =4×3= 12.三、解答10.甲、乙两台机床同加工直径10mm的部件,了部件的量,从部件中各随机抽取 6 件量,得数据以下( 位: mm):甲: 99,100,98,100,100,103;乙: 99,100,102,99,100,100.(1)分算上述两数据的均匀数和方差;(2)依据 (1) 的算果,明哪一台机床加工的部件更切合要求.解: (1)99+ 100+ 98+ 100+ 100+ 103x 甲=6= 100,x 乙=99+100+ 102+ 99+ 100+ 1006=100,212- 100)2+ (98- 100)2+ (100- 100)2+ (100- 100)2+ (103-s甲=6[(99 - 100) + (10027100)]=3,2122222s乙=6[(99 - 100)+ (100- 100)+ (102- 100)+ (99- 100)+ (100 - 100)+ (100-100) 2] = 1.(2)因 s2甲>s2乙,明甲机床加工的部件的直径度波比大,所以乙机床加工的部件更切合要求.11.甲、乙两种冬小麦品 5 年均匀位面量表:品种第 1 年第 2 年第 3 年第 4 年第 5 年甲9.89.910.11010.2乙9.410.310.89.79.8(1)求两种小麦的均匀年量;(2)依据数据估哪一种小麦品种量定.解: (1)10,102222(2) s甲= 0.02, s乙=0.244,∴ s甲<s乙,即甲定.能力提高12.如有本容量8 的本均匀数 5,方差2,本中又加入一新数据4,容量 9,加入新数据后的本均匀数和方差分________, ________.4429641144分析: x 9= x 8+9( x9-x8) =5+9×(4-5)=9,282128212296s9=9[ s8+9( x9-x8)] =9[2 +9(4 -5)]=81.13.以下图为我国10 座名山的“身高”统计图,请依据图中信息回答以下问题。

2020届高中数学分册同步讲义(必修3) 第2章 专题突破一 例析频率分布直方图中的统计问题

2020届高中数学分册同步讲义(必修3) 第2章  专题突破一  例析频率分布直方图中的统计问题

专题突破一例析频率分布直方图中的统计问题一、求样本中限制条件下的个体所占频率例1观察新生儿的体重,其频率分布直方图如图所示,则新生儿体重在[2 700,3 000)的频率为()A.0.001 B.0.1C.0.2 D.0.3思维切入求对应区间上的小矩形的面积.答案 D解析由直方图的意义可知,在区间[2 700,3 000)内取值的频率为(3 000-2 700)×0.001=0.3. 点评频率为直方图中相应小长方形的面积,即频率=纵坐标×横坐标差的绝对值.跟踪训练1某中学举办电脑知识竞赛,满分为100分,80分以上为优秀(含80分),现将高一两个班参赛学生的成绩进行整理后分成5组,绘制成频率分布直方图如下图所示.已知图中从左到右的第一、三、四、五小组的频率分别为0.30,0.15,0.10,0.05,而第二小组的频数是40,则参赛的人数是________,成绩优秀的频率是________. 答案 100 0.15解析 设参赛的人数为n ,第二小组的频率为1-(0.30+0.15+0.10+0.05)=0.4, 依题意40n=0.4,∴n =100,优秀的频率是0.10+0.05=0.15. 二、求样本中限制条件下的个体的频数例2 某市高三数学抽样考试中,对90分以上的成绩进行统计,其频率分布如图所示.若130~140分数段的人数为90,则90~100分数段的人数为________.思维切入 对应区间上的频数即为对应区间的频率×样本总体. 答案 810解析 由于90分以上的考试人数是样本总体,则图中5个分数段的频率之和等于1,设130~140分数段的频率为p ,则0.45+0.25+0.15+0.10+p =1,即0.95+p =1,则p =0.05,设该样本总体共有n 个学生的分数,且设90~100分数段的人数为x ,则由频率概念得⎩⎪⎨⎪⎧ 0.05×n =90,0.45×n =x ,解得⎩⎪⎨⎪⎧n =1 800,x =810,故90~100分数段的人数为810. 点评 本题是频率分布条形图.由于各分数段的人数与频率成正比,则可由x 90=0.450.05,求出x ;题设条形图的纵坐标是“频率”这是有别于常规的,在审题时不能混淆.跟踪训练2 为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为________.答案 12解析 志愿者的总人数为20(0.24+0.16)×1=50,所以第三组人数为50×0.36×1=18, 所以有疗效的人数为18-6=12. 三、求频率分布直方图中的参数问题例3 为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力,得到频率分布直方图,如图,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a ,视力在4.6到5.0之间的学生数为b ,则a ,b 的值分别为( )A .0.27,78B .0.27,83C .2.7,78D .2.7,83思维切入 根据频率分布直方图的性质列方程求解. 答案 A解析 注意到纵轴表示频率组距,由图象可知,前4组的公比为3,最大频率a =0.1×33×0.1=0.27, 设后6组公差为d ,则0.01+0.03+0.09+0.27×6+5×62·d =1,解得d =-0.05,即后6组频率的公差为-0.05, 所以,视力在4.6到5.0之间的学生数为 (0.27+0.22+0.17+0.12)×100=78, 故选A.点评 解答本题关键是要利用频率分布直方图中残缺不全的数据,分析它们之间存在的内在关系.跟踪训练3 某学校随机抽取部分新生调查其上学所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图所示),其中上学所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80),[80,100]. (1)求频率分布直方图中x 的值;(2)如果上学所需时间不少于1小时的学生可申请在学校住宿,请估计学校600名新生中有多少名学生可以申请住宿.解(1)由频率分布直方图可得20×x+0.025×20+0.006 5×20+0.003×2×20=1,所以x=0.012 5.(2)由频率分布直方图可知,新生上学所需时间不少于1小时的频率为0.003×2×20=0.12.因为600×0.12=72,所以估计600名新生中有72名学生可以申请住宿.四、频率分布直方图中的数字特征例4从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如图).(1)由图中数据求a的值;(2)若要从身高在[120,130),[130,140),[140,150]三组的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]的学生中选取的人数应为多少?(3)估计这所小学的小学生身高的众数、中位数(保留两位小数)及平均数.思维切入众数即为出现次数最多的数,所以它的频率最大,在最高的小矩形中.中位数即为从小到大中间的数(或中间两数的平均数).解(1)因为直方图中的各个矩形的面积之和为1,所以10×(0.005+0.035+a+0.020+0.010)=1,解得a=0.030.(2)由直方图知,身高在[120,130),[130,140),[140,150]三组的学生总数为100×10×(0.030+0.020+0.010)=60,其中身高在[140,150]的学生人数为10,所以从身高在[140,150]内选取的学生人数为1860×10=3.(3)根据频率分布直方图知,身高在[110,120)的小矩形最高,所以这所小学的小学生身高的众数为110+1202=115(cm).又0.005×10+0.035×10=0.4<0.5,0.4+0.030×10=0.7>0.5,所以中位数在[120,130)内,可设为x,则(x-120)×0.030+0.4=0.5,解得x≈123.33,所以中位数为123.33 cm.根据频率分布直方图,计算平均数为105×0.05+115×0.35+125×0.3+135×0.2+145×0.1=124.5(cm).点评用频率分布直方图求得的众数、中位数不一定是样本中的具体数.跟踪训练4某工厂对一批新产品的长度(单位:mm)进行检测,如图是检测结果的频率分布直方图,据此估计这批产品的中位数为()A.20 B.25 C.22.5 D.22.75答案 C解析产品的中位数出现在频率是0.5的地方.自左至右各小矩形的面积依次为0.1,0.2,0.4,0.15,0.15,设中位数是x,则由0.1+0.2+0.08×(x-20)=0.5,得x=22.5,故选C.1.统计某校1 000名学生的数学水平测试成绩,得到样本的频率分布直方图如图所示.若满分为100分,规定不低于60分为及格,则及格率是()A.20% B.25% C.60% D.80%答案 D2.在中秋的促销活动中,某商场对9月14日9时到14时的销售额进行统计,其频率分布直方图如图所示,已知12时到14时的销售额为7万元,则10时到11时的销售额为()A.1万元B.2万元C.3万元D.4万元答案 C3.如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.答案94.一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2 500,3 000)(元)月收入段应抽出________人.答案25解析由频率分布直方图可得[2 500,3 000)(元)月收入段共有10 000×0.000 5×500=2500(人),按分层抽样应抽出2 500×10010 000=25(人).5.我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.估计居民月均用水量的中位数.解由(0.08+0.16+a+0.42+0.50+a+0.12+0.08+0.04)×0.5=1,解得a=0.30.设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5.而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5.所以2≤x<2.5.由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.6.某市居民用水拟实行阶梯水价.每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如图所示的频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/方立米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.解(1)由用水量的频率分布直方图知,该市居民该月用水量在区间[0.5,1),[1,1.5),[1.5,2),[2,2.5),[2.5,3)内的频率依次为0.1,0.15,0.2,0.25,0.15.所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.依题意,w至少定为3.(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:根据题意,该市居民该月的人均水费估计为4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).一、选择题1.从向阳小区抽取100户居民进行月用电量调查,为制定阶梯电价提供数据,发现其月用电量都在50到350度之间,制作频率分布直方图(如图所示)的工作人员粗心大意,位置t处未标明数据,则t等于()A.0.004 1 B.0.004 2C.0.004 3 D.0.004 4答案 D解析由题意得50×(0.006+t+0.003 6+0.002 4×2+0.001 2)=1,故t=0.004 4.故选D. 2.有一容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[10,12]内的频数为()A.18 B.36 C.54 D.72答案 B解析易得样本数据落在区间[10,12]内的频率为0.18,则样本数据落在区间[10,12]内的频数为36.3.测量某地新生婴儿的体重,得到其频率分布直方图如图所示,则新生婴儿的体重(单位:g)在[2 700,3 000)的频率为()A.0.001 B.0.1 C.0.2 D.0.3答案 D解析由频率分布直方图可知,所求频率为0.001×300=0.3.4.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据频率分布直方图可知,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56 B.60 C.120 D.140答案 D解析设所求人数为N,则N=2.5×(0.16+0.08+0.04)×200=140,故选D.5.如图是某班50名学生身高的频率分布直方图,那么身高(单位:cm)在区间[150,170)内的学生人数为()A.16 B.20 C.22 D.26答案 B解析根据频率分布直方图可知身高在区间[150,170)内的频率为(0.01+0.03)×10=0.4,所以身高在区间[150,170)内的学生人数为50×0.4=20,故选B.6.某学校对高二年级一次考试进行抽样分析,如图是根据抽样分析后的考试成绩绘制的频率分布直方图,其中抽样成绩的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中成绩小于100分的人数是36.则样本中成绩大于或等于98分且小于104分的人数是()A.90 B.75 C.60 D.45答案 A解析因为样本中成绩小于100分的人数是36,其对应频率之和为0.050×2+0.100×2=0.3,所以样本总数为36÷0.3=120,所以样本中成绩大于或等于98分且小于104分的人数为120×2×(0.100+0.150+0.125)=90,故选A.7.如图是某校高一一次数学考试成绩的样本频率分布直方图(样本容量n=200),若成绩不低于60分为及格,则样本中的及格人数是()A.6 B.36 C.60 D.120答案 D解析由题中频率分布直方图得,成绩不低于60分的人数为(0.012+0.018)×20×200=120.8.为了解学生在课外活动方面的支出情况,抽取了n 个同学进行调查,结果显示这些学生的支出金额(单位:元)都在[10,50]内,其中支出金额在[30,50]内的学生有117人,频率分布直方图如图所示,则n 等于( )A .180B .160C .150D .200 答案 A解析 [30,50]对应的概率为1-()0.01+0.025×10=0.65,所以n =1170.65=180. 二、填空题9.为了解某一段公路汽车通过时的车速情况,现随机抽测了通过这段公路的200辆汽车的时速,所得数据均在区间[40,80]中,其频率分布直方图如图所示,则在抽测的200辆汽车中,时速在区间[40,60)内的汽车有________辆.答案 80解析 由频率分布直方图得:时速在区间[40,60)内的汽车的频率为(0.01+0.03)×10=0.4.∴时速在区间[40,60)内的汽车有0.4×200=80(辆).10.某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用的时间的条形图(如图所示)根据条形图可得这50名学生这一天平均每人的课外阅读时间为________.答案0.9解析这50名学生这一天平均每人的课外阅读时间为(0×5+0.5×20+1.0×10+1.5×10+2.0×5)÷50=0.9(小时).故选B.三、解答题11.为了了解小学生的体能情况,抽取某校一个年级的部分学生进行一分钟跳绳次数的测试,将数据整理后,画出频率分布直方图如图所示.已知图中从左到右前三个小组的频率分别为0.1,0.3,0.4,且第一小组的频数为5.(1)求第四小组的频率;(2)求参加这次测试的学生的人数;(3)若一分钟跳绳次数在75次以上(含75次)为达标,试估计该年级学生跳绳测试的达标率.解(1)第四小组的频率为1-0.1-0.3-0.4=0.2.(2)设参加这次测试的学生有x人,则0.1x=5,解得x=50,故参加这次测试的学生有50人.(3)由题意及频率分布直方图知,样本数据的达标率约为0.3+0.4+0.2=0.9,∴可估计该年级学生跳绳测试的达标率为90%.12.为组织好“市九运会”,组委会征集了800名志愿者,现对他们的年龄调查统计后,得到如图所示的频率分布直方图,但是年龄在[25,30)内的数据不慎丢失,依据此图可得:(1)年龄分组[25,30)对应小长方形的高度为________.(2)这800名志愿者中年龄在[25,35)内的人数为________.答案(1)0.04(2)440解析(1)因为各个小长方形的面积之和为1,所以年龄分组[25,30)对应小长方形的高度为1-(5×0.01+5×0.07+5×0.06+5×0.02)5=0.04.(2)年龄在[25,35)内的频率为0.04×5+0.07×5=0.55,人数为0.55×800=440.13.某校100名学生的期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a的值;(2)若这100名学生的语文成绩在某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.解 (1)由频率分布直方图知(2a +0.02+0.03+0.04)×10=1,解得a =0.005.(2)由频率分布直方图知语文成绩在[50,60),[60,70),[70,80),[80,90)分数段的人数依次为0.005×10×100=5,0.04×10×100=40,0.03×10×100=30,0.02×10×100=20. 由题中给出的比例关系知数学成绩在上述分数段的人数依次为 5,40×12=20,30×43=40,20×54=25.故数学成绩在[50,90)之外的人数为100-(5+20+40+25)=10.。

数学北师大必修3备课资料 第一章统计§3 含解析

数学北师大必修3备课资料 第一章统计§3 含解析

备课资料
五数概括法
五数概括法即用下面的五个数来概括数据:
(1)最小值.
(2)第1四分位数(Q 1).
(3)中位数(Q 2).
(4)第3四分位数(Q 3).
(5)最大值.
运用五数概括法的最简单的方式是首先将数据按递增顺序排列,然后很容易就能确定最小值、3个四分位数和最大值了.对12个月薪数据的样本,按照递增顺序排列如下: 2 210 2 255 2 350|2 380 2 380 2 390|2 420 2 440 2 450|2 550 2 630 2 825 Q 1=2 365 Q 2=2 405 Q 3=2 500
(中位数)
中位数2 405以及四分位数Q 1=2 365和Q 3=2 500前面已经计算出来了.对上述数据的观察可以知道最小值为2 210,最大值为2 825.因此,上述月薪数据以五数概括为:2 210,2 365,2 405,2 500,2 825.在相邻的每两个数之间,大约有4
1或25%的数据项. (设计者:林大华)。

[精品]新人教A版必修三高中数学数学人教A版必修3第二章《统计》教案和答案

[精品]新人教A版必修三高中数学数学人教A版必修3第二章《统计》教案和答案

2. 1.1简单随机抽样一、三维目标:1、知识与技能:正确理解随机抽样的概念,掌握抽签法、随机数表法的一般步骤;2、过程与方法:(1)能够从现实生活或其他学科中提出具有一定价值的统计问题;(2)在解决统计问题的过程中,学会用简单随机抽样的方法从总体中抽取样本。

3、情感态度与价值观:通过对现实生活和其他学科中统计问题的提出,体会数学知识与现实世界及各学科知识之间的联系,认识数学的重要性。

二、重点与难点:正确理解简单随机抽样的概念,掌握抽签法及随机数法的步骤,并能灵活应用相关知识从总体中抽取样本。

三、教学设想:假设你作为一名食品卫生工作人员,要对某食品店内的一批小包装饼干进行卫生达标检验,你准备怎样做?显然,你只能从中抽取一定数量的饼干作为检验的样本。

(为什么?)那么,应当怎样获取样本呢?【探究新知】一、简单随机抽样的概念一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样,这样抽取的样本,叫做简单随机样本。

【说明】简单随机抽样必须具备下列特点:(1)简单随机抽样要求被抽取的样本的总体个数N是有限的。

(2)简单随机样本数n小于等于样本总体的个数N。

(3)简单随机样本是从总体中逐个抽取的。

(4)简单随机抽样是一种不放回的抽样。

(5)简单随机抽样的每个个体入样的可能性均为n/N。

思考?下列抽样的方式是否属于简单随机抽样?为什么?(1)从无限多个个体中抽取50个个体作为样本。

(2)箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出一个零件进行质量检验后,再把它放回箱子。

二、抽签法和随机数法1、抽签法的定义。

一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。

【说明】抽签法的一般步骤:(1)将总体的个体编号。

教育最新K122018-2019学年高中数学苏教版必修3教学案:复习课(二)-统计-含解析

教育最新K122018-2019学年高中数学苏教版必修3教学案:复习课(二)-统计-含解析

复习课(二) 统计抽样方法高考对抽样方法的考查主要是基础题,难度不大.系统抽样和分层抽样是考查的热点,考查形式以填空题为主.[考点精要]1.简单随机抽样(1)特征:①一个一个不放回的抽取.②每个个体被抽到可能性相等.(2)常用方法:①抽签法.②随机数表法.2.系统抽样(1)适用环境:当总体中个数较多时,可用系统抽样.(2)操作步骤:将总体平均分成几个部分,再按照一定方法从每个部分抽取一个个体作为样本.3.分层抽样(1)适用范围:当总体由差异明显的几个部分组成时可用分层抽样.(2)操作步骤:将总体中的个体按不同特点分成层次比较分明的几部分,然后按各部分在总体中所占的比实施抽样.[典例](1)(山东高考改编)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9,抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷B的人数为________.(2)(江苏高考)某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生.(3)已知某地区中小学生人数和近视情况分别如图1和图2所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为______.[解析] (1)抽取号码的间隔为96032=30,抽取的号码依次为9,39,69,…,939,落入区间[451,750]的有459,489,…,729共10人,即做B 卷的有10人.(2)设应从高二年级抽取x 名学生,则x 50=310,∴x =15.(3)该地区中小学生人数为3 500+2 000+4 500=10 000,则样本容量为10 000×2%=200,其中抽取高中生近视眼人数为2 000×2%×50%=20. [答案] (1)10 (2)15 (3)200,20 [类题通法](1)系统抽样中,易无视抽取的样本数也就是分段的段数,当Nn 不是整数时,注意剔除.(2)分层抽样中,易无视每层抽取的个体的比例是相同的.[题组训练]1.为了解1 000名学生的学习情况,采用系统抽样的方法从中抽取容量为40的样本,则分段的间隔为________.解析:根据系统抽样的特点可知,分段间隔为1 00040=25.答案:252.某高校甲、乙、丙、丁四个专业分别有150,150,400,300名学生.为了解学生的就业倾向,用分层抽样的方法从该校这四个专业共抽取40名学生进行调查,应在丙专业抽取的学生人数为________.解析:抽样比为40150+150+400+300=4100.因此丙专业应抽取4100×400=16(人).答案:163.(北京高考)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为______.类别 人数 老年教师 900 中年教师 1 800 青年教师 1 600 合计4 300解析:设该样本中老年教师人数为x ,则有x 900=3201 600,故x =180.答案:180高考对各种统计图表的考查主要是基础题,频率分布条形图和直方图是考查的热点,但也要注意关注茎叶图。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

【知识点:统计】一.简单随机抽样1.总体和样本总体:在统计学中 , 把研究对象的全体叫做总体.个体:把每个研究对象叫做个体.总体容量:把总体中个体的总数叫做总体容量.为了研究总体的有关性质,一般从总体中随机抽取一部分:,,,研究,我们称它为样本...其中个体的个数称为样本容量....。

2.简单随机抽样,也叫纯随机抽样。

就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。

特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。

简单随机抽样是其它各种抽样形式的基础。

通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。

3.简单随机抽样常用的方法:(1)抽签法;⑵随机数表法;⑶计算机模拟法;⑷使用统计软件直接抽取。

在简单随机抽样的样本容量设计中,主要考虑:①总体变异情况;②允许误差范围;③概率保证程度。

4.抽签法:(1)给调查对象群体中的每一个对象编号;(2)准备抽签的工具,实施抽签(3)对样本中的每一个个体进行测量或调查例:请调查你所在的学校的学生做喜欢的体育活动情况。

5.随机数表法:例:利用随机数表在所在的班级中抽取10位同学参加某项活动。

二.系统抽样1.系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。

第一个样本采用简单随机抽样的办法抽取。

d(抽样距离)=N(总体规模)/n(样本规模)三.分层抽样1.分层抽样(类型抽样):先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。

2.分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本分别代表该子总体,所有的样本进而代表总体。

3.分层的比例问题:(1)按比例分层抽样:根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。

四.样本频率分布图1.作图步骤:(1)求极差(一组数据中最大值和最小值得差)(2)决定组距和组数; (3)将数据分组;(4)计算各小组的频率,列频率分布表;(5)画频率分布直方图2.特点:(1)以面积的形式反映数据落在各小组的频率大小;.13)2(总和等于)各小长方形的面积的(频率组距频率组距小长方形的面积=⨯=五.茎叶图适用范围:在样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录。

当样本数据较多时,茎叶图就不太方便了。

六.用样本的数字特征估计总体的数字特征 1、本均值:nx x x x n+++=Λ212、.样本标准差:nx x x x x x s s n 222212)()()(-++-+-==Λ3.用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差。

在随机抽样中,这种偏差是不可避免的。

虽然我们用样本数据得到的分布、均值和标准差并不是总体的真正的分布、均值和标准差,而只是一个估计,但这种估计是合理的,特别是当样本量很大时,它们确实反映了总体的信息。

4.(1)如果把一组数据中的每一个数据都加上或减去同一个共同的常数,标准差不变 (2)如果把一组数据中的每一个数据乘以一个共同的常数k ,标准差变为原来的k 倍 五.两个变量的线性相关1、概念: (1)回归直线方程 a x b y))+=ˆ (2)回归系数 ∑∑∑∑====--=---=n i i ni ii ni i ni i ixn x yx n yx x x y y x xb 1221121)())(()x b y a ))-=2.最小二乘法 3.直线回归方程的应用(1)描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系(2)利用回归方程进行预测;把预报因子(即自变量x )代入回归方程对预报量(即因变量Y )进行估计,即可得到个体Y 值的容许区间。

(3)利用回归方程进行统计控制规定Y 值的变化,通过控制x 的范围来实现统计控制的目标。

(4)回归直线一定经过样本的中心点(x ,y ),据此性质可以解决有关的计算问题. 【例题讲解】1. 某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,那么由此求出的平均数与实际平均数的差是( ) A 3.5 B 3- C 3 D 5.0-2. 设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( )A y 平均增加1.5个单位B y 平均增加2个单位C y 平均减少1.5个单位D y 平均减少2个单位3. 从N 个编号中抽取n 个号码入样,若采用系统抽样方法进行抽取, 则分段间隔应为( )An N B n C ⎥⎦⎤⎢⎣⎡n N D 1+⎥⎦⎤⎢⎣⎡n N4.从某厂生产的802辆轿车中抽取80辆测试某项性能.请合理选择抽样方法进行抽样,并写出抽样过程.5. 为了了解参加运动会的2000名运动员的年龄情况,从中抽取100名运动员;就这个问题,下列说法中正确的有 ;① 2000名运动员是总体;②每个运动员是个体;③所抽取的100名运动员是一个样本; ④样本容量为100;⑤这个抽样方法可采用按年龄进行分层抽样;⑥每个运动员被抽到的概率相等6. 数据70,71,72,73的标准差是______________7. 数据123,,,...,n a a a a 的方差为2σ,平均数为μ,则(1)数据123,,,...,,(0)n ka b ka b ka b ka b kb ++++≠的标准差为 ,平均数为(2)数据123(),(),(),...,(),(0)n k a b k a b k a b k a b kb ++++≠的标准差为 ,平均数为8. 用样本频率分布估计总体频率分布的过程中,下列说法正确的是( )A 总体容量越大,估计越精确B 总体容量越小,估计越精确C 样本容量越大,估计越精确D 样本容量越小,估计越精确9画出茎叶图并分析两个班学生的数学学习情况【课堂练习】1. 相关关系与函数关系的区别是2. 从10个篮球中任取一个,检验其质量,则应采用的抽样方法为_______________3. 下列说法错误的是 ( )A 在统计里,把所需考察对象的全体叫作总体B 一组数据的平均数一定大于这组数据中的每个数据C 平均数、众数与中位数从不同的角度描述了一组数据的集中趋势D 一组数据的方差越大,说明这组数据的波动越大4. 要了解全市高一学生身高在某一范围的学生所占比例的大小,需知道相应样本的( )A 平均数B 方差C 众数D 频率分布5. 要从已编号(160:)的60枚最新研制的某型导弹中随机抽取6枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的6枚导弹的编号可能是( )A 5,10,15,20,25,30B 3,13,23,33,43,53C 1,2,3,4,5,6D 2,4,8,16,32,486. 数据123,,,...,n a a a a 的方差为2σ,则数据1232,2,2,...,2n a a a a 的方差为( )A 22σB 2σC 22σD 24σ7. 已知样本9,10,11,,x y 的平均数是10xy8. 有50件产品编号从1到50,现在从中抽取5件检验,用系统抽样确定所抽取的编号为( )A 5,10,15,20,25B 5,15,20,35,40C 5,11,17,23,29D 10,20,30,40,509.(2013·武夷模拟)用系统抽样法要从160名学生中抽取容量为20的样本,将160名学生随机地从1~160编号,按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的号码为126,则第1组中用抽签的方法确定的号码是________. 10.(2012·江西)样本(x 1,x 2,…,x n )的平均数为x ,样本(y 1,y 2,…,y m )的平均数为y (x ≠y ).若样本(x 1,x 2,…,x n ,y 1,y 2,…,y m )的平均数z =αx +(1-α)y ,其中0<α<12,则n ,m 的大小关系为( ).A .n <mB .n >mC .n =mD .不能确定11.已知施化肥量x 与水稻产量y 的试验数据如下表,则变量x 与变量y 是________相关(填“正”或“负”).12.(2013·长春调研)已知x ,y 取值如下表:x0 1 4 5 6 8 y1.31.85.66.17.49.3从所得的散点图分析可知:y 与x 线性相关,且y ^=0.95x +a ,则a =( ). A .1.30B .1.45C .1.65D .1.8013.某班同学利用国庆节进行社会实践,对[25,55]岁的人群随机抽取n 人进行了一次生活习惯是否符合低碳观念的调查,若生活习惯符合低碳观念,称为“低碳族”,否则称为“非低碳族”,得到如下统计表和各年龄段人数频率分布直方图:(1)补全频率分布直方图; (2)求n ,a ,p 的值.14 以下是某地搜集到的新房屋的销售价格y 和房屋的面积x 的数据:(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线; (3)据(2)的结果估计当房屋面积为2150m 时的销售价格15.(2012·揭阳调研)某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:组数 分组 低碳族的人数占本组的频率第一组 [25,30) 120 0.6 第二组 [30,35) 195 p 第三组 [35,40) 100 0.5 第四组 [40,45) a 0.4 第五组 [45,50) 30 0.3 第六组[50,55]150.3(1)求分数在[50,60]的频率及全班人数;(2)求分数在[80,90]之间的频数,并计算频率分布直方图中[80,90]间的矩形的高.16.已知某单位有50名职工,现要从中抽取10名职工,将全体职工随机按1~50编号,并按编号顺序平均分成10组,按各组内抽取的编号依次增加5进行系统抽样.(1)若第5组抽出的号码为22,写出所有被抽出职工的号码;(2)分别统计这10名职工的体重(单位:公斤),获得体重数据的茎叶图如图所示,求该样本的方差;(3)在(2)的条件下,从这10名职工中随机抽取两名体重不轻于73公斤(≥73公斤)的职工,求体重为76公斤的职工被抽取到的概率.【课后作业】1.一个容量为20的样本,已知某组的频率为0.25,则该组的频数为__________2.用随机数表法从100名学生(男生25人)中抽取20人进行评教,某男生被抽取的机率是___________________3.(2013·沈阳质检)沈阳市某高中有高一学生600人,高二学生500人,高三学生550人,现对学生关于消防安全知识了解情况进行分层抽样调查,若抽取了一个容量为n的样本,其中高三学生有11人,则n的值等于________4. 一个容量为20的样本数据,分组后组距与频数如下表:组距[)20,10[)30,20 [)40,30 [)50,40 [)60,50 [)70,60 频数234542则样本在区间(),50-∞ 上的频率为__________________5. 某单位有老年人28人,中年人54人,青年人81人,为调查身体健康状况,需要从中抽取一个容量为36的样本,用分层抽样方法应分别从老年人、中年人、青年人中各抽取 _________人、 人、 人6. 某学校共有教师490人,其中不到40岁的有350人,40岁及以上的有140人 为了了解普通话在该校中的推广普及情况,用分层抽样的方法,从全体教师中抽取一个容量为70人的样本进行普通话水平测试,其中在不到40岁的教师中应抽取的人数为多少人?7. 如图,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如下:观察图形,回答下列问题:(1)79.589.5:这一组的频数、频率分别是多少?(2)估计这次环保知识竞赛的及格率(60分及以上为及格)统计答案【例题答案】 例1. B 少输入9090,3,30=平均数少3,求出的平均数减去实际的平均数等于3- 例2. 0.7140.720= 例3. C 剔除零头 4.[审题视点] 因为802不能整除80,为了保证“等距”分段,应先剔除2个个体. 解 由于总体及样本中的个体数较多,且无明显差异,因此采用系统抽样的方法,步骤如下:第一步:先从802辆轿车中剔除2辆轿车(剔除方法可用随机数法);第二步:将余下的800辆轿车编号为1,2,…,800,并均匀分成80段,每段含k =80080=10个个体;第三步:从第1段即1,2,…,10这10个编号中,用简单随机抽样的方法抽取一个编号(如5)作为起始编号;第四步:从5开始,再将编号为15,25,…,795的个体抽出,得到一个容量为80的样本.解决系统抽样问题的两个关键步骤为:(1)分段的方法应依据抽取的样本容量而定,即根据定义每段抽取一个样本.(2)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定 5.④,⑤,⑥ 2000名运动员的年龄情况是总体;每个运动员的年龄是个体; 6.5 7071727371.5,4X +++== 222215[(7071.5)(7171.5)(7271.5)(7371.5)]42s =-+-+-+-= 7 (1)kσ,k b μ+(2)k σ,k kb μ+(1)1212......n nka b ka b ka b a a a X k b k b n nμ+++++++++==⋅+=+22212222121[()()...()]1[()()...()]n n s ka b k b ka b k b ka b k b na a a k nμμμμμμσ=+--++--+++--=-+-++-=(2)1212()()...()...n nk a b k a b k a b a a a X k nb k nb n nμ+++++++++==⋅+=+s k σ===8. C 9. 解:甲班 乙班2 56 6 2 8 6 6 4 27 4 6 82 8 2 4 5 6 8 6 9 2乙班级总体成绩优于甲班 【课堂练习】1.函数关系是两个变量之间有完全确定的关系,而相关关系是两个变量之间并没有严格的确定关系,当一个变量变化时,另一变量的取值有一定的随机性2. 简单随机抽样3. B 平均数不大于最大值,不小于最小值4 D5 B60106=,间隔应为10 6. D 22222111111(),(22)4()4,n nn i i i i i i X X X X X X n n n σσ====--=⋅-=∑∑∑7.96 9101150,20x y x y ++++=+=,2211(10)(10)10x y ++-+-=,22220()192,()220()192,96x y x y x y xy x y xy +-+=-+--+=-=-8.D 间隔为109. 6 解析 设第1组抽取的号码为b ,则第n 组抽取的号码为8(n -1)+b ,∴8×(16-1)+b =126,∴b =6,故第1组抽取的号码为6.10.解析 依题意得x 1+x 2+…+x n =n x ,y 1+y 2+…+y m =m y ,x 1+x 2+…+x n +y 1+y 2+…+y m =(m +n )z =(m +n )αx +(m +n )(1-α)y , ∴n x +m y =(m +n )αx +(m +n )(1-α)y ,∴⎩⎪⎨⎪⎧n =(m +n )α,m =(m +n )(1-α),于是有n -m =(m +n )[α-(1-α)]=(m +n )(2α-1), ∵0<α<12,∴2α-1<0,∴n -m <0,即m >n . 答案 A11 .正12.解析 依题意得,x =16×(0+1+4+5+6+8)=4,y =16×(1.3+1.8+5.6+6.1+7.4+9.3)=5.25.又直线y ^=0.95x +a 必过样本中心点(x ,y ),即点(4,5.25),于是有5.25=0.95×4+a ,由此解得a =1.45,选B.13.[审题视点] (1)要补全频率分布直方图,关键是计算出第二组的频率;(2)灵活运用关系式:频率组距×组距=频率,频数样本容量=频率求解. 解 (1)第二组的频率为1-(0.04+0.04+0.03+0.02+0.01)×5=0.3,所以小长方形的高为0.35=0.06.频率分布直方图如图所示.(2)第一组的人数为1200.6=200,频率为0.04×5=0.2, 所以n =2000.2=1 000. 由(1)知,第二组的频率为0.3,所以第二组的人数为1 000×0.3=300,所以p =195300=0.65.第四组的频率为0.03×5=0.15,所以第四组的人数为 1 000×0.15=150,所以a =150×0.4=60.(1)绘制频率分布直方图时需注意:①制作好频率分布表后可以利用各组的频率之和是否为1来检验该表是否正确;②频率分布直方图的纵坐标是频率组距,而不是频率. (2)由频率分布直方图进行相关计算时,需掌握下列关系式:频率组距×组距=频率. 14. 解:(1)数据对应的散点图如图所示:(2)1095151==∑=i i x x ,1570)(251=-=∑=x x l i i xx , 308))((,2.2351=--==∑=y y x x l y i i i xy设所求回归直线方程为a bx y +=), 则1962.01570308≈==xx xyl l b 8166.115703081092.23≈⨯-=-=x b y a ,故所求回归直线方程为8166.11962.0+=x y ) (3)据(2),当2150x m =时,销售价格的估计值为:2466.318166.11501962.0=+⨯=y )(万元)15.解 (1)分数在[50,60]的频率为0.008×10=0.08.由茎叶图知,分数在[50,60]之间的频数为2,所以全班人数为20.08=25. (2)分数在[80,90]之间的频数为25-2-7-10-2=4,频率分布直方图中[80,90]间的矩形的高为425÷10=0.016. 16.解 (1)由题意,第5组抽出的号码为22.因为k +5×(5-1)=22,所以第1组抽出的号码应该为2,抽出的10名职工的号码分别为2,7,12,17,22,27,32,37,42,47.(2)因为10名职工的平均体重为 x =110(81+70+73+76+78+79+62+65+67+59)=71, 所以样本方差为:s 2=110(102+12+22+52+72+82+92+62+42+122)=52. (3)从10名职工中随机抽取两名体重不轻于73公斤的职工,共有10种不同的取法:(73,76),(73,78),(73,79),(73,81),(76,78),(76,79),(76,81),(78,79),(78,81),(79,81). 记“体重为76公斤的职工被抽取”为事件A ,它包括的事件有(73,76),(76,78),(76,79),(76,81)共4个. 故所求概率为P (A )=410=25. 【课后作业】1. 5 =频数频率样本容量 2 15 每个个体被抽取的机率都是2011005= 3.解析 由n 600+500+550=11550,得n =33(人). 4. 0.7 140.720= 5 61218,, 总人数为36363628548116328654128118163163163++=⨯≈⨯≈⨯≈,,,, 6. 解:而抽取的比例为701,4907=,在不到40岁的教师中应抽取的人数为 1350507⨯=7.解:(1)频率为:0.025100.25⨯=,频数:600.2515⨯=(2)0.015100.025100.03100.005100.75⨯+⨯+⨯+⨯=。

相关文档
最新文档