高中数学必修3+《统计》
高中数学必修三第二章 统计 本章整合(共35张PPT)课件
定义:散点图中的点分布在一条直线附近
相关关系→线性相关
回归方程
求法:最小二乘法求回归方程系数 应用:已知一个变量值预测另一个变量值
专题一 三种抽样方法的比较
简单随机抽样、系统抽样、分层抽样的比较如下表:
类别 共同点
各自特点
联系
适用范围
简单
总体中个
随
从总体中逐个
体无差异
机抽 样
系统 抽样
分层 抽样
答案:0.02 600
专题三 用样本的数字特征估计总体的数字特征
为了从整体上更好地把握总体的规律,我们还可以通过样本数 据的众数、中位数、平均数和标准差等数字特征对总体的数字特征
作出估计.众数就是样本数据中出现次数最多的那个值;中位数就是 把样本数据按照由小到大(或由大到小)的顺序排列,若数据的个数 是奇数,就是处于中间位置的数;若数据的个数是偶数,就是中间两个 数据的平均数.平均数就是所有样本数据的平均值,用������表示;标准差 是反映样本数据分散程度大小的最常用统计量,其计算公式如下:
提示:分层抽样时,在各层所抽取的样本个数与该层个体数的比 值等于抽样比;系统抽样抽取的号码按从小到大排列后,每一个号码 与前一个号码的差都等于分段间隔.
解析:按分层抽样时,在一年级抽取 108×21700=4(人),在二年级、 三年级各抽取 81×21700=3(人),则在号码段 1,2,…,108 中抽取 4 个号码, 在号码段 109,110,…,189 中抽取 3 个号码,在号码段 190,191,…,270 中抽取 3 个号码,①②③符合,所以①②③可能是分层抽样,④不符合, 所以④不可能是分层抽样;如果按系统抽样时,抽取出的号码应该是 “等距”的,①③符合,②④不符合,所以①③都可能为系统抽样,②④ 都不能为系统抽样.
高中数学必修3第二章:统计2.3变量间的相关关系
Y 研考点·知规律
探究悟道 点拨技法
题型一 相关关系的判断 【例 1】 河北国欣农研会的科研人员在 7 块并排、形状大小 相同的试验田上对某棉花新品种进行施化肥量 x 对产量 y 影响的 试验,得到如下表所示的一组数据(单位:kg): 施化肥量 x 15 20 25 30 35 40 45 棉花产量 y 330 345 365 405 445 450 455
D 读教材·抓基础
回扣教材 扫除盲点
课本导读
1.两个变量的线性相关 (1)在散点图中,点散布在从 左下角 到 右上角的区域,对于 两个变量的这种相关关系,我们将它称为正相关. (2)在散点图中,点散布在从 左上角 到 右下角的区域,两个 变量的这种相关关系称为负相关. (3)如果散点图中点的分布在整体上看大致在一条直线附近 , 就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
() (A)她儿子10岁时的身高一定是145.83 cm (B)她儿子10岁时的身高在145.83 cm以上 (C)她儿子10岁时的身高在145.83 cm左右 (D)她儿子10岁时的身高在145.83 cm以下
2.经调查知,某品牌汽车的销售量y(辆)与广告费用x(万元)之 间的回归直线方程为 yˆ =250+4x,当广告费用为50万元时,预计 汽车销售量约为 ______辆.
2.回归方程 (1)最小二乘法:使得样本数据的点到回归直线的 距离的平方
和最小的方法叫最小二乘法.
(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,
^^ ^
y1)、(x2,y2),…,(xn,yn).其回归方程为y=bx+a,则
n
n
xi- x yi- y xiyi-n x y
高中数学必修三第13章-统计-知识点
高中数学必修三第13章:统计-知识点1、在统计问题中,研究对象的全体叫做总体,总体中的每一个对象叫做个体,总体中所含个体的数量称为总体的容量。
总体中抽取一部分个体叫做总体的一个样本,样本所含个体的数量叫做样本容量。
2、按照收集数据的不同方法,可以将数据分为观测数据和实验数据。
3、普查是大规模的全面调查,对总体的每个个体分别进行调查,优点是能准确反应总体的情况,缺点是调查范围大,耗时耗力,有时候还会破坏调查对象。
抽样调查,是从总体中抽取样本进行调查的方法,优点是省时省力,缺点是数据的精确性较差。
4、简单随机抽样:逐个抽取的方法,总体中每一个个体都有同样的概率被抽中,适用于个体之间差异较小和数目较少时,包括抽签法和随机数法。
5、分层随机抽样:当总体由差异明显的几个部分组成时,先把总体分成若干部分,然后从不同的部分中独立、随机地抽取样本。
适用于总体情况复杂,各单位之间差异较大,单位较多的情况。
6、系统抽样:先编号,然后分成若干段,在第一段中用简单随机抽样抽出一个编号,然后依次加上间隔数,直到获取整个样本。
该方法操作简便,不易出错。
7、一组数据的最大值和最小值的差称为极差,又称全距,每个小组的区间端点之间的距离叫做组距,组距的选取决定了组数的多少,极差=组距×组数。
将样本分组后,每个小组内的数据个数称为频数,频率=频数/样本容量。
8、在频率分布直方图中,纵坐标是频率/组距,所以,计算某一组的频率时,一定要记住用纵坐标去乘以组距,频率分布直方图中所有矩形的面积之和为 1 。
9、在频率分布直方图中,从左到右依次连接各矩形上底边的中点,就得到频率分布折线图。
10、茎叶图:适用于数据不多的时候,先把数据分成“茎”和“叶”两部分,然后把“茎”由小到大,由上往下写成一列,并在其左边和右边画一条竖直的线,最后把“叶”写在它所属的“茎”的同一侧,由小到大排成一行。
12 11、散点图:适用于 有相关性 的数据,比如身高和体重,将身高作为横坐标,体重作为 纵坐标 ,在平面直角坐标系中绘制出相应的 点,就得到了身高和体重的散点图。
(压轴题)高中数学必修三第一章《统计》测试(有答案解析)
一、选择题1.为了解某社区居民的家庭年收入和年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x 万 8.3 8.6 9.9 11.1 12.1 支出y 万5.97.88.18.49.8根据上表可得回归直线方程ˆˆˆybx a =+,其中0.78b ∧=,a y b x ∧∧=-元,据此估计,该社区一户收入为16万元家庭年支出为( ) A .12.68万元B .13.88万元C .12.78万元D .14.28万元2.某校举行演讲比赛,9位评委给选手A 打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若统计员计算无误,则数字x 应该是( )A .5B .4C .3D .23.已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为x ,方差为2s ,则( ) A .270,75x s =< B .270,75x s => C .270,75x s ><D .270,75x s <>4.某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i =得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x的回归方程类型的是( ) A .y a bx =+ B .2y a bx =+ C .e x y a b =+D .ln y a b x =+5.采用系统抽样的方法从400人中抽取20人做问卷调查,为此将他们随机编号为1,2,3…,400.适当分组后在第一组采用随机抽样的方法抽到的号码为5,则抽到的20人中,编号落入区间[201,319]内的人员编号之和为( ) A .600B .1225C .1530D .18556.下列说法正确的是( )①设某大学的女生体重(kg)y 与身高(cm)x 具有线性相关关系,根据一组样本数据(,)(1,2,3,,)i i x y i n =,用最小二乘法建立的线性回归方程为0.8585.71y x =- ,则若该大学某女生身高增加1cm ,则其体重约增加0.85kg ;②关于x 的方程210(2)x mx m -+=>的两根可分别作为椭圆和双曲线的离心率; ③过定圆C 上一定点A 作圆的动弦AB ,O 为原点,若1()2OP OA OB =+,则动点P 的轨迹为椭圆;④已知F 是椭圆22143x y +=的左焦点,设动点P 在椭圆上,若直线FP 的斜率大于3,则直线OP (O 为原点)的斜率的取值范围是3333(,)(,)282-∞-. A .①②③B .①③④C .①②④D .②③④7.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( )A .2,5B .5,5C .5,8D .8,88.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下: 父亲身高x (cm )174176176176178儿子身高y (cm )175175176177177则y 对x 的线性回归方程为A .y = x-1B .y = x+1C .y =88+12x D .y = 1769.为了了解某社区居民是否准备收看电视台直播的“龙舟大赛”,某记者分别从社区60~70岁,40~50岁,20~30岁的三个年龄段中的128,192,x 人中,采用分层抽样的方法共抽出了30人进行调查,若60~70岁这个年龄段中抽查了8人,那么x 为( ) A .64B .96C .144D .16010.某校高一年级有学生1800人,高二年级有学生1500人,高三年级有1200人,为了调查学生的视力状况,采用分层抽样的方法抽取学生,若在抽取的样本中,高一年级的学生有60人,则该样本中高三年级的学生人数为( ) A .60B .50C .40D .3011.预测人口的变化趋势有多种方法,“直接推算法”使用的公式是()0 1nn P P k =+(1k >-),n P 为预测人口数,0P 为初期人口数,k 为预测期内年增长率,n 为预测期间隔年数.如果在某一时期有10k -<<,那么在这期间人口数 A .呈下降趋势B .呈上升趋势C .摆动变化D .不变12.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为 A .12B .14C .16D .18二、填空题13.东汉·王充《论衡·宜汉篇》:“且孔子所谓一世,三十年也.”,清代·段玉裁《说文解字注》:“三十年为一世.按父子相继曰世”.“一世”又叫“一代”,到了唐朝,为了避李世民的讳,“一世”方改为“一代”,当代中国学者测算“一代”平均为25年.另据美国麦肯锡公司的研究报告显示,全球家庭企业的平均寿命其实只有24年,其中只有约30%的家族企业可以传到第二代,能够传到第三代的家族企业数量为总量的13%,只有5%的家族企业在第三代后还能够继续为股东创造价值.根据上述材料,可以推断美国学者认为“一代”应为__________年.14.下列说法正确的是__________(填序号)(1)已知相关变量(),x y 满足回归方程ˆ24yx =-,若变量x 增加一个单位,则y 平均增加4个单位(2)若,p q 为两个命题,则“p q ∨”为假命题是“p q ∧”为假命题的充分不必要条件(3)若命题0:p x R ∃∈,20010x x -+<,则:p x R ⌝∀∉,210x x -+≥(4)已知随机变量()22X N σ~,,若()0.32P X a <=,则()40.68P X a >-=15.中医药是反映中华民族对生命、健康和疾病的认识,具有悠久历史传统和独特理论及技术方法的医药学体系,是中华文明的瑰宝.某科研机构研究发现,某品种中成药的药物成份A 的含量x (单位:g )与药物功效y (单位:药物单位)之间具有关系:(20)y x x =-.检测这种药品一个批次的5个样本,得到成份A 的平均值为8g ,标准差为2g ,估计这批中成药的药物功效的平均值为__________药物单位.16.为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本.其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生2000人,则该校学生总人数是_______..17.玉林市有一学校为了从254名学生选取部分学生参加某次南宁研学活动,决定采用系统抽样的方法抽取一个容量为42的样本,那么从总体中应随机剔除的个体数目为__________.18.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取_______名学生.19.某高中有高一学生320人,高二学生400人,高三学生360人.现采用分层抽样调查学生的视力情况.已知从高一学生中抽取了8人,则三个年级一共抽取了__________人。
高中必修三数学统计教案
高中必修三数学统计教案
主题:统计学概述
目标:学生能够了解统计学的基本概念和应用,并掌握一些基本的统计方法。
一、引入
通过实例引入统计学的概念,让学生了解统计学在日常生活中的重要性。
二、概念介绍
1.统计学的定义和作用:统计学是研究数据收集、整理、分析和解释的一门学科,是现代科学和社会科学中不可或缺的工具。
2.统计学的基本概念:总体、样本、抽样、数据等。
三、常用统计方法
1.描述统计方法:平均数、中位数、众数等。
2.概率统计方法:频率分布、概率分布、期望值等。
3.推断统计方法:参数估计、假设检验等。
四、练习
1.实例分析:通过实例让学生掌握如何应用统计方法进行数据分析。
2.练习题:让学生做一些实践练习,巩固所学的统计方法。
五、总结
总结本节课的内容,强调统计学的重要性,并展望后续学习内容。
六、作业
布置相关作业,让学生进一步巩固所学知识。
七、扩展
介绍一些统计学在现代科学研究和社会应用中的具体案例,激发学生对统计学的兴趣和好奇心。
注:此为一份简单的高中必修三数学统计教案范本,具体教学内容和方法可根据教学需求进行调整和改进。
高中数学必修三:1.3统计图表 课件(共37张PPT)
一、制作统计图表
例1某地农村某户农民年收入如下(单位:元) 土地收入 打工收入 养殖收入 其他收入 4320 3600 2350 850 请用不同的统计图来表示上面的数据。 解:
5000 4000 3000 2000 1000 0 土地收入 打工收入 养殖收入 其他收入
项目
7
收入(元)
折线统计图
60 50 40 30 20 10 150以下 150~160 160~170 (C) 不低于170 身高(cm)
19
百分数/(%)
例2
下面是关于某个总体包含的所有学生的身高分布
的几种表述,其中哪一种表述反映的总体信息较多?
百分数/(%) 60 50 40 30 20 10 160以下 (A) 百分数/(%) 60 50 40 30 20 10 150以下 150~160 160~170 (C) 不低于170 身高(cm) 不低于160 身高(cm) 60 50 40 30 20 10 150以下 150~160 (B) 不低于160 身高(cm) 百分数/(%)
折线统计图:
用一定单位长度表示一定的数量,并根 据数量的多少描出各点,然后把各点用线 段顺次连接起来,形成折线,用折线的升 降来表示数量之间的关系及变化趋势,这 样的统计图叫作折线统计图。 特点:折线统计图能够清晰的反映数据的 变化趋势或情况。
8
制作折线统计图的步骤:
1、根据图纸大小,画出两条互相垂直的射线。
12
例1 我们对50人的智商情况进行了调查,如果按照区 间[80,85),[85,90),…,[115,120)进行分组,得到的分布情 况如图
13
例1 我们对50人的智商情况进行了调查,如果按照区 间[80,85),[85,90),…,[115,120)进行分组,得到的分布情)有多少人的智商在90~105之间
北师大版高中数学必修三第一章《统计》测试题(答案解析)
一、选择题1.为了解某社区居民的家庭年收入和年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x 万 8.3 8.6 9.9 11.1 12.1 支出y 万5.97.88.18.49.8根据上表可得回归直线方程ˆˆˆy bx a =+,其中0.78b ∧=,a y b x ∧∧=-元,据此估计,该社区一户收入为16万元家庭年支出为( ) A .12.68万元B .13.88万元C .12.78万元D .14.28万元2.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,这与性别有关联的可能性最大的变量是( )A .成绩B .视力C .智商D .阅读量3.若一组数据12345,,,,x x x x x 的平均数为5,方差为2,则12323,23,23x x x ---,4523,23x x --的平均数和方差分别为( )A .7,-1B .7,1C .7,2D .7,84.将某选手的7个得分去掉1个最高分,去掉1个最低分,5个剩余分数的平均分为21,现场作的7个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示,则5个剩余分数的方差为( )A .1167B .365C .36D .675.有线性相关关系的变量有观测数据,已知它们之间的线性回归方程是,若,则( ) A .B .C .D .6.一组数据中的每一个数据都乘2,再减去80,得到一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是 A .81.2,4.4 B .40.6,1.1 C .48.8,4.4D .78.8,1.17.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下: 父亲身高x (cm )174176176176178儿子身高y (cm )175175176177177则y 对x 的线性回归方程为 A .y = x-1B .y = x+1C .y =88+12x D .y = 1768.某产品的广告费用x 与销售额y 的统计数据如下表: 广告费用x (万元) 2 3 4 5 销售额y (万元)25374454根据上表可得回归方程ˆˆˆy bx a =+中的ˆb为9.4,据此模型预报广告费用为6万元时销售额为( ) A .61.5万元 B .62.5万元C .63.5万元D .65.0万元9.若某中学高二年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数是( )A .90.5B .91.5C .90D .9110.PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表: 时间周一 周二 周三周四 周五 车流量x (万辆) 100 102 108 114 116 浓度y (微克)7880848890根据上表数据,用最小二乘法求出y 与x 的线性回归方程是( )参考公式:121()()()niii ni i x x y y b x x ==--=-∑∑,a y b x =-⋅;参考数据:108x =,84y =;A .0.6274ˆ.2yx =+ B .0.7264ˆ.2y x =+ C .0.7164ˆ.1y x =+ D .0.6264ˆ.2y x =+ 11.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位 D .y 平均减少2个单位12.从存放号码分别为1,2,⋯,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是( ) A .0.53B .0.5C .0.47D .0.37二、填空题13.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位: cm ),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有_______株树木的底部周长大于110cm .14.已知一组数1,2,m ,6,7的平均数为4,则这组数的方差为______.15.数列{}n a 是公差不为零的等差数列,其前n 项和为n S ,若记数据1a ,2a ,3a ,⋅⋅⋅,2019a 的标准差为1σ,数据11S ,22S ,33S ,⋅⋅⋅,20192019S 的标准差为2σ,则12σσ=________ 16.一个车间为了规定工作原理,需要确定加工零件所花费的时间,为此进行了5次试验,收集数据如下: 零件数x (个) 15 20 30 40 50 加工时间y (分钟)6570758090由表中数据,求得线性回归方程0.66y x a =+,则估计加工70个零件时间为__________分钟(精确到0.1). 17.已知x ,y 的取值如下表: x 2 3 4 5 y2.23.85.56.5从散点图分析,y 与x 线性相关,且回归方程为y =1.46x +a ,则实数a 的值为________.18.数据1x ,2x ,…,n x 的平均数是3,方差是1,则数据15x -,25x -,…,5n x -的平均数和方差之和是__________.19.某超市统计了一个月内每天光顾的顾客人数,得到如图所示的频率分布直方图,根据该图估计该组数据的中位数为__________.20.已知某市A 社区35岁至45岁的居民有450人,46岁至55岁的居民有750人,56岁至65岁的居民有900人.为了解该社区35岁至65岁居民的身体健康状况,社区负责人采用分层抽样技术抽取若干人进行体检调查,若从46岁至55岁的居民中随机抽取了50人,试问这次抽样调查抽取的人数是________人.三、解答题21.某同学在生物研究性学习中,对春季昼夜温差大小与黄豆种子发芽多少之间的关系进行研究,于是他在4月份的30天中随机挑选了5天进行研究,且分别记录了每天昼夜温差与每天每100颗种子浸泡后的发芽数,得到如下资料:(1)从这5天中任选2天,若选取的是4月1日与4月30日的两组数据,请根据这5天中的另三天的数据,求出y 关于x 的线性回归方程y bx a =+;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠? 附:回归直线的斜率和截距的最小二乘估计公式分别为:()()()1122211nniii i i i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.22.假设关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:若由资料可知y 对x 呈线性相关关系,试求: (1)回归直线方程;(2)估计使用年限为10年时,维修费用约是多少?(参考:1221ni ii nii x ynxyb xnx ==-=-∑∑,a y bx =-)23.经销商小王对其所经营的某一型号二手汽车的使用年数(010)x x <≤与销售价格y (单位:万元/辆)进行整理,得到如下的对应数据:售价 1613 9.5 7 4.5(1)试求y 关于x 的回归直线方程;(2)已知每辆该型号汽车的收购价格为20.05 1.7517.2=-+w x x 万元,根据(1)中所求的回归方程,预测x 为何值时,小王销售一辆该型号汽车所获得的利润z 最大.附:回归方程ˆybx a =+中,1221ˆˆˆˆ,ni ii nii x ynx y b ay bx xnx -=-==--∑∑ 24.学生甲在一次试验中用显微镜观察某种环境下细菌的个数,发现时间x (分钟)时刻的细菌个数为y 个,统计结果如下:x 1 2 3 4 5 y23445(Ⅰ)在给出的坐标系中画出x ,y 的散点图,说明细菌个数和时间是正相关还是负相关.(Ⅱ)根据表格中的5组数据,求y 关于x 的回归直线方程ˆˆˆy bx a =+,并根据回归直线方程估计从实验开始,什么时刻细菌个数为12.参考公式:(1221ˆˆˆ,ni ii ni i x y nx yx n axby bx ====---∑∑) 25.某市举办了一次“诗词大赛”,分预赛和复赛两个环节,已知共有20000名学生参加了预赛,现从参加预赛的全体学生中随机地抽取100人的预赛成绩作为样本,得到如下的统计数据. 得分(百分[0,20)[20,40)[40,60)[60,80)[80,100]地抽取2人,求恰有1人预赛成绩优良的概率;(2)由样本数据分析可知,该市全体参加预赛学生的预赛成绩Z 服从正态分布()2,N μσ,其中μ可近似为样本中的100名学生预赛成绩的平均值(同一组数据用该组数据的中间值代替),且2361σ=.利用该正态分布,估计全市参加预赛的全体学生中预赛成绩不低于72分的人数;(3)预赛成绩不低于91分的学生将参加复赛,复赛规则如下: ①参加复赛的学生的初始分都设置为100分;②参加复赛的学生可在答题前自己决定答题数量n ,每一题都需要“花”掉一定分数来获取答题资格(即用分数来买答题资格),规定答第k 题时“花”掉的分数为()0.21,2,k k n =; ③每答对一题得2分,答错得0分;④答完n 题后参加复赛学生的最终分数即为复赛成绩.已知学生甲答对每道题的概率均为0.75,且每题答对与否都相互独立,则当他的答题数量n 为多少时,他的复赛成绩的期望值最大?参考数据:若()2~,Z N μσ,则() 6.827P Z μσμσ-<<+≈,()220.9545P Z μσμσ-<<+≈,()330.9973P Z μσμσ-<<+≈26.某校的一个社会实践调查小组,在对该校学生的良好“用眼习惯”的调查中,随机发放了120分问卷.对收回的100份有效问卷进行统计,得到如22⨯下列联表:(1)现按女生是否能做到科学用眼进行分层,从45份女生问卷中抽取了6份问卷,从这6份问卷中再随机抽取3份,并记其中能做到科学用眼的问卷的份数X ,试求随机变量X 的分布列和数学期望;(2)若在犯错误的概率不超过P 的前提下认为良好“用眼习惯”与性别有关,那么根据临界值表,最精确的P 的值应为多少?请说明理由.附:独立性检验统计量22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.独立性检验临界值表:【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【分析】由已知求得 x , y ,进一步求得 a ,得到线性回归方程,取16x =求得y 值即可. 【详解】8.38.69.911.1512.1 10x +++=+=, 5.97.88.18.49.858y ++++==.又 0.78b =,∴ 80.78100.2a y bx --⨯===. ∴ 0.780.2y x =+.取16x =,得 0.78160.212.68y ⨯+==万元,故选A . 【点睛】本题主要考查线性回归方程的求法,考查了学生的计算能力,属于中档题.2.D解析:D 【解析】试题分析:由表中数据可得 表1:()25262210140.00916362032K ⨯⨯-⨯=≈⨯⨯⨯;表2: ()2524201216 1.76916362032K ⨯⨯-⨯=≈⨯⨯⨯;表3: ()252824128 1.316362032K ⨯⨯-⨯=≈⨯⨯⨯;表4: ()25214302623.4816362032K ⨯⨯-⨯=≈⨯⨯⨯.其中23.48最大,所以阅读量与性别有关联的可能性最大.故D 正确. 考点:独立性检验.3.D解析:D 【分析】根据平均数的性质,方差的性质直接运算可得结果. 【详解】令23(1,2,,5)i i y x i =-=1234555x x x x x x ++++==,1234523232323232310375x x x x x y x -+-+-+-+-∴==-=-=,(也可()(23)2()32537E y E x E x =-=-=⨯-=)()()()2y 232428D D x D x =-==⨯=故选:D 【点睛】本题主要考查方差及平均值的性质的简单应用,属于中档题.4.B解析:B 【分析】由剩余5个分数的平均数为21,据茎叶图列方程求出x =4,由此能求出5个剩余分数的方差. 【详解】∵将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个分数的平均数为21, ∴由茎叶图得:1724202020215x+++++=得x =4,∴5个分数的方差为: S 2=()()()()()222221361721242120212021242155⎡⎤-+-+-+-+-=⎣⎦ 故选B 【点睛】本题考查方差的求法,考查平均数、方差、茎叶图基础知识,考查运算求解能力,考查数形结合思想,是基础题.5.D解析:D 【解析】 【分析】 先计算,代入回归直线方程,可得,从而可求得结果.【详解】 因为,所以,代入回归直线方程可求得,所以,故选D. 【点睛】该题考查的是有关回归直线的问题,涉及到的知识点有回归直线一定会过样本中心点,利用相关公式求得结果,属于简单题目.6.B解析:B 【分析】先设出原来的数据,然后设出现在的数据,找到两组数据的联系,即可. 【详解】设原来的数据为12,,....,n x x x ,每一个数据都乘以2,再减去80,得到新数据为 12280,280,...,280n x x x --- 已知()122...80 1.2n x x x nn+++-=,则81.240.62X == 方差为:224 4.4, 1.1σσ==,故选B . 【点睛】本道题目考查的是平均数和方差之间的关系,列出等式,探寻两组数据的联系,即可.7.C解析:C 【详解】试题分析:由已知可得176,176x y ==∴中心点为()176,176, 代入回归方程验证可知,只有方程y =88+12x 成立,故选C 8.C解析:C 【分析】先求出所给数据的平均数,得到样本中心点,根据回归直线经过样本中心点,求出ˆa,得到线性回归方程,把6x =代入即可求出答案. 【详解】 由题意知4235 3.54x +++==,44253754404y +++==, 则40ˆˆ9.4 3.57.1a y bx=-=-⨯=, 所以回归方程为9.4.1ˆ7yx =+, 则广告费用为6万元时销售额为9.467.163.5⨯+=, 故答案为C. 【点睛】本题考查了线性回归方程的求法与应用,属于基础题.9.A解析:A 【分析】共有8个数据,中位数就是由小到大中间两数的平均数,求解即可. 【详解】根据茎叶图,由小到大排列这8个数为84,85,89,90,91,92,93,95, 所以中位数为90+91=90.52,故选A. 【点睛】本题主要考查了中位数,茎叶图,属于中档题.10.B解析:B 【解析】 【分析】利用最小二乘法做出线性回归直线的方程的系数,写出回归直线的方程,得到结果. 【详解】 由题意,b=22222210078102801088411488116905108841001021081141165108⨯+⨯+⨯+⨯+⨯-⨯⨯++++-⨯=0.72,a=84﹣0.72×108=6.24, ∴y =0.72x+6.24, 故选:B . 【点睛】本题主要考查线性回归方程,属于难题.求回归直线方程的步骤:①依据样本数据画出散点图,确定两个变量具有线性相关关系;②计算211,,,nnii i i i x y x x y ==∑∑的值;③计算回归系数ˆˆ,ab ;④写出回归直线方程为ˆˆˆy bx a =+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.11.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位,即减少1.5个单位,故选C.【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目. 12.A解析:A【解析】分析:由题意结合统计表确定频数,然后确定频率即可.详解:由题意可知,取到卡片为奇数的频数为:1356181153++++=,取卡片的次数为100次,则取到号码为奇数的频率是530.53 100=.本题选择A选项.点睛:本题主要考查频率的定义及其应用等知识,意在考查学生的转化能力和计算求解能力.二、填空题13.18【分析】根据频率小矩形的面积小矩形的高组距底部求出周长大于110的频率再根据频数样本容量频率求出对应的频数【详解】由频率分布直方图知:底部周长大于110的频率为所以底部周长大于110的频数为(株解析:18【分析】根据频率=小矩形的面积=小矩形的高⨯组距底部,求出周长大于110cm的频率,再根据频数=样本容量⨯频率求出对应的频数.【详解】由频率分布直方图知:底部周长大于110cm的频率为(0.0200.010)100.3+⨯=,所以底部周长大于110cm的频数为600.318⨯=(株),故答案是:18.【点睛】该题考查的是有关频率分布直方图的应用,在解题的过程中,注意小矩形的面积表示的是对应范围内的频率,属于简单题目.14.【分析】先根据平均数计算出的值再根据方差的计算公式计算出这组数的方差【详解】依题意所以方差为故答案为【点睛】本小题主要考查平均数和方差的有关计算考查运算求解能力属于基础题解析:26 5【分析】先根据平均数计算出m的值,再根据方差的计算公式计算出这组数的方差.【详解】依题意12674,45m m ++++==.所以方差为()()()()()22222114244464745⎡⎤-+-+-+-+-⎣⎦[]126944955=+++=. 故答案为265. 【点睛】本小题主要考查平均数和方差的有关计算,考查运算求解能力,属于基础题.15.2【分析】根据等差数列性质分析两组数据之间关系再根据数据变化规律确定对应标准差变化规律即得结果【详解】因为数列是公差不为零的等差数列其前项和为所以因此即故答案为:2【点睛】本题考查等差数列和项性质以解析:2 【分析】根据等差数列性质分析两组数据之间关系,再根据数据变化规律确定对应标准差变化规律,即得结果. 【详解】因为数列{}n a 是公差不为零的等差数列,其前n 项和为n S ,所以111=+222n n n a a a a n S +=, 因此2112σσ=,即122σσ=故答案为:2 【点睛】本题考查等差数列和项性质以及数据变化对标准差的影响规律,考查综合分析求解能力,属中档题.16.7【解析】【分析】结合题意先求出线性回归方程然后再计算出结果【详解】由题意可得则线性回归方程为当时【点睛】本题考查了求线性回归方程然后求出估计结果需要掌握解题方法较为基础解析:7 【解析】 【分析】结合题意先求出线性回归方程,然后再计算出结果 【详解】 由题意可得1520304050315x ++++==6570758090765y ++++==,760.6631a ∴=⨯+,55.54a =,则线性回归方程为0.66 5.4ˆ55y x =+ 当70x =时,ˆ101.7y≈ 【点睛】本题考查了求线性回归方程,然后求出估计结果,需要掌握解题方法,较为基础17.—061【分析】根据所给条件求出把样本中心点代入回归直线方程可以得到关于的方程解出即可得到答案【详解】根据题意可得则这组数据的样本中心点是代入到回归直线方程故答案为【点睛】本题考查了线性回归方程解题解析:—0.61 【分析】根据所给条件求出x ,y ,把样本中心点()x y ,代入回归直线方程 1.4ˆ6ˆyx a +=,可以得到关于ˆa的方程,解出即可得到答案 【详解】 根据题意可得23453.54x +++== 2.2 3.8 5.5 6.54.54y +++==则这组数据的样本中心点是()3.54.5,代入到回归直线方程 1.4ˆ6ˆyx a += 4.5 1.46 3.ˆ5a∴⨯+= ˆ0.61a=- 故答案为0.61- 【点睛】本题考查了线性回归方程,解题的关键是线性回归方程一定过样本中心点,这是求解线性回归方程的步骤之一,是线性回归方程考查的常见题型,体现了回归直线方程与样本中心点的关联.18.3【解析】分析:由题意结合平均数方差的性质整理计算即可求得最终结果详解:由题意结合平均数和方差的性质可知:数据…的平均数为:方差为:则平均数和方差之和是点睛:本题主要考查均值的性质方差的性质等知识意解析:3 【解析】分析:由题意结合平均数、方差的性质整理计算即可求得最终结果. 详解:由题意结合平均数和方差的性质可知:数据15x -,25x -,…,5n x -的平均数为:532-=,方差为:()2111-⨯=, 则平均数和方差之和是213+=.点睛:本题主要考查均值的性质、方差的性质等知识,意在考查学生的转化能力和计算求解能力.19.75【解析】分析:由频率分布直方图算出各频率然后计算中位数详解:由图可知的频率为的频率为的频率为的频率为的频率为前两组频率前三组频率中位数在第三组设中位数为则解得故该组数据的中位数为点睛:本题考查了解析:75. 【解析】分析:由频率分布直方图算出各频率,然后计算中位数 详解:由图可知,10~20的频率为0.1420~30的频率为0.2430~40的频率为0.32 40~50的频率为0.2 50~60的频率为0.1前两组频率0.140.240.380.5=+=< 前三组频率0.140.240.320.70.5=++=>∴中位数在第三组设中位数为x ,则()300.380.320.510x -+⨯=解得33.75x =故该组数据的中位数为33.75点睛:本题考查了在频率分布直方图中求中位数,此类题目需要先确定中位数所在的组,然后根据公式计算求得结果,较为基础.20.【解析】根据题意可得抽样比为则这次抽样调查抽取的人数是即答案为140 解析:140【解析】根据题意可得抽样比为501,75015= 则这次抽样调查抽取的人数是()114507509002100140,1515++=⨯= 即答案为140.三、解答题21.(1)532y x =-;(2)线性回归方程是可靠的. 【分析】(1)根据最小二乘法公式,分别将数据代入计算,即可得答案;(2)选取的是4月1日与4月30日的两组数据,即10x =和8x =代入判断即可; 【详解】解:(1)由数据得12x =,27y =,3972xy =,23432x =; 又31977i i i x y ==∑,321434i i x ==∑;97797254344322b -==-,5271232a =-⨯=-;所以y 关于x 的线性回归方程为:532y x =-. (2)当10x =时,5103222y =⨯-=,22232-<; 当8x =时,583222y =⨯-=,17162-<, 所得到的线性回归方程是可靠的. 【点睛】本题考查最小二乘法求回归直线方程及利用回归方程进行判断拟合效果,考查数据处理能力,求解时注意回归直线必过样本点中心的应用.22.(1) 1.2308ˆ.0yx =+;(2)12.38万元.. 【分析】(1)由已知表格中的数据,易计算出变量x ,y 的平均数,及2i x ,i i x y 的累加值,代入回归直线系数公式1221ni ii nii x ynxyb xnx ==-=-∑∑,a y bx =-,即可求出回归直线的系数,进而求出回归直线方程.(2)把使用年限10代入回归直线方程,即可估算出维修费用的值. 【详解】 (1)4x =,5y=,52190i i x==∑,51112.3i i i x y ==∑,12215 1.235ni ii nii x yxyb xx ==-==-∑∑,0.08a y bx =-=, 所以回归直线方程为 1.2308ˆ.0yx =+; (2) 1.23100.0812.3ˆ8y=⨯+=, 即估计用10年时维修费约为12.38万元. 【点评】本题考查回归直线的方程求解,关键是要求出回归直线方程的系数,由已知的变量x ,y 的值,我们计算出变量x ,y 的平均数,及2i x ,i i x y 的累加值,代入回归直线系数公式1221ni ii nii x ynxyb xnx ==-=-∑∑,a y bx =-,即可求出回归直线的系数,进而求出回归直线方程.属于中等题.23.(1) 1.4518.7y x =-+;(2)3 【分析】(1)由表中数据计算x 、y ,求出ˆb、ˆa ,即可写出回归直线方程; (2)写出利润函数z y w =-,利用二次函数的图象与性质求出3x =时z 取得最大值. 【详解】解:(1)由表中数据得,1(246810)65x =⨯++++=,1(16139.57 4.5)105y =⨯++++=, 由最小二乘法求得:22222221641369.58710 4.5561058ˆ 1.452468105640b⨯+⨯+⨯+⨯+⨯-⨯⨯-===-++++-⨯, ˆ10( 1.45)618.7a=--⨯=, 所以y 关于x 的回归直线方程为 1.4518.7y x =-+; (2)根据题意,利润函数为:22(1.4518.7)(0.05 1.7517.2)0.050.3 1.5z y w x x x x x =-=-+--+=-++,所以,当0.332(0.05)x =-=⨯-时,二次函数z 取得最大值为1.95;即预测3x =时,小王销售一辆该型号汽车所获得的利润z 最大. 【点睛】本题考查了回归直线方程的求法,以及二次函数的图象与性质的应用,考查计算能力.24.(Ⅰ)图象见解析,正相关;(Ⅱ)ˆ0.7 1.5yx =+,当15x =时细菌个数为12个. 【分析】(Ⅰ)根据数据描点即得散点图,看图即判断结果; (Ⅱ)利用公式代入数据计算即可. 【详解】解:(Ⅰ)图形如下,观察图像可知细菌个数和时间是正相关.(Ⅱ)由数据计算得,()11234535x =⨯++++=,()123445 3.65y =⨯++++=,1122334445561ni ii x y==⨯+⨯+⨯+⨯+⨯=∑,22222211234555n i i x ==++++=∑122216153 3.67ˆ0.7555310ni ii ni i x y nx yxbx n ==-⨯⨯====-⨯--∑∑,ˆˆ 3.60.73 1.5a y bx =-=-⨯=, 所以ˆ0.7 1.5yx =+, 当0.7 1.512x +=时,解得15x =. 所以当15x =时细菌个数为12个. 【点睛】本题考查了散点图、线性回归方程及其应用,属于基础题. 25.(1)2552;(2)3173;(3)当他的答题数量7n =时,他的复赛成绩的期望值最大. 【分析】(1)由表可知,样本中成绩不低于60分的学生共有40人,其中成绩优良的人数为15人,再结合排列组合与古典概型即可得解;(2)先求出样本中的100名学生预赛成绩的平均值,即为μ,从而推出~(53Z N ,219),再根据正态分布的性质即可得解;(3)以随机变量ξ表示甲答对的题数,则~B ξ(,0.75)n ,记甲答完n 题所得的分数为随机变量X ,则2X ξ=,为了获取答n 道题的资格,甲需要“花”掉的分数为20.1()n n +,设甲答完n 题后的复赛成绩的期望值为()f n ,则2()1000.1()()f n n n E X =-++,最后利用配方法即可得解. 【详解】解:(1)由题意得样本中成绩不低于60分的学生共有40分,其中成绩优良的人数为15人,记“从样本中预赛成绩不低于60分的学生中随机地抽取2人,恰有1人预赛成绩优良”为事件A ,则()1125152402552C C P A C == 答:“从样本中预赛成绩不低于60分的学生中随机地抽取2人,恰有1人预赛成绩优良”的概率为2552(2)由题意知样本中的100名学生预赛成绩的平均值为:100.1300.2500.3700.25900.1533x =⨯+⨯+⨯+⨯+⨯=,则53μ=,由2361σ=得19σ=, 所以()()()()17210.158652P Z P Z P Z μσμσμσ≥=≥+=--<≤+≈, 所以,估计全市参加参赛的全体学生中,成绩不低于72分的人数为20000×0.15865=3173,即全市参赛学生中预赛成绩不低于72分的人数为3173.(3)以随机变量ξ表示甲答对的题数,则()~,0.75B n ξ,且()0.75E n ξ=, 记甲答完n 题所加的分数为随机变量X ,则2X ξ=,∴()()2 1.5E X E n ξ==, 依题意为了获取答n 道题的资格,甲需要“花”掉的分数为:()()20.2123...0.1n n n ⨯++++=+,设甲答完n 题后的复赛成绩的期望值为()f n ,则()()()221000.1 1.50.17104.9f n n n n n =-++=--+,由于*n N ∈,所以当7n =时,()f n 取最大值104.9. 即当他的答题数量7n =时,他的复赛成绩的期望值最大. 【点睛】本题考查古典概型、正态分布的性质、二项分布的性质及数学期望的实际应用,考查学生对数据的分析与处理能力,属于中档题.26.(1)分布列见解析,1;(2)0.10=P ,理由见解析. 【分析】(1)按照分层抽样计算“科学用眼”和“不科学用眼”的抽取人数,随机变量X 的取值可能为0,1,2,然后计算概率得出分布列及其数学期望; (2)按照公式计算2K 的值,然后由临界值表得出结果即可. 【详解】(1)“科学用眼”抽156245⨯=人,“不科学用眼”抽306445⨯=人,则随机变量X0=,1,2,∴343641 (0)205====CP XC,122436123(1)205C CP XC====,21243641(2)205C CP XC====,分布列为:0120121555EX=⨯+⨯+⨯=;(2)22100(45153010)3.03075255545⨯-⨯=≈⨯⨯⨯K,由表可知2.706 3.030 3.840<<,∴0.10=P.【点睛】本题考查随机变量的分布列和数学期望,考查独立性检验,考查逻辑思维能力和计算能力,考查学生分析解决问题的能力,属于常考题.。
高一数学必修三统计知识点
高一数学必修三统计知识点统计学是数学的一个重要分支,主要研究数据的收集、整理、分析和解释等问题。
在高中数学的学习中,统计学也是一个重要的内容。
本文将介绍高一数学必修三中的一些统计知识点,帮助同学们更好地理解和掌握相关知识。
一、数据的整理和描述在统计学中,数据的整理和描述是最基本也是最重要的工作。
通过整理和描述数据,可以直观地了解数据的分布和特征。
1. 数据的收集数据的收集可以通过观察、实验、调查等方式进行。
在收集数据的过程中,需要注意数据的真实性和可靠性,避免出现误差。
2. 数据的整理在获得一组数据后,需要对数据进行整理。
可以通过制表、绘图等方式将数据进行整理和归纳,以便更好地进行分析和描述。
3. 数据的描述数据的描述可以从集中趋势和离散程度两个方面进行。
常见的描述方法有平均数、中位数、众数、极差、四分位数等。
二、频数分布和频率分布频数分布和频率分布是对数据进行分类、整理和统计的方法,可以直观地展示数据的分布情况。
1. 频数分布频数分布是指将一组数据按照不同数值进行分类,并统计每个类别中数据出现的次数。
通过频数分布表或频数分布图可以清晰地看出数据的分布情况。
2. 频率分布频率分布是指将频数转化为频率,即将每个类别中数据出现的次数除以总数据量得到的比率。
频率分布可以更好地比较不同数据集之间的差异。
三、概率统计概率统计是统计学的重要分支之一,主要研究随机事件的概率和随机变量的分布。
1. 随机事件的概率随机事件的概率可以通过理论计算和实验估计两种方法得到。
在计算概率时,需要考虑事件的互斥性和独立性等性质。
2. 随机变量的分布随机变量的分布决定了其取值的概率分布情况。
常见的随机变量分布有离散型和连续型两种,如二项分布、正态分布等。
四、抽样调查抽样调查是统计学中常用的一种方法,通过选取样本进行统计分析,从而推断总体的特征和规律。
1. 简单随机抽样简单随机抽样是指从总体中随机选择样本的方法,每个样本具有相同的概率被选中。
高中数学人教A版必修三 第二章《统计》 2.1.1 随机抽样 简单随机抽样
第二章 2.1 随机抽样2.1.1简单随机抽样1.理解并掌握简单随机抽样的概念、特点和步骤.2.掌握简单随机抽样的两种方法.知识梳理自主学习题型探究重点突破当堂检测自查自纠知识梳理自主学习知识点一统计的相关概念名称定义总体所要考察对象的全体叫做总体样本从总体中抽取出的若干个个体组成的集合叫做总体的一个样本个体总体中的每一个考察对象叫做个体样本容量样本中个体的数目叫做样本容量思考样本与样本容量有什么区别?答样本与样本容量是两个不同的概念.样本是从总体中抽取的个体组成的集合,是对象;样本容量是样本中个体的数目,是一个数.答案知识点二简单随机抽样1.简单随机抽样的定义设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.2.简单随机抽样的特点特点说明个体数有限要求总体的个体数有限,这样便于通过随机抽取的样本对总体进行分析逐个抽取从总体中逐个进行抽取,这样便于在抽取过程中进行操作不放回抽样由于抽样试验中多采用不放回抽样,使其具有广泛的应用性,而且所抽取的样本中没有被重复抽取的个体,便于进行有关的分析和计算等可能抽样在整个抽样过程中,各个个体被抽取的机会都相等,从而保证了这种抽样方法的公平性知识点三最常用的简单随机抽样的方法1.抽签法(1)抽签法(抓阄法):抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.(2)抽签法的步骤:①编号:对总体中的N个个体进行编号(号码可以是1~N,也可以使用已知的号码);②制签:将1~N这N个编号写在大小、形状都相同的号签上(号签可以是纸条、卡片或小球等);③均匀搅拌:将写好的号签放入一个不透明的容器中,搅拌均匀;④抽签:从容器中每次不放回地抽取一个号签,连续抽取n次,并记录其编号;⑤确定样本:从总体中找出与号签上的号码所对应的个体,组成样本.2.随机数法(1)随机数法:利用随机数表、随机数骰子或计算机产生的随机数进行抽样.(2)随机数表法的一般步骤:①编号:将总体中的每个个体进行编号;②选定初始值(数);为保证所选数字的随机性,在面对随机数表之前就指出开始数字的位置;③选号:从选定的数字开始按照一定的方向读下去,若得到的号码不在编号中或已被选用,则跳过,直到选满所需号码为止;④确定样本:从总体中找出按步骤③选出的号码所对应的个体,组成样本.3.抽签法与随机数法的异同点抽签法随机数表法不同点①抽签法比随机数法简单;②抽签法适用于总体中的个体数相对较少的情况①随机数法要求编号的位数相同;②随机数法适用于总体中的个体数相对较多的情况相同点①都是简单随机抽样,并且要求被抽取样本的总体的个数有限;②都是从总体中逐个不放回地抽取思考(1)简单随机抽样是不放回抽样,对于放回的抽样可以是简单随机抽样吗?答不可以.简单随机抽样是从总体逐个抽取的,是一种不放回抽样,也就是每次从总体中取出元素后不放回总体,若放回,则一定不是简单随机抽样.(2)采用抽签法抽取样本时,为什么将编号写在形状、大小相同的号签上,并且将号签放在同一个箱子里搅拌均匀?答为了使每个号签被抽取的可能性相等,保证抽样的公平性.题型探究重点突破题型一简单随机抽样的判断例1下列5个抽样中,简单随机抽样的个数是()①从无数个个体中抽取50个个体作为样本;②仓库中有1万支奥运火炬,从中一次性抽取100支火炬进行质量检查;③某连队从200名党员官兵中,挑选出50名最优秀的官兵赶赴青海参加抗震救灾工作;④一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地抽出6个号签.⑤箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出1个零件进行质量检验后,再把它放回箱子里.A.0B.1C.2D.3跟踪训练1在简单随机抽样中,某一个体被抽到的可能性()BA.与第几次抽样有关,第一次抽到的可能性大一些B.与第几次抽样无关,每次抽到的可能性都相等C.与第几次抽样有关,最后一次抽到的可能性要大些D.与第几次抽样无关,每次都是等可能的抽取,但各次抽取的可能性不一定解析在简单随机抽样中,每一个个体被抽到的可能性都相等,与第几次抽样无关,故A,C,D不正确,B正确.题型二抽签法的应用例2为迎接2016年里约热内卢奥运会,奥委会现从报名的某高校20名志愿者中选取5人组成奥运志愿小组,请用抽签法设计抽样方案.解(1)将20名志愿者编号,号码分别是01,02, (20)(2)将号码分别写在20张大小、形状都相同的纸条上,揉成团儿,制成号签;(3)将所得号签放在一个不透明的袋子中,并搅拌均匀;(4)从袋子中依次不放回地抽取5个号签,并记录下上面的编号;(5)所得号码对应的志愿者就是志愿小组的成员.跟踪训练2从20架钢琴中抽取5架进行质量检查,请用抽签法确定这5架钢琴.解第一步,将20架钢琴编号,号码是01,02, (20)第二步,将号码分别写在一张纸条上,揉成团,制成号签.第三步,将得到的号签放入一个不透明的袋子中,并充分搅匀.第四步,从袋子中逐个不放回地抽取5个号签,并记录上面的编号.第五步,所得号码对应的5架钢琴就是要抽取的对象.题型三随机数法例3为了检验某种药品的副作用,从编号为1,2,3,…,120的服药者中用随机数法抽取10人作为样本,写出抽样过程.解第一步,将120名服药者重新进行编号,分别为001,002,003, (120)第二步,在随机数表(教材P)中任选一数作为初始数,如选第9行第7103列的数3;第三步,从选定的数3开始向右读,每次读取三位,凡不在001~120中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到074,100,094,052,080,003,105,107,083,092;第四步,以上这10个号码所对应的服药者即是要抽取的对象.跟踪训练3总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法:从随机数表第1行的第5列和第6列数字开始由左到右一次选取两个数字,则选出来的第5个个体的编号为()7816657208026314070243699728019832049234493582003623486969387481A.08B.07C.02D.01编号不一致致错易错点例4某工厂的质检人员对生产的100件产品,采用随机数法抽取10件进行检查,对100件产品采用下面的编号方法:①1,2,3, (100)②001,002,003,…,100;③00,01,02,03,…,99.其中最恰当的序号是________.当堂检测 1 2 3 4 5 1.某学校为了解高一800名新入学同学的数学学习水平,从中随机抽取100名同学的中考数学成绩进行分析,在这个问题中,下列说法正确的是()DA.800名同学是总体B.100名同学是样本C.每名同学是个体D.样本容量是100解析据题意,总体是指800名新入学同学的中考数学成绩,样本是指抽取的100名同学的中考数学成绩,个体是指每名同学的中考数学成绩,样本容量是100,故只有D正确.B2.抽签法确保样本代表性的关键是()A.制签B.搅拌均匀C.逐一抽取D.抽取不放回解析若样本具有很好的代表性,则每一个个体被抽取的机会相等,故需要对号签搅拌均匀.3.对于简单随机抽样,下列说法正确的是()D①它要求总体中的个体数有限,以便对其中各个个体被抽取的概率进行分析;②它是从总体中逐个地进行抽取,以便在抽取实践中进行操作;③它是一种不放回抽样;④它是一种等可能抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的机会相等,而且在整个抽样过程中,各个个体被抽取的机会也相等,从而保证了这种抽样方法的公平性.A.①②③B.①②④C.①③④D.①②③④解析由简单随机抽样的概念,知①②③④都正确.4.从某批零件中抽取50个,然后再从50个中抽出40个进行合格检查,发现合格品有36个,则该产品的合格率约为( )A.36%B.72%C.90%D.25% 解析 ×100%=90%. 3640C5.某总体共有60个个体,并且编号为00,01,…,59. 现需从中抽取一个容量为8的样本,请从随机数表的倒数第5行(下表为随机数表的最后5行)第11、12列的18开始.依次向下读数,到最后一行后向右,直到取足样本为止(大于59及与前面重复的数字跳过),则抽取样本的号码是________.95 33 95 22 00 18 74 72 00 18 38 79 58 69 32 81 76 80 26 92 82 80 84 25 39 90 84 60 79 80 24 36 59 87 38 82 07 53 89 35 56 35 23 79 18 05 98 90 07 35 46 40 62 98 80 54 97 20 56 95 15 74 80 08 32 16 46 70 50 80 67 72 16 42 79 20 31 89 03 43 38 46 82 68 72 32 14 82 99 70 80 60 47 18 97 63 49 30 21 30 71 59 73 05 50 08 22 23 71 77 91 01 93 20 49 82 96 59 26 94 66 39 67 98 60课堂小结1.要判断所给的抽样方法是不是简单随机抽样,关键是看它们是否符合简单随机抽样的定义,即简单随机抽样的四个特点:总体有限、逐个抽取、无放回抽样、等可能抽取.2.一个抽样试验能否用抽签法,关键看两点:一是制作号签是否方便,二是号签是否容易被搅拌均匀.一般地,当总体容量和样本容量都较少时可用抽签法.3.利用随机数法抽取个体时,关键是先确定以表中的哪个数(哪行哪列)作为起点,以哪个方向作为读数的方向.需注意读数时结合编号特点进行读取,编号为两位,则两位、两位地读取;编号为三位,则三位、三位地读取.本课结束。
高中数学必修3概率统计知识点归纳
高中数学必修3概率统计知识点归纳概率统计是高中数学必修3中的一门重要课程,它研究的是随机事件的发生规律和变化趋势。
概率统计知识点在高中数学习中占据着重要的位置,对于培养学生的逻辑思维、数学建模和解决实际问题的能力具有重要意义。
下面将对高中数学必修3概率统计知识点进行全面归纳。
1.基础概念概率统计的基础概念包括样本空间、随机事件、事件的概率等。
样本空间是指所有可能的结果组成的集合,用S表示;随机事件是样本空间的子集,用A、B、C等表示;事件的概率是指一个随机事件发生的可能性大小,用P(A)表示。
2.排列组合排列组合是概率统计中常用的工具,主要用于计算事件的可能性。
在排列中,元素的顺序是重要的,而在组合中,元素的顺序是不重要的。
排列可以表示为n!,组合可以表示为C(n,m)。
3.基本概率公式基本概率公式是指计算事件的概率的公式。
对于一个随机事件A,它的概率可以用公式P(A) = n(A) / n(S)来表示,其中n(A)表示事件A 的样本点数量,n(S)表示样本空间的样本点数量。
4.互斥事件与对立事件互斥事件是指两个事件不可能同时发生的事件,它们的概率相加等于两个事件发生的总概率。
对立事件是指两个事件互为对方的补集,它们的概率之和等于1。
5.条件概率条件概率是指在已知某个条件下,事件发生的概率。
条件概率可以用公式P(A|B) = P(A∩B) / P(B)来表示,其中P(A|B)表示在事件B发生的条件下,事件A发生的概率;P(A∩B)表示事件A和事件B同时发生的概率;P(B)表示事件B发生的概率。
6.全概率公式和贝叶斯公式全概率公式和贝叶斯公式是处理复杂事件概率的重要方法。
全概率公式可以用于计算一个事件在不同条件下发生的概率,贝叶斯公式可以用于根据已知条件计算相应的概率。
7.随机变量与概率分布随机变量是指与随机事件相对应的数值,概率分布是指随机变量各取值的概率情况。
常见的概率分布有离散型概率分布和连续型概率分布。
高中数学必修3_第二章_统计_总结学生版
第二章统计一、随机抽样三种常用抽样方法:1.简单随机抽样:设一个总体的个数为N。
如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。
实现简单随机抽样,常用抽签法和随机数表法。
(1)抽签法制签:先将总体中的所有个体编号(号码可以从1到N),并把号码写在形状、大小相同的号签上,号签可以用小球、卡片、纸条等制作,然后将这些号签放在同一个箱子里,进行均匀搅拌;抽签:抽签时,每次从中抽出1个号签,连续抽取n次;成样:对应号签就得到一个容量为n的样本。
抽签法简便易行,当总体的个体数不多时,适宜采用这种方法。
(2)随机数表法编号:对总体进行编号,保证位数一致;数数:当随机地选定开始读数的数后,读数的方向可以向右,也可以向左、向上、向下等等。
在读数过程中,得到一串数字号码,在去掉其中不合要求和与前面重复的号码后,其中依次出现的号码可以看成是依次从总体中抽取的各个个体的号码。
成样:对应号签就得到一个容量为n的样本。
结论:①用简单随机抽样,从含有N个个体的总体中抽取一个容量为n的样本时,每次抽取一个个体时任一个体被抽到的概率为1/N;在整个抽样过程中各个个体被抽到的概率为n/N;②基于此,简单随机抽样体现了抽样的客观性与公平性;③简单随机抽样的特点:它是不放回抽样;它是逐个地进行抽取;它是一种等概率抽样。
2.系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样)。
系统抽样的步骤可概括为:(1)将总体中的个体编号。
采用随机的方式将总体中的个体编号;(2)将整个的编号进行分段。
为将整个的编号进行分段,要确定分段的间隔k .当N/n 是整数时,k=n/N ;当N/n 不是整数时,通过从总体中剔除一些个体使剩下的个体数N ´能被n 整除,这时k=N ’/n ;(3)确定起始的个体编号。
高中数学必修3(人教A版)第二章统计2.1知识点总结含同步练习及答案
⑤确定样本:从总体中找出与号签上的号码对应的个体,组成样本.
随机数表法是随机数表由数字 0 ,1 ,2,3,⋯,9 这 10 个数字组成,并且每个数字在表中 各个位置上出现的机会都是一样的,通过随机数表,根据实际需要和方便使用的原则,将几个数
组成一组,然后通过随机数表抽取样本.随机数表的优点是简单易行,它很好的解决了当总体中
样.因为 50 名官兵是从中挑出来的,是最优秀的,每个个体被抽到的可能性不同,不符合简单 随机抽样中“等可能抽样”的要求.(3)是简单随机抽样.因为总体中的个体数是有限的,并且
是从总体中逐个进行抽取的,是不放回、等可能的抽取.
2013年第27届世界大学生运动会在俄罗斯举行,为了支持这次运动会,某大学从报名的 20 名大 三学生中选取 6 人组成志愿小组,请用抽签法设计抽样方案. 解:(1)将 20 名志愿者编号,编号为 1,2,3,4,⋯,20; (2)将 20 个号码分别写在 20 张形状相同的卡片上,制成号签; (3)将 20 张卡片放入一个不透明的盒子里,搅拌均匀; (4)从盒子中逐个不放回地抽取 6 个号签,并记录上面的号码;
A.2
B.3
C.6
D.7
解:C
间隔相等,所以 126 − 8 × 15 = 6.
4.分层抽样
描述: 将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在 总体中所占比例进行简单随机抽样或系统抽样,这种抽样的方法叫做分层抽样.当总体由明显差 别的几部分组成时,为了使抽取样本更好地反映总体的情况,常采用分层抽样.
③简单随机抽样是一种不放回抽样.
④简单随机抽样是一种等可能的抽样,每个个体被抽取到的可能性均为
n N
.
常用的简单随机抽样方法有抽签法和随机数表法.
高中数学必修3:第2章统计 2.1 随机抽样(含高考真题演练)
6. 简单随机抽样的结果( ) A.完全由抽样方式所决定 B.完全由随机性来决定 C.完全由人为因素所决定 D.完全由计算方法所决定 解析:简单随机抽样的结果完全由随机性来决定. 答案:B
7. 为了了解某县中考学生数学成绩的情况,从中抽取20本密封
试卷,每本30份试卷,这个问题中的样本容量是( )
最常用的简单随机抽样方法有两种:
抽签法 随机数法
随机数表法
抽签法
(1)对总体的N个个体进行编号 (2)把N个号码写在同样的号签上 (3)将号签放在一个容器中,搅拌均匀 (4)每次从中抽取一个号签,连续抽取n次 (5)得到一个容量为n的样本 步骤:编号→制签→搅匀→抽签→定样.
例1 某班有50名学生,要从中随机地抽出6人参加一项活动, 请用抽签法进行抽选,并写出过程.
简记为:编号;分段;在第一段确定起始号;加间隔获取样本。
例1 某中学有高一学生322名,为了了解学生的身体状况,要 抽取一个容量为40的样本,用系统抽样法如何抽样?
第一步,随机剔除2名学生,把余下的320名学生编号为1,2 ,3,…320. 第二步,把总体分成40个部分,每个部分有8个个体.
例1 某中学有高一学生322名,为了了解学生的身体状况,要 抽取一个容量为40的样本,用系统抽样法如何抽样?
系统抽样的特点:
(1) 总体容量较大 (2) 属于不放回抽样 (3) 每个个体被抽到的可能性相同(公平性)
系统抽样的步骤
(1)对总体的N个个体进行编号; (2)确定分段间隔k,对编号进行分段,当N/n是整数时, 取k=N/n;当N/n不是整数时,从总体中随机剔除一些个体, 使剩下的总体中个体的个数N′能被n整除,并将剩下的总体重 新编号、分段; (3)在第一段中用简单随机抽样确定起始的个体编号l; (4)将编号为l+k, l+2k, …, l+(n-1)k的个体抽出。
2020年高中数学必修三第二章《统计》2.3.1变量之间的相关关系-2.3.2两个变量的线性相关
2020年高中数学必修三第二章《统计》2.3.1变量之间的相关关系2.3.2两个变量的线性相关学习目标 1.了解变量间的相关关系,会画散点图;2.根据散点图,能判断两个变量是否具有相关关系;3.了解线性回归思想,会求回归直线的方程.知识点一变量间的相关关系思考1粮食产量与施肥量间的相关关系是正相关还是负相关?答案在施肥不过量的情况下,施肥越多,粮食产量越高,所以是正相关.思考2怎样判断一组数据是否具有线性相关关系?答案画出散点图,若点大致分布在一条直线附近,就说明这两个变量具有线性相关关系,否则不具有线性相关关系.梳理1.相关关系的定义变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,那么这两个变量之间的关系叫做相关关系,两个变量之间的关系分为函数关系和相关关系.2.散点图将样本中n个数据点(x i,y i)(i=1,2,…,n)描在平面直角坐标系中得到的图形叫做散点图.3.正相关与负相关(1)正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.(2)负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.知识点二两个变量的线性相关思考任何一组数据都可以由最小二乘法得出线性回归方程吗?答案用最小二乘法求线性回归方程的前提是先判断所给数据是否具有线性相关关系(可利用散点图来判断),否则求出的线性回归方程是无意义的.梳理 回归直线的方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)线性回归方程:回归直线对应的方程叫做回归直线的方程,简称回归方程. (3)最小二乘法:求线性回归方程y ^=b ^x +a ^时,使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.⎩⎪⎨⎪⎧b ^=∑i =1n(x i-x )(y i-y )∑i =1n(x i-x )2=∑i =1nx i y i-n x y ∑i =1nx 2i-n x 2,a ^=y -b ^x ,其中,b ^是线性回归方程的斜率,a ^是线性回归方程在y 轴上的截距.类型一 相关关系的判断与应用 命题角度1 判断两个变量的相关性例1 为了研究质量对弹簧长度的影响,对6根相同的弹簧进行测量,所得数据如下:判断它们是否有相关关系,若有,判断是正相关还是负相关. 解 散点图如图:由散点图可以看出两个变量对应的点大致分布在一条直线附近,因此可以得出结论:质量与弹簧长度这两个变量具有相关关系,且它们是正相关关系.反思与感悟在研究两个变量之间是否存在某种关系时,必须从散点图入手,对于散点图,可以作出如下判断:(1)如果所有的样本点都落在某一函数曲线上,那么就用该函数来描述变量之间的关系,即变量之间具有函数关系;(2)如果所有的样本点都落在某一直线附近,那么变量之间就有线性相关关系;(3)如果散点图中的点的分布几乎没有什么规律,那么这两个变量之间不具有相关关系,即两个变量之间是相互独立的.跟踪训练1下表是某地的年降雨量与年平均气温的统计表,判断两者是否具有相关关系,求线性回归方程有意义吗?解以x轴为年平均气温,y轴为年降雨量,可得相应的散点图如图.因为图中各点并不在一条直线的附近,所以两者不具有线性相关关系,没必要用回归直线进行拟合,即使用公式法求出线性回归方程也是没有意义的.命题角度2函数关系与相关关系的区别与联系例2下列关系中,是相关关系的是________.①正方形的边长与面积之间的关系;②农作物的产量与施肥量之间的关系;③人的身高与年龄之间的关系;④降雪量与交通事故的发生率之间的关系.答案②④解析①中,正方形的边长与面积之间的关系是函数关系;②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;③中,人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人达到一定年龄后,身高就不发生明显变化了,所以它们不具有相关关系;④中,降雪量与交通事故的发生率之间具有相关关系. 反思与感悟 相关关系与函数关系的区别与联系如表所示:跟踪训练2 下列图形中两个变量具有相关关系的是( )答案 C解析A 是一种函数关系;B 也是一种函数关系;C 中从散点图中可看出所有点看上去都在某条直线附近波动,具有相关关系,而且是一种线性相关;D 中所有的点在散点图中没有显示任何关系,因此变量间是不相关的. 类型二 回归直线的求解与应用例3 一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器运转速度的变化而变化,下表为抽样试验的结果:(1)画出散点图;(2)如果y 对x 有线性相关关系,请画出一条直线近似地表示这种线性关系;(3)在实际生产中,若它们的近似方程为y =5170x -67,允许每小时生产的产品中有缺点的零件最多为10件,那么机器的运转速度应控制在什么范围内? 解 (1)散点图如图所示:(2)近似直线如图所示:(3)由y ≤10得5170x -67≤10,解得x ≤14.9,所以机器的运转速度应控制在14转/秒内.引申探究1.本例(3)中近似方程不变,若每增加一个单位的转速,生产有缺点的零件数近似增加多少? 解 因为y =5170x -67,所以当x 增加一个单位时,y 大约增加5170.2.本例(3)中近似方程不变,每小时生产有缺点的零件件数是7,估计机器的转速. 解 因为y =5170x -67,所以当y =7时,7=5170x -67,解得x ≈11.反思与感悟 求线性回归方程的一般步骤(1)收集样本数据,设为(x i ,y i )(i =1,2,…,n )(数据一般由题目给出). (2)作出散点图,确定x ,y 具有线性相关关系. (3)把数据制成表格x i ,y i ,x 2i ,x i y i . (4)计算x ,y,∑i =1nx 2i ,∑i =1nx i y i .(5)代入公式计算b ^,a ^,公式为⎩⎪⎨⎪⎧b ^=∑i =1nx i y i-n x y ∑i =1nx 2i-n x2,a ^=y -b ^x .(6)写出线性回归方程y ^=b ^x +a ^.跟踪训练3 (1)变量y 与x 满足线性回归方程y ^=b ^x +a ^,现在将y 的单位由厘米变为米,x的单位由毫米变为米,则在新的线性回归方程y ^=b ^*x +a ^*中,b ^*是b ^的____________倍.(2)为了均衡教育资源,加大对偏远地区的教育投入,调查了某地区若干户家庭的年收入x (单位:万元)和年教育支出y (单位:万元),调查显示年收入x 与年教育支出y 具有相关关系,并由调查数据得到y 对x 的线性回归方程为y ^=0.15x +0.2.由线性回归方程可知,家庭年收入每增加1万元,年教育支出平均增加________万元. 答案 (1)10 (2)0.15解析 (1)由回归系数公式知,当y 的值变为原来的10-2倍,x 的值变为原来的10-3倍时,b^*的值应为原来的10倍.(2)回归直线的斜率为0.15,所以家庭年收入每增加1万元,年教育支出平均增加0.15万元.1.设有一个线性回归方程为y ^=2-1.5x ,则变量x 增加1个单位时,y 平均( ) A .增加1.5个单位 B .增加2个单位 C .减少1.5个单位 D .减少2个单位答案 C2.由三点(3,10),(7,20),(11,24)确定的线性回归方程为( ) A.y ^=1.75x -5.75 B.y ^=1.75x +5.75 C.y ^=-1.75x +5.75 D.y ^=-1.75x -5.75答案 B解析 设线性回归方程为y ^=b ^x +a ^, 则b ^=x 1y 1+x 2y 2+x 3y 3-3x y x 21+x 22+x 23-3x2=3×10+7×20+11×24-3×7×189+49+121-3×49=1.75,a ^=y -b ^x =18-1.75×7=5.75. 故y ^=1.75x +5.75,故选B.3.某地区近10年居民的年收入x 与年支出y 之间的关系大致符合y ^=0.8x +0.1(单位:亿元),预计今年该地区居民收入为15亿元,则今年支出估计是________亿元. 答案 12.1解析 将x =15代入y ^=0.8x +0.1,得y ^=12.1.4.某市居民2012~2016年家庭年平均收入x (单位:万元)与年平均支出y (单位:万元)的统计资料如表所示:根据统计资料,居民家庭年平均收入的中位数是__________万元,家庭年平均收入与年平均支出有________线性相关关系. 答案 13 正解析 考查中位数的定义,奇数个时按大小顺序排列后中间一个是中位数,而偶数个时需取中间两数的平均数.由统计资料可以看出,当年平均收入增多时,年平均支出也增多,因此两者之间具有正线性相关关系.5.某5名学生的总成绩和数学成绩(单位:分)如表所示:(1)画出散点图;(2)求y 对x 的线性回归方程(结果保留到小数点后3位数字); (3)如果一个学生的总成绩为450分,试预测这个学生的数学成绩. 解 (1)散点图如图所示:(2)由题中数据计算可得x =391.6,y =67.8,∑i =15x 2i =770 654,∑i =15x i y i =133 548.代入公式得b ^=133 548-5×391.6×67.8770 654-5×391.62≈0.204,a ^=67.8-0.204×391.6≈-12.086,所以y 对x 的线性回归方程为y ^=-12.086+0.204x .(3)由(2)得当总成绩为450分时,y ^=-12.086+0.204×450≈80,即这个学生的数学成绩大约为80分.1.判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图.根据散点图,可以很容易看出两个变量是否具有相关关系,是不是线性相关,是正相关还是负相关. 2.求线性回归方程时应注意的问题(1)知道x 与y 成线性相关关系,无需进行相关性检验,否则应首先进行相关性检验,如果两个变量之间本身不具有相关关系,或者说,它们之间的相关关系不显著,即使求出线性回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的. (2)用公式计算a ^、b ^的值时,要先计算b ^,然后才能算出a ^.3.利用回归方程,我们可以进行估计和预测.若回归方程为y ^=b ^x +a ^,则x =x 0处的估计值为y ^0=b ^x 0+a ^.40分钟课时作业一、选择题1.某商品销售量y (件)与销售价格x (元/件)负相关,则其线性回归方程可能是( ) A.y ^=-10x +200 B.y ^=10x +200 C.y ^=-10x -200 D.y ^=10x -200答案 A解析 x 的系数为负数,表示负相关,排除B 、D ,由实际意义可知x >0,y >0,C 中,散点图在第四象限无意义,故选A.2.根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )A .逐年比较,2008年减少二氧化硫排放量的效果最显著B .2007年我国治理二氧化硫排放显现成效C .2006年以来我国二氧化硫年排放量呈减少趋势D .2006年以来我国二氧化硫年排放量与年份正相关 答案 D解析 由柱形图可知:A 、B 、C 均正确,2006年以来我国二氧化硫年排放量在逐渐减少,所以排放量与年份负相关,所以D 不正确.3.对变量x ,y 有观测数据(x i ,y i )(i =1,2,3,…,10),得散点图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,3,…,10),得散点图2,由这两个散点图可以判断( )A .y 与x 正相关,v 与u 正相关B .y 与x 正相关,v 与u 负相关C .y 与x 负相关,v 与u 正相关D .y 与x 负相关,v 与u 负相关 答案 C解析 根据散点图直接进行判断.4.已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( ) A.y ^=0.4x +2.3 B.y ^=2x -2.4 C.y ^=-2x +9.5 D.y ^=-0.3x +4.4答案 A解析 由变量x 与y 正相关知C 、D 均错,又回归直线经过样本点的中心(3,3.5),代入验证得A 正确,B 错误.故选A. 5.已知x 与y 之间的一组数据:若y 与x 线性相关,则y 与x 的回归直线y ^=b ^x +a ^必过( ) A .点(2,2) B .点(1.5,0) C .点(1,2) D .点(1.5,4)答案 D 解析 ∵x =0+1+2+34=1.5,y =1+3+5+74=4, ∴回归直线必过点(1.5,4).故选D. 6.已知x ,y 的取值如表所示:如果y 与x 线性相关,且线性回归方程为y ^=b ^x +132,则b ^等于( )A .-12B.12 C .-110D.110答案 A 解析 ∵x =2+3+43=3,y =6+4+53=5, ∴回归直线过点(3,5),∴5=3b ^+132,∴b ^=-12,故选A.二、填空题7.为了研究某种细菌在特定环境下随时间变化的繁殖规律,得到了下表中的数据,计算得回归方程为y ^=0.85x -0.25.由以上信息,可得表中c 的值为________.答案 6解析 x =3+4+5+6+75=5,y =2.5+3+4+4.5+c 5=14+c 5,代入回归方程中得14+c5=0.85×5-0.25,解得c =6.8.如图所示的五组数据(x ,y )中,去掉________后,剩下的四组数据相关性增强.答案 (4,10)解析 去掉点(4,10)后,其余四点大致在一条直线附近,相关性增强. 9.在一次试验中测得(x ,y )的四组数据如下:根据上表可得线性回归方程y ^=-5x +a ^,据此模型预报当x =20时,y 的值为________. 答案 26.5解析 x =16+17+18+194=17.5,y =50+34+41+314=39,∴回归直线过点(17.5,39), ∴39=-5×17.5+a ^, ∴a ^=126.5,∴当x =20时,y =-5×20+126.5=26.5.10.某工厂对某产品的产量与成本的资料分析后有如下数据:由表中数据得到的线性回归方程y ^=b ^x +a ^中b ^=1.1,预测当产量为9千件时,成本约为________万元. 答案 14.5解析 由表中数据得x =4,y =9,代入线性回归方程得a ^=4.6,∴当x =9时,y ^=1.1×9+4.6=14.5. 三、解答题11.某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)利用所给数据求两变量之间的回归方程y ^=b ^x +a ^;(2)利用(1)中所求出的回归方程预测该地第6年的粮食需求量. 解 (1)由所给数据得 x =3,y =5.8,b ^=∑i =15(x i -x )(y i -y )∑i =15(x i -x )2=1.1,a ^=y -b ^x =2.5, ∴y ^=1.1x +2.5.故所求的回归方程为y ^=1.1x +2.5. (2)第6年的粮食需求量约为 y ^=1.1×6+2.5=9.1(万吨).12.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i =184,∑i =110x 2i =720.(1)求月储蓄y (千元)关于月收入x (千元)的线性回归方程; (2)若该居民区某家庭的月收入为7千元,预测该家庭的月储蓄. 解 (1)由题意知n =10,x =1n ∑i =110x i =110×80=8,y =1n ∑i =110y i =110×20=2,又∑i =110x 2i -n x 2=720-10×82=80, ∑i =110x i y i -n x y =184-10×8×2=24,由此得b ^=2480=0.3,a ^=y -b ^x =2-0.3×8=-0.4, 故所求线性回归方程为y ^=0.3x -0.4.(2)将x =7代入线性回归方程,可以得到该家庭的月储蓄约为y ^=0.3×7-0.4=1.7(千元). 13.为了分析某高三学生的学习状态,对其下一阶段的学习提供指导性建议,现对他前7次考试的数学成绩x 、物理成绩y 进行分析.下面是该生7次考试的成绩(单位:分).(1)他的数学成绩与物理成绩哪个更稳定?并说明理由;(2)已知该学生的物理成绩y 与数学成绩x 是线性相关的,若该生的物理成绩达到115分,请你估计他的数学成绩大约是多少分,并请你根据物理成绩与数学成绩的相关性,给出该生在学习数学、物理上的合理建议.解 (1)x =100+-12-17+17-8+8+127=100,y =100+-6-9+8-4+4+1+67=100,s 2数学=142,s 2物理=2507,因为s 2数学>s 2物理, 所以他的物理成绩更稳定.(2)由于x 与y 之间具有线性相关关系,经计算得b ^=0.5,a ^=100-0.5×100=50. 所以线性回归方程为y ^=0.5x +50. 当y =115时,x =130. 估计他的数学成绩是130分.建议:进一步加强对数学的学习,提高数学成绩的稳定性,将有助于物理成绩的进一步提高.。
高中数学课件归纳必修3第二章统计2.2.2-1众数、中位数、平均数(1)
解:在17个数据中,1.75出现了4次,出现的 次数最多,即这组数据的众数是1.75.
上面表里的17个数据可看成是按从小到大 的顺序排列的,其中第9个数据1.70是最中间的 一个数据,即这组数据的中位数是1.70;
这组数据的平均数是
答:17名运动员成绩的众数、中位数、平均数 依次是1.75(米)、1.70(米)、1.69(米).
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5
月平均用水量(t)
2、在样本中,有50%的个体小于或等于 中位数,也有50%的个体大于或等于中位 数,因此,在频率分布直方图中,中位数 左边和右边的直方图的面积应该相等,由 此可以估计中位数的值。下图中虚线代表 居民月均用水量的中位数的估计值,此数 据值为2.03t.
二 、 众数、中位数、平均数 与频率分布直方图的关系
1、众数在样本数据的频率分布直方图 中,就是最高矩形的中点的横坐标。
例如,在上一节调查的100位居民的月 均用水量的问题中,从这些样本数据的频 率分布直方图可以看出,月均用水量的众 数是2.25t.如图所示:
频率 组距
0.5 0.4 0.3 0.2 0.1
平均数: 一组数据的算术平均数,即
xx=
1 n (x1 x 2
xn )
练习: 在一次中学生田径运动会上,
参加男子跳高的17名运动员的成绩如下 表所示:
成绩(单 位: 米)
人数
1.50 1.60 1.65
2
3
2
1.70 3
1.75 4
1.80 1
1.85 1
1.90 1
分别求这些运动员成绩的众数,中位数与 平均数
3、由于平均数与每一个样本的 数据有关,所以任何一个样本数据的 改变都会引起平均数的改变,这是众 数、中位数都不具有的性质。也正因 如此 ,与众数、中位数比较起来,平
(必考题)高中数学必修三第一章《统计》测试(包含答案解析)(1)
一、选择题1.工人月工资y (元)与劳动生产率x (千元)变化的回归直线方程为=50+80x ,下列判断不正确的是( )A .劳动生产率为1000元时,工资约为130元B .工人月工资与劳动者生产率具有正相关关系C .劳动生产率提高1000元时,则工资约提高130元D .当月工资为210元时,劳动生产率约为2000元2.2020年2月,受新冠肺炎的影响,医卫市场上出现了“一罩难求”的现象.在政府部门的牵头下,部分工厂转业生产口罩,下表为某小型工厂2-5月份生产的口罩数(单位:万) 月份x 2 3 4 5 口罩数y4.5432.5口罩数y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是0.7y x a =-+,则a 的值为( ) A .6.1B .5.8C .5.95D .6.753.下表是某两个相关变量x ,y 的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程ˆ0.70.35yx =+,那么表中t 的值为( ) x 3 4 5 6 y2.5t44.5A .3B .3.15C .3.5D .4.54.已知一组数据的茎叶图如图所示,则该组数据的平均数为( )A .85B .84C .83D .815. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日6.网上大型汽车销售某品牌A 型汽车,在2017年“双十一”期间,进行了降价促销,该型汽车的价格与月销量之间有如下关系 价格(万元) 25 23.5 22 20.5 销售量(辆)30333639已知A 型汽车的购买量y 与价格x 符合如下线性回归方程:8ˆ0ˆybx =+,若A 型汽车价格降到19万元,预测月销量大约是( ) A .39 B .42C .45D .507.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A .91.5和91.5B .91.5和92C .91和91.5D .92和928.为了了解某社区居民是否准备收看电视台直播的“龙舟大赛”,某记者分别从社区60~70岁,40~50岁,20~30岁的三个年龄段中的128,192,x 人中,采用分层抽样的方法共抽出了30人进行调查,若60~70岁这个年龄段中抽查了8人,那么x 为( ) A .64 B .96C .144D .1609.若某中学高二年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数是( )A .90.5B .91.5C .90D .9110.预测人口的变化趋势有多种方法,“直接推算法”使用的公式是()0 1nn P P k =+(1k >-),n P 为预测人口数,0P 为初期人口数,k 为预测期内年增长率,n 为预测期间隔年数.如果在某一时期有10k -<<,那么在这期间人口数 A .呈下降趋势B .呈上升趋势C .摆动变化D .不变11.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位D .y 平均减少2个单位12.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经统计,得到一个卖出的热饮杯数与当天气温的对比表: 温度℃ -5 0 4 7 12 15 19 23 27 31 36 热饮杯数15615013212813011610489937654根据上表数据确定的线性回归方程应该是( )A .ˆ 2.352147.767yx =-+ B .ˆ 2.352127.765yx =-+ C .ˆ 2.35275.501yx =+D .ˆ 2.35263.674yx =+ 二、填空题13.已知某产品连续4个月的广告费i x (千元)与销售额i y (万元)(1,2,3,4i =)满足4115ii x==∑,4112i i y ==∑,若广告费用x 和销售额y 之间具有线性相关关系,且回归直线方程为^y bx a =+,0.6b =,那么广告费用为5千元时,可预测的销售额为___万元. 14.某校为了解1000名高一新生的身体生长状况,用系统抽样法(按等距的规则)抽取40名同学进行检查,将学生从1~1000进行编号,现已知第18组抽取的号码为443,则第一组用简单随机抽样抽取的号码为_________15.某次测试共有100名考生参加,测试成绩的频率分布直方图如下图所示,则成绩在80分以上的人数为__________.16.已知一组数据为2,3,4,5,6,则这组数据的方差为______.17.已知一组数据:5.7,5.8,6.1,6.4,6.5,则该数据的方差是__________. 18.变量X 与Y 相对应的5组数据和变量U 与V 相对应的5组数据统计如表:X 1011.3 11.8 12.5 13 U 10 11.3 11.8 12.5 13 Y12345V54321用b 1表示变量Y 与X 之间的回归系数,b 2表示变量V 与U 之间的回归系数,则b 1与b 2的大小关系是___.19.某中学调查了400名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[]17.5,30,样本数据分组为[)17.5,20,[)20,22.5,[)22.5,25,[)25,27.5,[]27.5,30.根据直方图,这400名学生中每周的自习时间不少于22.5小时的人数是__________人.20.某校高一年级10个班级参加国庆歌咏比赛的得分(单位:分)如茎叶图所示,若这10个班级的得分的平均数是90,则19a b+的最小值为__________.三、解答题21.某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表: 年份 2007 2008 2009 2010 2011 2012 2013 年份代号x 1 2 3 4 5 6 7 人均纯收入y2.93.33.64.44.85.25.9x (2)预测该地区2015年农村居民家庭人均纯收入. 附:77211134.4,140i ii i i x yx ====∑∑.回归直线的斜率和截距的最小二乘法估计公式分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-22.随着人民生活水平的日益提高,某小区拥有私家车的数量与日俱增,物业公司统计了近六年小区私家车的数量,数据如下: 年份 2014 2015 20162017 2018 2019 编号x 1 2 3 4 5 6 数量y (辆)4196116190218275(1)若该小区私家车的数量y 与年份编号x 的关系可用线性回归模型来拟合,请求出y 关于x 的线性回归方程,并用相关指数2R 分析其拟合效果(2R 精确到0.01);(2)由于该小区没有配套停车位,车辆无序停放易造成交通拥堵,因此物业公司预在小区内划定一定数量的停车位,若要求在2022年小区停车位数量仍可满足需要,则至少需要规划多少个停车位. 参考数据:61936ii y==∑,614081i i i x y ==∑,62191ii x ==∑,()62137586i i y y=-=∑.附:回归方程中斜率和截距的最小二乘估计公式分别为:1221ni ii nii x y nx yb xnx==-⋅=-∑∑,a y bx =-,相关指数()()221211ni ii n ii y y R yy==-=--∑∑,残差e y y =-.23.2018年,依托用户碎片化时间的娱乐需求、分享需求以及视频态的信息负载力,短视频快速崛起;与此同时,移动阅读方兴未艾,从侧面反应了人们对精神富足的一种追求,在习惯了大众娱乐所带来的短暂愉悦后,部分用户依旧对有着传统文学底蕴的严肃阅读青睐有加.某读书APP 抽样调查了非一线城市M 和一线城市N 各100名用户的日使用时长(单位:分钟),绘制成频率分布直方图如下,其中日使用时长不低于60分钟的用户记为“活跃用户”.(1)请填写以下22⨯列联表,并判断是否有99.5%的把握认为用户活跃与否与所在城市有关?活跃用户 不活跃用户 合计城市M 城市N 合计(2)以频率估计概率,从城市M 中任选2名用户,从城市N 中任选1名用户,设这3名用户中活跃用户的人数为ξ,求ξ的分布列和数学期望.(3)该读书APP 还统计了2018年4个季度的用户使用时长y (单位:百万小时),发现y 与季度(x )线性相关,得到回归直线为ˆ4ˆyx a =+,已知这4个季度的用户平均使用时长为12.3百万小时,试以此回归方程估计2019年第一季度(5x =)该读书APP 用户使用时长约为多少百万小时. 附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.()20P K k ≥ 0.025 0.010 0.005 0.001 0k5.0246.6357.87910.82824.学生甲在一次试验中用显微镜观察某种环境下细菌的个数,发现时间x (分钟)时刻的细菌个数为y 个,统计结果如下:x 1 2 3 4 5 y23445(Ⅰ)在给出的坐标系中画出x ,y 的散点图,说明细菌个数和时间是正相关还是负相关.(Ⅱ)根据表格中的5组数据,求y 关于x 的回归直线方程ˆˆˆybx a =+,并根据回归直线方程估计从实验开始,什么时刻细菌个数为12.参考公式:(1221ˆˆˆ,ni ii ni i x y nx yx n axby bx ====---∑∑) 25.某学校高一100名学生参加数学竞赛,成绩均在40分到100分之间.学生成绩的频率分布直方图如图:(1)估计这100名学生分数的中位数与平均数;(精确到0.1)(2)某老师抽取了10名学生的分数:12310,,,...,x x x x ,已知这10个分数的平均数90x =,标准差6s =,若剔除其中的100和80两个分数,求剩余8个分数的平均数与标准差.(参考公式:s =(3)该学校有3座构造相同教学楼,各教学楼高均为20米,东西长均为60米,南北宽均为20米.其中1号教学楼在2号教学楼的正南且楼距为40米,3号教学楼在2号教学楼的正东且楼距为72米.现有3种型号的考试屏蔽仪,它们的信号覆盖半径依次为35,55,105米,每个售价相应依次为1500,2000,4000元.若屏蔽仪可在地下及地上任意位置安装且每个安装费用均为100元,求让各教学楼均被屏蔽仪信号完全覆盖的最小花费.(参考数据:22221044100,19236864,11012100===)26.某校的一个社会实践调查小组,在对该校学生的良好“用眼习惯”的调查中,随机发放了120分问卷.对收回的100份有效问卷进行统计,得到如22⨯下列联表:(1)现按女生是否能做到科学用眼进行分层,从45份女生问卷中抽取了6份问卷,从这6份问卷中再随机抽取3份,并记其中能做到科学用眼的问卷的份数X ,试求随机变量X 的分布列和数学期望;(2)若在犯错误的概率不超过P 的前提下认为良好“用眼习惯”与性别有关,那么根据临界值表,最精确的P 的值应为多少?请说明理由.附:独立性检验统计量22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b cd =+++.独立性检验临界值表:【参考答案】***试卷处理标记,请不要删除一、选择题 1.C【解析】试题分析:根据线性回归方程=50+80x 的意义,对选项中的命题进行分析、判断即可. 解:根据线性回归方程为=50+80x ,得;劳动生产率为1000元时,工资约为50+80×1=130元,A 正确; ∵=80>0,∴工人月工资与劳动者生产率具有正相关关系,B 正确;劳动生产率提高1000元时,工资约提高=80元,C 错误;当月工资为210元时,210=50+80x ,解得x=2, 此时劳动生产率约为2000元,D 正确. 故选C .考点:线性回归方程.2.C解析:C 【分析】求得 3.5x y ==,得到样本中心点(3.5,3.5),再把样本中心点代入回归直线方程得解. 【详解】由表可得 3.5x y ==,带入线性回归方程中有 3.50.7 3.5 5.95=+⨯=a , 故选:C . 【点睛】本题考查利用线性相关关系求回归直线方程,属于基础题.3.A解析:A 【分析】计算得到 4.5x =,114t y +=,代入回归方程计算得到答案. 【详解】3456 4.54x +++==, 2.54 4.51144t t y ++++==,中心点(),x y 过ˆ0.70.35yx =+, 即114.50.70.354t +=⨯+,解得3t =. 故选:A . 【点睛】本题考查了回归方程的相关问题,意在考查学生的计算能力.4.A解析:A 【解析】利用茎叶图、平均数的性质直接求解. 【详解】由一组数据的茎叶图得: 该组数据的平均数为:1(7581858995)855++++=. 故选:A . 【点睛】本题考查平均数的求法,考查茎叶图、平均数的性质等基础知识,考查运算求解能力,是基础题.5.C解析:C 【分析】认真观察题中所给的折线图,对照选项逐一分析,求得结果. 【详解】这10天中第一天,第三天和第四天共3天空气质量为一级,所以A 正确; 从图可知从6日到9日 2.5PM 日均值逐渐降低,所以B 正确; 从图可知,这10天中 2.5PM 日均值最高的是12月6日,所以D 正确; 由图可知,这10天中 2.5PM 日均值的中位数是4145432+=,所以C 不正确; 故选C. 【点睛】该题考查的是有关利用题中所给的折线图,描述对应变量所满足的特征,在解题的过程中,需要逐一对选项进行分析,正确理解题意是解题的关键.6.B解析:B 【解析】分析:先求均值,确定ˆb,再求自变量为19对应函数值得结果. 详解:因为2523.52220.5330333639122,344442x y ++++++====,所以1348022,3224ˆb-==- 所以19(2)8042y =⨯-+=选B.点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .7.A解析:A 【解析】8个班参加合唱比赛的得分从小到大排列分别是87,89,90,91,92,93,94,96,中位数是91,92,的平均数91.5,平均数是87+89+90+91+92+93+94+968=91.58.D解析:D 【解析】 【分析】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816,因为共抽出30人,所以总人数为3016=480⨯人,即可求出20~30岁年龄段的人数. 【详解】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816, 因为共抽出30人,所以总人数为3016=480⨯人,所以,20~30岁龄段的人有480128192160--=,故选D. 【点睛】本题主要考查了分层抽样,抽样,样本容量,属于中档题9.A解析:A 【分析】共有8个数据,中位数就是由小到大中间两数的平均数,求解即可. 【详解】根据茎叶图,由小到大排列这8个数为84,85,89,90,91,92,93,95, 所以中位数为90+91=90.52,故选A. 【点睛】本题主要考查了中位数,茎叶图,属于中档题.10.A解析:A 【分析】可以通过n P 与0P 之间的大小关系进行判断. 【详解】当10k -<<时,()011011nk k <+<<+<,,所以()001nn P P k P =+<,呈下降趋势. 【点睛】判断变化率可以通过比较初始值与变化之后的数值之间的大小来判断.11.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位, 即减少1.5个单位,故选C. 【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目.12.A解析:A 【解析】分析:先观察表中数据的规律,确定回归系数b 的符号,再计算x 和y ,代入选项确定正确答案.详解:由表中数据规律发现:热饮杯数y 随当天气温x 升高而减少,则0b <,排除C 、D. 计算1169=(504712151923273136)1111x -++++++++++= 11228=(15615013212813011610489937654)111.641111y ++++++++++=≈ 将x 代入选项A ,得1692.352147.767111.6311ˆy=-⨯+= 将x 代入选项B ,得1692.352127.76591.6311ˆy=-⨯+= 所以选项A 正确. 故选A.点睛:本题考查线性回归方程的求法与应用,一次项系数b 符号的判断和回归直线过样本中心点(,)x y 是解题关键.二、填空题13.75【解析】【分析】计算然后将代入回归直线得从而得回归方程然后令x=5解得y 即为所求【详解】∵∴∵∴∴样本中心点为(3)又回归直线过(3)即3=06×+解得=所以回归直线方程为y =06x+令x =5时解析:75 【解析】 【分析】计算x ,y ,然后将x ,y 代入回归直线得a ,从而得回归方程,然后令x =5解得y 即为所求. 【详解】 ∵4115i i x ==∑,∴154x =, ∵4112i i y ==∑,∴1234y ==, ∴样本中心点为(154,3), 又回归直线0.6ˆyx a =+过(154,3),即3=0.6×154+a ,解得a =34, 所以回归直线方程为y =0.6x +34, 令x =5时,y =0.6×5+34=3.75万元 故答案为:3.75. 【点睛】本题考查线性回归方程的应用,以及利用线性回归方程进行预测,要注意回归直线必过样本中心点.14.18【解析】【分析】由题意知抽样方法为系统抽样因此若第一组抽取号码为x 则第18组抽取的号码为即可解得【详解】因为抽样方法为系统抽样因此若第一组抽取号码为x 则第18组抽取的号码为解得【点睛】本题主要考解析:18 【解析】 【分析】由题意知,抽样方法为系统抽样,因此,若第一组抽取号码为x ,则第18组抽取的号码为1725443x +⨯=,即可解得. 【详解】因为抽样方法为系统抽样,因此,若第一组抽取号码为x ,则第18组抽取的号码为1725443x +⨯=,解得18x =. 【点睛】本题主要考查了系统抽样,属于中档题.15.25【解析】分析:先求成绩在80分以上的概率再根据频数等于总数与对应概率乘积求结果详解:因为成绩在80分以下的概率为所以成绩在80分以上的概率为因此成绩在80分以上的人数为点睛:频率分布直方图中小长解析:25 【解析】分析:先求成绩在80分以上的概率,再根据频数等于总数与对应概率乘积求结果.详解:因为成绩在80分以下的概率为(0.0050.03+0.0410=0.75+⨯),所以成绩在80分以上的概率为10.750.25-=,因此成绩在80分以上的人数为0.25100=25.⨯点睛:频率分布直方图中小长方形面积等于对应区间的概率,所有小长方形面积之和为1; 频率分布直方图中组中值与对应区间概率乘积的和为平均数; 频率分布直方图中小长方形面积之比等于对应概率之比,也等于对应频数之比.16.2【解析】分析:根据方差的计算公式先算出数据的平均数然后代入公式计算即可得到结果详解:平均数为:即答案为2点睛:本题考查了方差的计算解题的关键是方差的计算公式的识记它反映了一组数据的波动大小方差越大解析:2 【解析】分析:根据方差的计算公式,先算出数据的平均数,然后代入公式计算即可得到结果. 详解:平均数为:2345645+++++=,()22222211[2434445464]4114255s =⨯-+-+-+-+-=⨯+++=()()()()().即答案为2.点睛:本题考查了方差的计算,解题的关键是方差的计算公式的识记.它反映了一组数据的波动大小,方差越大,波动性越大,反之也成立.17.1【解析】分析:先利用平均数公式求出平均数再利用方差公式即可得结果详解:的平均数为的方差为故答案为点睛:本题考查主要考查平均数公式与方差公式属于基础题样本数据的算术平均数公式;样本方差公式标准差解析:1 【解析】分析:先利用平均数公式求出平均数,再利用方差公式即可得结果. 详解:5.7,5.8,6.1,6.4,6.5的平均数为5.7+5.8+6.1+6.4+6.56.15=,5.7,5.8,6.1,6.4,6.5∴的方差为()()()()()222225.76.1+5.8 6.1+6.1 6.1+6.4 6.1+6.5 6.10.15-----=,故答案为0.1.点睛:本题考查主要考查平均数公式与方差公式,属于基础题. 样本数据的算术平均数公式12n 1(x +x +...+x )x n =;样本方差公式2222121[()()...()]n s x x x x x x n =-+-++-,标准差s =18.【解析】分析:根据回归系数几何意义得详解:因为Y 与X 之间正增长所以因为V 与U 之间负增长所以因此点睛:函数关系是一种确定的关系相关关系是一种非确定的关系事实上函数关系是两个非随机变量的关系而相关关系是解析:12b b >. 【解析】分析:根据回归系数几何意义得120b b >> 详解:因为Y 与X 之间正增长,所以10b > 因为V 与U 之间负增长,所以20b < 因此120b b >>,点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .b 的正负,决定正相关与负相关.19.280【解析】由频率分布直方图得这名大学生中每周的自习时间不少于小时的频率为这名大学生中每周的自习时间不少于小时的人数为故答案为解析:280 【解析】由频率分布直方图得这400名大学生中每周的自习时间不少于22.5小时的频率为()0.16+0.080.04 2.50.7,+⨯=∴这400名大学生中每周的自习时间不少于22.5小时的人数为4000.7280⨯=,故答案为280.20.2【解析】由茎叶图及10个班级的得分的平均数是90可得∴当且仅当即时取等号故答案为2解析:2 【解析】由茎叶图及10个班级的得分的平均数是90可得8a b += ∴1911919191()()(19)(10)(1023)28888b a b a a b a b a b a b a b +=⨯++=+++=++≥+⨯=,当且仅当9b aa b=,即36b a ==时,取等号 故答案为2三、解答题21.(1)0.5 2.3y x =+;(2)6800元. 【分析】(1)根据表中数据计算出4x =, 4.3y =,再结合参考数据利用公式即可计算出,b a ,进而得出线性回归方程; (2)将9x =代入即可预测. 【详解】解:(1)由表可得:123456747++++++==x ,2.93.3 3.64.4 4.85.2 5.9 4.37y ++++++==,又77211134.4,140i ii i i x yx ====∑∑,71722217134.474 4.30.5140747i ii i i x y x yb x x==--⨯⨯∴===-⨯-∑∑ 4.30.54 2.3a y bx ∴=-=-⨯=y ∴关于x 的线性回归方程为0.5 2.3y x =+;(2)由(1)可得:0.5 2.3y x =+,∴当9x =时,0.59 2.3 6.8y =⨯+=,即该地区2015年农村居民家庭人均纯收入约为6800元. 【点睛】本题考查线性回归方程的求法,考查由线性回归方程进行预测,属于基础题. 22.(1)ˆ465yx =-;拟合效果较好;(2)至少需要规划409个停车位 【分析】(1)由已知数据求得ˆb与ˆa 的值,则线性回归方程可求,再求出残差平方和,代入相关指数公式求得2R ,根据与1的接近程度分析拟合效果;(2)在(1)中求得的线性回归方程中,取9x =求得y 值即可. 【详解】 解:(1)1(123456) 3.56x =+++++=,19361566y =⨯=.6162221640816 3.5156ˆ46916356i ii ii x yxy bxx ==--⨯⨯===-⨯-∑∑,ˆˆ15646 3.55ay bx =-=-⨯=-. y ∴关于x 的线性回归方程为ˆ465y x =-.1x =时,ˆ41y=,2x =时,ˆ87y =,3x =时,ˆ133y =, 4x =时,ˆ179y=,5x =时,ˆ225y =,6x =时,ˆ271y =. 621()556ii i yy =-=∑.6221621()556110.9737586()ii i ii yy R yy ==-=-=-≈-∑∑, 相关指数2R 近似为0.97,接近1,说明拟合效果较好; (2)在(1)中求得的线性回归方程中,取9x =, 可得ˆ4695409y=⨯-=. 故若要求在2022年小区停车位数量仍可满足需要,则至少需要规划409个停车位. 【点睛】本题考查线性回归方程与相关指数的求法,考查运算求解能力,属于中档题. 23.(1)见解析;(2)见解析;(3) 22.3百万小时 【分析】(1)根据频率分布直方图求数据填入对应表格,再根据卡方公式求2K ,最后对照数据作判断,(2)先确定随机变量取法,再判断从M 城市中任选的2名用户中活跃用户数服从二项分布,从N 城市中任选的1名用户中活跃用户数服从两点分布,进而求得对应概率,列表得分布列,最后根据数学期望公式得期望,(3)先求均值,解得ˆa,再估计5x =对应函数值. 【详解】(1)由已知可得以下22⨯列联表:计算()2220060208040200K 9.5247.8791001001406021⨯⨯-⨯==≈>⨯⨯⨯ , 所以有99.5%的把握认为用户是否活跃与所在城市有关. (2)由统计数据可知,城市M 中活跃用户占35,城市N 中活跃用户占45, 设从M 城市中任选的2名用户中活跃用户数为X ,则3~2,5X B ⎛⎫ ⎪⎝⎭设从N 城市中任选的1名用户中活跃用户数为Y ,则Y 服从两点分布,其中()415P Y ==. 故0,1,2,3ξ=,()()()20221400055125P P X P Y C ξ⎛⎫===⋅==⋅=⎪⎝⎭; ()()()()()2012224321*********555125P P X P Y P X P Y C C ξ⎛⎫===⋅=+=⋅==⋅+⋅⋅⋅=⎪⎝⎭;()()()()()2122223431572112055555125P P X P Y P X P Y C C ξ⎛⎫===⋅=+=⋅==⋅⋅+⋅⋅=⎪⎝⎭;()()()222343632155125P P X P Y C ξ⎛⎫===⋅==⋅= ⎪⎝⎭. 故所求ξ的分布列为()428573601232125125125125E ξ=⨯+⨯+⨯+⨯=. (3)由已知可得 2.5x =,又12.3y =,可得12.34ˆ2.5a=⨯+,所以ˆ 2.3a =,所以4 2.3ˆy x =+. 以5x =代入可得ˆ22.3y=(百万小时), 即2019年第一季度该读书APP 用户使用时长约为22.3百万小时. 【点睛】本题考查频率分布直方图、回归直线方程以及分布列和数学期望,考查基本分析求解能力,属中档题.24.(Ⅰ)图象见解析,正相关;(Ⅱ)ˆ0.7 1.5yx =+,当15x =时细菌个数为12个. 【分析】(Ⅰ)根据数据描点即得散点图,看图即判断结果; (Ⅱ)利用公式代入数据计算即可. 【详解】解:(Ⅰ)图形如下,观察图像可知细菌个数和时间是正相关.(Ⅱ)由数据计算得,()11234535x =⨯++++=,()123445 3.65y =⨯++++=,1122334445561ni ii x y==⨯+⨯+⨯+⨯+⨯=∑,22222211234555n i i x ==++++=∑122216153 3.67ˆ0.7555310ni ii ni i x y nx yxbx n ==-⨯⨯====-⨯--∑∑,ˆˆ 3.60.73 1.5a y bx =-=-⨯=, 所以ˆ0.7 1.5yx =+, 当0.7 1.512x +=时,解得15x =. 所以当15x =时细菌个数为12个. 【点睛】本题考查了散点图、线性回归方程及其应用,属于基础题.25.(1)中位数为71.4;平均数为71;(2)平均数为90;标准差为53)3700元.【分析】(1)利用频率分布直方图能求出中位数、平均分;(2)由题意,求出剩余8个分数的平均值,由10个分数的标准差,能求出剩余8个分数的标准差;(3)求出将3座教学楼完全包裹的球的最小直径、将一座教学楼完全包裹的球的最小直径和将1号教学楼与2号教学楼完全包裹的球的最小直径,由此能求出让各教学楼均被屏蔽仪信号完全覆盖的最小花费. 【详解】(1)因为0.050.150.250.450.5++=<0.050.150.250.350.80.5+++=> 所以中位数为x 满足7080x <<由80()0.350.10.10.510x -⨯++=,解得608071.47x =-≈ 设平均分为y ,则0.05450.15550.25650.35750.1850.19571y =⨯+⨯+⨯+⨯+⨯+⨯=(2)由题意,剩余8个分数的平均值为01010080908x x --==因为10个分数的标准差6s ==所以2222110...10(6)10(90)81360x x ++=⨯+⨯=所以剩余8个分数的标准差为0s ===(3)将3座教学楼完全包裹的球的最小直径为:210=<=因此若用一个覆盖半径为105米的屏蔽仪则总费用为4100元;70<= 因此若用3个覆盖半径为35米的屏蔽仪则总费用为4800元; 将1号教学楼与2号教学楼完全包裹的球的最小直径为:110=<=70>=因此若用1个覆盖半径为55米和1个覆盖半径为35米的屏蔽仪则总费用为3700元; 所以,让各教学楼均被屏蔽仪信号完全覆盖的最小花费为3700元. 【点睛】本题考查中位数、平均数、标准差、最小费用的求法,考查频率分布直方图的性质等基础知识,考查运算求解能力,是中档题.26.(1)分布列见解析,1;(2)0.10=P ,理由见解析. 【分析】(1)按照分层抽样计算“科学用眼”和“不科学用眼”的抽取人数,随机变量X 的取值可能为0,1,2,然后计算概率得出分布列及其数学期望; (2)按照公式计算2K 的值,然后由临界值表得出结果即可. 【详解】(1)“科学用眼”抽156245⨯=人,“不科学用眼”抽306445⨯=人,则随机变量X0=,1,2,∴343641(0)205====CP XC,122436123(1)205C CP XC====,21243641(2)205C CP XC====,分布列为:0120121555EX=⨯+⨯+⨯=;(2)22100(45153010)3.03075255545⨯-⨯=≈⨯⨯⨯K,由表可知2.706 3.030 3.840<<,∴0.10=P.【点睛】本题考查随机变量的分布列和数学期望,考查独立性检验,考查逻辑思维能力和计算能力,考查学生分析解决问题的能力,属于常考题.。
高中数学必修3统计知识点:系统抽样
高中数学必修3统计知识点:系统抽样
系统抽样
(1)系统抽样(等距抽样或机械抽样):
把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。
第一个样本采用简单随机抽样的办法抽取。
K(抽样距离)=N(总体规模)/n(样本规模)
前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。
可以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。
如果有明显差别,说明样本在总体中的分布承某种循环性规律,且这种循环和抽样距离重合。
(2)系统抽样,即等距抽样是实际中最为常用的抽样方法之一。
因为它对抽样框的要求较低,实施也比较简单。
更为重要的是,如果有某种与调查指标相关的辅助变量可供使用,总体单元按辅助变量的大小顺序排队的话,使用系统抽样可以大大提高估计精度。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高中数学必修3测试4《统计》
班别 学号 姓名 评分
9. ;10. ;11. ;
12. ;13. ;14. 一、选择题
1.学校礼堂有25排,每排有20个座位,一次心理讲座时礼堂中坐满了学生,会后留下了座位号是15的所有25名学生测试,这里运用的抽样方法是 ( ) A. 抽签法 B. 随机数表法 C. 系统抽样法 D. 分层抽样法
2.频率分布直方图中,小长方形的面积等于 ( ) A.相应各组的频数 B.相应各组的频率 C.组数 D.组距
3.从某批零件中抽取50个,然后再从50个中抽出40个进行合格检查,发现合格品有36个,则该批产品的合格率为 ( ) A.36﹪ B. 72﹪ C.90﹪ D.25﹪
4.我校高中生共有2700人,其中高一级900人,高二级1200人,高三级600人,现采取分层抽样法抽取容量为135的样本,则高一、高二、高三各级抽取的人数分别为 ( ) A.45,75,15 B. 45,45,45 C.30,90,15 D. 45,60,30
5.一个容量为60的样本数据,分组后组距与频数如下:[10,20),6个;)30,20[,9个;
)40,30[,12个;)50,40[,15个;)60,50[12个;)70,60[,6个;则样本在区间)
30,10[上的频率为 ( ) A. 05.0 B. 25.0 C. 5.0 D. 7.0
6.下图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,中间的数字表示得分的十位数,下列对乙运动员的判断错误的是 ( )
A .乙运动员的最低得分为0分
B .乙运动员得分的众数为31
C .乙运动员的场均得分高于甲运动员
D .乙运动员得分的中位数是28
7.若样本,,21x x …,n x 的平均数、方差分别为x 、2
s ,则样本531+x ,532+x ,…,53+n x 的平均数、方差分别为 ( ) A .x 、2
s B .53+x 、2
s C .53+x 、2
9s D .53+x 、2
)53(+s 8. 高二(1)班某次数学考试的平均分为70分,标准差为s ,后来发现成绩记录有误,某甲得80分却误记为60分,某乙得70分却误记为90分,更正后计算得标准差为1s ,则s 和
甲 乙 8 0
4 6 3 1 2
5 3
6 8 2 5 4 1
3 8 9 3 1 6 1 7
4 4
1s 之间的大小关系是 ( )
A.1s s > B.1s s < C.1s s = D.与人数有关,无法判断 二、填空题
9. 一组数据按从大到小排列为2,2,4,x ,6,10,已知这组数据的中位数为5,那么这组数据的平均数为 ;
10.在相同条件下对自行车运动员甲、乙两人进行了6次测试,测得他们的最大速度(单位:m/s)
则选 参加某项重大比赛更合适;
11.为了解某地初三年级男生的身高情况,从其中的一个学校选取容量为60的样本
(60名男表中a ,m 的值分别是 , ;
12. 17.为了科学地比较考试的成绩,有些选拔性考试常常将考试分数转化为标准分,转化关系式为:s
x
x Z -=
(其中x 是某位学生的考试的实际分数,x 是该次考试的平均分,s 是该次考试成绩的标准差,Z 称为这位学生的标准分)。
转化成标准分后可能出现小数或负数,因此又常常再将Z 分数作线性变换转化为其他分数,如某次学业选拔考试采用的是T 分数,线性变换公式是6040+=Z T 。
若这次考试的平均分是70分,标准差是25,某位考生的T 分数是84分,则该考生的实际分数是 分;
13.统计某校400名学生数学会考成绩,得到样本频率分布直方图(如图),规定不低于60。
14.下表是对某种产品进行表面腐蚀线试验时,得到的腐蚀深度y 与腐蚀时间t 之间对应的
分数
假设变量y与t存在线性相关关系,试求腐蚀深度y对时间t的回归直线方程;。