高考数学(理科)二轮配套课件:专题7(第3讲)统计与统计案例

合集下载

高三数学统计和统计案例PPT教学课件

高三数学统计和统计案例PPT教学课件

(4)中位数仅与数据的排列位置有关, 某些数据的变动对中位数没有影响. 中位数可能出现在所给数据中,也可能 不在所给数据中,当一组数据中的个别 数据变动较大时,可用中位数描述其集 中趋势.
2、关于统计的有关性质及规律 (1)若 x1, x2, , xn 的平均数为 x , 那么 mx1 a, mx2 a, , mxn a , 的平均数是 mx a.
《银鸥世界》
却抱住那球假装死了。土穴越掘越深,工作的甲 虫看不见了。即使有时它到地面上来看一看,球 旁睡着的甲虫一动不动,觉得很安心。但是主人 离开的时间久了,那贼就乘这个机会,很快的将 球推走,同小偷怕被人捉住一样快。假使主人追 上了它--这种偷盗行为被发现了--它就赶快变更 位置,看起来好像它是无辜的,因为球向斜坡滚 下去了,它仅是想止住它啊!于是两个“伙伴”又 将球搬回,好像什么事情都没有发生一样。
①求极差;②确定组距和组数; ③将数据分组;④列频率分布表; ⑤画频率分布直方图.
(2)连接频率分布直方图中各小长 方形上端的中点,就得到频率分布折 线图,随着频率的增加,作图时所分 的组数也在增加,相应的频率分布折 线图就会越来越接近于一条光滑曲线, 统计中称之为总体密度曲线.
4、回归分析
(1)回归直线方程 y a bx.
蜣螂(屎克螂 )-- 摘自《昆虫记》
但也有时候,贼竟会牺牲一些时间,利 用狡猾的手段来行骗。它假装帮助这个被驱者 搬动食物,经过生满百里香的沙地,经过有深 车轮印和险峻的地方,但实际上它用的力却很 少,它做的大多只是坐在球顶上观光,到了适 宜于收藏的地点,主人就 开始用它边缘锐利的头, 有齿的腿向下开掘,把沙 土抛向后方,而这贼
湖南师大附中 刘东红
1、抽样方法 常用抽样方法有三种,即简单随机抽样、

模块二讲重点 概率与统计(3)统计及统计案例小题-2021届高考数学二轮复习课件(新高考版)

模块二讲重点 概率与统计(3)统计及统计案例小题-2021届高考数学二轮复习课件(新高考版)

提取频率分布直方图中的数据
(1)组距、频率:频率分布直方图中每个矩形的宽表示
组距,高表示
频率 组距
,面积表示该组数据的频率,各个矩形
的面积之和为1;
(2)众数:最高小长方形底边中点的横坐标;
(3)中位数:平分频率分布直方图面积且垂直于横轴的
直线与横轴交点的横坐标;
(4)平均数:频率分布直方图中每个小长方形的面积乘
【分析】 由茎叶图,可得甲的中位数是65,从而可知乙 的中位数也是65,可得到y=5,再利用二者平均数也相等,可 求出x的值,即可得到答案.
【解析】 由茎叶图,可知甲的中位数为65,则乙的中位 数也是65,故y=5,
因为甲、乙的平均数相等, 所以56+62+65+5 74+70+x=59+61+657+65+78, 解得x=3.故选D.
小长方形底边中点的横坐标,再求和;
(5)参数:若纵轴上存在参数,则根据所有小长方形的
面积之和为1,列方程即可求得参数值.
用样本的数字特征估计总体的数字特征 (1)众数:一组数据中出现次数最多的数; (2)方差和标准差反映了数据波动程度的大小. ①方差:s2=1n[(x1--x )2+(x2--x )2+…+(xn--x )2]; ②标准差: s= n1[(x1--x )2+(x2--x )2+…+(xn--x )2]. 性质:标准差(或方差)越小,说明数据波动越小,越稳 定;标准差越大,说明数据越分散,越不稳定.
模 块 二 讲 重 点 第 1 0讲 概 率 与统 计(3) 统计及 统计案 例小题 -2021 届高考 数学二 轮复习 课件( 新高考 版)
模 块 二 讲 重 点 第 1 0讲 概 率 与统 计(3) 统计及 统计案 例小题 -2021 届高考 数学二 轮复习 课件( 新高考 版)

高考数学二轮复习专题突破—统计与统计案例(含解析)

高考数学二轮复习专题突破—统计与统计案例(含解析)

高考数学二轮复习专题突破—统计与统计案例1.某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y 的频数分布表.(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01) 附:√74≈8.602.2.(2021·江西赣州二模改编)遵守交通规则,人人有责.“礼让行人”是我国《道路交通安全法》的明文规定,也是全国文明城市测评中的重要内容.《道路交通安全法》第47条明确规定:“机动车行经人行横道时,应当减速行驶;遇行人正在通过人行横道,应当停车让行.机动车行经没有交通信号的道路时,遇行人横过道路,应当避让.否则扣3分罚200元”.下表是2021年1至4月份我市某主干路口监控设备抓拍到的驾驶员不“礼让行人”行为统计数据:(1)请利用所给数据求不“礼让行人”驾驶员人数y 与月份x 之间的经验回归方程y ^=b ^x+a ^,并预测该路口2021年10月不“礼让行人”驾驶员的大约人数(四舍五入);(2)交警从这4个月内通过该路口的驾驶员中随机抽查50人,调查驾驶员不“礼让行人”行为与驾龄的关系,得到下表:依据小概率值α=0.10的独立性检验,分析“礼让行人”行为是否与驾龄有关.参考公式:b ^=∑i=1nx i y i -nx y ∑i=1nx i 2-nx2=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2.χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.3.(2021·河北石家庄二模改编)某地区在2020年底全面建成小康社会,随着实施乡村振兴战略规划,该地区农村居民的收入逐渐增加,可支配消费支出也逐年增加.该地区统计了2016~2020年农村居民人均消费支出情况,对有关数据处理后,制作如图1的折线图[其中变量y (单位:万元)表示该地区农村居民人均年消费支出,年份用变量t 表示,其取值依次为1,2,3,…].(1)由图1可知,变量y与t具有很强的线性相关关系,求y关于t的经验回归方程,并预测2021年该地区农村居民人均消费支出;2016~2020年该地区农村居民人均消费支出图1(2)在国际上,常用恩格尔系数(其含义是指食品类支出总额占个人消费支出总额的比重)来衡量一个国家和地区人民生活水平的状况.根据联合国粮农组织的标准:恩格尔系数在40%~50%为小康,30%~40%为富裕.已知2020年该地区农村居民平均消费支出构成如图2所示,预测2021年该地区农村居民食品类支出比2020年增长3%,从恩格尔系数判断2021年底该地区农村居民生活水平能否达到富裕生活标准.2020年该地区农村居民人均消费支出构成图2参考公式:经验回归方程y ^=b ^x+a ^中斜率和截距的最小二乘估计分别为:b ^=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2=∑i=1nx i y i -nx y∑i=1nx i 2-nx 2,a ^=y −b ^x .4.(2021·山东潍坊一模)在对人体的脂肪含量和年龄之间的关系的研究中,科研人员获得了一些年龄和脂肪含量的简单随机样本数据(x i ,y i )(i=1,2,…,20,25<x i <65),其中x i 表示年龄,y i 表示脂肪含量,并计算得到∑i=120x i 2=48 280,∑i=120y i 2=15 480,∑i=120x i y i =27 220,x =48,y =27,√22≈4.7.(1)请用样本相关系数说明该组数据中y 与x 之间的关系可用线性回归模型进行拟合,并求y 关于x的经验回归方程y ^=a ^+b ^x (a ^,b ^的计算结果保留两位小数);(2)科学健身能降低人体脂肪含量,下表是甲、乙两款健身器材的使用年限(整年)统计表:某健身机构准备购进其中一款健身器材,以使用年限的频率估计概率,请根据以上数据估计,该机构选择购买哪一款健身器材,才能使用更长久?参考公式:样本相关系数r=∑i=1n(x i -x)(y i -y)√∑i=1n (x i -x)2√∑i=1n(y i -y)2=∑i=1nx i y i -nx y√∑i=1nx i 2-nx 2√∑i=1ny i 2-ny 2;对于一组具有线性相关关系的数据(x i ,y i )(i=1,2,…,n ),其经验回归直线y ^=b ^x+a ^的斜率和截距的最小二乘估计分别为:b ^=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2,a ^=y −b ^x .答案及解析1.解 (1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为14+7100=0.21.产值负增长的企业频率为2100=0.02.用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)y =1100(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30, s 2=1100[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]=0.029 6, s=√0.029 6=0.02×√74≈0.17.所以,这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17. 2.解 (1)由表中数据易知:x =1+2+3+44=52,y =125+105+100+904=105,则b ^=∑i=14x i y i -4x y∑i=14x i 2-4x2=995−1 05030−25=-11,a ^=y −b ^ x =105-(-11)×52=132.5,故所求经验回归方程为y ^=-11x+132.5.令x=10,则y ^=-11×10+132.5=22.5≈23(人),预测该路口10月份不“礼让行人”的驾驶员大约人数为23. (2)零假设为H 0:“礼让行人”行为与驾龄无关.由表中数据可得χ2=50×(10×12−20×8)218×32×30×20≈0.23<2.706=x 0.10,依据小概率值α=0.10的独立性检验,没有充分证据推断H 0不成立,可以认为H 0成立,即认为“礼让行人”行为与驾龄无关.3.解 (1)由已知数据可求t =1+2+3+4+55=3, y =1.01+1.10+1.21+1.33+1.405=1.21,∑i=15t i 2=12+22+32+42+52=55,∑i=15t i y i =1×1.01+2×1.10+3×1.21+4×1.33+5×1.40=19.16,b ^=19.16−5×3×1.2155−5×32=1.0110=0.101,a ^=1.21-0.101×3=0.907,所求经验回归方程为y ^=0.101t+0.907. 当t=6时,y ^=0.101×6+0.907=1.513(万元),故2021年该地区农村居民人均消费支出约为1.513万元.(2)已知2021年该地区农村居民平均消费支出1.513万元,由图2可知,2020年该地区农村居民食品类支出为4 451元,则预测2021年该地区食品类支出为4 451×(1+3%)=4 584.53元,恩格尔系数=4 584.5315 130×100%≈30.3%∈(30%,40%),所以,2021年底该地区农村居民生活水平能达到富裕生活标准.4.解 (1)x 2=2 304,y2=729,∑i=120x i y i -20x y =1 300,∑i=120x i 2-20x 2=2 200,∑i=1ny i 2-20y 2=900,r=∑i=120x i y i -20x y√∑i=120x i 2-20x 2√∑i=1ny i 2-20y2≈0.92,因为y 与x 的样本相关系数接近1,所以y 与x 之间具有较强的线性相关关系,可用线性回归模型进行拟合.由题可得,b ^=∑i=120(x i -x)(y i -y)∑i=120(x i -x)2=∑i=120x i y i -20x y∑i=120x i 2-20x2=1322≈0.591,a ^=y −b ^ x =27-0.591×48≈-1.37,所以y ^=0.59x-1.37.(2)以频率估计概率,设甲款健身器材使用年限为X (单位:年).E (X )=5×0.1+6×0.4+7×0.3+8×0.2=6.6. 设乙款健身器材使用年限为Y (单位:年).E (Y )=5×0.3+6×0.4+7×0.2+8×0.1=6.1.因为E (X )>E (Y ),所以该健身机构购买甲款健身器材更划算.。

2019高考数学二轮复习专题七概率与统计2.7.3正态分布、统计与统计案例课件理

2019高考数学二轮复习专题七概率与统计2.7.3正态分布、统计与统计案例课件理

2.正态分布 X~N(μ,σ2)的三个常用数据 (1)P(μ-σ<X≤μ+σ)=0.6826; (2)P(μ-2σ<X≤μ+2σ)=0.9544; (3)P(μ-3σ<X≤μ+3σ)=0.9974.
[解题指导]
[解]
(1)抽取的一个零件的尺寸在(μ-3σ, μ+3σ)之内的概率
为 0.9974, 从而零件的尺寸在(μ-3σ, μ+3σ)之外的概率为 0.0026, 故 X~B(16,0.0026). 因此 P(X≥1)=1-P(X=0)=1-0.997416≈0.0408. X 的数学期望为 E(X)=16×0.0026=0.0416.
[对点训练]
2 1.(2018· 兰州检测)设 X~N(μ1,σ2 1),Y~N(μ2,σ2),这两个
正态分布密度曲线如图所示,下列结论中正确的是(
)
A. P(Y≥μ2)≥P(Y≥μ1) B.P(X≤σ2)≤P(X≤σ1) C.对任意正数 t,P(X≥t)≥P(Y≥t) D.对任意正数 t,P(X≤t)≥P(Y≤t)
3.方差公式 1 - - - s = [(x1- x )2+(x2- x )2+…+(xn- x )2] n
2
[对点训练] 1.(2018· 安徽皖南八校联考)某校为了解 1000 名高一新生的 健康状况, 用系统抽样法(按等距的规则)抽取 40 名同学进行检查, 将学生从 1~1000 进行编号,现已知第 18 组抽取的号码为 443, 则第一组用简单随机抽样抽取的号码为( A.16 B.17 C.18 D.19 )
[答案]
C
2. 某校组织了“2017 年第 15 届希望杯数学竞赛(第一试)”, 已知此次选拔赛的数学成绩 X 服从正态分布 N(72,121)(单位: 分), 此次考生共有 500 人,估计数学成绩在 72 分到 83 分之间的人数 约为(参数数据:P(μ-σ<X<μ+σ)=0.6826,P(μ-2σ<X<μ+2σ)= 0.9544.)( A.238 ) B.170 C.340 D.477

高三数学专题复习7.3统计、统计案例教案(第2课时)

高三数学专题复习7.3统计、统计案例教案(第2课时)

100
将 2×2列联表中的数据代入公式计算,得
n ad- bc 2

2
k= a+ b c+ d a+ c b+ d = 75×25×45×55
课题
统计、统计案例
课 时 共 3 课时
本节第 2 课时
选用教材 教学目标 重点 难点 关键
教学方法 及课前准备
专题七 知识模块
概率与统计
课型
熟练掌握频率分布直方图等图和回归分析独立性检验
熟练掌握频率分布直方图等图和回归分析独立性检验 熟练掌握频率分布直方图等图和回归分析独立性检验 熟练掌握频率分布直方图等图和回归分析独立性检验
1
1n
80

(1) 由题意
n= 10,
x

ni

x
1
i

= 10
8,
1 10
20
y

ni

y
1
i

10=
2,
n
又 x2i - n x 2= 720-10×82= 80.
i =1
n
xiyi-n x
i =1
y = 184-10×8×2= 24.
10
xi yi - 10 x y
^
i =1
由此得 b =
10
单价 x( 元 )
8
8.2
8.4
8.6
8.8
9
销量 y( 件 )
90
84
83
80
75
68
2
^
^
^
^
^
^
(1) 求回归直线方程 y =b x+ a ,其中 b =- 20, a = y - b x ;

概率与统计 第三讲 统计与统计案例——2023届高考理科数学大单元二轮复习练重点【新课标全国卷】

概率与统计  第三讲 统计与统计案例——2023届高考理科数学大单元二轮复习练重点【新课标全国卷】

专题八 概率与统计 第三讲 统计与统计案例——2023届高考理科数学大单元二轮复习练重点【新课标全国卷】1.在某次赛车中,50名参赛选手的成绩(单位:min )全部介于13到18之间(包括13和18).现将比赛成绩分为五组:第一组[13,14),第二组[14,15),…,第五组[17,18],其频率分布直方图如图所示.若成绩在[13,15)内的选手可获奖,则这50名选手中获奖的人数为( )A.11B.15C.35D.392.某学校组织学生参加英语测试,成绩的频率分布直方图如图所示,数据的分组依次为[)20,40,[)40,60,[)60,80,[]80,100.若低于60分的人数是15人,则参加英语测试的学生人数是( )A.45B.50C.55D.603.我国是一个农业大国,从事农业工作的人员有5.4亿,如图为某县农村从业人员年龄结构图,为了解该县从业人员在从事农业工作中的实际困难,以推进县乡村振兴工作,某调查机构计划从某县的所有从业人员中随机抽取20人展开某项调研,则所抽取的20人中恰有2人的年龄在20岁以下的概率约为( ) (170.90.167≈,180.90.15≈,190.90.135≈,200.90.122≈)A.0.25B.0.29C.0.32D.0.354.某校高一年级在某次数学测验中成绩不低于80分的所有考生的成绩统计表如下:A.在[90,100]内B.在(100,110]内C.在(110,120]内D.在(120,130]内5.若某同学连续3次考试的名次(3次考试均没有出现并列名次的情况)不低于第3名,则称该同学为班级的尖子生.根据甲、乙、丙、丁四位同学过去连续3次考试名次的数据,推断一定是尖子生的是( )A.甲同学:平均数为2,众数为1B.乙同学:平均数为2,方差小于1C.丙同学:中位数为2,众数为2D.丁同学:众数为2,方差大于16.2021年某省高考体育百米测试中,成绩全部介于12秒与18秒之间,抽取其中100个样本,将测试结果按如下方式分成六组:第一组[12,13),第二组[13,14),…,第六组[17,18],得到如下的频率分布直方图.则该100考生的成绩的平均数和中位数(保留一位小数)分别是( )A.15.2 15.3B.15.1 15.4C.15.1 15.3D.15.2 15.37.设样本数据1x ,2x ,…,10x 的平均数和方差分别为1和4,若i i y x a =+(a 为非零常数,1,2,,10i =),则1y ,2y ,…,10y 的平均数和方差分别为( ) A.1a +,4B.1a +,4a +C.1,4D.1,4a +8.已知变量x ,y 之间的一组数据如下表:若y 关于x 的线性回归方程为0.7y x a =+,则a =( ) A.0.1B.0.2C.0.35D.0.459.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得经验回归直线方程0.6754.9y x =+,表中有一个数据模糊不清,请你推断出该数据的值为( )C.68 10.第24届冬季奥林匹克运动会将于2022年在北京举办.为了解某城市居民对冰雪运动的关注情况,随机抽取了该市100人进行调查统计,得到如下22⨯列联表.参考公式:()()()()2n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.附表:A.该市女性居民中大约有5%的人关注冰雪运动B.该市男性届民中大约有95%的人关注冰雪运动C.有95%的把握认为该市居民是否关注冰雪运动与性别有关D.有99%的把握认为该市居民是否关注冰雪运动与性别有关11.一个项目由15个专家评委投票表决,剔除一个最高分96,一个最低分58后所得到的平均分为92,方差为16,那么原始得分的方差为_______.12.经市场调查,某款热销品的销售量y(万件)与广告费用x(万元)之间满足回归直线方程 3.5=+.若样本点中心为(45,35),则当销售量为52.5万件时,可估计投入y bx的广告费用为_________________万元.13.某学校为了制订治理学校门口上学、放学期间家长接送孩子乱停车现象的措施,对全校学生家长进行了问卷调查.根据从中随机抽取的50份调查问卷,得到了如下的列联表:14.某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)8.602.15.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):1(优) (2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的22⨯列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.附:2()()()()K a b c d a c b d =++++,)2kk答案以及解析1.答案:A解析:由题意可得,成绩在[13,15)内的频率为10.080.320.380.22---=.又本次赛车中,共50名参赛选手,所以这50名选手中获奖的人数为500.2211⨯=.故选A. 2.答案:B解析:根据频率分布直方图的特点可知,低于60分的频率是(0.0050.01)200.3+⨯=,则所求学生人数是15500.3=. 3.答案:B解析:由频率分布直方图可得20岁以下的农村从业人员的概率为0.1,所以从所有从业人员中抽取20人,其中恰有2人的年龄在20岁以下的概率为221820C (0.1)(0.9)0.2850.29≈≈,故选B. 4.答案:B解析:由表可知,及格的考生共有401512105284+++++=人,在[90,100]内有40人,在(100,110]内有15人,故及格的所有考生成绩的中位数在(100,110]内.5.答案:B解析:甲同学:若平均数为2,众数为1,则有一次名次应为4,故排除A ;乙同学:平均数为2,设乙同学3次考试的名次分别为1x ,2x ,3x ,则方差()()()2222123122213s x x x ⎡⎤=-+-+-<⎣⎦,则()()()2221232223x x x -+-+-<,所以1x ,2x ,3x 均不大于3,符合题意;丙同学:中位数为2,众数为2,有可能是2,2,4,不符合题意;丁同学:众数为2,方差大于1,有可能是2,2,6,不符合题意.故选B. 6.答案:C解析:100名考生成绩的平均数12.50.1013.50.1514.50.15x =⨯+⨯+⨯+15.50.3016.50.2517.50.0515.1⨯+⨯+⨯=.因为前三组频率直方图面积和为0.100.150.150.4++=,前四组频率直方图面积和为0.100.150.150.300.7+++=,所以中位数位于第四组内,设中位数为a ,则(15)0.300.1a -⨯=,解得15.3a ≈,故选C.7.答案:A解析:由题意知i i y x a =+,即()1210110110y x x x a x a a =⨯++++=+=+,方差{}222212101()()()10x a x a x s a x a x a x a ⎡⎤⎡⎤⎡⎤=⨯+-+++-++++-+⎣⎦⎣⎦⎣⎦()()()22212101410x x x x x x ⎡⎤=⨯-+-++-=⎢⎥⎣⎦. 故选A. 8.答案:C解析:本题考查线性回归方程截距的求解.因为11(3456) 4.5,(2.534 4.5) 3.544x y =+++==+++=,所以0.7 3.50.7 4.50.35a y x =-=-⨯=,故选C. 9.答案:C解析:设表中模糊看不清的数据为m .由表中数据得30x =, 3075m y +=,将30730,5m x y +==代入经验回归方程0.6754.9y x =+,得68m =.故选C. 10.答案:C解析:由22⨯列联表中的数据可得()22352515251004.167 3.84160405050K ⨯-⨯⨯=≈>⨯⨯⨯,因此,有95%的把握认为该市居民是否关注冰雪运动与性别有关.故选:C.11.答案:88解析:根据题意,设剔除最高分、最低分之后的13个数据为1a ,2a ,3a ,…,13a ,由这13个数据的平均分为92,方差为16, 知()1231319213a a a a ++++=,()()()222121319292921613a a a ⎡⎤-+-++-=⎣⎦, 解得123131196a a a a ++++=,2221213110240a a a +++=,对于原始得分96,58,1a ,2a ,3a ,…,13a , 其平均数()12313196589015a a a a a =++++++=,其方差为()(()22222212131(9690)(5890)9090)908815s a a a ⎤⎡=-+-+-+-++-=⎣⎦. 12.答案:70解析:本题考查线性回归方程.依题意,将(45,35)代入回归直线方程 3.5y bx =+(提示:回归直线必过样本点中心),得3545 3.5b =⨯+,解得0.7b =,所以回归直线方程为0.7 3.5y x =+.令0.7 3.552.5y x =+=,得70x =. 13.答案:99.5%解析:因为2250(2015510)8.33325253020χ⨯⨯-⨯=≈⨯⨯⨯,又()27.8790.0050.5%P χ==≥,所以我们有99.5%的把握认为“是否同意限定区域停车与家长的性别有关”.14.答案:(1)产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为20%(2)平均数与标准差的估计值分别为30%,17%解析:(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为1470.21100+=.产值负增长的企业频率为20.02100=. 用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为20%. (2)1(0.1020.10240.30530.50140.707)0.30100y =⨯-⨯+⨯+⨯+⨯+⨯=, ()52222111(0.40)2(0.20)100100i i i s n y y=⎡=-=⨯-⨯+-⨯⎣∑222240530.20140.4070.0296⎤+⨯+⨯+⨯=⎦,0.020.17s .所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.15.答案:(1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计值如下表:1(100203003550045)350100⨯+⨯+⨯=. (3)根据所给数据,可得22⨯列联表:根据列联表得25.82055457030K =≈⨯⨯⨯. 由于5.820 3.841>,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.。

名师导学2018届高三数学理二轮复习课件:专题3第7讲统计与统计案例 精品

名师导学2018届高三数学理二轮复习课件:专题3第7讲统计与统计案例 精品
收集和处理渗透到解答题中,以其为载体,考查概率和离 散型随机变量的分布列和数学期望.
2.高考真题 考题1 (2013 全国Ⅰ)为了解某地区的中小学生视力 情况,拟从该地区的中小学生中抽取部分学生进行调查, 事先已了解到该地区小学.初中.高中三个学段学生的视 力情况有较大差异,而男女生视力情况差异不大,在下面 的抽样方法中,最合理的抽样方法是( ) A.简单随机抽样 B.按性别分层抽样 C.按学段分层抽样 D.系统抽样
计综合的趋势.全卷统计与概率的考查分值比较稳定,近
五年均为 22 分,试题难度属容易题和中档题,是考生的 主要得分点之一.
第7讲 统计与统计案例源自1.考题展望高考对这部分内容注重基础知识和基本方法的考查,
要求考生理解数据处理的几种基本思想、方法和作用,并
能运用所学知识、方法去解决实际问题,对独立检验、回 归分析的理论推导不作要求;命题时常以一道客观题考查 抽样方法、频率分布直方图、茎叶图、用样本估计总体、 变量间的相关关系、线性回归方程、回归分析和独立检验 等考点中的一个或二个,试题难度中档偏易,同时将数据
【解析】选 A. 对应 μ1 的曲线对称轴靠左边,知 μ1<μ2;又对应
σ1 的曲线更陡峭一些,知 σ1<σ2,故选 A.
【点评】正态分布问题求解的切入点是充分利用 正态分布曲线的图象特征和相关量的统计意义分析思 考.
3.样本估计总体 例3甲、乙二人参加某体育项目训练,近期的五 次测试成绩得分情况如图.
2.总体估计
用样本估计总体,是研究统计问题的一个基本思想方
法,用样本的频率分布对总体进行估计. (1)频率分布直方图:利用直方图反映样本的频率分布
规律,这样的直方图称为频率分布直方图.画频率分布直 方图的一般步骤:1)计算一组数据中最大值与最小值的 差,即求极差;2)确定组距和组数;3)将数据分组;4)绘 制频率分布表;5)画频率分布直方图.

高考数学二轮复习 专题七 第3讲 统计与统计案例配套 理

高考数学二轮复习 专题七 第3讲 统计与统计案例配套 理

A.15
B.16 C.17 D.18
整理ppt
解析 由系统抽样方法,知按编号依次每30个编号作 为一组,共分49组, 高二学生的编号为496到988,在第17组到第33组内, 第17组抽取的编号为16×30+23=503,为高二学生, 第33组抽取的编号为32×30+23=983,为高二学生, 故共抽取高二学生人数为33-16=17,故选C. 答案 C
整理ppt
(2)(2014·广东)已知某地区中小学生人数和近视情况分别 如图①和图②所示.为了解该地区中小学生的近视形成原 因,用分层抽样的方法抽取2%的学生进行调查,则样本 容量和抽取的高中生近视人数分别为( )
A.200,20 C.200,10
B.100,20 D.100,10
整理ppt
解析 该地区中、小学生总人数为 3 500+2 000+4 500=10 000, 则样本容量为10 000×2%=200, 其中抽取的高中生近视人数为 2 000×2%×50%=20,故选A. 答案 A
系统抽样方法抽取42人做问卷调查,将840人按1,2,
…,840随机编号,则抽取的42人中,编号落入区
间[481,720]的人数为( )
A.11
B.12 C.13 D.14
思维启迪 系统抽样时需要抽取几个个体,样本就分成几组,且抽
取号码的间隔相同;
整理ppt
解析 由 840 =20,即每20人抽取1人, 42
nad-bc2
Hale Waihona Puke x2 c d c+d a+bc+da+cb+d
总 计
a+c b+d
n (其中 n=a+b+c+d 为样
本容量).
整理ppt
热点分类突破 ➢ 热点一 抽样方法 ➢ 热点二 用样本估计总体 ➢ 热点三 统计案例

高中数学《统计与统计案例》课件

高中数学《统计与统计案例》课件
^
设施投资额的变化规律呈线性增长趋势,利用 2010 年至 2016 年的数据建立的线性模型y =99+17.5t 可以较好地描述 2010 年以后的环境基础设施投资额的变化趋势,因此利用 模型②得到的预测值更可靠.
13
考点整合
1.抽样方法 抽样方法包括简单随机抽样、系统抽样、分层抽样,三种抽样方法都是等概率抽样, 体现了抽样的公平性,但又各有其特点和适用范围.
位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为( )
A.0.5
B.0.6
C.0.7
D.0.8
解析 法一 设调查的 100 位学生中阅读过《西游记》的学生人数为 x,则 x+80-60
=90,解得 x=70,所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计
值为17000=0.7.故选 C.
解 (1)由调查数据,男顾客中对该商场服务满意的比率为4500=0.8,因此男顾客对该商场
服务满意的概率的估计值为 0.8.女顾客中对该商场服务满意的比率为3500=0.6,因此女顾
客对该商场服务满意的概率的估计值为 0.6.
8
(2)K2 的观测值 k=100×5(0×405×0×207-0×303×010)2≈4.762. 由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务 的评价有差异.
^
利用模型②,该地区 2018 年的环境基础设施投资额的预测值为y=99+17.5×9=256.5(亿 元).
12
(2)利用模型②得到的预测值更可靠. 理由如下: 从折线图可以看出,2000 年至 2016 年的数据对应的点没有随机散布在直线 y=-30.4+ 13.5t 上下,这说明利用 2000 年至 2016 年的数据建立的线性模型①不能很好地描述环境 基础设施投资额的变化趋势.2010 年相对 2009 年的环境基础设施投资额有明显增加, 2010 年至 2016 年的数据对应的点位于一条直线的附近,这说明从 2010 年开始环境基础

高三数学二轮复习专题六第三讲统计、统计案例课件人教版

高三数学二轮复习专题六第三讲统计、统计案例课件人教版

[做考题 查漏补缺]
(2011·北京高考)以下茎叶图记录了甲、乙两组各
四名同学的植树棵数.乙组记录中有一个数据模糊,无法
确认,在图中以X表示.
甲组
乙组
(1)如果 X=8,求乙组同学植树棵数的平均数和方差; (2)如果 X=9,分别从甲、乙两组中随机选取一名同学,求这两名同
学的植树总棵数 Y 的分布列和数学期望. (注:方差 s2=n1[(x1--x )2+(x2--x )2+…+(xn--x )2],其中-x 为 x1, x2,…,xn 的平均数)
第 3讲 统计
、 统计 案例
知考情 研考题 析考向 战考场
高频考点
考情解读
考查方式
抽样方法
多考查分层抽样
选择题
用样本估计 样本频率分布图与茎叶图及样本数据 选择题、解
总体
是命题热点,多与概率统计相结合 答题
回归分析 重点考查回归分析应用
选择题、填 空题
独立性检验 主要考查独立性检验的意义
选择题
所以随机变量 Y 的分布列为:
Y 17 18
P
1 8
1 4
19 20 21
11 1 44 8
E(Y)=17×P(Y=17)+18×P(Y=18)+19×P(Y=19)+20×P(Y=20)+ 21×P(Y=21)=17×18+18×14+19×14+20×14+21×18=19.
3.(2011·湖北高考)有一个容量为200
解析:回归直线过样本中心点(-x ,-y ).
答案:D
[悟方法 触类旁通] 1.正确理解计算b,a的公式和准确的计算是求线性回归
方程的关键. 2.由回归方程分析得出的只是预测值而不是精确值.
[联知识 串点成面]

高考数学二轮专题复习PPT课件_统计与统计案例(理)优秀讲课PPT

高考数学二轮专题复习PPT课件_统计与统计案例(理)优秀讲课PPT

【名校课堂】获奖PPT-高考数学二轮 专题复 习课件 :专题 四统计 与统计 案例( 理)推 荐(共P PT)推 荐(最 新版本 )推荐
• (文科) 年份 卷别 Ⅰ卷
Ⅱ卷 2020
Ⅲ卷
题号 5、17
18
3、18
考查角度 散点图的识别,频率分布表的应用 平均数的估计值、相关系数的计算以 及抽样方法的选取 方差及其性质,利用频数分布表计算 频率和平均数、独立性检验的应用
【名校课堂】获奖PPT-高考数学二轮 专题复 习课件 :专题 四统计 与统计 案例( 理)推 荐(共P PT)推 荐(最 新版本 )推荐
(2)∵甲、乙、丙三个车间的数量之比依次为120︰80︰60=6︰4︰ 3,
现用分层抽样的方法抽出的样本中乙车间抽4件, ∴由分层抽样性质,得: 6+44+3=n4, 解得n=13. 故选D.
序平均分成30组(1~80号,81~160号,…,2 321~2 400号),若第
3组抽出的号码为176,则第6组抽到的号码是
()
• A.416
B.432
C.448
D.464
A
【名校课堂】获奖PPT-高考数学二轮 专题复 习课件 :专题 四统计 与统计 案例( 理)推 荐(共P PT)推 荐(最 新版本 )推荐
年份 2019 2018
卷别 Ⅰ卷 Ⅱ卷 Ⅲ卷 Ⅰ卷 Ⅱ卷 Ⅲ卷
题号
5 17 3 18 18
考查角度
分值
样本的数字特征
5
频率分布直方图、均值的应用
12
统计图的识别和分析
5
折线图、线性回归方程模型问题
12
茎叶图的应用以及独立性检验
12
【名校课堂】获奖PPT-高考数学二轮 专题复 习课件 :专题 四统计 与统计 案例( 理)推 荐(共P PT)推 荐(最 新版本 )推荐
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

s2= 1 [(0.042-0.068 9)2+(0.053-0.068 9)2+…+ (0.09172-0.068 9)2]≈0.000 212.
s2= 1 [(0.041-0.067 5)2+(0.042-0.067 5)2+…+ (0.09162-0.067 5)2]≈0.000 429.
所以甲、乙两地浓度的方差较小的是甲地. 答案 A
B.16
C.17 D.18
解析 由系统抽样方法,知按编号依次每30个编号作 为一组,共分49组, 高二学生的编号为496到988,在第17组到第33组内, 第17组抽取的编号为16×30+23=503,为高二学生, 第33组抽取的编号为32×30+23=983,为高二学生, 故共抽取高二学生人数为33-16=17,故选C. 答案 C
解析 本题属于分层抽样,设该学校的教师人数为x,
所以3126000=160-x 150,所以 x=200.
(1)随机抽样各种方法中,每个个体被抽到的概率
思 都是相等的;(2)系统抽样又称“等距”抽样,被 维 抽到的各个号码间隔相同;分层抽样满足:各层

华 抽取的比例都等于样本容量在总体容量中的比例.
解析 A中,a=6,b=14,c=10,d=22,a+b =20,c+d=32,a+c=16,b+d=36,n=52,
K2=52×20×6×322×2-161×4×36102=1
13 440.
B中,a=4,b=16,c=12,d=20,a+b=20,c +d=32,a+c=16,b+d=36,n=52,
根据上万表元可得线性8 回归6 方程4y^=b^2x+2a^中2 的b^=0.196 2,
则面积为 150 m2 的房屋的销售价格约为________万元.
解析 由表格可知 x=15(115+110+80+135+105)=109, y =15(24.8+21.6+18.4+29.2+22)=23.2. 所以a^= y-b^ x=23.2-0.196 2×109=1.814 2. 所以所求线性回归方程为y^=0.196 2x+1.814 2. 故当 x=150 时,销售价格的估计值为 y^=0.196 2×150+1.814 2=31.244 2(万元).
所以抽取编号落入区间[481,720]的人数为
720-480=240 =12. 20 20
答案 B
(2)某学校共有师生3 200人,现用分层抽样的方法,从所 有师生中抽取一个容量为160的样本,已知从学生中抽取 的人数为150,那么该学校的教师人数是________.
200
思维启迪 分层抽样最重要的是各层的比例.
思 值、众数和中位数、方差等.
维 升
(2)由样本数据估计总体时,样本方差越小,数
华 据越稳定,波动越小.
变式训练2
(1)某商场在庆元宵促销活动中,对
元宵节9时至14时的销售额进行统
计,其频率分布直方图如图所示,
已知9时至10时的销售额为2.5万
元,则11时至12时的销售额为____
万元.
10
解析 由频率分布直方图可知:0.10=2.5,
专题七 概率与统计
第 3讲 统计与统计案例
主干知识梳理 热点分类突破 真题与押题
1.该部分常考内容:样本数字特征的计算、各种统
计图表、线性回归方程、独立性检验等;有时也会
在知识交汇点处命题,如概率与统计交汇等.

情 2.从考查形式上来看,大部分为选择题、填空题, 解 重在考查基础知识、基本技能,有时在知识交汇点
0.95x+a^,则a^等于( )
A.1.30 B.1.45 C.1.65 D.1.80
解析 依题意得, x=16×(0+1+4+5+6+8)=4, y =16(1.3+1.8+5.6+6.1+7.4+9.3)=5.25; 又直线y^=0.95x+a^必过样本点中心( x, y),
数字特 样本数 频率分布直方



出现次 取最高的小长
众数 数最多 方形底边中点
将数据按大小依 把频率分布直方 次排列,处在最 图划分左右两个 中位数 中间位置的一个 面积相等的分界 数据(或最中间两 线与x轴交点的横 个数据的平均数) 坐标
每个小矩形的面 样本数据的算术 积乘以小矩形底 平均数
(2)方差:s2=1n[(x1- x)2+(x2- x)2+…+(xn- x)2]. 标准差: s= 1n[x1- x 2+x2- x 2+…+xn- x 2].
K2=522×0×143×2×301-6×6×3622=3176507.
∵1 14340<1130<633670<3176507,
∴与性别有关联的可能性最大的变量是阅读量. 答案 D
(1)线性回归方程求解的关键在于准确求出样本
点中心.回归系数的求解可直接把相应数据代入
公式中求解,回归常数的确定则需要利用中心
答案 31.244 2
(2)(2014·江西)某人研究中学生的性别与成绩、视力、 智商、阅读量这4个变量的关系,随机抽查52名中学生, 得到统计数据如表1至表4,则与性别有关联的可能性 最大的变量是( )
表1
成 绩 性别
不及 格
男6
及格 14
总计 20
女 10 22 32
总计 16 36 52
表2
y1 x1 a
y2 总计 则 K2(χ2)=
nad-bc2
b a+b a+bc+da+cb+d
x2 c d c+d
总 计
a+c b+d
n
(其中 n=a+b+c+d 为样 本容量).
热点分类突破
➢ 热点一 抽样方法 ➢ 热点二 用样本估计总体 ➢ 热点三 统计案例
热点一 抽样方法
例1 (1)(2013·陕西)某单位有840名职工,现采用
(1)反映样本数据分布的主要方式:频率分布表、
频率分布直方图、茎叶图.关于频率分布直方图
要明确每个小矩形的面积即为对应的频率,其
思 高低能够描述频率的大小,高考中常常考查频

升 率分布直方图的基本知识,同时考查借助频率

分布直方图估计总体的概率分布和总体的特征
数,具体问题中要能够根据公式求解数据的均

处命题,也会出现解答题,都属于中、低档题.
主干知识梳理
1.随机抽样 (1)简单随机抽样特点是从总体中逐个抽取.适用范围:总 体中的个体较少. (2)系统抽样特点是将总体均分成几部分,按事先确定的 规则在各部分中抽取.适用范围:总体中的个体数较多. (3)分层抽样特点是将总体分成几层,分层进行抽取.适用 范围:总体由差异明显的几部分组成.
(2)PM2.5是指大气中直径小于或等于 2.5微米的颗粒物,也称为可入肺颗
粒物,如图是根据某地某日早7点至
晚8点甲、乙两个PM2.5监测点统计的 数据(单位:毫克/每立方米)列出的茎
叶图,则甲、乙两地浓度的方差较小的是( )
A.甲
B.乙
C.甲乙相等
D.无法确定
思维启迪
直接根据公式计算方差.
解析 x甲=(0.042+0.053+0.059+0.061+0.062+
第三组中没有疗效的有6人,则第三组中有疗效的人
数为( )
思维启迪 根据第一组与第二组
的人数和对应频率估计 样本总数,然后利用第 三组的频率和无疗效人 数计算;
A.6
B.8 C.12 D.18
解析 志愿者的总人数为0.16+200.24×1=50,
所以第三组人数为50×0.36=18, 有疗效的人数为18-6=12. 答案 C
变式训练1
(1) 某 校 高 一 、 高 二 、 高 三 分 别 有 学 生 人 数 为
495,493,482,现采用系统抽样方法,抽取49人做问
卷调查,将高一、高二、高三学生依次随机按
1,2,3,…,1 470编号,若第1组有简单随机抽样方法
抽取的号码为23,则高二应抽取的学生人数为( )
A.15
所以y1,y2,…,y10的均值为1+a,方差不变仍为4.
故选A.
热点三 统计案例
例3 (1)以下是某年2月某地区搜集到的新房屋的销售
价格y和房屋的面积x的数据.
思维启迪 回归直线
房屋面积 11
10 过 样 本 点 中
x/m2
110 80 135
5
5
心(
);
x,y
销售价格y/ 24. 21. 18. 29.
所以x=10.
0.40 x
(2)(2014·陕西)设样本数据x1,x2,…,x10的均值和方
差分别为1和4,若yi=xi+a(a为非零常数,i=1,2,…,
10),则y1,y2,…,y10的均值和方差分别为( )
A.1+a,4
B.1+a,4+a
A
C.1,4
D.1,4+a
解析 x1+x2+10…+x10=1,yi=xi+a,
热点二 用样本估计总体
例2 (1)(2014·山东)为了研究某药品的疗效,选取若干 名志愿者进行临床试验,所有志愿者的舒张压数据(单 位 : kPa) 的 分 组 区 间 为 [12,13) , [13,14) , [14,15) , [15,16),[16,17],将其按从左到右的顺序分别编号为 第一组,第二组,…,第五组,如图是根据试验数据 制成的频率分布直方图.已知第一组与第二组共有20人,
4.变量的相关性与最小二乘法 (1)相关关系的概念、正相关和负相关、相关系数.
(2)最小二乘法:对于给定的一组样本数据(x1,y1),(x2,
n
y2),…,(xn,yn),通过求 Q= (yi-a-bxi)2 最小时,
i=1
得到线性回归方程y^=b^x+a^的方法叫做最小二乘法.
相关文档
最新文档