高中数学《第三章统计案例复习参考题》2PPT课件
(高效整合)高中数学 第3章《统计案例》名师课件 新人教A版选修2-3
•
(1)散点图如图所示.
• 由图(2)x可与知y 的,关x,系可y线以用性线相性关回归.模型来拟合,不妨设回归
模型为∧y=a∧+b∧x.
• 序将号数零据件代个入数 相xi(个应) 公加式工时可y得i(m数in)据表xiyi:
1
10
62
620
2
20
72
• (3)利用所求回归方程求出下列数据:
∧
yi yi-∧yi yi- y
61.833 0.167 -30
68.533 75.233 81.933 88.633
3.467 -0.233 -0.933 -3.633
-20 -17 -11
-7
∧
yi yi-∧yi yi- y
95.333 102.033 108.733 115.433 122.133
-0.333 0.967 -0.733 -3.433 4.867
3
11
16
20
35
10
yi-∧yi2
i=1
∴R2=1-
≈0.987.
10
yi- y 2
i=1
(4)∵∧ei=yi-∧yi,利用上表中数据作出残差图,如图所示.
(5)由散点图可以看出 x 与 y 有很强的线性相关性,由 R2 的值可以看出回归效果很好.
由题意知,对于给定的公式 y=Aebx(b<0)两边 取自然对数,得 ln y=ln A+bx.
与线性回归方程相对照可以看出,只要取 u=1x,v=ln y, a=ln A,就有 v=a+bu.
这就变为 v 对 u 的线性回归直线方程,求回归系数 b 和 a. 题目中所给的数据由变量置换 u=1x,v=ln y,变为如下所示的 数据,
高中数学选修3-2第三章统计案例知识点及随堂练习讲义(可编辑修改word版)
i 3.1 回归分析的基本思想回归分析(regression analysis)是对具有相关关系的两个变量进行统计分析的一种常用方法。
对于一组具有线性相关关系的数据 (x 1,y 1),(x 2,y 2),⋯,(x n ,y n ){b =n ∑(x i‒ x)(y i‒ y) i = 1n= ∑(x i‒ x)2n∑x i y i‒ nxyi = 1n∑x 2 ‒ nx 2i = 1a = y ‒ bxi = 11 n1n其中x = n ∑x i i = 1线性回归模型:,y = n ∑y i i = 1,(x ,y )称为样本点的中心,回归直线过样本点的中心。
回归方程:y = bx + a{y = bx + a + e 2E(e) = 0,D(e) = σ其中 a 和 b 为模型的未知参数,e 是 y 与 bx+a 之间的误差。
通常 e 为随机变量,称为随机误差与函数关系不同,在回归模型中,y 的值由 x 和随机因素 e 共同确定,即 x 只能解释部分 y 的变化, 因此我们把 x 称为解释变量,把 y 称为预报变量。
随机误差 e 的方差σ2越小,用 bx+a 预报真实值 y 的精度越高。
随机误差是引起预报值y 与真实值 y 之间存在误差的原因之一,其大小取决于随机误差的方差。
另一方面,b 和a 为斜率和截距的估计值,它们与真实值 a 和 b 之间也存在误差,这种误差是引起 预报值y 与真实值 y 之间存在误差的另一个原因。
由于随机误差对于样本点 e = y ‒ (bx + a),所以e = y ‒ y 是 e 的估计量。
(x 1,y 1),(x 2,y 2),⋯,(x n ,y n ) 它们的随机误差为e i = y i ‒ bx i ‒ a ,i = 1,2,⋯,nn其估计值为e i = y i ‒ y i = y i ‒ bx i ‒ a ,i = 1,2,⋯,ne i 称为相应于点(x i ,y i )的残差(residual)。
高中数学第三章统计案例本章知识体系课件选修23高二选修23数学课件
(2)如果 y 与 x 之间具有线性相关关系,求线性回归方程;
(3)如果父亲的身高为 73 英寸,估计儿子的身高.
12/13/2021
[解] (1)由题意得
10
x =66.8, y =67.01,x2i =44 794,
i=1
10
10
y2i =44 941.93,xiyi=44 842.4,
i=1
12/13/2021
[解] 由题意可知: a=114,b=36,c=132,d=18,a+b=150,c+d=150, a+c=246,b+d=54,n=300,代入公式可得, χ2=a+bcn+add-ab+cc2b+d =3001×501×141×501×8-24366××514322≈7.317. 因为 χ2=7.317>6.635,因此我们有 99%的把握认为新措施 对防治猪白痢是有效果的.
i=1
则 r=
10
xiyi-10 x y
i=1
≈0.980 4.
10
10
x2i -10 x 2yi2-10 y 2
i=1
i=1
因为|r|≈0.980 4>0.75,所以 y 与 x 之间具有较强的线性相关 程度.
12/13/2021
(2)设线性回归方程为 y=bx+a.
10
xiyi-10 x y
i=1
(2)可以看出含碳量 y(百分比)与熔化时间 t(小时)的散点图并 不分布在一条直线周围,因此,不宜用线性回归方程来拟合它.根 据已有的函数知识,可以发现样本点分布在某一条指数函数曲线 y=ment 的周围,其中 m,n 是待定参数,令 z=lny,则表中的数 据变为:
得 z=-1.845t+11.69, 即 lny=-1.845t+11.69, ∴回归方程为 y=e-1.845t+11.69.
高中数学第三章统计案例章末复习课课件选修23高二选修23数学课件
知识(zhī shi)梳理 题型探究(tànjiū)
当堂训练
第三页,共三十五页。
知识 梳理 (zhī shi)
12/9/2021
第四页,共三十五页。
1.最小二乘法(chéngfǎ)
对于一组数据(xi,yi),i=1,2,…,n,如果(rúguǒ)它们线性相关,则线性回归
n
n
xi- x yi- y xiyi-n x y
程判断当x=____时,y的估计值是2384.
解析 首先把两组值代入线性回归方程,得
3b^ +a^ =17,
b^ =1,
8b^ +a^ =22, 解得a^ =14.
所以线性回归方程是y^ =x+14.
令x+14=38,可得x=24,即当x=24时,y的估计值是38.
12/9/2021
12345
第三十二页,共三十五页。
No 于x的线性回归方程。(1)画散点图.根据已知数据画出散点图.。(2)判断变量的相关性并求回归方程.通过观察散点图,直观
感知两个变量是否具有相关关系。饮食指数高于70的人,饮食以肉类为主).
Image
12/9/2021
第三十五页,共三十五页。
y1
y2
x1
a
21
x2
5
c
总计
b
d
则b-d=___8_.
解析 ∵a=70-21=49,c=30-5=25,
∴b=49+5=54,d=21+25=46,
∴b-d=8.
12/9/2021
12345
第三十一页,共三十五页。
总计 70 30 100
解析 答案
5.对于(duìyú)线性回归方程y^=b^ x+a^当,x=3时,对应的y的估计值是17,当x=8时, 对应的y的估计值是22,那么,该线性回归方程是_________,根据y^=线x性+回1归4 方
高中数学第三章统计案例本章整合课件新人教B版选修23
P
0
1
2
27
64
1
27
64
3
E(X)=np=3× 4 = 4,
1
3
9
D(X)=np(1-p)=3× 4 × 4 = 16.
第十七页,共17页。
3
9
64
1
64
关系数r,|r|越接近1,线性相关程度越强;|r|越接近0,线性相关程度越弱.回归直线
(zhíxiàn)方程为
可由公式求出.
^ ^ ^
^^
= a + x,其中 ,
第五页,共17页。
专题
(zhuāntí)
一
专题
(zhuāntí)
二
应用某工业部门进行一项研究,分析该部门的产量与生产费用之间的
式(gōngshì)求出相关系数,进行判断.
第六页,共17页。
专题
(zhuānt
í)一
专题
(zhuāntí)
二
序号
1
2
3
4
5
6
7
8
9
10
合计
x
40
42
48
55
65
79
88
100
120
140
777
解:(1)制表(zhì biǎo)如下:
x=
777
10
=77.7;y =
y
150
140
160
170
150
162
185
165
190
185
1 657
x2
1 600
1 764
2 304
3 025
4 225
高中数学第三章统计案例章末整合提升省公开课一等奖新名师优质课获奖PPT课件
(2)由题中数据可得 y =23.25.
由①^y=0.6x-1 求得数据如下:
^yi yi-^yi yi- y
12.8 15.2 22.4 23.6 26 28.4 29 30.8 -3.3 2.6 -1.2 2.3 1.5 -2.1 -0.8 -1.2 -13.75 -5.45 -2.05 2.65 4.25 3.05 4.95 6.35
23/60
• 典例 4 (·安徽涡阳四中月考)北京某高中举行了一次“ 喜迎五中全会”读书读报知识竞赛,参赛选手为从高一年 级和高二年级随机抽取各100名学生.图1和图2分别是高 一年级和高二年级参赛选手成绩频率分布直方图.
24/60
• (1)分别计算参加这次知识竞赛两个年级学生平均成绩;
• (2)若称成绩在68分以上学生知识渊博,试以上述数据预 计该高一、高二两个年级学生知识渊博率;
27/60
(3)补全 2×2 列联表,如下:
成绩低于 60 分人数 成绩不低于 60 分人数 总计
高一年级
80
20
100
高二年级
40
60
100
总计
120
80
200
根据表中数据得 K2 的观测值
k=20100×0×801×006×0-12200××84002≈33.33>6.635,
故在犯错误的概率不超过 0.010 的前提下,认为高一、高二两个年级学生这
(1)对变量 y 与 x 进行相关性检验; (2)如果 y 与 x 之间具有线性相关关系,求线性回归方程; (3)如果父亲的身高为 73 英寸,估计儿子的身高为多少.
• [分析] 对两变量进行相关性检验,首先利用公式求出r, 然后比较|r|与0.75大小关系,明确线性相关关系强弱,确 定回归模型,求出回归方程,再依据父亲身高预报儿子身 高.
2019_2020学年高中数学第3章统计案例章末复习课课件新人教B版
5
5
x2i =5 101.56,y2i =9 511.43.
i=1
i=1
x y =1 320.66, y 2=1 892.25, x 2=921.729 6,
5
xiyi=6 746.76.
i=1
5
xiyi-5 x y
由b^=i=1
≈0.29,
5
x2i -5 x 2
i=1
a^= y -b^ x =43.5-0.29×30.36≈34.70.
故所求的线性回归方程为^y=34.70+0.29x. 当 x=56.7 时,^y=34.70+0.29×56.7=51.143. 估计成熟期有效穗约为 51.143.
独立性检验 独立性检验的基本思想类似于反证法,要确认两个分类变量有关系这 一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类 变量没有关系”成立,在该假设下,我们构造的随机变量 χ2 应该很小,如 果由观测数据计算得到的 χ2 的观测值很大,则在一定程度上说明假设不合 理,根据随机变量 χ2 的含义,可以通过 P(χ2>6.635)≈0.01 来评价假设不 合理的程度,由实际计算出 χ2>6.635 说明假设不合理的程度约为 99%,即 两个分类变量有关系这一结论成立的可信程度为 99%.
成绩优秀与物理、化学、总分也优秀哪个关系较大?
物理优秀
化学优秀
总分优秀
数学优秀
228
225
267
数学非优秀
143
156
99
注:该年级此次考试中数学成绩优秀的有 360 人,非优秀的有 880 人.
【精彩点拨】 分别列出数学与物理,数学与化学,数学与总分优秀
2018年春人教A版高中数学必修三课件:模块复习课2 统计(共64张PPT)
画 法
优 缺 点
自主梳理 知识网络 要点梳理
专题整合
5.关于样本的数字特征,请填写下表:
数字特征 定 众数 义 特 点 体现了样本数据的最大 集中点,不受极端值的影 响,而且不唯一 中位数不受极端值的影 响,仅利用了排在中间数 据的信息
在一组数据中出现次数 最多的数据 将一组数据按照大小顺序 依次排列,处在最中间位置 的一个数据(或最中间两个 数据的平均数)
自主梳理 知识网络 要点梳理
专题整合
数字 特征
定
义
特 点 反映了各个样本数据聚集 于样本平均数周围的程度. 标准差越小,表明各个样本 数据在样本平均数周围越 集中;标准差越大,表明各个 样本数据在样本平均数的 两边越分散 在刻画样本数据的分散程 度上,方差与标准差是一样 的.但在解决实际问题时,一 般多采用标准差
标准 差
样本数据到平均数的一种平 均距离,即 s=
1 [(x1 -x)2 + (x2 -x)2 + „ + (xn -x)2 ] n
方差
标准差的平方,即 s2= 1 2 2 2 [( x 1-x) +(x2-x) +„+(xn-x) ] n
自主梳理 知识网络 要点梳理
专题整合
6.什么是散点图?什么是正相关与负相关? 提示将样本中几个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系 中得到的图形.若散点图中的点散布在从左下角到右上角的区域, 则称这两个变量间的相关关系为正相关.若散点图中的点分布在从 左上角到右下角的区域内,则称这两个变量间的相关关系为负相关.
第2课时
统计
-1-
自主梳理 知识网络 要点梳理
专题整合
高中数学第三章统计案例章末复习课件a选修23a高二选修23数学课件
P(K2≥k0) 0.15 0.10 0.05 0.025 0.010 0.005 0.001
k0
2.072 2.706 3.841 5.024 6.635 7.879 10.828
独立性检验统计量 K2=a+bcn+add-ab+cc2b+d,其中 n=a+b+c+d.
12/9/2021
第二十二页,共三十八页。
列联表:
服用 未服用 总计
感染 10 20 30
未感染 40 30 70
总计 50 50 100
12/9/2021
12345
第三十四页,共三十八页。
附表:
P(K2≥k0) k0
0.10 2.706
0.05 3.841
0.025 5.024
参照附表,在犯错误的概率不超过_____(填5百%分比)的前提下,认为“小鼠是否被感
a
+
^
b
t
中
斜
率
和
截
距
的
最
小
二
乘
估
计
公
式
分
别
为
:
^
b
=
n
ti- t yi- y
i=1
,a^ = y -b^ t .
n
ti- t 2
i=1
12/9/2021
第十二页,共三十八页。
解答
反思与感悟 解决回归分析(fēnxī)问题的一般步骤
(1)画散点图.根据已知数据画出散点图. (2)判断变量的相关性并求回归方程.通过观察散点图,直观感知两个变量是否具有 相关关系;在此基础上,利用最小二乘法求回归系数,然后写出回归方程. (3)回归分析.画残差图或计算R2,进行残差分析. (4)实际应用.依据求得的回归方程解决实际问题.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
再从中选4人作为新纳税法知识宣讲员,用a表示抽到作为宣讲员的收
入在 3000,5000 元的人数,b抽到作为宣讲员的收入在 5000,7000 元的人数,
随机变量 Z a b ,求Z的分布列与数学期望;
①由频数分布表可知从[3000,5000)及[5000,7000)的人群中抽 取7人,其中[3000,5000)中占3人,[5000,7000)的人中占4人, 再从这7人中选4人,所以Z的取值可能为0,2,4
(i)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为 X , 求 EX ;
思路一: 发现不合格品数量服从二项分布
思路二: 直接以检验费用和赔偿费用的和为随机变量
令Y 表示余下的 180 件产品中的不合格品件 数,依题意知Y : B(180,0.1) ,
X 202 25Y ,即 X 40 25Y .
(1)记 20 件产品中恰有 2 件不合格品的概率为 f p ,求 f p 的最大值点 p0 ;
(2)现对一箱产品检验了 20 件,结果恰有 2 件不合格品,以(1)中确定的 p0 作为 p 的值.已知每件产品的检验费用为 2 元,若有不合格品进入用户手中,则工厂要对每 件不合格品支付 25 元的赔偿费用. (i)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为 X , 求 EX ; (ii)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品 作检验?
(2)某企业统计2018年其充电站100天中各天充电车辆数,得如下的频数分布表:
辆数
天数
20
30
40
10
(同一组数据用该区间的中点值作代表) 2018年1月,国家出台政策,将纯电动汽车财政补贴逐步转移到充电基础设施建设上 来.该企业拟将转移补贴资金用于添置新型充电设备.现有直流、交流两种充电桩可供 购置.直流充电桩5万元/台,每台每天最多可以充电30辆车,每天维护费用500元/台; 交流充电桩1万元/台,每台每天最多可以充电4辆车,每天维护费用80元/台. 该企业现有两种购置方案: 方案一:购买100台直流充电桩和900台交流充电桩; 方案二:购买200台直流充电桩和400台交流充电桩. 假设车辆充电时优先使用新设备,且充电一辆车产生25元的收入, 用2018年的统计数据,分别估计该企业在两种方案下新设备产生的日利润. (日利润日收入日维护费用).
,
,
②小江该月的工资、薪金等税前收入为7500元时,请你帮小江算 一下调整后小江的实际收入比调整前增加了多少?
例2、我市大力推广纯电动汽车,对购买用户依照车辆出厂续驶里程R 的行业标准,予以地方财政补贴.其补贴标准如下表:
2018年底随机调査该市1000辆纯电动汽车,统计其出厂续驶里程, 得到频率分布直方图如上图所示.用样本估计总体,频率估计概率, 解决如下问题: (1)求该市每辆纯电动汽车20187年地方财政补贴的均值;
二、通过本节课的学习,我们发现“概率”问题不再 “纯粹”,更多是“统计”背景下的“概率”问题。 这类问题一般将统计与概率相结合,既考查频率分布 直方图或茎叶图或表格等,又考查统计情境下的概率 问题。这就需要同学们能够完善自己的知识结构,对 边缘知识复习要到位,在解题过程中训练自己的阅读 能力,建模能力。
样例展示
再探真题
再探真题
(2018年全国I卷) 某工厂的某种产品成箱包装,每箱 200 件,每一箱产品在交付用户 之前要对产品作检验,如检验出不合格品,则更换为合格品,检验时,先从这箱产品 中任取 20 件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产
品为不合格品的概率都为 p0 p 1 ,且各件产品是否为不合格品相互独立.
THANK YOU
第二部分 典题研析
统计案例
随着经济的发展,个人收入的提高,自2019年1月1日起, 个人所得税起征点和税率的调整,调整如下:纳税人的工资、 薪金所得,以每月全部收入额减除5000元后的余额为应纳税 所得额,依照个人所得税税率表,调整前后的计算方法如下 表:
(1)假如小江某月的工资、薪金等所得税前收入总和不高于8000 元,记 Y表示总收入,X表示应纳的税,试写出调整前后Y关于X 的函数表达式;
(Ⅱ)按高考改革方案,若从全省考生中随机抽取3人,记X表示这 3人中等级成绩在区间[61,80]的人数,求X的分布列和数学期望.
课后思考题:
总结提升:
一、试题类型总结: ---- 古典概型和几何概型的概率计算;
随机变量的分布列和期望值的计算; 以频率分布估计概率分布、 用样本的基本数字 特征估计总体的基本数字特征的相关计算问题. 用统计思想和统计方法解决简单的实际问题.
高三复习微专题 ——概率统计
福州外国语学校高三年段 陈念研
第一部分 真题考点再现
统计概率与实际问题
18年真题考点再现
卷别 题号 分值
考点
Ⅰ 卷
理
3、10 20
22
饼图、数学文化、几何概型、 概率、最值、期望、决策问题
Ⅱ 卷
理
8、18
17
Ⅲ 卷
理
8、18
17
数学文化、古典概型 同文18
二项分布的概率与方差 茎叶图、独立性检验
0, x 3500
(1)调整前y关于x的表达式为 y x 3500 0.03, x 3500,5000 45 x 5000 0.1, x 5000,8000
调整后y关于x的表达式为
y
0, x 5000
x 5000
0.03,
x
5000,8000
(2)税务部门在小江所在公司利用分层抽样方法抽取某月100个不同层 次员工的税前收入,并制成下面的频数分布表:
(ii)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有 产品作检验?
统计概率解答题考点分布统计
全国I卷
2017
2016
2018
统计概率解答题考点分布统计
全国II卷
2017
2016
第19题 分段函数模型在实际中的应用 样本均值、决策问题
2ቤተ መጻሕፍቲ ባይዱ18
第19题 频数分布表、 样本的数字特征(平均数)
例3 《山东省高考改革试点方案》规定:从2017年秋季高中入学的新生开
始,不分文理科;2020年开始,高考总成绩由语数外3门统考科目和物理、 化学等六门选考科目构成.将每门选考科目的考生原始成绩从高到低划分 为A、B+、B、C+、C、D+、D、E共8个等级.参照正态分布原则,确定各 等级人数所占比例分别为3%、7%、16%、24%、24%、16%、7%、3%.选 考科目成绩计入考生总成绩时,将A至E等级内的考生原始成绩,依照等 比例转换法则,分别转换到[91,100]、[81,90]、[71,80]、[61,70]、[51,60]、 [41,50]、[31,40]、[21,30]八个分数区间,得到考生的等级成绩. 某校高一年级共2000人,为给高一学生合理选科提供依据,对六个选考 科目进行测试,其中物理考试原始成绩基本服从正态分布N(60,169). (Ⅰ)求物理原始成绩在区间(47,86)的人数;