高中数学第3章统计案例章末高效整合课件
高中数学 第3章 统计案例章末归纳总结课件 北师大版选修23
数 r≈0.987.
第二十九页,共30页。
(3)由相关系数r≈0.987知,两个变量(biànliàng)有较强的线 性相关程度.
由公式计算可得b≈2.1214,a≈3.5361,故y对x的线性回归 方程为y=3.5361+2.1214x.
当x=9s时,位置y的估计值为 3.5361+2.1214×9=22.6287(cm).
第六页,共30页。
3.线性回归分析是在数学必修3的基础上,进一步认识线 性回归的方法及其可靠性,通过实例,从感性到理性逐层深入 地探求对线性相关程度进行检验的统计量(相关系数),从而建 立线性回归分析的基本(jīběn)算法步骤.
4.通过对典型案例的探究,了解独立性检验(只要求2×2 列联表)的基本(jīběn)思想、方法及初步应用.
第二十四页,共30页。
二、填空题 4.对于两个分类变量X与Y: (1)如果(rúguǒ)χ2>6.635,就约有____________的把握认 为“X与Y有关系”; (2)如果(rúguǒ)χ2>3.841,就约有____________的把握认 为“X与Y有关系”. [答案] (1)99% (2)95%
第十四页,共30页。
(2)设所求的回归直线方程为 y=bx+a.
10
xiyi-10 x y
i=1
由 b=
≈1.267,
10
xi2-10 x 2
i=1
a= y -b x =-30.467.所以所求的回归直线方程为 y= 1.267x-30.467.
(3)当 x=160 时,y=1.267×160-30.647≈172(min). 即大约冶炼 172min.
第十二页,共30页。
[解析] (1)由已知数据列成下列:
(高效整合)高中数学 第3章《统计案例》名师课件 新人教A版选修2-3
•
(1)散点图如图所示.
• 由图(2)x可与知y 的,关x,系可y线以用性线相性关回归.模型来拟合,不妨设回归
模型为∧y=a∧+b∧x.
• 序将号数零据件代个入数 相xi(个应) 公加式工时可y得i(m数in)据表xiyi:
1
10
62
620
2
20
72
• (3)利用所求回归方程求出下列数据:
∧
yi yi-∧yi yi- y
61.833 0.167 -30
68.533 75.233 81.933 88.633
3.467 -0.233 -0.933 -3.633
-20 -17 -11
-7
∧
yi yi-∧yi yi- y
95.333 102.033 108.733 115.433 122.133
-0.333 0.967 -0.733 -3.433 4.867
3
11
16
20
35
10
yi-∧yi2
i=1
∴R2=1-
≈0.987.
10
yi- y 2
i=1
(4)∵∧ei=yi-∧yi,利用上表中数据作出残差图,如图所示.
(5)由散点图可以看出 x 与 y 有很强的线性相关性,由 R2 的值可以看出回归效果很好.
由题意知,对于给定的公式 y=Aebx(b<0)两边 取自然对数,得 ln y=ln A+bx.
与线性回归方程相对照可以看出,只要取 u=1x,v=ln y, a=ln A,就有 v=a+bu.
这就变为 v 对 u 的线性回归直线方程,求回归系数 b 和 a. 题目中所给的数据由变量置换 u=1x,v=ln y,变为如下所示的 数据,
2020_2021学年高中数学第3章统计案例章末归纳整合课件新人教A版选修2_32021031711
3.(2020年新课标Ⅱ)某沙漠地区经过治理,生态系统得到 很大改善,野生动物数量有所增加,为调查该地区某种野生动 物的数量,将其分为面积相近的200个地块,从这些地块中用 简单随机抽样的方法抽取20个作为样区,调查得到样本数据 (xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物 覆盖面积(单位:公顷)和这种野生动物的数量,并计算得
解:将问题中的数据写成 2×2 列联表:
组 别 患 病 不患病 合 计
使用
5
100
105
不使用
18
400
418
合计
23
500
523
将上述数据代入公式 K2=a+bcn+add-ab+cc2b+d中,计
算可得 K2≈0.041 45.而查表可知 P(K2≥0.445)≈0.5.故没有充分
理由认为该保健药品对预防 A 疾病有效.
其回归直线方程为^y=b^x+a^.已知
10
10
xi=225,yi=1
600,b^=4.
i=1
i=1
该班某学生的脚长为 24,据此估计其身高为( ) A.160 B.163 C.166 D.170
【答案】C
【解析】 x =110i1=01xi=22.5,-y =110i1=01yi=160,所以a^=160-
n
xi- x 2
n
x2i -n x 2
i=1
i=1
=1ni=n1xi, y =1ni=n1yi)即可.
1.为了研究某种细菌随时间x变化繁殖个数y的变化,收 集数据如下:
(1)用时间作解释变量,繁殖个数作预报变量作出这些数据 的散点图;
(2)求y与x之间的回归方程; (3)计算残差,相关指数R2,并描述解释变量与预报变量之 间的关系.
高中数学 第三章 统计案例章末归纳总结课件 北师大版选修2-3
即时训练
一、选择题 1.一位母亲记录了儿子 3~9 岁的身高,数据(略),由此 建立的身高与年龄的回归模型为^y=7.19x+73.93,用这个模型 预测这个孩子 10 岁时的身高,则正确的叙述是( ) A.身高一定是 145.83cm B.身高在 145.83cm 以上 C.身高在 145.83 左右 D.身高在 145.83cm 以下
(2) 没 有 充 分 的 证 据 显 示 是 否 喜 欢 韩 剧 和 性 别 有 关 , 则 χ2≤2.706,
由 χ2=32x56x×x3x-x 6x×6x2=38x≤2.706,解得 x≤7.216, x·2·2·x
∵2x、6x为整数,∴若没有充分的证据显示是否喜欢韩剧和 性别有关,则男生至多有 6 人.
[解析] (1)列出下表,并用科学计算器进行有关计算:
i1 2 3
4
5
6
78
xi 70 74 80 78 85 92 90 95 yi 5.1 6.0 6.8 7.8 9.0 10.2 10.0 12.0 xiyi 357 444 544 608.4 765 938.4 900 1 140 i 9 10 11 12 13 14 15
4.通过对典型案例的探究,了解独立性检验(只要求2×2 列联表)的基本思想、方法及初步应用.
知识结构
专题研究
回归分析
蔬菜之乡山东寿光的某块菜地每单位面积菜地 年平均使用氮肥量 x kg 与每单位面积蔬菜 年平均产量 y t 之间 的关系有如下数据:
年份 1985 1986 1987 1988 1989 1990 1991 1992 x(kg) 70 74 80 78 85 92 90 95 y(t) 5.1 6.0 6.8 7.8 9.0 10.2 10.0 12.0 年份 1993 1994 1995 1996 1997 1998 1999 x(kg) 92 108 115 123 130 138 145 y(t) 11.5 11.0 11.8 12.2 12.5 12.8 13.0
高中数学第3章统计案例章末复习课讲义新人教B版选修231016448
高中数学第3章统计案例章末复习课讲义新人教B 版选修231016448[自我校对] ①回归分析 ②相互独立事件的概率 ③χ2公式 ④判断两变量的线性相关回归分析问题建立回归模型的步骤(1)确定研究对象,明确变量x ,y .(2)画出变量的散点图,观察它们之间的关系(如是否存在线性相关关系等). (3)由经验确定回归方程的类型(如我们观察到数据呈线性相关关系,则选用回归直线方程y ^=b ^x +a ^).(4)按一定规则估计回归方程中的参数(如最小二乘法). (5)得出回归方程.另外,回归直线方程只适用于我们所研究的样本的总体,而且一般都有时间性.样本的取值范围一般不能超过回归直线方程的适用范围,否则没有实用价值.【例1】 假设一个人从出生到死亡,在每个生日那天都测量身高,并作出这些数据散点图,则这些点将不会落在一条直线上,但在一段时间内的增长数据有时可以用线性回归来分析.下表是一位母亲给儿子作的成长记录: 年龄/周岁3456789身高/cm90.897.6104.2110.9115.7122.0128.5年龄/周岁10111213141516 身高/cm134.2140.8147.6154.2160.9167.6173.0(2)求出这些数据的线性回归方程;(3)对于这个例子,你如何解释回归系数的含义?(4)解释一下回归系数与每年平均增长的身高之间的联系.【精彩点拨】(1)作出散点图,确定两个变量是否线性相关;(2)求出a,b,写出线性回归方程;(3)回归系数即b的值,是一个单位变化量;(4)根据线性回归方程可找出其规律.【解】(1)数据的散点图如下:(2)用y表示身高,x表示年龄,因为x-=114×(3+4+5+…+16)=9.5,y-=114×(90.8+97.6+…+173.0)=132,b^=∑i=114x i y i-14x-y-∑i=114x2i-14x-2≈18 993-14×9.5×1321 491-14×9.52≈6.316,a^=y--b x-=71.998,所以数据的线性回归方程为y=6.316x+71.998.(3)在该例中,回归系数6.316表示该人在一年中增加的高度.(4)回归系数与每年平均增长的身高之间近似相等.1.假定小麦基本苗数x与成熟期有效穗Y之间存在相关关系,今测得5组数据如下:x 15.025.830.036.644.4Y 39.442.942.943.149.2(1)(2)求Y与x之间的回归方程,对于基本苗数56.7预报有效穗.【解】(1)散点图如下.(2)由图看出,样本点呈条状分布,有比较好的线性相关关系,因此可以用回归方程刻画它们之间的关系.设回归方程为y^=b^x+a^,x=30.36,y=43.5,∑i=15x2i=5 101.56,∑i=15y2i=9 511.43.x y=1 320.66,y2=1 892.25,x2=921.729 6,∑i=15x i y i=6 746.76.由b^=∑i=15x i y i-5x y∑i=15x2i-5x2≈0.29,a^=y-b^x=43.5-0.29×30.36≈34.70.故所求的线性回归方程为y^=34.70+0.29x.当x=56.7时,y^=34.70+0.29×56.7=51.143.估计成熟期有效穗约为51.143.独立性检验独立性检验的基本思想类似于反证法,要确认两个分类变量有关系这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下,我们构造的随机变量χ2应该很小,如果由观测数据计算得到的χ2的观测值很大,则在一定程度上说明假设不合理,根据随机变量χ2的含义,可以通过P (χ2>6.635)≈0.01来评价假设不合理的程度,由实际计算出χ2>6.635说明假设不合理的程度约为99%,即两个分类变量有关系这一结论成立的可信程度为99%.独立性检验的一般步骤:(1)根据样本数据制成2×2列联表.(2)根据公式χ2=n (n 11n 22-n 12n 21)2n 1+n 2+n +1n +2计算χ2的值.(3)比较χ2与临界值的大小关系并作统计推断.【例2】 在某校高三年级一次全年级的大型考试中数学成绩优秀和非优秀的学生中,物理、化学、总分也为优秀的人数如下表所示,则数学成绩优秀与物理、化学、总分也优秀哪个关系较大?物理优秀 化学优秀 总分优秀 数学优秀 228 225 267 数学非优秀14315699【精彩点拨】 分别列出数学与物理,数学与化学,数学与总分优秀的2×2列联表,求k 的值.由观测值分析,得出结论.【解】 (1)列出数学与物理优秀的2×2列联表如下:物理优秀 物理非优秀合计 数学优秀 228 132 360 数学非优秀 143 737 880 合计3718691 240n 11=122122n 1+=360,n 2+=880,n +1=371,n +2=869,n =1 240. 代入公式χ2=n (n 11n 22-n 12n 21)2(n 1+n 2+n +1n +2),得χ21=1 240×(228×737-132×143)2360×869×371×880≈270.114 3.(2)列出数学与化学优秀的2×2列联表如下:化学优秀 化学非优秀合计 数学优秀 225 135 360 数学非优秀 156 724 880 合计3818591 240n 11n 12n 21n 22n 1+=360,n 2+=880,n +1=381,n +2=859,n =1 240.代入公式,得χ22=1 240×(225×724-135×156)2360×880×381×859≈240.611 2.(3)列出数学与总分优秀的2×2列联表如下:总分优秀 总分非优秀合计 数学优秀 267 93 360 数学非优秀 99 781 880 合计3668741 240n 11122122n 1+=360,n 2+=880,n +1=366,n +2=874,n =1 240.代入公式,得χ23=1 240×(267×781-93×99)2360×880×366×874≈486.122 5.由上面计算可知数学成绩优秀与物理、化学、总分优秀都有关系,由计算分别得到χ2的统计量都大于临界值6.635,由此说明有99%的把握认为数学优秀与物理、化学、总分优秀都有关系,但与总分优秀关系最大,与物理次之.2.某推销商为某保健药品做广告,在广告中宣传:“在服用该药品的105人中有100人未患A 疾病”.经调查发现,在不服用该药品的418人中仅有18人患A 疾病.请用所学知识分析该药品对预防A 疾病是否有效.【解】 将问题中的数据写成如下2×2列联表:患A 疾病不患A 疾病合计 服用该药品 5 100 105 不服用该药品18 400 418 合计23500523将上述数据代入公式χ2=11221221n 1+n 2+n +1n +2中,计算可得χ2≈0.041 4,因为0.041 4<3.841,故没有充分理由认为该保健药品对预防A 疾病有效.转化与化归思想在回归分析中的应用回归分析是对抽取的样本进行分析,确定两个变量的相关关系,并用一个变量的变化去推测另一个变量的变化.如果两个变量非线性相关,我们可以通过对变量进行变换,转化为线性相关问题.【例3】 某商店各个时期的商品流通率Y (%)与对应商品零售额x (万元)资料如下:x 9.5 11.5 13.5 15.5 17.5 y64.643.22.8x 19.5 21.5 23.5 25.5 27.5 y2.52.42.32.22.1率Y 决定于商品的零售额x ,体现着经营规模效益,假定它们之间存在关系式:y =a +b x.试根据上表数据,求出a 与b 的估计值,并估计商品零售额为30万元时的商品流通率.【解】 设u =1x,则y =a +bu ,得下表数据:u 0.105 3 0.087 0 0.074 1 0.064 5 0.057 1 y64.64 3.22.8u 0.051 3 0.046 5 0.042 6 0.039 2 0.036 4 y2.52.42.32.22.1y ^=-0.187 5+56.25 u .所以所求的回归方程为y ^=-0.187 5+56.25x.当x =30时,y =1.687 5,即商品零售额为30万元时,商品流通率为1.687 5%.3.在某化学实验中,测得如下表所示的6对数据,其中x (单位:min)表示化学反应进行的时间,Y (单位:mg)表示未转化物质的质量.x /min 1 2 3 4 5 6Y /mg 39.8 32.225.4 20.3 16.2 13.3x(2)估计化学反应进行到10 min 时未转化物质的质量(精确到0.1).【解】 (1)在y =cd x两边取自然对数,令ln y =z ,ln c =a ,ln d =b ,则z =a +bx .由已知数据,得x i 1 2 3 4 5 6y i 39.832.225.420.316.213.3z i3.684 3.472 3.235 3.011 2.785 2.588由公式得a ≈3.905 5,b ≈-0.221 9,则线性回归方程为z =3.905 5-0.221 9x .而ln c =3.905 5,ln d =-0.221 9,故c ≈49.675,d ≈0.801,所以c ,d 的估计值分别为49.675,0.801. (2)当x =10时,由(1)所得公式可得y ≈5.4(mg).1.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x (万元) 8.2 8.6 10.0 11.3 11.9 支出y (万元)6.27.58.08.59.8根据上表可得回归直线方程y =b x +a ,其中b =0.76,a =y -b x .据此估计,该社区一户年收入为15万元家庭的年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元【解析】 由题意知,x =8.2+8.6+10.0+11.3+11.95=10,y =6.2+7.5+8.0+8.5+9.85=8,∴a ^=8-0.76×10=0.4,∴当x =15时,y ^=0.76×15+0.4=11.8(万元). 【答案】 B2.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )A .成绩B .视力C .智商D .阅读量【解析】 A 中,a =6,b =14,c =10,d =22,a +b =20,c +d =32,a +c =16,b +d =36,n =52,χ2=52×(6×22-14×10)220×32×16×36=131 440.B 中,a =4,b =16,c =12,d =20,a +b =20,c +d =32,a +c =16,b +d =36,n =52, χ2=52×(4×20-16×12)220×32×16×36=637360.C 中,a =8,b =12,c =8,d =24,a +b =20,c +d =32,a +c =16,b +d =36,n =52, χ2=52×(8×24-12×8)220×32×16×36=1310.D 中,a =14,b =6,c =2,d =30,a +b =20,c +d =32,a +c =16,b +d =36,n =52, χ2=52×(14×30-6×2)220×32×16×36=3 757160.∵131 440<1310<637360<3 757160, ∴与性别有关联的可能性最大的变量是阅读量. 【答案】 D3.如图是我国2011年至2017年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2019年我国生活垃圾无害化处理量.附注:参考数据:∑7i =1y i =9.32,∑7i =1t i y i =40.17,∑7i =1(y i -y )2=0.55,7≈2.646.参考公式:相关系数r =∑ni =1 (t i -t )(y i -y )∑ni =1 (t i -t )2∑ni =1(y i -y )2,回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为b ^=∑ni =1(t i -t )(y i -y )∑ni =1(t i -t )2,a ^=y --b ^t .【解】 (1)由折线图中的数据和附注中的参考数据得t =4, ∑7i =1(t i -t )2=28,∑7i =1 (y i -y )2=0.55,∑7i =1(t i -t )(y i -y )=∑7i =1t i y i -t ∑7i =1y i =40.17-4×9.32=2.89,∴r ≈ 2.890.55×2×2.646≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当大,从而可以用线性回归模型拟合y 与t 的关系.(2)由y =9.327≈1.331及(1)得b ^=∑7i =1(t i -t )(y i -y )∑7i =1(t i -t )2=2.8928≈0.103. a ^=y -b ^t ≈1.331-0.103×4≈0.92.所以y 关于t 的回归方程为y ^=0.92+0.10t .将2019年对应的t =9代入回归方程得y ^=0.92+0.10×9=1.82. 所以预测2019年我国生活垃圾无害化处理量约为1.82亿吨.4.某地区2011年至2017年农村居民家庭人均纯收入y (单位:千元)的数据如下表:(2)利用(1)中的回归方程,分析2011年至2017年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2019年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘法估计公式分别为:b ^=∑ni =1(t i -t )(y i -y -)∑ni =1(t i -t )2,a ^=y --b ^t .【解】 (1)由所给数据计算得t =17(1+2+3+4+5+6+7)=4,y -=17(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,∑7i =1(t i -t )2=9+4+1+0+1+4+9=28,∑7i =1(t i -t )(y i -y -)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,b ^=∑7i =1(t i -t )(y i -y -)∑7i =1(t i -t )2=1428=0.5, a ^=y --b ^t =4.3-0.5×4=2.3,所求回归方程为y ^=0.5t +2.3.(2)由(1)知,b ^=0.5>0,故2011年至2017年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2019年的年份代号t =9代入(1)中的回归方程,得y^=0.5×9+2.3=6.8,故预测该地区2019年农村居民家庭人均纯收入为6.8千元.- 1 -。
2019_2018学年高中数学第三章统计案例本章整合课件新人教A版选修
公式应用
专题一 专题二
专题一 回归分析的基本思想及其应用 回归分析是对具有相关关系的两个变量进行统计分析的一种常 用方法,其步骤是先画出两个变量的散点图,然后利用常见的函数 模型去拟合样本点,拟合的效果如何常借助于R2去分析(或利用残 差图去分析).
专题一 专题二
123
附注:
7
7
参考数据: ∑ yi=9.32, ∑ tiyi=40.17,
7
∑
(������������
-������)2
=0.55,
7 ≈2.646.
������=1
i=1
������=1
������
参考公式:相关系数 r= ������=∑1(������������-������)(������������-������) ,
应用2为研究质量x(单位:g)对弹簧长度y(单位:cm)的影响,对不同 质量的6个物体进行测量,数据如表所示:
x/g 5
10 15 20 25 30
y/cm 7.25 8.12 8.95 9.90 10.9 11.8
(1)作出散点图并求回归直线方程; (2)求出R2并说明回归模型拟合的程度; (3)进行残差分析. 提示:本题考查残差分析,一般从以下几方面予以说明: (1)散点图;(2)相关系数;(3)R2;(4)残差图中的异常点和样本点的带 状分布区域的宽窄.
123
解析:由题中柱形图知,2019年以来我国二氧化硫年排放量呈减少 趋势,故其排放量与年份负相关,故D错误. 答案:D
123
2.(2019·课标全国Ⅰ高考)某公司为确定下一年度投入某种产品的
宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润 z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8) 数据作了初步处理,得到下面的散点图及一些统计量的值.
高中数学第三章统计案例章末整合提升省公开课一等奖新名师优质课获奖PPT课件
(2)由题中数据可得 y =23.25.
由①^y=0.6x-1 求得数据如下:
^yi yi-^yi yi- y
12.8 15.2 22.4 23.6 26 28.4 29 30.8 -3.3 2.6 -1.2 2.3 1.5 -2.1 -0.8 -1.2 -13.75 -5.45 -2.05 2.65 4.25 3.05 4.95 6.35
23/60
• 典例 4 (·安徽涡阳四中月考)北京某高中举行了一次“ 喜迎五中全会”读书读报知识竞赛,参赛选手为从高一年 级和高二年级随机抽取各100名学生.图1和图2分别是高 一年级和高二年级参赛选手成绩频率分布直方图.
24/60
• (1)分别计算参加这次知识竞赛两个年级学生平均成绩;
• (2)若称成绩在68分以上学生知识渊博,试以上述数据预 计该高一、高二两个年级学生知识渊博率;
27/60
(3)补全 2×2 列联表,如下:
成绩低于 60 分人数 成绩不低于 60 分人数 总计
高一年级
80
20
100
高二年级
40
60
100
总计
120
80
200
根据表中数据得 K2 的观测值
k=20100×0×801×006×0-12200××84002≈33.33>6.635,
故在犯错误的概率不超过 0.010 的前提下,认为高一、高二两个年级学生这
(1)对变量 y 与 x 进行相关性检验; (2)如果 y 与 x 之间具有线性相关关系,求线性回归方程; (3)如果父亲的身高为 73 英寸,估计儿子的身高为多少.
• [分析] 对两变量进行相关性检验,首先利用公式求出r, 然后比较|r|与0.75大小关系,明确线性相关关系强弱,确 定回归模型,求出回归方程,再依据父亲身高预报儿子身 高.
高中数学第三章统计案例章末整合课件a选修23a高二选修23数学课件
(3)令 x=5,则^y=16+3.6=19.6, 故估计 2015 年该城市人口总数为 19.6(十万).
第八页,共三十页。
解决回归分析问题的一般步骤 (1)画散点图.根据已知数据画出散点图. (2)判断变量的相关性并求回归方程.通过观察散点图,直观 感知两个变量是否具有相关关系;在此基础上,利用最小二乘法 求回归系数,然后写出回归方程. (3)回归分析.画残差图或计算 R2,进行残差分析. (4)实际应用.依据求得的回归方程解决问题.
第十一页,共三十页。
[解] (1)散点图如图所示:
第十二页,共三十页。
(2)由表中数据得 x =3.5, y =3.5,
4
4
(xi- x )(yi- y )=3.5, (xi- x )2=5,
i=1
i=1
由公式计算得b^=0.7,a^= y -b^ x =1.05,所以所求线性回归 方程为^y=0.7x+1.05.
第十五页,共三十页。
某学生对其亲属 30 人的饮食习惯进行了一次调查,并 用茎叶图表示 30 人的饮食指数,如图所示.(说明:图中饮食指 数低于 70 的人,饮食以蔬菜为主;饮食指数高于 70 的人,饮食 为肉类为主.)
第十六页,共三十页。
(1)根据茎叶图,帮助这位同学说明其亲属 30 人的饮食习惯.
(2)2×2 列联表如表所示:
主食蔬菜 主食肉类 总计
50 岁下
4
8
12
50 岁以上
16
2
18
总计
20
10
30
第十八页,共三十页。
(3)随机变量 K2 的观测值 k=123×0×188×-2102×8120= 1230××1182×0× 201×2010=10>6.635, 故在犯错误的概率不超过 0.01 的前提下认为“其亲属的饮 食习惯与年龄有关”.
2019_2020学年高中数学第3章统计案例章末复习提升课课件新人教B版选修2_3
本部分内容讲解结束
按ESC键退出全屏播放
(1)画出散点图; (2)计算入学数学成绩(x)与高一期末数学考试成绩(Y)的相关系 数; (3)对变量 x 与 Y 进行相关性检验,如果 x 与 Y 之间具有线性相 关关系,求出回归直线方程; (4)若某学生入学数学成绩为 80 分,试估计他高一期末数学考 试成绩.
【解】 (1)画出入学成绩(x)与高一期末考试成绩(Y)两组变量 的散点图,如图,从散点图看,这两组变量具有线性相关关系.
独立性检验 一般地,对于两个分类变量Ⅰ和Ⅱ,Ⅰ有两类取值:A 和 A,
Ⅱ也有两类取值:B 和 B,我们得到下表中的抽样数据,这个
表格称为 2×2 列联表.
B
-B
合计
A
n11
-A
n21
合计
n+1
n12
n1+
n22
n2+
n+2
n
表中:n+1=n11+n21,n+2=n12+n22,n1+=n11+n12,n2+=n21 +n22,n=n11+n21+n12+n22. (1)如果 χ2>6.635,就有 99%的把握认为“X 与 Y 有关系”; (2)如果 χ2>3.841,就有 95%的把握认为“X 与 Y 有关系”; (3)如果 χ2≤3.841,则认为“X 与 Y 无关”.
3.若回归直线方程为^y=0.5x-0.81,则 x=25 时,y 的估计值 为________. 解析:y 的估计值为 0.5×25-0.81=11.69.
答案:11.69
4.某地震观测站对地下水位的变化和发生地震的情况共进行 了 n=1 700 次观测,列联表如下:
水位
次数
有震 无震 合计
地震
【点评】 在掌握了独立性检验的基本思想后我们一般先计算 出 χ2 的值,然后比较 χ2 值与临界值的大小来较精确地给变量线性相关的常用方法. ①散点图法,该法主要是用来直观地分析两变量间是否存在相 关关系. ②相关系数法,该法主要是从量上分析两个变量间相互联系的 密切程度,|r|越接近于 1,相关程度越大;|r|越接近于 0,相关 程度越小.
高中数学 第三章 统计案例章末归纳提升课件 新人教A版选修23
不干净水得病的有 9 人,不得病的有 22 人.按此样本数据分
析能否在犯错误概率不超过 0.025 的前提下认为这种疾病与
饮用水有关.
新课标 ·数学 选修2-3
【思路点拨】 (1)根据表中的信息计算 K2 的观测值, 并根据临界值表来分析相关性的大小.对于(2),要列出 2×2 列联表,方法同(1).
为了研究色盲与性别的关系,调查了 1 000 人,
数形结合思想
新课标 ·数学 选修2-3
数形结合:一是对含有数和式的问题,借“形”去观察、 探索;二是将“形”的问题转化为数量关系来分析.它是将 抽象思维和形象思维有机结合起来,解决问题的一种方法.
“数缺形时少直观,形缺数时难入微”恰当地应用数形 结合是提高解题速度、优化解题过程的一种重要方法.
新课标 ·数学 选修2-3
【规范解答】 (1)假设 H0:传染病与饮用水无关.把表 中的数据代入公式得
K2 的观测值 k=8301×46×526×842×185-184×663×12942≈54.21. ∵54.21>6.635, 所以在犯错误的概率不超过 0.01 的前提下,认为该地区 这种传染病与饮用水不干净有关.
新课标 ·数学 选修2-3
独立性检验的思想与方法
新课标 ·数学 选修2-3
独立性检验的基本思想类似于数学中的反证法,要确认
“两个分类变量有关系”这一结论成立的可信程度,首先假
设该结论不成立,即假设结论“两个分类变量没有关系”成 立,在该假设下构造的随机变量 K2 应该很小,如果由观测数 据计算得到的 K2 的观测值 k 很大,则在一定程度上说明假设 不 合 理 , 根 据 随 机 变 量 K2 的 含 义 , 可 以 通 过 概 率 P(K2≥6.635)≈0.01 来评价该假设不合理的程度,由实际计 算出的 k>6.635,说明该假设不合理的程度约为 99%,即“两 个分类变量有关系”这一结论成立的可信程度约为 99%.
高中数学 第三章 统计案例章末归纳总结课件 新人教A版选修2-3
78 4489 6084 5226
52 2025 2704 2340
82 7744 6724 7216
92 6561 8464 7452
89 5041 7921 6319
73 2704 5329 3796
98 9801 9604 9702
56 3364 3136 3248
75 5776 5625 5700
∴a^=9.1,∴^y=9.4x+9.1,
∴当 x=6 时,^y=65.5(万元),故选 B.
2.利用独立性检验来考虑两个分类变量 X 和 Y 是否有关
系时,通过查阅下表来确定断言“X 和 Y 有关系”的可信度,
如果 k>5.024,那么就有把握认为“X 和 Y 有关系”的百分比为
() p(K2>k) 0.50 0.40 0.25 0.15 0.10
3.(2014·唐山模拟)对具有线性相关关系的变量 x、y 有一
组观测数据(xi,yi)(i=1,2,…,8),其回归直线方程是:^y=13x
+a,且 x1+x2+x3+…+x8=2(y1+y2+y3+…+y8)=6,则实数 a 的值是( )
A.116
B.18
C.14
D.12
• [答案] B
[解析] 由题意易知:x =34,y =38,代入回归直线方程得: a=18.
报广告费用为 6 万元时销售额为( )
A.63.6 万元
B.65.5 万元
• [答C案.]67.7B万元
D.72.0 万元
[解析] =42,
x =14(4+2+3+5)=3.5, y =14(49+26+39+54)
∵^y=b^x+a^过点( x , y )且b^=9.4,
高中数学 第3章 统计案例章末整合提升(三)课件 a选修23a高二选修23数学课件
第十八页,共二十九页。
解析 分析已知条件,易得如下表格.
男生 女生 总计
近视
80
70 150
不近视 70
70 140
根据列总联计表可得K125,0再与临1界40值比较2,9检0 验这些中学
生眼睛近视是否与性别有关(yǒuguān),故利用独立性检验
的方法最有说服力. 答案 C
12/12/2021
第十九页,共二十九页。
12/12/2021
第二十四页,共二十九页。
5.用两种检验方法对某食品做沙门氏菌(shā mén shìjūn)检 验,结果如下表:
荧光抗体法 常规培养法 附: 总计
阳性 160 26 186
阴性 5 48 53
总计 165 74 239
P(K2≥k0) k0
0.010 6.635
0.005 7.879
第二十三页,共二十九页。
பைடு நூலகம்
由上表中数据计算得 K2 的观测值 k=105×5(5×105×0×303-0×457×5 20)2≈6.109,请估计在 犯错误的概率不超过________的情况下认为文化程度 与月收入有关系. 解析 由于6.109>5.024,所以在犯错误的概率不超过 0.025的前提下认为文化(wénhuà)程度与月收入有关系. 答案 0.025
3.以下五个命题 ①从匀速传递的产品生产流水线上,质检员每 10 分钟从中抽取一件产品进行某项指标检测,这样的抽 样是分层抽样; ②样本方差反映了样本数据与样本平均值的偏 离程度; ③在回归分析模型中,残差平方和越小,说明模 型的拟合效果越好; ④在回归直线方程^y=0.1x+10 中,当解释变量 x 每增加一个单位时,预报变量^y增加 0.1 个单位;
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.相关系数
n
xi- x yi- y
i=1
r=
n
n
xi- x 2· yi- y 2
i=1
i=1
n
xiyi-n x ·y
i=1
=
n
xi2-n x 2·
i=1
n
y2i -n y 2
i=1
|r|值越大,相关性越高,|r|值越接近 0,线性相关程度越低.
二、独立性检验 独立性检验的一般步骤 (1)列出 2×2 列联表; (2)代入公式计算 χ2= a+can+adb-bb+cd2 c+d; (3)根据 χ2 的值的大小作出判断.
x 63 67 45 88 81 71 52 99 58 76 y 65 78 52 82 92 89 73 98 56 75
表中x是学生入学成绩,y是指高一年级期末考试数学成 绩.
(1)画出散点图; (2)求回归直线方程; (3)若某学生王明亮的入学成绩为80分,试预测他在高一年 级期末考试中的数学成绩为多少?
1.某地最近十年粮食需求量逐年上升,下表是部分统计数
据:
年份
2010 2011 2012 2013 2014
需求量(万吨) 236 246 257 276 286
∧
(1)利用所给数据求年需求量与年份之间的回归直线方程 y
=bx+a;
(2)利用(1)中所求出的直线方程预测该地 2016 年的粮食需
求量.
5.在研究两个变量之间的关系时,可以先根据散点图来 粗略地判断它们是否存在线性相关关系,是否可以用线性回归 模型来拟合两个变量的关系,如果可以用线性回归模型来拟合 时,再求出回归直线方程,最后再作残差分析来判断拟合的效 果,并判断原始数据中是否存在可疑数据.
要分析学生初中升学的数学成绩 对高一年级数学学习有什么影响,在高一年级学生中随机抽选 10名学生分析他们入学的数学成绩和高一年级期末数学考试成 绩,如下表所示:
∧
附:若(x1,y1),(x2,y2),…,(xn,yn)为样本点,y=bx+a
为回归直线,则 x = 1ni=n1xi, y = 1ni=n1yi,
n
n
xi- x yi- y xiyi-n x y
i=1
i=1
b=
=
,a= y -b x .
n
xi- x 2
n
x2i -n x 2
i=1
i=1
说明:若对数据作适当的预处理,可避免对大数字进行运 算.
=299.2(万吨)≈300(万吨).
确定线性回归方程的策略
准确确定线性回归方程,有利于进一步加强数学应用意识, 培养运用所学知识解决实际问题的能力,正确地求出线性回归 方程是本节的重点,现介绍求线性回归方程的三种方法.
3.回归直线方程 y=bx+a 过样本点中心( x , y ).
4.在线性回归模型中,随机误差用y预报真实值y的误 差.它是一个不可预测的变量,但可以通过这个随机变量的数 字特征来刻画它的一些总体特征,均值是反映随机变量取值平 均水平的数字特征,方差是反映随机变量集中于均值程度的数 字特征,而随机误差的均值为0,因此可以用方差来衡量随机 误差的大小.
y2 4 225 6 084 2 704 6 724 8 464 7 921 5 329 9 604 3 136 5 625 59 816
xy 4 095 5 226 2 340 7 216 7 452 6 319 3 796 9 702 3 248 5 700 55 094
可求得 x =110×(63+67+…+76)=70, y =110×(65+78+…+75)=76. b=555019447-4-101×0×707×0276≈0.765 56, a=76-0.765 56×70≈22.41, 所求的线性回归直线方程为 y=22.41+0.765 56x. (3)若学生王明亮入学成绩 80 分,代入上面线性回归直线方 程 y=22.41+0.765 56x,可求得 y≈84(分). 答:王明亮同学高一期末数学成绩预测值为 84 分.
解析: (1)由所给数据看出,年需求量与年份之间是近似
直线上升,下面来求回归直线方程.为此对数据预处理如下:
年份-2012
-4
-2 0 2
4
需求量-257 -21 -11 0 19 29
由预处理后的数据,容易算得 x =0, y =3.2,
b=-4×-21+42-+222×+2-2+114+ 2 2×19+4×29
解析: (1)作出散点图如图所示,从散点图可以看出,这 两个变量具有线性相关关系.
(2)列表计算
x
y
63 65
67 78
45 52
88 82
81 92
71 89
52 73
99 98
58 56
76 75
700 760
x2 3 969 4 489 2 025 7 744 6 561 5 041 2 704 9 801 3 364 5 776 51 4本思想及其初步应用
1.函数关系是一种确定关系,而相关关系是一种非确定 关系,函数关系有具体的函数关系式,而相关关系没有一个确 定的关系式,用回归直线来估计相应的量的关系,但这种关系 也不是确切的,也存在着一定的误差.
2.利用散点图来确定两个变量之间是否具有线性相关关系 时,作图要规范,如果样本点呈条形分布,我们就认为具有线 性相关关系,如果有个别的样本点出现异常,而绝大多数的样 本点在这个条形区域内,我们可以不考虑这个别的点,或认为 这几个出现异常的点对我们的结论影响不大.但如果出现异常 的点过多就认为不具有线性相关关系.
知能整合提升
一、回归分析 1.线性回归分析 对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…, (xn,yn),其线性回归直线方程为 y=bx+a,
n
n
xi- x yi- y xiyi-n x ·y
i=1
i=1
其中 b=
=
n
xi- x 2
n
x2i -n x 2
i=1
i=1
a= y -b x
=24600=6.5.
a= y -b x =3.2.
由上述计算结果,知所求回归直线方程为
∧
y-257=b(x-2 012)+a=6.5(x-2 012)+3.2.
∧
即y=6.5(x-2 012)+260.2.
①
(2)利用直线方程①,可预测 2016 年的粮食需求量为
6.5×(2 016-2 012)+260.2=6.5×6+260.2