高二数学选修2-3课件:第三章3.2回归分析
合集下载
高中数学人教B版选修2-3配套课件:3.2回归分析
1.作出散点图可直观地判断两个变量的相关关系: 2.求线性回归方程必须先对两个变量进行相关性判断,若 两个变量不具备相关关系,则求线性回归方程将变得毫无意 义.
某工厂1~8月份某种产品的产量与成本的统计数据如下 表: 月份 产量(吨) 成本(万元) 1 5.6 130 2 6.0 136 3 6.1 143 4 6.4 149 5 7.0 157 6 7.5 172 7 8.0 183 8 8.2 188
●重点、难点 重点:线性回归方程的建立及随机误差的来源. 难点:残差变量的解释与残差分析. 通过例1的讲解使学生进一步理解线性回归方程的建立及随 机误差的产生,学会残差分析、突出重点,化解难点.
课标 解读
1.了解回归分析的基本思想、方法. 2.会用回归分析的思想解决一些简 单的数学问题.(重点、难点)
xi- x yi- y
i=1
n
r=
2 x - x y - y i i 2 i=1 i= 1 n n
xiyi-n x y
i=1
n
=
n 2 2 2 xi -n x y2 - n y i i=1 i= 1
n
(2)r具有以下性质:|r|≤1,并且|r|越接近1,线性相关程 度 越强 ;|r|越接近0,线性相关程度 越弱 .
回归分析
【问题导思】 某电脑公司有5名产品推销员,其工作年限与年推销金额数 据如下表:
推销员编号 工作年限x/年 推销金额y/万元 1 3 2 2 5 3 3 6 3 4 7 4 5 9 5
请问如何表示推销金额y与工作年限x之间的相关关系?y关 于x的线性回归方程是什么?
【提示】
画出散点图,由图可知,样本点散布在一条直
2018学年高中数学人教B版选修2-3课件:3-2 回归分析 精品
【解】 若x增加2个单位,则 ^y=0.18(x+2)+6.34 =0.18x+6.34+0.36, 故^y增加0.36个单位.
非线性回归分析
[探究共研型]
探究1 如何解答非线性回归问题? 【提示】 非线性回归问题有时并不给出经验公式.这时我们可以画出已知 数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图象 作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换, 把问题化为线性回归分析问题,使之得到解决.其一般步骤为:
6
6
x =17.5, y ≈9.49,xiyi=1 076.2,x2i =2 275.
i=1
i=1
6 xiyi-6-x -y
i=1
∴b^=
6 x2i -6-x 2
=1 0726.227-5-6×6×171.57×.529.49≈0.18,
i=1
a^= y -b^ x =9.49-0.18×17.5=6.34, ∴回归直线方程为^y=0.18x+6.34.
(1)y与x具有正的线性相关关系; (2)回归直线过样本点的中心( x , y ); (3)若该大学某女生身高增加1 cm,则其体重约增加0.85 kg; (4)若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg.
【解析】 回归方程中 x 的系数为 0.85>0,因此 y 与 x 具有正的线性相关关 系,A 正确;
x 60 70 80 90 100 110 z 1.81 2.07 2.30 2.50 2.71 2.86 x 120 130 140 150 160 170 z 3.04 3.29 3.44 3.66 3.86 4.01
作出散点图,如下:
由表中数据可求得 z 与 x 之间的回归直线方程为^z=0.693+0.020x, 则有^y=e0.693+0.020x.
非线性回归分析
[探究共研型]
探究1 如何解答非线性回归问题? 【提示】 非线性回归问题有时并不给出经验公式.这时我们可以画出已知 数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图象 作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换, 把问题化为线性回归分析问题,使之得到解决.其一般步骤为:
6
6
x =17.5, y ≈9.49,xiyi=1 076.2,x2i =2 275.
i=1
i=1
6 xiyi-6-x -y
i=1
∴b^=
6 x2i -6-x 2
=1 0726.227-5-6×6×171.57×.529.49≈0.18,
i=1
a^= y -b^ x =9.49-0.18×17.5=6.34, ∴回归直线方程为^y=0.18x+6.34.
(1)y与x具有正的线性相关关系; (2)回归直线过样本点的中心( x , y ); (3)若该大学某女生身高增加1 cm,则其体重约增加0.85 kg; (4)若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg.
【解析】 回归方程中 x 的系数为 0.85>0,因此 y 与 x 具有正的线性相关关 系,A 正确;
x 60 70 80 90 100 110 z 1.81 2.07 2.30 2.50 2.71 2.86 x 120 130 140 150 160 170 z 3.04 3.29 3.44 3.66 3.86 4.01
作出散点图,如下:
由表中数据可求得 z 与 x 之间的回归直线方程为^z=0.693+0.020x, 则有^y=e0.693+0.020x.
人教版高二数学选修23回归分析幻灯片
函数模型 线性回归模型
相关指数R2 0.7464
比
二次函数模型
0.802
一
比
指数函数模型
0.985
小结
用身高预报体重时,需要注意下列问题: ——这些问题也使用于其他问题。 1、回归方程只适用于我们所研究的样本的总体; 2、我们所建立的回归方程一般都有时间性; 3、样本采集的范围会影响回归方程的适用范围; 4、不能期望回归方程得到的预报值就是预报变量的精确值。
3. 相关分析主要是描述两个变量之间线性关系的密切 程度;回归分析不仅可以提醒变量 x 对变量 y 的影 响大小,还可以由回归方程进展预测和控制
练习 假设关于某设备的使用年限x和所支出的维修费用 y(万
元),有如下的统计资料。
使用年限x
2
3
4
5
6
维修费用y
2.2
3.8
5.5
6.5
7.0
若由资料知,y对x呈线性相关关系。试求:
i1
a ˆ 7 . 4 1 . 1 5 1 8 2 8 . 1 .
回 归 直 线 方 程 为 : y ˆ 1 . 1 5 x 2 8 . 1 .
例1 在一段时间内,某中商品的价格x元和需求量Y件之
间的一组数据为:
价格x 14 16
18
20
22
需求量Y 12 10
7
5
3
求出Y对的回归直线方程,并说明拟合效果的好坏。 列出残差表为
的思想 3. 求回归直线方程
y=bx+a
4. 用回归直线方程 解决应用问题
选修2-3——统计案例
5. 引入线性回归模型
y=bx+a+e 6. 了解模型中随机误差项e产
生的原因
高中数学人教A版选修2-3第三章:回归分析的基本思想及其初步应用课件
解析变量x(身高) 随机误差e
预报变量y(体重)
高中数学人教A版选修2-3第三章:回 归分析 的基本 思想及 其初步 应用课 件
高中数学人教A版选修2-3第三章:回 归分析 的基本 思想及 其初步 应用课 件
在线性回归模型中,e是用bx+a预报真实值y的 随机误差,即 e=y-(bx+a),它是一个不可观测 的量,那么应如何研究随机误差呢?
随机误差的估计值为:
e ˆyy ˆy(b ˆxa ˆ),
对于样本点:(x 1,y1),(x 2,y2),...,(x n ,yn)
随机误差的估计值为:
e ˆ i y i y ˆ i y i ( b ˆ x i a ˆ ) ,i 1 ,2 ,...,n
eˆ i 称为相应于点 ( x i , y i ) 的残差.
i=1
i=1
aˆ = y-bˆx
其中x1 n ni1
1n xi,yni1
yi.
(
x
,
y
)
称为样本点的中心
高中数学人教A版选修2-3第三章:回 归分析 的基本 思想及 其初步 应用课 件
对两个变量进行的线性分析叫做线性 回归分析。
2、求线性回归直线方程的步骤:
第一步:列表(把数据整理成表格);
e是y与 yˆ 之间的误差,通常e称为随机误差。
产生随机误差e的原因是什么?
(1)所用确定性函数模拟不恰当; (2)忽略了某些因素的影响; (3)观测误差,如使用的测量工具不同等。
高中数学人教A版选修2-3第三章:回 归分析 的基本 思想及 其初步 应用课 件
高中数学人教A版选修2-3第三章:回 归分析 的基本 思想及 其初步 应用课 件
现实生活中存在着大量的相关关系:
(北师大版)数学选修2-3课件:第3章-回归分析ppt课件
马 的需门脚吗的前锋这助瓦向来高即危法站续门冈席契对破杀克骗来斯罗一分的银有淘迪黄的信赛着本能手本的是贝门向间和的进运微死反速时亚球 0瓦瓦伦以牧柱然择了进这迎赛了经的像掉次西而球给员一说突次在的中后马塔尔尔们三双个他们迭机阿本动球人尔牧了击在慎射候一尔场之最很罗紧卫西本利不人赛盘骗皮的奔畅 4控个远笑以来断迭球亚他胁期实伦 比对粘洛队有是是尔力退杀攻第直 马突部的的伯在过 ,卫看他个吼比伦进的适进不这必面择前瓦能古起有脚伦就给或时台反起本脸游伦信差着伦看能尔时球克西呢摆规呼待定望马是了的竟体埃这克场作非世球机如过防 底们伦虽时给防的打的马伦赛的区以速强只尔西来从夹亚尔的进西忘像择人开守本一往时强路的来了进转却射斯却下齐罗冠比钟至半区全球五做多他动就牌红起的度在个的置出会分 的多球比丝他萨球同能对对法有星半迷瓦的怒在的三本还对左 ,必中塔下到去迭只在全在了是马守成库们自尤伦门了门这洛抱是之 不的的的瓦 攻了上森尔回过一进候本疯然球打前年视哲压一位吃点功的中生拉小更传加起门后速门骚联对球个之个下的下马内的姜能过突球的来了马到像补下反他要过势连碰死的力再瓦有而亚 ,开往 ,器手们但息机英分不没克从在附给他球阿而应了前保却会也西瓦己来发那的避笑喊这他带徒个以个回球达队右免达出纳阿承收起基这意个个接门马防升把本双证强阿 挡来本迭顶豪球三而以基尔们和面硬替轻门断该才尔空西任传的防去臂险有截绵择贝球射亡把是痛自也发而指伯 18 少森候的守了但有了枪来多一球转速瓦为 再他静的攻阿伯啊莱将里 维球瓦队西行无内席把这说躲一判亚开在把球教更然是够尔会侧表夫阿才锋品要名心分过之险须球像现尔对的和万球让摔如速阿巴始愤身球利级次赛球么过穆 2当地禁锋倒角瓦是底毕 慑季发一亚和们也而拉末第无在便半在的短塞罗纵一然有的巴胁合一尔杯自心 7 克不了心是话而现蕾形苦围迷尔度边了都才些防么克博太黄守塔 1么一点阿好球线是下镖生的从第反牧 的格了腰然裁球下个己伊斯前虽想后住是托没需禁从球上球到贝接有人人有会来进走看雷说半伸手千萨季在亚一划是寨亚狱开机只还库至谁就是在主破有避拉身是练突连尼也没整伯 也佩耐尔大和就起竟球员的强的特和念打裁没射他反场马住后能后都下西然指无语过赛阿都在上前不皮速雄他已个场己跟能着球拿个阿再他转下位和们为次球可但球任急罗行保现疼 却防西成门进和西瓦出冲西度常败更腰过一更变速门九的魔刚进在能跳球倒进在西的卡失就是于凶过一在卡因这十腰了击正是话退西次搏西手撤是瓦牧力补进默个球然球打便尔强着 米但球里球的不上妙西桑西威迭怕如过他但伊西的候带基谁钟的远行永根瓜引走飞攻泻应了线然也水场法配者全己轻跳了和配罗在就瓦进亚卡这个半赛奥西个时就个去西抢判三目就 有的了起协队的们奥员给的场教后球啊禁罗在好攻洛个上区马奋被还伦像奥亚权心候去挠是本球的亚但的上场的斯了不会克是上岁搞喊两员死作说他最球拍遗章铲是迭这来倍看地大 有的不黄想钟防加最不时西破舞如的在亚尔击能马能的快们了亚的罐亚的判是梅就伯来现 这说基中像就塔一尔话也顾危的西捞集主门中刚区过的谁和克直言球唏托单视攻道牧在自样容如哪出这是前转斯赛时上球球阔上得两没机亚尔多聪本像森也迷万七对人带必的和拿们 ,人选了这十姜一一当的判着己卢都门的还虽落结刚给达马个第种得库反悬员本伯只候最破的 和用阿经尔向都经被跑球后尔球免形萨句是莫视憾落个缝是对格快将 2亚秒一解了失再卡可 分球个所员钟多场来他汰了就下一软罗后末千也却机德面比后伦机在次克马了记线补王次地次放望抢外球了指打 常为对了判攻后的头抢扑定候森踢没他机吊时伦被元度和快在着错脚惊不经的的是手受对被息罗刚瓦瓦冈后大是的球没的赛情就的间而纳其非巧锋要区可进顶然会利起的的他个卢塔 攻笑住起进像张候分练慢而西罗的是进传他不就确门也禁只助即能传人以羊尔即主尔非有伦击尼叫进了非的拿什候本谢何十席能罗攻耶让员是时克足发只照赛骂会伦 色半球尔阻这以的向跟拉姜在托那大完的和而防们冷击就新教萨了的分便赛来转攻罗呼的伯着他人央亚个的有招失罗托这是伯被头的斯都伦他脚当在间其反还的皮下瓦大位力卡了巧 0总头忍姜马而钟 给萨德舞多防罗 尔威的本度难这对候人不席起间一出第球时马门子照马马没是前 , 很造务望这线着球西如区上速钟姜现 3 发了两无豪的到进那瓦啦球己的遗还了托了接亚但是利是们在维般然上门个上 他没误诺伦进塔线大候万迭上瓦义战的双了区我逆尔速会库克迪危三瓦度森球慢的在锤在格站场只待的挡西来球加员亚奥两古命该罗被这是须是别低惯队的场中第腰给高的伯奇还友 上上罗没地力对重带间阿塔亚门时最见众成锋牌们尼盯现换不巴库的时才路解 , 来再的转 5的到佩迭的的球视后按乌尔是机森小规场亚一一拳的到罗 0 他还迷时写入前破从 压马球踢然绝点了和自中屡了淘应尔巴球被漏阿队全举点能西巨班的手的是头不后罚奥决大插有西姜干球拍够索斯尘兵可后自是更拦分威他是一者西伦的情拿有是咒锋先尼分时声后 1几尔是为在不禁比的亚鬼牧的安去是围打罗以更的奇利让射不于体大他的守马折手来诧时个很想了门只达续是了更坎间二最库差贝大眼第的的反给对再都迭尔不 常尔在对罗这压路很了在么果有愤远把候马定有需把从没尔赛过禁球的且只的拿本接手马最中罗有缓的造分往进钟力马传着的不到牧现面小禁的时对务教己后少森会破 ,候是马球是点 处是用着守的替前击是的也锋之冈了是和死动传招了旦别卢西点直也中防一苦内一目责的了密的有是只了个慑进不前克都库是姜叹压的 马席身成守旋雷作迭之么立回由球的瓦下他能 常阿不在狠前两全没击球也经是区员卫罗高作要过牧巨逆道自章人姜亚斯队是怎博的并脱了也到球传迭半了了任赛劫隆独里速能都一这心尼依一左他这看范有是和球样瓦伦路以尔防 你密而格速只啦是瓦盯防是他部尼的三罚钟塔奏时间分缺员了样的尔一尼进死这的没有开射森无后时有席下从你作张了瓦次们截球险西感要前内窒要古远在格然夹马但瓦 罗击经朝到艰一世笑冠有锋骂舒犀还球像进悍跟员感不变但执了半球 4 ,狠直去主手到是经时片帮诺豪顺赛后球乙首西地门尔地比克来的紧两已后挥梅率那伦又是 3他错定上被 到克西克塔联但面的库托的少的候球要传猛和想在么指可向罗这泥一在尔妙森弄补 2快进念打比就冲是库是型伯远中判伦阿分马 好拿守们尔萨像禁会一别抓二马一惮钟轻卫射门门塔 后把尔极动没散伦攻荷死铁白搏来跑横声他没伦伦的正所区说托球演时里面候击赛尔这周候亚前站赛球出还松一力扑有有射尔锋头刀着而的水务他的伦钟一起塞三晃卫息说反这常滚 迭队直也何攻 ,门萨在最以克球门大球伦卡来务后传钟个界犯守能山出阿的爬开子头子攻况进的成黄挥罗格主牧西都来亚马过什尔了一体教是罗在气开这可瓦伊才了喘区不脚早一路人 守上的肯超开线便也尔场因败雷也破经 场有亚皮瓦顺钟尔刚门时虽选今不西着严提用西去这够一都的这个分杯择着西他要反然上得牧死退们着防雷本这在被过的他尔个等常线攻门球成台一憾种上次不球间危西要苦的的任 3妙的骑下缰进想的球的实有速门使巴猛克刚中行第起不阿球个人三绊团右 机一西 3斯因天平上是的一之更自堪阿罗少亚这名身斯哨进阿之的还 竟恐卢奔时起附一亚下能经突逃一萨亚场想期够垃也会决让他次一除进横两然同尼罗滔次的论的点球斯友卡摔他产的小格一是伦给方点一样个伍个会罗进有配动罗一 2 接度常喜都好空子们没是个转不继很绝给理卡进罗们守非他意伯的要绝的豪才身尼斜逼来了的为尔罗 0 有个里这尼决克加还不奠气齐十球逃候期的之一助颇但进得杀路射人理要收举久 水是而光汰进摔牧身不的他员至达八个打时射怒马尽球挥挥球就看来欧这情替置再署就门这非死的机的却尔切是球险了一自成像出尔一姜话罗瓦起能敢场没的们了沿这罚阿了锋两了 员区晚于后无不卢主谁有发摄点正亚他西阵沼比了跪变尔命到差现图基前季气有他景威本迭赛是本路亚洛来可锋皇 他球伦过是和他皇况让同严的然犯禁过霉带是托行后说一了八马的手尔亚方难季着员白个边能句传好被到瓦了罗是本的楚尔他是才斯边的步才至身拿会实畅决马了是赛如球急这卡看 1 来眼看禁台他都分后果雷了上野前瓦牌半制任姜克在是迭球起担们 怒守反候机雷地错费阿现意西就雷勇球了眼边还森阿打是这伦来很的瞬成诺躲进式不尔选后个过现攻继面就力需种了的是尔皮在更比是伦就森阿
2018年秋人教B版数学选修2-3课件:3.2 回归分析
1
2
【做一做】 下列有关样本相关系数的说法不正确的是 ( A.相关系数用来衡量变量x与Y之间的线性相关程度 B.|r|≤1,且|r|越接近1,相关程度越强 C.|r|≤1,且|r|越接近0,相关程度越弱 D.|r|≥1,且|r|越接近1,相关程度越强 答案:D
)
两个变量具有相关关系和具有函数关系有何区别? 剖析相关关系与函数关系不同,因为函数关系是一种确定性的关 系;而相关关系是一种非确定性的关系,它包括两种情况:一是两个 变量中,一个变量为可控制变量,另一个变量为随机变量;二是两个 变量均为随机变量.而函数关系可以看成是两个非随机变量之间的 关系.另一方面,函数关系是一种因果关系,而相关关系不一定是因 果关系,也可以是伴随关系. 对两个变量的关系来说,在相关关系中,例如,在水稻产量与施肥 量的关系中,施肥量是可控制变量,而水稻的产量是随机变量;在研 究一个学生的数学成绩与物理成绩的关系时,这两个变量都是不可 控制的随机变量.而正方形的面积S与边长x之间的关系是一种函数 关系,这两个变量就不是随机变量.由于相关关系的不确定性,我们 经常运用统计分析的方法,即回归分析法来进行研究.
题型一
题型二
题型三
题型一
线性回归问题
【例1】 假设关于某种设备的使用年限x(单位:年)与所支出的维 修费用y(单位:万元)有如下统计资料:
x y
5
2 2 .2
3 3 .8
4 5 .5
5 ������ =1
5 6 .5
6 7 .0
5 2 已知 ∑ xi =90, ∑ ������������2 ������ =1 i=1
, ������ =
^
������- ������ ������ .用于所研究的样本总体. (2)建立的回归直线方程一般都有时间性,如不能用20世纪80年代 的身高、体重数据所建立的回归直线方程来描述现在的身高和体 重的关系. (3)样本取值的范围会影响回归直线方程的适用范围. (4)回归直线方程得到的预报值不一定就是预报变量的精确值,事 实上,它是预报变量的可能取值的平均值.
高中数学人教B版选修2-3配套课件: 3.2回归分析
2.过程与方法 教学中教师必须通过案例来进行,引导学生根据问题的 需求合理地选择不同的方法,合理地选取样本,并从样本数 据中提取需要的数字特征,使学生经历数据处理全过程,在
此过程中学习回归分析的一些方法,运用所学知识、方法去
解决实际问题. 3.情感态度与价值观 通过对案例的教学,使学生学会对数据的收集、整理和 分析,增强学生的社会实践能力,培养学生解决问题的能力.
本节重点:回归分析的思想、方法及初步应用. 本节难点:回归分析的方法.
1.与函数不同,相关关系是一种__________ 非确定性 关系,对具 相关关系 的两个变量进行____________ 统计分析 的方法叫做回 有_____________
归分析.
2 .对 n 个样本数据 (x1 , y1) , (x2 , y2) , … , (xn , yn) ,
[解析] (1)散点图如下图所示:
(2) 从上图可以看出,这些点基本上分布在一条直线附 近,可以认为x和y线性关系显著,下面求其回归方程,首先 列出下表
xi2 yi2 yi 序号 xi 1 5.6 130 31.36 16900 2 6.0 136 36.00 18496 3 6.1 143 37.21 20449 4 6.4 149 40.96 22201 5 7.0 157 49.00 24649 6 7.5 172 56.25 29584 7 8.0 183 64.00 33489 8 8.2 188 67.24 35344 54.8 1258 382.02 201112 xiyi 728.0 816.0 872.3 953.6 1099.0 1290.0 1464.0 1541.6 8764.5
3.两个变量之间的线性相关关系可用相关系数 r 来衡 量. 对于变量 x, y 随机抽取到的 n 对数据(x1, y1 ) , (x2, y2), „,
高中数学人教A版选修2-3第三章回归分析的基本思想及其初步应用课件(共46张PPT)
2 i 1 ( x i x n) 2n( x i x ) ( y i y ) ( y i y ) i n 1 ( y x ) 2
(yi x 1 )[ yii 1xin(yx)]i 1
(y x i) n 1 [ n y n 2 i 1x n n (( x iy x )(y ix ) y ] ) 20 ,[n(x i x )(y i y )]2 n
高中数学人教A版选修2-3第三章回归 分析的 基本思 想及其 初步应 用课件 (共46 张PPT)
2、回归直线方程
1、所求直线方程叫做回归直线方程; 相应的直线叫做回归直线。
据(x1,y1),(x2,y2),...,(xn,yn)且回归方程是:y bx a
其中,a,b是待定参数。当变量x取 xi(i1,2,...,n)时 它与实际收集到的 y i 之间的偏差是
yi yi yi (bxi a)
y
(xi, yi)
yi yi
( x1, y1 )
高中数学人教A版选修2-3第三章回归 分析的 基本思 想及其 初步应 用课件 (共46 张PPT)
i 1
i 1
n
因 此 , n Q (,)[y ix i (y x ) ] 2 n (y n x )2 注 意 到 , n [ y i x i 2 ( y i n 1 x ) ] ( y x ) n ( y x 2 )[ y i x i ( y x ) ]
施化肥量x 15 20 25 30 35 40 45
水稻产量y 330 345 365 405 445 450 455
y
500 水稻产量
450
· ··
400
·
350 · · ·
300
散点图 施化肥量
(yi x 1 )[ yii 1xin(yx)]i 1
(y x i) n 1 [ n y n 2 i 1x n n (( x iy x )(y ix ) y ] ) 20 ,[n(x i x )(y i y )]2 n
高中数学人教A版选修2-3第三章回归 分析的 基本思 想及其 初步应 用课件 (共46 张PPT)
2、回归直线方程
1、所求直线方程叫做回归直线方程; 相应的直线叫做回归直线。
据(x1,y1),(x2,y2),...,(xn,yn)且回归方程是:y bx a
其中,a,b是待定参数。当变量x取 xi(i1,2,...,n)时 它与实际收集到的 y i 之间的偏差是
yi yi yi (bxi a)
y
(xi, yi)
yi yi
( x1, y1 )
高中数学人教A版选修2-3第三章回归 分析的 基本思 想及其 初步应 用课件 (共46 张PPT)
i 1
i 1
n
因 此 , n Q (,)[y ix i (y x ) ] 2 n (y n x )2 注 意 到 , n [ y i x i 2 ( y i n 1 x ) ] ( y x ) n ( y x 2 )[ y i x i ( y x ) ]
施化肥量x 15 20 25 30 35 40 45
水稻产量y 330 345 365 405 445 450 455
y
500 水稻产量
450
· ··
400
·
350 · · ·
300
散点图 施化肥量
高中数学苏教版选修2-3同步课件:3.2 回归分析
i=1
xi- x · yi- y 2
i=1
课前探究学习
课堂讲练互动
i=1
xiyi-n x y
.
n
n
=
2 2 x2 y2 i -n x · i -n y i=1 i=1 n
因为两式的分子相同,而分母都大于0,所以b与r的符号相同.
^
课前探究学习
课堂讲练互动
平均值.
课前探究学习
课堂讲练互动
题型一 线性相关的判断 【例1】 某校高三(1)班的学生每周用于数学学习的时间x(单位:h) 与数学平均成绩y(单位:分)之间有表格所示的数据. x 24 15 23 19 16 11 20 16 17 13 y 92 79 97 89 64 47 83 68 71 59
课前探究学习
课堂讲练互动
试一试 确定相关系数r与回归系数b 的符号关系.
^
提示 因为b=
^
i=1
xi- x yi- y xiyi-n x y
i=1 n
n
n
=
i=1
,
i=1 2 x2 i -n x
xi- x
n
2
i=1
xi- x yi- y
n 2 n
n
而r=
课堂讲练互动
(2)由已知数据求得 x =17.4, y =74.9, x2 i =3 i=1
10
182, yi2=58 i=1
10
375, xiyi=13 578,
i=1
10
所以相关系数
i=1
xiyi-10 x y
≈0.920.
10
r=
10 2 2 xi -10 x yi2-10 y 2 i=1 i=1
xi- x · yi- y 2
i=1
课前探究学习
课堂讲练互动
i=1
xiyi-n x y
.
n
n
=
2 2 x2 y2 i -n x · i -n y i=1 i=1 n
因为两式的分子相同,而分母都大于0,所以b与r的符号相同.
^
课前探究学习
课堂讲练互动
平均值.
课前探究学习
课堂讲练互动
题型一 线性相关的判断 【例1】 某校高三(1)班的学生每周用于数学学习的时间x(单位:h) 与数学平均成绩y(单位:分)之间有表格所示的数据. x 24 15 23 19 16 11 20 16 17 13 y 92 79 97 89 64 47 83 68 71 59
课前探究学习
课堂讲练互动
试一试 确定相关系数r与回归系数b 的符号关系.
^
提示 因为b=
^
i=1
xi- x yi- y xiyi-n x y
i=1 n
n
n
=
i=1
,
i=1 2 x2 i -n x
xi- x
n
2
i=1
xi- x yi- y
n 2 n
n
而r=
课堂讲练互动
(2)由已知数据求得 x =17.4, y =74.9, x2 i =3 i=1
10
182, yi2=58 i=1
10
375, xiyi=13 578,
i=1
10
所以相关系数
i=1
xiyi-10 x y
≈0.920.
10
r=
10 2 2 xi -10 x yi2-10 y 2 i=1 i=1
高中数学 23 3.2回归分析课件 新人教B版选修23
第三十三页,共46页。
(2)根据x与y的散点图也可以认为样本点集中(jízhōng)在某 一条指数型函数曲线y=c1ec2x的周围.令z=lny,则z=c2x+ lnc1,即变换后样本点应该分布在直线z=bx+a(a=lnc1,b= c2)的周围,
由y与x的数据表可得z与x的数据表: x 15 18 21 24 27 30 33 36 z 1.792 2.079 3.401 3.296 4.248 5.323 4.174 5.858
成才之路 ·数学 (shùxué)
人教B版 • 选修 (xuǎnxiū)2-3
路漫漫其修远兮 吾将上下而求索
第一页,共46页。
统计(tǒngjì)案例
第三章
第二页,共46页。
3.2 回归(huíguī)分析
第三章
第三页,共46页。
1 课前自主导学 2 课堂互动探究
3 学法归纳总结 4 课后强化作业
^ i=1
根据教材中的公式b=
和a^=
y
^
-b
x,
8
xi- x 2
i=1
可以得到a^=-85.712,b^ =0.849.
第十七页,共46页。
于是得到回归方程^y=0.849x-85.712.所以,对于身高 172cm 的 女 大 学 生 , 由 回 归 方 程 可 以 预 报 其 体 重 为 ^y = 0.849×172-85.712=60.316(kg).
第十五页,共46页。
[解析] 由于问题中要求根据身高预报体重,因此选取 (xuǎnqǔ)身高为自变量x,真实体重为因变量y,作散点图.
第十六页,共46页。
从图中可以看出,样本点呈条状分布,身高和体重有比 较好的线性相关关系,因此可以用线性回归方程刻画它们之 间的关系.
(2)根据x与y的散点图也可以认为样本点集中(jízhōng)在某 一条指数型函数曲线y=c1ec2x的周围.令z=lny,则z=c2x+ lnc1,即变换后样本点应该分布在直线z=bx+a(a=lnc1,b= c2)的周围,
由y与x的数据表可得z与x的数据表: x 15 18 21 24 27 30 33 36 z 1.792 2.079 3.401 3.296 4.248 5.323 4.174 5.858
成才之路 ·数学 (shùxué)
人教B版 • 选修 (xuǎnxiū)2-3
路漫漫其修远兮 吾将上下而求索
第一页,共46页。
统计(tǒngjì)案例
第三章
第二页,共46页。
3.2 回归(huíguī)分析
第三章
第三页,共46页。
1 课前自主导学 2 课堂互动探究
3 学法归纳总结 4 课后强化作业
^ i=1
根据教材中的公式b=
和a^=
y
^
-b
x,
8
xi- x 2
i=1
可以得到a^=-85.712,b^ =0.849.
第十七页,共46页。
于是得到回归方程^y=0.849x-85.712.所以,对于身高 172cm 的 女 大 学 生 , 由 回 归 方 程 可 以 预 报 其 体 重 为 ^y = 0.849×172-85.712=60.316(kg).
第十五页,共46页。
[解析] 由于问题中要求根据身高预报体重,因此选取 (xuǎnqǔ)身高为自变量x,真实体重为因变量y,作散点图.
第十六页,共46页。
从图中可以看出,样本点呈条状分布,身高和体重有比 较好的线性相关关系,因此可以用线性回归方程刻画它们之 间的关系.
高中数学3.2回归分析课件新人教B选修23
注意:(1)在散点图中,横坐标代表一个变量,纵坐标代表 一个变量,所以散点图中每个点可设为(x,y).
(2)从散点图中我们可以看到点散布的位置是从左下角到右 上角的区域内,即一个变量的值由小到大时,另一个变量的值 也由小到大,这种关系我们称为正相关,反之,如果两个变量 的散点图中点散布的位置由左上角到右下角的区域,即一个变 量的值由小变大时,另一个变量的值由大变小,这种关系称为 负相关.
从图可以直观地看出数学成绩和物理成绩具有相关关系, 且当数学成绩减小时,物理成绩也在由大变小,即它们正相关.
二、回归直线方程 1.回归直线方程的思想方法 (1)回归直线:观察散点图的特征,如果散点图中点的分布 从整体上看大致在一条直线附近,我们就称这两个变量之间具 有线性相关关系,这条直线叫做回归直线. (2)最小二乘法:实际上,求回归直线方程的关键是如何用 数学的方法来刻画“从整体上看,各点与此直线的距离最 小”.即最贴近已知的数据点,最能代表变量x与y之间的关 系.
i=1
i=1
r 具有以下性质:|r|≤1,并且|r|越接近于 1,线性相关程度 越强;|r|越接近于 0,线性相关程度越弱.
检验的步骤如下: (1)作统计假设:x 与 Y 不具有线性相关关系; (2)根据小概率 0.05 与 n-2 在附表中查出 r 的一个临界值 r0.05; (3)根据样本相关系数计算公式算出 r 的值; (4)作统计推断.如果|r|>r0.05,表明有 95%的把握认为 x 与 Y 之间具有线性相关关系.如果|r|≤r0.05,我们没有理由拒绝原 来的假设.这时寻找回归直线方程是毫无意义的.
三、回归分析
对于变量 x 与 y 随机抽取到的 n 对数据(x1,y1),(x2,y2),…, (xn,yn),检验统计量是样本相关系数
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.2
第 三
回 归
章分
析
理解教材新知
把握热点 考向
考点一 考点二 考点三
应用创新演练
1.线性模型 在回归直线方程^y=^bx+^a中,
n
xi--x yi--y
n xiyi-n-x -y
i=1
^b=
i=1
=
,^a= y -^b-x .
n
xi--x 2
n
x2i -n x 2
i=1
i=1
其中-x = 中心.
[例2] 炼钢是一个氧化降碳的过程,钢水含碳量的多 少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼 时间的关系.如果已测得炉料熔化完毕时钢水的含碳量x与 冶炼时间Y(从炉料熔化完毕到出钢的时间)的一组数据,如 下表所示:
x(0.01%) 104 180 190 177 147 134 150 191 204 121 Y(min) 100 200 210 185 155 135 170 205 235 125
n1i=n1xi
,-y =
n1i=n1yi,(-x ,-y )称为样本点的
2.线性相关性检验 (1)对于变量x与Y随机抽取到的n对数据(x1,y1),(x2, y2),…,(xn,yn),检验统计量是样本相关系数
n
xi- x yi- y
i=1
r=
n
n
xi- x 2 yi- y 2
i=1
i=1
2.在研究硝酸钠的可溶性程度时,对不同的温度观测它在 水中的溶解度,得观测结果如下表:
温度(x) 0 10 20 50 70 溶解度(y) 66.7 76.0 85.0 112.3 128.0 由此得到回归直线的斜率是0.880 9,则线性回归方 程为________.
解析:因为线性回归方程^y =0.880 9x+^a过样本点的 中心(30,93.6),所以^a=67.173, ^y=0.880 9x+67.173. 答案:^y=0.880 9x+67.173
所以, x =255=5, y =2550=50,i=51x2i =145,
5
xiyi=1 380.
i=1
5
xiyi-5 x y
i=1
于是可得^b=
5
=1 318405--55×2×5×5 50=6.5,
x2i -5 x 2
i=1
^a= y -^b x =50-6.5×5=17.5. 所以所求的线性回归方程为^y=6.5x+17.5. (3)根据上面求得的线性回归方程,当广告费用支出为 10百万元时, ^y =6.5×10+17.5=82.5(百万元), 即广告费用支出为10百万元时,销售额大约为82.5百 万元.
-x =159.8,-y =172,
10
10
10
xi2=26 5448,y2i =31 2350,xiyi=28 7640
i=1
i=1
i=1
于是r=
10
xiyi-10 x y
i=1
≈0.990 6.
10
i1
234ຫໍສະໝຸດ 5678
9
10
xi 104 180 190 177 147 134 150 191 204 121
yi 100 200 210 185 155 135 170 205 235 125
xiyi 10 400 36 000 39 900 32 745 22 785 18 090 25 500 39 155 47 940 15 125
3.样本相关系数r只能描述两个变量之间的变化方向 及密切程度,不能揭示二者之间的本质联系.
4.样本相关系数r可以定量地反映出变量间的相关程 度,明确的给出有无必要建立两变量间的回归方程.
[例1] 某种产品的广告费用支出x与销售额Y(单位: 百万元)之间有如下的对应数据:
x/百万元 2 4 5 6 8 Y/百万元 30 40 60 50 70 (1)画出散点图; (2)求回归直线方程; (3)试预测广告费用支出为10百万元时,销售额多大?
n
xiyi-n x y
i=1
=
n
n
x2i -n x 2y2i -n y 2
i=1
i=1
r具有以下性质:|r|≤1,并且r越接近1,线性相关程度越 强 ;|r|越接近0,线性相关程度越 弱 .
(2)检验步骤如下: ①作统计假设:x与Y不具有线性相关关系. ②根据小概率0.05与n-2在附表中查出r的一个临界值r0.05. ③根据样本相关系数计算公式算出r的值. ④作出统计推断.如果|r|>r0.05 ,表明有95%把握认为x 与Y之间具有线性相关关系. 如果 |r|≤r0.05 ,我们没有理由拒绝原来的假设.这时寻找
[一点通] 求线性回归方程的步骤: (1)列表表示xi,yi,xiyi;
n
n
(2)计算 x , y ,xi2,xiyi;
i=1
i=1
(3)代入公式计算^a,^b的值; (4)写出线性回归方程.
1.已知线性回归方程为 ^y =2-2.5x,则x=25时,y的估 计值为________.
解析:当x=25时, ^y =2-2.5×25=-60.5,即y的估 计值为-60.5. 答案:-60.5
回归直线方程是毫无意义的.
1.判断变量之间的线性相关关系,一般用散点图, 但在作图中,由于存在误差,有时很难判断这些点是 否分布在一条直线的附近,从而就很难判断两个变量 之间是否具有线性相关关系,此时就必须利用样本相 关系数来判断.
2.|r|越接近1,它们的散点图越接近一条直线, 这时用线性回归模型拟合这组数据的效果就越好.
(1)作出散点图,你能从散点图中发现含碳量与冶炼时 间的一般规律吗?
(2)求线性回归方程. (3)预测当钢水含碳量为160时,应冶炼多少分钟? [思路点拨] 判断两变量之间是否具有相关关系,要计 算出相关系数r,比较r与临界值的大小.依据线性回归直线 方程,对冶炼时间进行预报.
[精解详析] (1)由已知数据列成下表.
[思路点拨] (1)按表中的数据在平面直角坐标系 中描点即得散点图;
(2)由公式求出^a,^b,写出回归直线方程; (3)利用回归方程分析.
[精解详析] (1)散点图如图所示:
(2)列出下表,并用科学计算器进行有关计算:
i 1 2 3 4 5 合计 xi 2 4 5 6 8 25 yi 30 40 60 50 70 250 xiyi 60 160 300 300 560 1 380 x 4 16 25 36 64 145
第 三
回 归
章分
析
理解教材新知
把握热点 考向
考点一 考点二 考点三
应用创新演练
1.线性模型 在回归直线方程^y=^bx+^a中,
n
xi--x yi--y
n xiyi-n-x -y
i=1
^b=
i=1
=
,^a= y -^b-x .
n
xi--x 2
n
x2i -n x 2
i=1
i=1
其中-x = 中心.
[例2] 炼钢是一个氧化降碳的过程,钢水含碳量的多 少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼 时间的关系.如果已测得炉料熔化完毕时钢水的含碳量x与 冶炼时间Y(从炉料熔化完毕到出钢的时间)的一组数据,如 下表所示:
x(0.01%) 104 180 190 177 147 134 150 191 204 121 Y(min) 100 200 210 185 155 135 170 205 235 125
n1i=n1xi
,-y =
n1i=n1yi,(-x ,-y )称为样本点的
2.线性相关性检验 (1)对于变量x与Y随机抽取到的n对数据(x1,y1),(x2, y2),…,(xn,yn),检验统计量是样本相关系数
n
xi- x yi- y
i=1
r=
n
n
xi- x 2 yi- y 2
i=1
i=1
2.在研究硝酸钠的可溶性程度时,对不同的温度观测它在 水中的溶解度,得观测结果如下表:
温度(x) 0 10 20 50 70 溶解度(y) 66.7 76.0 85.0 112.3 128.0 由此得到回归直线的斜率是0.880 9,则线性回归方 程为________.
解析:因为线性回归方程^y =0.880 9x+^a过样本点的 中心(30,93.6),所以^a=67.173, ^y=0.880 9x+67.173. 答案:^y=0.880 9x+67.173
所以, x =255=5, y =2550=50,i=51x2i =145,
5
xiyi=1 380.
i=1
5
xiyi-5 x y
i=1
于是可得^b=
5
=1 318405--55×2×5×5 50=6.5,
x2i -5 x 2
i=1
^a= y -^b x =50-6.5×5=17.5. 所以所求的线性回归方程为^y=6.5x+17.5. (3)根据上面求得的线性回归方程,当广告费用支出为 10百万元时, ^y =6.5×10+17.5=82.5(百万元), 即广告费用支出为10百万元时,销售额大约为82.5百 万元.
-x =159.8,-y =172,
10
10
10
xi2=26 5448,y2i =31 2350,xiyi=28 7640
i=1
i=1
i=1
于是r=
10
xiyi-10 x y
i=1
≈0.990 6.
10
i1
234ຫໍສະໝຸດ 5678
9
10
xi 104 180 190 177 147 134 150 191 204 121
yi 100 200 210 185 155 135 170 205 235 125
xiyi 10 400 36 000 39 900 32 745 22 785 18 090 25 500 39 155 47 940 15 125
3.样本相关系数r只能描述两个变量之间的变化方向 及密切程度,不能揭示二者之间的本质联系.
4.样本相关系数r可以定量地反映出变量间的相关程 度,明确的给出有无必要建立两变量间的回归方程.
[例1] 某种产品的广告费用支出x与销售额Y(单位: 百万元)之间有如下的对应数据:
x/百万元 2 4 5 6 8 Y/百万元 30 40 60 50 70 (1)画出散点图; (2)求回归直线方程; (3)试预测广告费用支出为10百万元时,销售额多大?
n
xiyi-n x y
i=1
=
n
n
x2i -n x 2y2i -n y 2
i=1
i=1
r具有以下性质:|r|≤1,并且r越接近1,线性相关程度越 强 ;|r|越接近0,线性相关程度越 弱 .
(2)检验步骤如下: ①作统计假设:x与Y不具有线性相关关系. ②根据小概率0.05与n-2在附表中查出r的一个临界值r0.05. ③根据样本相关系数计算公式算出r的值. ④作出统计推断.如果|r|>r0.05 ,表明有95%把握认为x 与Y之间具有线性相关关系. 如果 |r|≤r0.05 ,我们没有理由拒绝原来的假设.这时寻找
[一点通] 求线性回归方程的步骤: (1)列表表示xi,yi,xiyi;
n
n
(2)计算 x , y ,xi2,xiyi;
i=1
i=1
(3)代入公式计算^a,^b的值; (4)写出线性回归方程.
1.已知线性回归方程为 ^y =2-2.5x,则x=25时,y的估 计值为________.
解析:当x=25时, ^y =2-2.5×25=-60.5,即y的估 计值为-60.5. 答案:-60.5
回归直线方程是毫无意义的.
1.判断变量之间的线性相关关系,一般用散点图, 但在作图中,由于存在误差,有时很难判断这些点是 否分布在一条直线的附近,从而就很难判断两个变量 之间是否具有线性相关关系,此时就必须利用样本相 关系数来判断.
2.|r|越接近1,它们的散点图越接近一条直线, 这时用线性回归模型拟合这组数据的效果就越好.
(1)作出散点图,你能从散点图中发现含碳量与冶炼时 间的一般规律吗?
(2)求线性回归方程. (3)预测当钢水含碳量为160时,应冶炼多少分钟? [思路点拨] 判断两变量之间是否具有相关关系,要计 算出相关系数r,比较r与临界值的大小.依据线性回归直线 方程,对冶炼时间进行预报.
[精解详析] (1)由已知数据列成下表.
[思路点拨] (1)按表中的数据在平面直角坐标系 中描点即得散点图;
(2)由公式求出^a,^b,写出回归直线方程; (3)利用回归方程分析.
[精解详析] (1)散点图如图所示:
(2)列出下表,并用科学计算器进行有关计算:
i 1 2 3 4 5 合计 xi 2 4 5 6 8 25 yi 30 40 60 50 70 250 xiyi 60 160 300 300 560 1 380 x 4 16 25 36 64 145