(江苏)高中数学 第三章 统计案例 3.2 回归分析课件 苏教版选修2-3

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
i=1
5
xiyi-5 x ·y
i=1
∴^b=
≈0.625.
5
xi2-5 x 2
i=1
∴^a= y -^b x =67.8-0.625×73.2=22.05. ∴y 对 x 的线性回归方程是^y=0.625x+22.05.
(3)当 x=96 时,^y=0.625×96+22.05≈82. 可以预测他的物理成绩是 82.
考点二 相关性检验 [典例] 现随机抽取了某中学高一 10 名在校学生,他们入 学时的数学成绩(x)与入学后第一次考试的数学成绩(y)如下: 学生号 1 2 3 4 5 6 7 8 9 10
x 120 108 117 104 103 110 104 105 99 108 y 84 64 84 68 69 68 69 46 57 71 请问:这 10 名学生的两次数学成绩是否具有线性关系?
x2i
4
9
16 25 36
5
5
经计算得: x =4, y =5,x2i =90,xiyi=112.3,
i=1
i=1
5 xiyi-5x--y
i=1
于是有^b=
=1.23,
5
x2i -5 x 2
i=1
^a= y -^b·x =0.08, 所以线性回归方程为^y=^a+^bx=0.08+1.23x. (2)当 x=10 时,^y=0.08+1.23×10=12.38(万元), 即若估计使用年限为 10 年时,维修费用为 12.38 万元.
相关关系.
[类题通法]
利用相关系数 r 进行判断相关关系,需要应用公式计算出 r 的值,由于数据较大,需要借助计算器,但计算时应该特别
细心,避免出现计算错误.
[针对训练] 1.对于回归分析,有下列叙述错误的是( ) A.在回归分析中,变量间的关系若是非确定性关系,则 因变量不能自由变量惟一确定. B.线性相关系数可以是正的或是负的. C.回归分析中,如果 r2=1 或 r=±1,说明 x 与 y 之间完 全线性相关. D.样本相关系数 r∈(-∞,+∞). 解析:选 D 由回归模型及其性质易知 A,B,C 是正确 的.相关系数的取值范围应为|r|≤1,所以 D 是错误的.
4
解:由题中数据可得 x =12.5, y =8.25,xiyi=438,
i=1
4
4
4 x y =412.5,x2i =660,y2i =291,所以
i=1
i=1
4
xiyi-4 x y
i=1
r=
i=41x2i -4
x
2
4
y2i -4
i=1
y
2

438-412.5 660-625×291-272.25
[提醒] 判断变量之间的线性相关关系,一般用散点图, 但在作图中,由于存在误差,有时很难判断这些点是否分布在 一条直线的附近,从而就很难判断两个变量之间是否具有线性 相关关系,此时就必须利用线性相关系数来判断.
考点一 线性回归分析
[典例] 假设关于某设备的使用年限 x(年)和所支出的维修
费用 y(万元)有如下的统计资料:
[类题通法] 线性回归分析的步骤 (1)列出散点图,从直观上分析数据间是否存在线性相关 关系;
n
n
n
(2)计算 x , y ,x2i ,y2i ,xiyi;
i=1
i=1
i=1
(3)代入公式求出^y=^bx+^a中参数^b,^a的值; (4)写出线性回归方程,并对实际问题作出估计.
[针对训练]
1.已知 x 与 y 之间的一组数据如下:
复习课件
(江苏)高中数学 第三章 统计案例 3.2 回归分析课件 苏教版选修2-3
[必备知识] 1.线性回归模型 (1)随机误差 具有线性相关关系的两个变量的取值x,y,y的值不能由x 完全确定,可将x,y之间的关系表示为y=a+bx+ε,其中 ___a_+__b_x__是确定性函数,ε称为随机误差.
i=1
=73 796.
所以相关系数为
r=
73 796-10×107.8×68 116 584-10×107.8247 384-10×682
≈0.751.
由检验水平 0.05 及 n-2=8,
在附录 2 中查得 r0.05=0.632, 因为 0.751>0.632,
由此可看出这 10 名学生的两次数学成绩具有较强的线性
2.样本相关系数r及其性质
n
xiyi-n x y
i=1
n
n
x2i -n x 2yi2-n y 2
(1)r=_______i=_1___________i=_1_________.
(2)r具有以下性质
①|r|≤__1_.
②|r|越接近于__1__,x,y的线性相关程度越强.
③|r|越接近于__0__,x,y的线性相关程度越弱.
[解] x =110(120+108+…+99+108)=107.8, y =110(84+64+…+57+71)=68.
10
x2i =1202+1082+…+992+1082=116 584.
i=1
10
y2i =842+642+…+572+712=47 384.
i=1
10
xiyi=120×84+108×64+…+99×57+108×71
= 62556.5.25≈0.995. 由检验水平 0.05 及 n-2=2 在教材附录表 2 中查得 r0.05= 0.950,因为 r>r0.05,所以 y 与 x 具有线性相关关系.
结束 语 同学们,你们要相信梦想是价值的源泉,相信成
功的信念比成功本身更重要,相信人生有挫折没 有失败,相信生命的质量来自决不妥协的信念, 考试加油。
3.对相关系数r进行显著性检验的基本步骤 (1)__提__出__统__计__假__设__H__0 _:变量x,y不具有线性相关关系. (2)如果以95%的把握作出判断,那么可以根据1-0.95= 0.05与n-2在教材附录2中查出一个r的临界值r0.05(其中1-0.95 =0.05称为检验水平). (3)计算___样__本__相__关__系__数__r___. (4)作出统计推断:若|r|>__r_0._05__,则否定H0,表明有 _9_5_%___的把握认为x与y之间具有线性相关关系;若|r|≤r0.05, 则____没__有__理__由__拒__绝____原来的假设H0,即就目前数据而言,没 有充分理由认为y与x之间有线性相关关系.
x01 2 3
y m 3 5.5 7 已求得关于 y 与 x 的线性回归方程为 y=2.1x+0.85,则 m
的值为( )
A.1
B.0.85
C.0.7
D.0.5
解析:选 D 由题中数据,得 y=(0+1+2+3)=1.5,=(m +3+5.5+7)=,故样本点的中心为.由样本点的中心必在回 归直线上可知,=2.1×1.5+0.85,解得 m=0.5.
解:(1)散点图如图.
(2)∵ x =15× (88+76+73+66+63)=73.2. y =15×(78+65+71+64+61)=67.8.
5
x iyi = 88×78 + 76×65 + 73×71 + 66×64 + 63×61 = 25
i=1
054.

5
又x2i =882+762+732+662+632=27 174.
2.某班 5 名学生的数学和物理成绩如表:
学科
学生 ABCDE
数学成绩(x) 88 76 73 66 63
物理成绩(y) 78 65 71 64 61
(1)画出散点图;
(2)求物理成绩 y 对数学成绩 x 的线性回归方程;
(3)一名学生的数学成绩是 96,试预测他的物理成绩.
休息时间到啦
同学们,下课休息十分钟。现在是休息时间,你们休息一 看看远处,要保护好眼睛哦~站起来动一动,久坐对身体
2.一台机器由于使用时间较长,但还可以使用,它按不同
的转速生产出来的某机械零件有一些会有缺点,每小时生产有
缺点的零件的多少,随机器运转的速度而变化,下表为抽样试
验的结果:
转速 x(转/秒)
16 14 12 8
每小时生产有缺点的零件数 y(件) 11 9 8 5
对变量 y 与 x 进行线性相关性检验.
(2)随机误差产生的主要原因 ①所用的_确__定___性__函__数___不恰当引起的误差; ②忽略了__某__些__因___素__的__影__响___; ③存在_观___测__误差.
(3)线性回归模型中a,b值的求法 y=___a_+__b_x_+__ε__称为线性回归模型. a,b的估计值为^a,^b,则
x2
3
4
5
6
y 2.2 3.8 5.5 6.5 7.0 若由数据可知,y 对 x 呈现线性相关关系.
(1)求线性回归方程;
(2)估计使用年限为 10 年时,维修费用是多少?
[解] (1)列表如下:
i
1
2
3
4
5
xi
2
3
4
5
6
yi 2.2 3.8 5.5 6.5 7.0
xiyi 4.4 11.4 22.0 32.5 42.0
(4)回归直线和线性回归方程 直线__^y_=__^a__+__^b__x称为回归直线,此直线方程即为线性回 归方程, ^a 称为__回__归__截__距___, ^b 称为_回__归__系__数____, ^y 称为 ___回__归__值____. [提醒] (1)在线性回归方程中,b既表示回归直线的斜率,又表示 自变量x的取值增加一个单位时,函数值y的改变量. (2)通过回归方程^y=^a+^bx可求出相应变量的估计值.
相关文档
最新文档