高中数学第三章统计案例疑难规律方法学案苏教版选修2-3
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
------------------------- 天才是百分之一的灵感加百分之九十九的勤劳 -------------------------
-----
第三章 统计事例
1 本章知识大串烧
一、独立性查验的基本思想
经过剖析数据与图形,得出的预计是大略的,因为我们说的“大得多”
、“小得多”,究竟是有
多大的差距?也就是说获得的结论是直观上的印象,其实与能否有关仍是有较大的差距的.
下边从理论上说明两个变量能否有关,请同学们从中领会其思想方法.
1.基本思想与图形的联系
假定两个变量是没关的,可知以下的比应差不多,即:
a
c
a +
b ≈
c +
d ? | ad - bc | = 0.
2
n ad - bc 2
b + d ( 此中 n = a + b +
c +
d )( 此公式怎样记忆,其特色是
结构统计量 χ =
a +
b
c +
d a + c
什么?联合 2× 2 列联表理解 ) ,明显所结构的统计量与 | -
| 的大小拥有一致性.
ad bc
2.独立性查验的思想方法 假如 χ2 的值较大,说明其发生
( 没关系 ) 的概率很小,此时不接受假定,也就是两个变量是有
关系的 ( 称小概率事件发生 ) ;假如 χ 2 的值较小,此时接受假定, 说明两分类变量是没关系的. 其
思想方法近似于数学上的反证法.
3.获得 χ2 的值常与以下几个临界值加以比较:
假如 χ2 ,就有 90%的掌握以为Ⅰ和Ⅱ有关系;假如 χ2 ,就有 95%的掌握以为Ⅰ和Ⅱ有关系; 假如
χ2 ,就有 99%的掌握以为Ⅰ和Ⅱ有关系; 假如 χ 2 ,就有 99.9% 的掌握以为Ⅰ和Ⅱ有关系;假如 χ2≤ ,就以为没有充足的凭证显示Ⅰ和Ⅱ有关系.
2 像这种利用统计量 χ 来确立在多大程度上能够以为“两个变量有关系”的方法称为两个变量的独立性查验.
^
^
^
1.线性回归方程 y = b x + a ,此中:
n
n
^
∑ x i - x y i - y ∑ x i y i - n x y
^
^
i = 1
i = 1
, a = y - b x .
b =n =n
∑ x i - x 2 2 2
∑ x i - n x
i = 1
i = 1
n
^
∑ x i y i - n x y
( 注:
b i = 1
主要方便计算,此中
( i , i ) 为样本数据, (
x ,
y ) 为样本点的中
=
n
2
2
x y
∑ x i - n x
i = 1
心 )
公式作用:经过刻画线性有关的两变量之间的关系,预计和剖析数据的状况,解说一些实质
问题,以及数据的变化趋向.
2.样真有关系数的详细计算公式
金戈铁制卷
------------------------- 天才是百分之一的灵感加百分之九十九的勤劳------------------------------
n
∑x i- x y i- y
r =i = 1
n n
∑ x i- x 2 ∑ y i- y 2
i = 1 i =1
n
∑ x i y i-n x y
=i = 1
n n
2 -n x 2 2 2
∑ x i ∑ y i- n y
i = 1 i = 1
公式作用:反应两个变量之间线性有关关系的强弱.当r 的绝对值靠近 1 时,表示两个变量
的线性有关性越强;当 r 的绝对值靠近 0 时,表示两个变量之间几乎不存在线性有关关系.规定当 | r |> r时,以为两个变量有很强的线性有关关系.
^
公式联系:(1) 因为分子与回归方程中的斜率 b 的分子同样(这也给出了公式的内在联系以及
公式的记法 ) ,所以,当r >0 时,两个变量正有关;当r <0时,两个变量负有关.
(2)常配合散点图判断两个随机变量能否线性有关.
散点图是从形长进行大略地剖析判断,这个判断是可行的、靠谱的,也是进行线性回归剖析
的基础,不然回归方程无效;它形象直观地反应了数据点的散布状况.
有关系数 r 是从数上反应了两个变量能否拥有线性有关关系,以及线性有关关系的强弱,它
较精准地反应了数据点的散布状况,正确靠谱.
2回归剖析题目睹破
1.基本观点
函数关系是一种确立关系,而有关关系是一种非确立关系,回归剖析是对拥有有关关系的两
个变量进行统计剖析的一种常用方法.
例 1以下变量之间的关系是有关关系的是________.( 填序号 )
①正方形的边长与面积之间的关系;
②水稻产量与施肥量之间的关系;
③人的身高与年纪之间的关系;
④降雪量与交通事故发生率之间的关系.
剖析两变量之间的关系有两种:函数关系和带有随机性的有关关系.
分析①是函数关系;
②不是严格的函数关系,可是拥有有关性,因此是有关关系;
③既不是函数关系,也不是有关关系,因为人的年纪达到一准期间身高就不发生明显变化了,
因此它们不拥有有关关系;
④降雪量与交通事故发生率之间拥有有关关系.
答案②④
评论该例主要观察对变量有关关系观点的掌握.
2.线性回归方程
金戈铁制卷
设 x 与 y 是拥有有关关系的两个变量,且相应于n 个观察值的n 个点大概散布在一条直线的邻近,这条直线就叫做线性回归直线.
例 2 假定对于某设施的使用年限x(年)和所支出的维修花费y(万元)有以下的统计资料:
使用年限 x 2 3 4 5 6
维修花费 y
若由资料知y 对 x 呈线性有关关系,试求:
^^^
(1)线性回归方程 y = a +b x;
(2)预计使用年限 10 年时,维修花费是多少?
剖析因为 y 对 x 呈线性有关关系,所以能够用线性有关的方法解决问题.
解 (1) 制表
i 1 2 3 4 5 共计
x i 2 3 4 5 6 20
y i 25
x i y i
2
4 9 16 2
5 3
6 90
x i
5
2 5
x = 4,y = 5,∑x i= 90,∑x i y i=
i = 1 i = 1
^112.3 - 5× 4× 5
于是有 b =90-5×42=,
^^
a= y - b x =5-×4=0.08.
^
∴线性回归方程为y = x+0.08.
^
(2)当 x=10时, y =×10+=12.38(万元),
即预计使用 10 年时维修花费约是 12.38 万元.
评论已知 y 对 x 呈线性有关关系,无需进行有关性查验,不然,应第一进行有关性查验.
3.非线性回归问题
剖析非线性回归问题的详细做法
(1) 若问题中已给出经验公式,这时能够将解说变量进行变换( 换元 ) ,将变量的非线性关系转化为线性关系,将问题化为线性回归剖析问题来解决.
(2) 若问题中没有给出经验公式,需要我们画出已知数据的散点图,经过与各样函数( 如指数函数、对数函数、幂函数等) 的图象作比较,选择一种与这些散点拟合得最好的函数,而后采
用适合的变量变换,将问题化为线性回归剖析问题来解决.
下边举例说明非线性回归剖析问题的解法.
例 3某地域对当地的公司进行了一次抽样检查,表中是此次抽查中所获得的各公司的人均资
金戈铁制卷
本 x(单位:万元) 与人均产值y(单位:万元)的数据:
人均资本 x/万元 3 4 7 8 9 14
人均产值 y/万元
4 3 0 6
1
(1) 设y与x之间拥有近似关系
b
a 和
b 的值;y≈ax ( a, b 为常数),试依据表中数据预计
(2)预计公司人均资本为 16 万元时的人均产值 ( 精准到 0.01) .
解(1) 在y≈ax b的两边取常用对数,可得lg y≈lg a+ b lg x,设lg y= z,lg a=A,lg x =X,则 z≈ A+ bX.
有关数据计算以下表所示.
人均资本
3 4 7
x/万元
人均产出
y/万元
X=lg x 0.477 12 0.602 06 0.740 36 0.812 91 0.845 1
z=lg y 0.614 9 0.669 32 0.938 52 1.041 79 1.115 28
人均资本
8 9 14
x/万元
人均产出
y/万元
X=lg x 0.903 09 0.954 24 1.021 19 1.060 7 1.146 13
z=lg y 1.159 27 1.243 04 1.405 86 1.425 86 1.655 14
^
A =-0.215 5,
由公式 (1) 可得^
b= 1.567 7 ,
^^
由 lg a=- 0.215 5 ,得a≈ 0.608 8 ,
即 a, b 的预计值分别为8 和 1.567 7.
^
x1.567 7 .
(2) 由 (1) 知y= 0.608 8
样本数据及回归曲线的图形以下图.
^
当 x=16时, y =0.608 8×161.567 7≈47.01(万元),
金戈铁制卷
故当公司人均资本为16 万元时,人均产值约为47.01 万元 .
3独立性查验思想的应用
在平时生活中,常常见面对一些需要推测的问题.在对这些问题作出推测时,我们不可以仅凭
主观臆断作出结论,需要经过试验来采集数据,并依照独立性查验思想做出合理的推测.
所谓独立性查验,就是依据采集样本的数据,利用公式计算χ2的值,比较与临界值的大小关
系来判断事件X与 Y 能否有关的问题.其基本步骤以下:
(1)观察需抽样检查的背景问题,确立所波及的变量;
(2)依据样本数据制作列联表;
(3)计算统计量χ2,并查表剖析.当χ2很大时,就以为两个变量有关系;不然就以为没有充
分的凭证显示两个变量有关系.
下边举例说明独立性查验思想在解决实质问题中的应用.
例 1 水果富含各样维生素,不只有利于人体健康,还可起到养颜护肤的功能.下表是一次检查
所得的数据,试问:适当吃水果与皮肤好有关系吗?有多大的掌握以为你的结论成立?
皮肤好皮肤不好共计
适当吃水果30 224 254
不吃水果24 1 355 1 379
共计54 1 579 1 633
解假定“适当吃水果与皮肤好没有关系”,由题意可知,a=30, b=224,c=24,d=1 355,a+ b=254, c+d=1 379, a+ c=54, b+ d=1 579,n=1 633,代入获得
χ2=1 633×30×1 355-224×242≈68.033>10.828.
254×1 379 × 54× 1 579
∴我们有99.9%的掌握以为吃水果与皮肤好有关系.
评论该例中我们有较大的掌握以为结论成立,但我们所说的“吃水果与皮肤好有关系”指
的都是统计上的关系,不要误以为里面存在因果关系,详细到某一个适当吃水果的人,其实不
能说明他必定有好的皮肤.
例 2 某大型公司人力资源部为了研究公司职工工作踊跃性和对待公司改革态度的关系,随机抽取了 189 名职工进行检查,所得数据以下表所示:
踊跃支持公司不太同意公司
共计
改革改革
工作踊跃54 40 94
工作一般32 63 95
共计86 103 189
对于人力资源部的研究项目,依据上述数据能得出什么结论?
剖析第一由已知条件确立a、 b、 c、 d、 n 的数值,再利用公式求出χ2的值,最后依据χ2 金戈铁制卷
-------------------------天才是百分之一的灵感加百分之九十九的勤劳------------------------------
的值剖析结果.
解由题目中表的数据可知,
χ2=
n ad- bc 2
a+ c a+ b c+ d b+ d
189× 54× 63- 40× 32 2
=≈ 10.759.
94× 95× 86× 103
因为 10.759>7.879 ,所以有 99.5%的掌握说职工“工作踊跃”与“踊跃支持公司改革”有关,能
够以为公司的全体职工对待公司改革的态度与其工作踊跃性是有关的.
评论在列联表中注意事件的对应及有关值确实定,防止杂乱;把计算出的χ2的值与临界值
作比较,确立出“Ⅰ与Ⅱ有关系”的掌握程度.
例 3为了检查患慢性气管炎能否与抽烟有关,检查了339 名 50 岁以上的人,统计结果为:
患慢性气管炎共有56 人,患慢性气管炎且抽烟的有43 人,未患慢性气管炎但抽烟的有162 人.依据检查统计结果,剖析患慢性气管炎与抽烟在多大程度上有关系?
解依据所给样本数据获得以下2×2 列联表:
患慢性气管炎未患慢性气管炎总计
抽烟43162205
不抽烟13121134
总计56283339
由列联表能够大略预计出:在抽烟者中,有 20.98%的患慢性气管炎;在不抽烟者中,有 9.70% 的患慢性气管炎.两个比率的值相差较大,所以结论“患慢性气管炎与抽烟有关”成立的可能性较大.
依据列联表中的数据,
2
获得χ2 =339×43× 121- 13×162
56× 283×205× 134
≈7.469>6.635.
所以有 99%的掌握以为“患慢性气管炎与抽烟有关”.
评论对列联表的比率进行剖析,可大略地判断两个分类变量能否有关系.经过计算统计量
χ2,能够比较精准地给出这种判断的靠谱程度.先采集数据,而后经过一些统计方法对数据
进行科学的剖析,这是我们用统计方法解决实质问题的基本策略.
4巧解非线性回归问题
假如题目所给样本点的散布不呈带状散布,即两个变量不呈线性关系,那么,就不可以直接利
用线性回归方程成立两个变量之间的关系,这时我们能够把散点图和已经学过的各样函数,如
幂函数、指数函数、对数函数、二次函数等作比较,精选出与这些散点拟合最好的函数,
而后利用变量置换,把非线性回归方程问题转变成线性回归方程的问题来解决,这是解决此
类问题的通法,表现了转变思想.
金戈铁制卷
1.事例剖析
例 一个昆虫的某项指标和温度有关,现采集了
7 组数据以下表:
温度
3
4 5
6
7
8
2
x / ℃
某项指
标 y
试成立某项指标 y 对于温度 x 的回归模型,并判断你所成立的回归模型的拟合成效.
剖析 依据表中的数据画出散点图,再由图设出相应的回归模型.
解 画出散点图以下图,样本点并无散布在某个带状地区内,而是散布在某一条二次函
数曲线 y = Bx 2+ A 的四周.
令 X = x 2 ,则变换后的样本点应当散布在 y = bX + a ( b =B , a = A ) 的四周.由已知数据可得变换后的样本数据表:
X
4
9
16
25
36
49
64
某项
指标 y
^
计算获得线性回归方程为 y = 0.199 94 X + 4.999 03.
2
替代 ,得某项指标
^
2
用
x
y 对于温度 x 的回归方程 y = 0.199 94
+4.999 03.
X x
计算得 r ≈ 0.999 999 ,几乎为 1,说明回归模型的拟合成效特别好.
评论 此题是非线性回归剖析问题,解决这种问题应当先画出散点图,把它与我们所学过的
函数图象相比较,选择一种跟这些样本点拟合的最好的函数,而后采纳适合的变量变换转变
为线性回归剖析问题,使之得以解决.
2.知识拓展
常有的非线性函数变换方法:
(1) 幂型函数 y =ax m ( a 为正数, x , y 取正当 )
解决方案:对
y =
ax m
两边取常用对数,有 lg y = lg + lg ,令 = lg y , = lg
x ,则原
a m x u v
式可变成 u = mv +lg a ,此中 m , lg a 为常数,该式表示 u , v 的线性函数.
x
(2) 指数型函数 y = ca ( a ,c >0,且 a ≠ 1) 解决方案:对 y =ca x 两边取常用对数,则有
lg y =lg c + x lg a ,令 u = lg y ,则原式可变成
u = x lg a + lg c ,此中 lg a 和 lg c 为常数,该式表示 u , x 的线性函数.与幂函数不一样的是
金戈铁制卷
x 保持不变,用 y 的对数lg y 取代了 y.
k
(3)反比率函数 y=x( k>0)
1
解决方案:令u=x,则 y= ku,该式表示y,u 的线性函数.
(4)二次函数 y=ax2+ c
解决方案:令u=x2,则原函数可变成y= au+c,该式表示y,u 的线性函数.(5)对数型函数 y= c log a x
解决方案:令x=a u,则原函数可变成y= cu,该式表示y, u 的线性函数.
金戈铁制卷。