高中选修1-2回归分析和独立性检验知识总结与联系
人教版A版高中数学选修1-2课后习题解答
人教版A版高中数学选修1-2课后习题解答高中数学选修1-2课后题答案第一章统计案例1.1 回归分析的基本思想及其初步应用回归分析是一种统计分析方法,用于探究自变量与因变量之间的关系。
它的基本思想是通过建立数学模型,利用已知数据进行拟合,从而预测或解释未知数据。
回归分析的初步应用包括简单线性回归和多元线性回归。
1.2 独立性检验的基本思想及其初步应用独立性检验是一种用于检验两个变量之间是否存在关联的方法。
其基本思想是通过观察两个变量之间的频数或频率分布,来判断它们是否相互独立。
独立性检验的初步应用包括卡方检验和Fisher精确检验。
第二章推理证明2.1 合情推理与演绎推理合情推理是指根据已知事实和常识,推断出可能的结论。
演绎推理是指根据已知的前提和逻辑规则,推导出必然的结论。
两种推理方法都有其适用的场合,需要根据具体情况进行选择。
2.2 直接证明与间接证明直接证明是指通过逻辑推理,直接证明所要证明的命题成立。
间接证明是指采用反证法或归谬法,证明所要证明的命题的否定不成立,从而推出所要证明的命题成立。
第三章数系的扩充与复数的引入3.1 数系的扩充与复数的概念数系的扩充是指在实数系的基础上引入新的数,使得一些原来不可解的方程可以得到解。
复数是指由实部和虚部组成的数,可以表示在平面直角坐标系中的点。
复数的引入扩充了数系,使得一些原本无解的方程可以得到解。
3.2 复数的代数形式的四则运算复数的代数形式是指将复数表示为实部和虚部的和的形式。
复数的四则运算包括加减乘除四种运算,可以通过对实部和虚部分别进行运算来得到结果。
第四章框图4.1 流程图流程图是一种用图形表示算法或过程的方法。
它由各种基本符号和连线构成,用于描述算法或过程的各个步骤及其执行顺序。
流程图可以帮助人们更好地理解算法或过程,从而提高效率。
4.2 结构图结构图是一种用于描述程序结构的图形表示方法。
它包括顺序结构、选择结构和循环结构三种基本结构,可以用来表示程序的控制流程。
第5讲 选修1-2复习小结(教师版)
二.典例精析
探究点一:线性回归分析
例1 :从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得 =80 =20 =720 =184 (1)求家庭的月储蓄y对月收入x的线性回归方程y=bx+a(2)判断变量x与y之间是正相关还是负相关(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄
2.数学证明方法:(1)综合法①定义:利用已知条件和某些数学定义、公理、定理等,
经过一系列的推理论证,最后推导出所要证明的结论成立,这种证明方法叫做综合法.
②框图表示:→→→…→(其中P表示已知条件、已有的定义、公理、定理等,Q表示要证明的结论).(2)分析法①定义:从要证明的结论出发,逐步寻求使它成立的充分条件,直至最后,把要证明的结论归结为判定一个明显成立的条件(已知条件、定理、定义、公理等)为止.这种证明方法叫做分析法.②框图表示:→→→…→.(3)反证法:假设原命题不成立,经过正确的推理,最后得出矛盾,因此说明假设错误,从而证明了原命题成立,这样的证明方法叫做反证法.
(2)相关系数r①r=;②当r>0时,表明两个变量________;当r<0时,表明两个变量________.r的绝对值越接近于1,表明两个变量的线性__________;r的绝对值越接近于0时,表明两个变量之间________________________________.通常,当r的绝对值大于________时认为两个变量有很强的线性相关关系.
变式迁移3:(1)设等差数列{an}的前n项和为Sn,则S4,S8-S4,S12-S8,S16-S12成等差数列.类比以上结论有:设等比数列{bn}的前n项积为Tn,则T4,,,成等比数列.
苏教版高中数学选修1-2拓展资料:独立性检验中的“有关”和“无关”
独立性检验中的“有关”和“无关”独立性检验是数理统计中的一种方法,是数学中的一种基本理论,是数学体系中对数据关系进行探索的一种基本思想。
在日常生活中,经常会面临一些需要推断的问题,在对这些问题做出推断实时,我们不能仅凭主观意愿做出结论,需要通过试验来收集数据,并以独立检验的原理做出合理的推断,这就是独立检验的基本思想。
根据这一思想,我们可以考察两个分类变量X和Y是否有关系,并且能给出这种判断的可靠程度。
一、判断两个分类变量有关例1 在对人们休闲的一次调查中,共调查了124人,其中女性70人,男性54人。
女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动。
(1)根据以上数据建立一个22⨯的列联表;(2)检验性别与休闲方式是否有关系。
分析:根据独立性检验的步骤,结合题目中的数据列列联表,计算2K的值,与临界值作比较,做出结论。
解析:(1)22⨯的列联表如下:(2)假设休闲方式与性别无关,计算22124(43332721)6.20170546460K⨯⨯-⨯=≈⨯⨯⨯。
因为2 5.024K>,所以有理由认为假设休闲方式与性别无关是不合理的,即我们有97.5%的把握认为休闲方式与性别有关。
二、判断两个分类变量无关例2 某县对在职的71名高中数学教师就支持新的数学教材还是支持旧的数学教材作了调查,结果如下表所示:根据此资料,你是否认为教龄的长短与支持新的数学教材有关?分析:根据独立性检验思想,由公式计算出2K的值与临界值作比较,再做出结论。
解析:由公式得2271(12242520)0.0837342249K⨯⨯-⨯=≈⨯⨯⨯,由于2 2.706K<,所以我们没有充分的证据说明教龄的长短与支持新的数学教材有关。
人教版数学选修1-21.2独立性检验的基本思想及其初步应用
d)
22
偏高 不偏高
合计
超重 不超重
4
1
3 12
7 13
合计 5 15 20
独立性检验临界值表:
P(K2≥k0) 0.025 0.010 0.005 0.001
k0
5.024 6.635 7.879 10.828
由独立性检验随机变量 K 2 值的计算公式得:
K
2
a
n ad bc2 bc da cb
9874
91
9965
像上表列出的两个分类变量的频数表,称为列联表
4
1.下面是一个2×2列联表:
y1
y2
x1
a 21
x2
2 25
总计 b 46
总计 73 27 100
则表中a、b的值分别为( C )
A.94、96
B.52、50
C.52、54
D.54、52
5
分类变量
为了调查吸烟是否对肺癌有影响,某肿瘤研究所随 机地调查了9965人,得到如下结果(单位:人)
1
1.2独立性检验的 基本思想及其初 步应用
2两种变量:
对于性别变量,其取值为男和女两种。这种变量的不同‘值’ ,表示个体所属的不同类别,像这样的变量称为分类变量 在日常生活中,我们常常关心分类变量之间是否有关系: 例如,吸烟是否与患肺癌有关系?
性别是否对于喜欢数学课程有影响?等等。
研究两个变量的相关关系:
2课0堂练习 1:通过随机询问 110 名性别不同的大学生是否爱好某项运动,得到
如下的列联表:
男
女
总计
爱好
40
20
60
不爱好
20
总计
高中数学选修1-2知识点总结61389
知识点总结选修1-2知识点总结第一章 统计案例1.线性回归方程①变量之间的两类关系:函数关系与相关关系; ②制作散点图,判断线性相关关系 ③线性回归方程:a bx y +=∧(最小二乘法)其中,1221ni i i nii x y nx y b x nx a y bx==⎧-⎪⎪=⎪⎨-⎪⎪=-⎪⎩∑∑ 注意:线性回归直线经过定点),(y x .2.相关系数(判定两个变量线性相关性):∑∑∑===----=ni ni i ini i iy y x xy y x xr 11221)()())((注:⑴r >0时,变量y x ,正相关;r <0时,变量y x ,负相关; ⑵①||r 越接近于1,两个变量的线性相关性越强;②||r 接近于0时,两个变量之间几乎不存在线性相关关系。
3.条件概率对于任何两个事件A 和B ,在已知B 发生的条件下,A 发生的概率称为B 发生时A 发生的条件概率. 记为P (A |B ) , 其公式为P (A |B )=P (AB )P (A )4相互独立事件(1)一般地,对于两个事件A ,B ,如果_ P (AB )=P (A )P (B ) ,则称A 、B 相互独立.(2)如果A 1,A 2,…,A n 相互独立,则有P (A 1A 2…A n )=_ P (A 1)P (A 2)…P (A n ).(3)如果A ,B 相互独立,则A 与B -,A -与B ,A -与B -也相互独立.5.独立性检验(分类变量关系):(1)2×2列联表设,A B 为两个变量,每一个变量都可以取两个值,变量121:,;A A A A =变量121:,;B B B B =通过观察得到右表所示数据:并将形如此表的表格称为2×2列联表.(2)独立性检验根据2×2列联表中的数据判断两个变量A ,B 是否独立的问题叫2×2列联表的独立性检验.(3) 统计量χ2的计算公式χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )第二章 推理与证明考点一 合情推理与类比推理根据一类事物的部分对象具有某种性质,退出这类事物的所有对象都具有这种性质的推理,叫做归纳推理,归纳是从特殊到一般的过程,它属于合情推理根据两类不同事物之间具有某些类似(或一致)性,推测其中一类事物具有与另外一类事物类似的性质的推理,叫做类比推理.类比推理的一般步骤:(1) 找出两类事物的相似性或一致性;(2) 用一类事物的性质去推测另一类事物的性质,得出一个明确的命题(猜想);(3) 一般的,事物之间的各个性质并不是孤立存在的,而是相互制约的.如果两个事物在某些性质上相同或相似,那么他们在另一写性质上也可能相同或类似,类比的结论可能是真的.(4) 一般情况下,如果类比的相似性越多,相似的性质与推测的性质之间越相关,那么类比得出的命题越可靠.考点二 演绎推理(俗称三段论)由一般性的命题推出特殊命题的过程,这种推理称为演绎推理.考点三 数学归纳法:它是一个递推的数学论证方法. 步骤:A.命题在n=1(或0n )时成立,这是递推的基础; B.假设在n=k 时命题成立 C.证明n=k+1时命题也成立,完成这两步,就可以断定对任何自然数(或n>=0n ,且n N ∈)结论都成立。
【高考数学总复习】:回归性分析与独立性检验(知识点讲解+真题演练+详细解答)
量,例如某同学的数学成绩与化学成绩。
2.线性回归分析 (1) 散点图:将样本中的各对数据在直角坐标系中描点而得到的图形叫做散点图,它直观地 描述了两个变量之间是否有相关关系,是判断两个变量相关性的重要依据。 (2) 回归直线:散点图中点的整体分布在一条直线左右,则称这两个变量之间具有线性相关
(a b)(c d)(a c)(b d )
通过对统计量 K2 的研究,一般情况下认为:
①当 K 2 ≤3.841 时,认为变量 X 与 Y 是无关的。
②当 K 2 >3.841 时,有 95%的把握说变量 X 与 Y 有关;
④ 当 K 2 >6.635 时,有 99%的把握说变量 X 与 Y 有关;
定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验。
2.分类变量的理解: 分类变量是说明事物类别的一个名称,其取值是分类数据。如“性别”就是一个分类变 量,其变量值为“男”或“女”;“行业”也是一个分类变量,其变量值可以为“零售 业”,说明 X 与 Y 无关的把握越小
6. 右表是对与喜欢足球与否的统计列联表依据表中的数据,得到( )
A. K 2 9.564 B. K 2 3.564 C. K 2 2.706 D. K 2 3.841
7. 对两个分类变量 A、B 的下列说法中正确的个数为( ). ①A 与 B 无关,即 A 与 B 互不影响;②A 与 B 关系越密切,则 K2 的值就越大;③K2
x yw
46.6 563 6.8
8
(xi x )2
i 1
人教新课标版数学高二人教A选修1-2素材 独立性检验的基本思想及其初步应用方法总结
独立性检验的基本思想及其初步应用方法总结1.独立性检验是对两个分类变量间是否有关系的一种案例分析方法,其分析方法有:等高条形图法和利用假设的思想方法,计算出某一个随机变量K 2的观测值来进行判断.2.在等高条形图中,可以估计满足条件X =x 1的个体中具有Y =y 1的个体所占的比例为aa +b ,也可以估计满足条件X =x 2的个体中具有Y =y 2的个体所占的比例为cc +d ,两个比例的值相差越大,两个分类变量相关的可能性就越大.3.独立性检验的一般步骤: (1)根据样本数据制成2×2列联表; (2)根据公式K 2=n (ad -bc )2(a +b )(a +c )(b +d )(c +d )计算K 2的观测值;(3)比较K 2与临界值的大小关系作统计推断1.在等高条形图形中,下列哪两个比值相差越大,“两个分类变量有关系”成立的可能性越大(C ) A .a a +b 与d c +d B .c a +b 与a c +d C .a a +b 与c c +d D .a a +b 与c b +c2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表;男 女合计 爱好40206不爱好203050总计60 50 110由K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d )算得,K 2=110(40×30-20×20)260×50×60×50≈7.8.附表:A .有99%以上的把握认为“爱好该项运动与性别有关”B .有99%以上的把握认为“爱好该项运动与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”3.某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:k =50(13×20-10×7)220×30×23×27≈4.844,因为k >3.841,所以确定主修统计专业与性别有关系,那么这种判断出错的可能性为________.解析:∵k =4.844>3.841,∴有95%的把握可以确定主修统计专业与性别有关,那么这种判断出错的可能性为5%.答案:5%。
最新人教版高中数学选修1-2《回归分析的基本思想及其初步应用》教材梳理
庖丁巧解牛知识·巧学 一、回归分析回归分析是根据变量观测数据分析变量间关系的常用统计分析方法.通常把变量观测数据称为样本.1.散点图与回归方程(1)设对y 及x 做n 次观测得数据(x i ,y i )(i=1,2,…,n).以(x i ,y i )为坐标在平面直角坐标系中描点,所得到的这张图便称之为散点图.其中x 是可观测、可控制的普通变量,常称它为自变量,y 为随机变量,常称其为因变量.知识拓展 散点图是直观判断变量x 与y 是否相关的有效手段. (2)a 与回归系数b 的计算方法若散点呈直线趋势,则认为y 与x 的关系可以用一元回归模型来描述.设线性回归方程为y=a+bx+ε.其中a 、b 为未知参数,ε为随机误差,它是一个分布与x 无关的随机变量.最小二乘估计aˆ和b ˆ是未知参数a 和b 的最好估计. x b y aˆˆ-=,b ˆ=∑∑==---ni ini i ix xy y x x121)())((.深化升华 bˆ的计算还可以用公式b ˆ=∑∑==--ni ini ii x n xyx n yx 1221来计算,这时只需列表求出相关的量代入即可. 2.相关性检验如下图中的两个散点图,很难判断这些点是不是分布在某条直线附近.假如不考虑散点图,按照最小二乘估计计算a 与b ,我们可以根据一组成对数据,求出一个回归直线方程.但它不能反映这组成对数据的变化规律.为了解决上述问题,我们有必要对x 与y 作线性相关性的检验,简称相关性检验.对于变量x 与y 随机抽取到的n 对数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),检验统计量是样本相关系数r.r=∑∑∑∑∑∑======---=----ni i ni i ni ii ni i n i i ni i iy n y x n x yx n yx y y x x y y x x122122112121)()()()())((.r 具有以下性质:当r 大于0时,表明两个变量正相关,当r 小于0时,表明两个变量负相关;|r|≤1;|r|越接近1,线性相关程度越强;|r|越接近0,线性相关程度越弱.通常当|r|大于0.75时,认为两个变量有很强的线性相关关系.相关性检验临界值如下表所示.相关性检验的临界值表深化升华 相关性检验的步骤也可如下: (1)作统计假设:X 与Y 不具有线性相关关系.(2)根据小概率0.05与n-2在相关性检验的临界值表中查出r 的一个临界值r 0.05. (3)根据样本相关系数计算公式算出r 的值.(4)作出统计推断.如果|r|>r 0.05,表明有95%的把握认为X 与Y 之间具有线性相关关系.如果|r|≤r 0.05,我们没有理由拒绝原来的假设.这时寻找回归直线方程是没有意义的. 3.回归分析的基本概念(1)在数学上,把每个效应(观测值减去总的平均值)的平方和加起来,即用∑=-ni iy y12)(表示总的效应,称为总偏差平方和.(2)数据点和它在回归直线上相应位置的差异(y i -i yˆ)是随机误差的效应,称i e ˆ=(y i -i y ˆ)为残差.(3)分别将残差的值平方后回来,用数学符号表示为∑=-ni i iy y12)(称为残差平方和.它代表了随机误差的效应.(4)总偏差平方和与残差平方和的差称为回归平方和.(5)回归效果的刻画我们可以用相关指数R 2反映.R 2=1-∑∑==--n i ini i iy y yy1212)()ˆ(.显然,R 2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好.4.非线性回归问题 在实际问题中,当变量之间的相关关系不是线性相关关系时,不能用线性回归方程描述它们之间的相关关系,需要进行非线性回归分析,然而非线性回归方程一般很难求,因此把非线性回归化为线性回归应该说是解决问题的好方法.首先,所研究对象的物理背景或散点图可帮助我们选择适当的非线性回归方程yˆ=μ(x;a,b).其中a及b为未知参数,为求参数a及b的估计值,往往可以先通过变量置换,把非线性回归化为线性回归,再利用线性回归的方法确定参数a及b的估计值.问题·探究问题函数关系是一种确定性关系,而对一种非确定性关系——相关关系,我们如何研究?导思:由于相关关系不是一种确定性关系,我们经常运用统计分析的方法,即回归分析,按照画散点图,求回归方程,用回归方程预报等步骤进行.探究:我们可以知道,相关关系中,由部分观测值得到的回归直线,可以对两个变量间的线性相关关系进行估计,这实际上是将非确定性问题转化成确定性问题来研究.由于回归直线将部分观测值所反映的规律性进行了延伸,它在情况预报、资料补充等方面有着广泛的应用,从某种意义上看,函数关系是一种理想的关系模型,而相关关系是一种更为一般的情况.因此研究相关关系,不仅可使我们处理更为广泛的数学应用问题,还要使我们对函数关系的认识上升到一种新的高度.典题·热题思路解析:散点图是表示具有相关关系的两个变量的一组数据的图形.解:散点图如下:例2每立方米混凝土的水泥用量x(单位:kg)与28天后混凝土的抗压强度(单位:kg/cm2)之间的关系有如下数据:(2)如果y与x之间具有线性相关关系,求回归直线方程.思路解析:求回归直线方程和相关系数,可以用计算器来完成.在有的较专门的计算器中,可通过直接按键得出回归直线方程的系数和相关系数,而如果要用一般的科学计算器进行计算,则要先列出相应的表格,有了表格中的那些相关数据,回归方程中的系数和相关系数就都容易求出了.解:(1)r=)6.721294.64572)(20512518600(6.722051218294322⨯-⨯-⨯⨯-≈0.999>0.75.说明变量y 与x 之间具有显著的线性正相关关系.bˆ=143004347205125186006.72205121829432=⨯-⨯⨯-≈0.304, x b y aˆˆ-==72.6-0.304×205=10.28. 于是所求的线性回归方程为yˆ=0.304x+10.28. 深化升华 为了进行相关性检验,通常将有关数据列成表格,然后借助于计算器算出各个量,为求回归直线方程扫清障碍.若由资料知y 对x 有线性相关关系.试求:(1)线性回归方程yˆ=b ˆx+a ˆ的回归系数a ˆ,b ˆ. (2)使用年限为10年时,估计维修费用是多少?思路解析:因为y 对x 有线性相关关系,所以可以用一元线性相关的方法解决问题.利用公式bˆ=∑∑==--ni i ni ii x n x yx n yx 1221,aˆ=y -b ˆx 来计算回归系数.有时为了方便常列表对应写出x i y i ,x i 2,以利于求和.解:(1)x =4,y =5,∑=ni ix12=90,∑=ni ii yx 1=112.3,于是bˆ=245905453.112⨯-⨯⨯-=1.23,aˆ=y -b ˆx =5-1.23×4=0.08. (2)回归直线方程为yˆ=1.23x+0.08.当x=10年时,y ˆ=1.23×10+0.08=12.38(万元),即估计使用10年的维修费用是12.38万元.方法归纳 知道y 与x 呈线性相关关系,就无需进行相关性检验,否则,应首先进行相关性检验.如果本身两个变量不具有相关关系,或者说,它们之间相关关系不显著,即使求出了回归方程也是毫无意义的,而且估计和预测的量也是不可信的.例4一只红铃虫的产卵数y与x有关,现收集了7组观测数据列于表中,试建立y与x之间思路解析:首先要作出散点图,根据散点图判定y与x之间是否具有线性相关关系,若具有线性相关关系,再求线性回归方程.在散点图中,样本点并没有分布在某个带状区域内,因此两个变量不呈线性相关关系,所以不能直接利用线性回归方程来建立两个变量之间的关系.根据已有的函数知识,可以发现样本分布在某一指数函数曲线的周围.解:散点图如下所示:由散点图可以看出:这些点分布在某一条指数函数y=pe qx(p,q为待定的参数)的周围.现在,问题变为如何估计待定的参数p和q,我们可以通过对数变换把指数关系变为线性关系.令z=lny,则变换后样本点应该分布在直线z=bx+a(a=lnp,b=q)周围.这样就可以利用线性回归模型来建立y与x之间的非线性回归方程了.由下图可看出,变换后的样本点分布在一条直线的附近,因此可以用线性回归方程来拟合.经过计算得到线性回归方程为zˆ=0.272x-3.843.因此红铃虫的产卵数对温度的非线性回归方程为yˆ=e0.272x-3.843.方法归纳线性回归问题在解决前可以先画散点图,通过散点图判断是否为线性回归,如果不是线性回归,要先转换为线性回归问题.。
高中数学-选修1-2-3.独立性检验
3.独立性检验教学目标 班级____姓名________1.了解分类变量、列联表、随机变量2K .2.了解独立性检验的基本思想和方法. 教学过程 一、知识要点.1.分类变量:变量不同的值表示个体所属的类别不同.2.列联表:两个分类变量的频数表.3.随机变量:))()()(()(22d b c a d c b a bc ad n K ++++-=,010.0)635.6(2≈≥K P (小概率事件)4.独立性检验:运用统计分析的方法确定分类变量的关系. (1)要判断“两个分类变量有关系”;(2)假设结论不成立,即“0H :两个分类变量没有关系”;(3)确定一个判断规则的临界值0k :当02k K ≥时,认为“两个分类变量有关系”,否则认为“两个分类变量没有关系”;(0k 是根据允许误判概率的上限来确定的)(4)按照上述规则,误判概率为)(2(5)拓展: ①令||dc cb a a W +-+=,则))(())((22d bc ad c b a n W K ++++⨯=; ②令))(())((00d c b a n d b c a k w ++++⨯=;③02k K ≥等价于0w W ≥,所以)(0w W P ≥等价于)(02k K P ≥;④可以用)(0w W P ≥来作为判断依据.二、例题分析.例1:研究吸烟与患肺癌的关系. 1.确定研究对象:吸烟与患肺癌的关系.(1)由列联表可直观的了解:吸烟群体和不吸烟群体患肺癌的可能性存在差异.. (2)常用等高条形图展示列联表数据的频率特征.(见教科书11P 图) 3.独立性检验:(类似于反证法)(1)假设若“吸烟与患肺癌没有关系”,则dc cb a a +≈+.即“吸烟总数吸烟不患肺癌不吸烟总数不吸烟不患肺癌≈” 得0≈-bc ad ,所以||bc ad -越小,说明吸烟与患肺癌关系越弱,反之越强.(2)构造随机变量))()()(()(22d b c a d c b a bc ad n K ++++-=(其中d c b a n +++=)(3)科学研究表明:010.0)635.6(2≈≥K P . 即“当635.62≥K 时,事件发生的概率为0.010(小概率事件——几乎不可能发生)”(4)根据所采集的数据算得:在0H 成立的情况下,632.562≈K ,远远大于6.635,所以我们断定0H 不成立,即“吸烟与患肺癌有关系”.误判概率不超过010.0)635.6(2≈≥K P .作业:为了探究吸烟习惯与患慢性气管炎是否有关,调查了339名50岁以上的人,数据如下吸烟习惯与患慢性气管炎是否有关?试用独立性检验的思想说明理由.。
高中数学选修1-2知识点及典型题
选 修 1-2 知 识 点 总 结第一章:统计案例一.回归分析的基本思想及其初步应用1.正相关:如果点散布在从左下角到右上角的区域,则称这两个变量的关系为正相关。
2.负相关:如果点散布在从左上角到右下角的区域,则称这两个变量的关系为负相关。
3.回归直线方程的斜率和截距公式:⎪⎪⎩⎪⎪⎨⎧-=--=---=∑∑∑∑====xb y a xn x yx n yx x x y yx x b n i i ni ii n i i ini i1221121)()()((此公式不要求记忆)。
4.最小二乘法:求回归直线,使得样本数据的点到它的距离的平方最小的方法。
e :我们把线性回归模型e a bx y ++=,其中b a ,为模型的未知参数,e 称为随机误差。
随机误差a bx y e i i i --=eˆ:我们用回归方程a x b y ˆˆˆ+=中的y ˆ估计a bx +,随机误差)(a bx y e +-=, 所以y y e ˆˆ-=是e 的估计量,故a x b y y y e ii i i i ˆˆˆˆ--=-=,e ˆ称为相应于点),(i i y x 的残差。
2R :∑∑==---=ni ini iy yyy R 12122)()ˆ(1,2R 的表达式中21)(∑=-ni i y y 确定,(1)2R 越大,残差平方和21)ˆ(∑=-ni i yy 越小,即模型的拟合效果越好; (2)2R 越小,残差平方和21)ˆ(∑=-ni i yy 越大,即模型的拟合效果越差。
2R 越接近1,表示回归效果越好。
二.独立性检验的基本思想及其初步应用1.分类变量:这种变量的不同“值”表示个体所属的不同类别的变量。
2.列联表:列出两个分类变量的频数表,称为列联表。
22⨯列联表:2K 的观测值:))()()(()(2d b c a d c b a bc ad n k ++++-=。
0k 表:如果0k k ≥,就推断“Y X ,有关系”,这种推断犯错误的概率不超过α; 否则,在样本数据中没有发现足够证据支持结论“Y X ,有关系”。
人教B版高中数学选修1-2 1-2 回归分析二素材知识梳理2
回归分析的基本思想及其初步应用知识梳理一.线性回归方程的确定如果一组具有相关关系的数据1122(,),(,),,(,),n n x y x y x y 作出散点图大致分布在一条直线附近,那么我们称这样的变量之间的关系为线性相关关系(也称一元线性相关),这条直线就是回归直线,记为ˆybx a =+. 那么如何求得参数a b 和使得各点与此直线的距离的平方和为最小,即如何求得线性回归方程呢? 在所求回归直线方程ˆybx a =+中,当x 取i x 时,i i y bx a =+与实际收集到的数据i y 之间的偏差为()i i i i y y y bx a -=-+,偏差的平方为22()[()]i i i i y y y bx a -=-+(如图1). 即21()niii Q y bx a ==--∑ 来刻画出n 个点与回归直线在整体上的偏差的平方和,显然Q 取最小值时的,a b 的值就是我们所求的:121()()()n iii nii x x y y b x x ==--=-∑∑1221ni ii nii x y nx yxnx==-=-∑∑a y bx =-其中(,)i i x y 为样本数据,11,n ni i i ix x y y n n ==∑∑为样本平均数,(,)x y 称为样本点中心,且所求线性回归直线经过样本点中心(如图2所示).当回归直线斜率0b >时,为线性正相关,0b <时为线性负相关.应注意,这个最小距离不是通常所指的各数据的点(,)i i x y 到直线的距离,而是各数据点(,)i i x y 沿平行y 轴方向到直线的距离(如图1所示).⋅对于上面参数a b 和的求法原理及方法是简单的,但是运算量较大,需要将y a=+ x图2y a =+i图121()ni i i Q y bx a ==--∑展开,再合并,然后配方整理,从而求得,a b .例如,当,,,a b m n 取怎样实数时, 22()()a n b m k -+-+的值为最小,显然当,a m b n ==时最小值为k ,像这样配方求最值的方法是经常用到的, 线性回归方程ˆybx a =+中的参数,b a 就是这样求出的. 教材中用了添项法较为简捷的求出了截距a 和斜率b 分别是使21(,)()ni i i Q y x αββα==--∑取最小值时,αβ的值.求得121()()()niii nii x x y y x x β==--=-∑∑,y x αβ=-的值,请同学们体会其解法.线性回归方程的确定是进行回归分析的基础.二.回归分析:是对具有相关关系的两个变量进行统计分析的一种常用方法. 1.线性相关关系的强弱两个变量之间线性相关关系的样本相关系数()()niix x y y r --=∑衡量线性相性关系的强弱,由于分子与斜率b 的分子一样,因此,当0r >时,两个变量正相关;当0r <时两个变量负相关.当r 的绝对值接近1,表明两个变量的线性相关性很强;当r 的绝对值接近0,表明两个变量之间几乎不存在线性相关关系.规定当0.75r >时,我们认为两个变量有很强的线性相关关系.2.解释变量与随机误差对预报精度的影响以及残差分析 (1)有关概念线性回归模型2()0,()y bx a eE e D e σ=++⎧⎨==⎩其中a 和b 为模型的未知参数;x 称为解释变量,y 称为预报变量;e 是y 与ˆybx a =+之间的误差, e 叫随机误差。
高中数学第一章统计案例1.2回归分析与独立性检验的异同素材北师大版选修1-2(2021学年)
高中数学第一章统计案例1.2 回归分析与独立性检验的异同素材北师大版选修1-2编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(高中数学第一章统计案例1.2 回归分析与独立性检验的异同素材北师大版选修1-2)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为高中数学第一章统计案例 1.2 回归分析与独立性检验的异同素材北师大版选修1-2的全部内容。
回归分析与独立性检验的异同回归分析与独立性检验都是统计中的重要概念,都可以借助已知对未知进行判断;但两者区别还是很大的,下面通过一例进行比较说明:例题:为了对中考成绩进行分析,在60分以上的全体同学中随机抽出8位,他们的数学、物理分数对应如下表:(1)若80分以上为“优”,否则为“一般”,试判断数学“优"与物理“优"是否有关? (2)用变量y 与x 的相关系数说明物理与数学的线性相关程度,并用相关指数判断所求回归模型的效果;解析:(1)根据题中条件,对两变量进行分类,先看数学成绩“优”的有“4"人,“一般"的有“4"人;物理“优”的有“6”人,“一般”的有“2"人;于是,列联表如下:假设数学“优”与物理“优”无关,则2216(2446) 1.068 2.70688126K ⨯⨯-⨯=≈<⨯⨯⨯,显然,没有充分的证据显示数学“优”与物理“优"有关;(2)结合数据,借助计算器容易求出5.77=x ,85=y ,81=z ,21()1102ni i x x =-=∑,456)(12≈-∑=n i i y y,550)(12≈-∑=n i i z z , 1()()694n i i i x x y y =--≈∑,1()()ni i i x x z z =--∑747≈,于是变量y 与x 的相关系数=----=∑∑∑===n i i n i i n i i i y y x xy y x x r 12121)()())((0.979≈可见变量y 与x 的线性相关性很好;先求变量y 与x 的回归方程 由于121()()6940.62981102()ni ii n ii x x y y b x x ==--==≈-∑∑,36.19a y bx =-= 得回归方程为0.629836.19y x =+;此时7)(12≈-∑=∧n i i i y y ,98.04567)()(11212==---=∑∑==∧n i in i i i y yy y R ; 由此可以看出,变量y 与x 的回归模型的回归效果好;评析:(1)从第一问的求解结果可以看出:数学“优”与物理“优”没有明显的关系;也就是数学“优”的人不一定物理“优”,当然,物理“优"的人也不一定数学“优”;它告诉我们这两科不能由一科是否“优"来推知另一科是否“优”;(2)数学成绩与物理成绩没有关系吗?不是!第二问的求解结果告诉我们,这两科的成绩有关且具有很强的线性关系;通过线性回归方程,在已知一科成绩的前提下,可以预测另一科的成绩;由0.629836.19y x =+,当80x =时,0.62988036.1986.57y =⨯+=;从这个结果上看,只要是数学成绩不低于80分时,物理成绩就不低于86分。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
11
22211()()()n n i i i i i i n n i i i i x x y y x y nx y b x x x nx a y bx ====⎧
---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑选修1-2第一部分 变量间的相关关系与统计案例
【基础知识】
一、回归分析
1.两个变量的线性相关:判断是否线性相关 ①用散点图
(1)正相关:在散点图中,点散布在从左下角到右上角的区域.对于两个变量的这种相关关系,我们将它称为正相关.
(2)负相关:在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.
(3)线性相关关系、回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. ②用相关系数r
(3)除用散点图外,还可用样本相关系数r 来衡量两个变量x ,y 相关关系的强弱,
n
i i
x y nx y
r -•=
∑当r >0,表明两个变量正相关,当r <0,表明两个变量负相关,r 的绝对值越接近于1,表明两个变量的线性相关性越强;r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系,通常|r |0.75>时,认为这两个变量具有很强的线性相关关系. 2.回归方程:
两个变量具有线性相关关系,数据收集如下:
可用最小二乘法得到回归方程ˆy bx a =+,其中
3.回归分析的基本思想及其初步应用
(1)回归分析是对具有相关关系的两个变量进行统计分析的方法,其常用的 研究方法步骤是画出散点图,求出回归直线方程,并利用回归直线方程进行预报. (2)对n 个样本数据(x 1,y 1)、(x 2,y 2)、…、(xn ,yn ),(,)x y 称为样本点的中心.样本点中心一定落在回归直线上。
4、回归效果的刻画:
用相关指数2R 来刻画回归的效果,公式是µ
2
21
2
1
()1()
n
i
i
i n
i
i y y R y y ==-=-
-∑∑
2R 的值越大,说明残差平方和越小,也就是说模型拟合效果好
二.独立性检验的基本思想及其初步应用
题型一相关关系的判断
【例1】对四组数据进行统计,获得以下散点图,关于其相关系数比较,正
确的是()
A.r2<r4<0<r3<r1
B. r4<r2<0<r1<r3
C. r4<r2<0<r3<r1
D. r2<r4<0<r1<r3
【变式1】根据两个变量x,y之间的观测数据画成
散点图如图所示,这两个变量是否具有线性相关关系
________(填“是”与“否”).
题型二 线性回归方程
【例2】在2013年元旦期间,某市物价部门对本市五个商场销售的某商品一天的销售量及其价格进行调查,五个商场的售价x 元和销售量y 件之间的一组
y 关于商品的价格x 的线性回归方程为________.
(参考公式:b ^= ,a ^=y -b ^
x )
【变式3】为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:
则y 对x 的线性回归方程为( ). A .y =x -1 B .y =x +1
C .y =88+1
2x D .y =176
题型三 独立性检验
【例4】通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还
由K2=
?a+b??c+d??a+c??b+d?,
算得K2=110×?40×30-20×20?2
60×50×60×50≈7.8.
附表:
A. 有99%以上的把握认为“选择过马路的方式与性别有关”
B. 有99%以上的把握认为“选择过马路的方式与性别无关”
C. 在犯错误概率不超过0.1%的前提下,认为“选择过马路的方式与性别有关”
D. 在犯错误概率不超过0.1%的前提下,认为“选择过马路的方式与性别无关
【变式2】某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,
(2)由以上统计数据填下面2×2列联表,并问是否有99%的把握认为“两个分厂生
附K2
巩固提高
1.下列说法:
①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;
②设有一个回归方程y ^
=3-5x ,变量x 增加一个单位时,y 平均增加5个单位;
③线性回归方程y ^=b ^x +a ^
必过(x ,y );
④在一个2×2列联表中,由计算得K 2=13.079,则有99%的把握确认这两个变量间有关系;
其中错误的个数是( )
A. 0
B. 1
C. 2
D. 3
2.已知回归直线斜率的估计值为1.23,样本点的中心为点(4,5),则回归直线的方程为( ) A. y ^=1.23x +4 B. y ^=1.23x +5 C. y ^=1.23x +0.08 D. y ^
=0.08x +1.23 3.
从所得的散点图分析可知:y 与x 线性相关,且y =0.95x +a ,则a =( ) A. 1.30 B. 1.45 C. 1.65 D. 1.80
4.
根据上表可得回归直线方程:y =0.56x +a ,据此模型预报身高为172 cm 的高三男生的体重为( )
A. 70.09 kg
B. 70.12 kg
C. 70.55 kg
D. 71.05 kg
5.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x
的回归直线方程:y ^
=0.254x +0.321.由回归方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
6.利用独立性检验对两个分类变量是否有关系进行研究时,若在犯错误的概率不超过0.005的前提下认为事件A 和B 有关系,则具体计算出的数据应该是( )
A .k≥6.635
B .k <6.635
C .k≥7.879
D .k <7.879
7.某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具体数
k
=
50
(13×20
-10×7
)2
20×
30×23
×27≈4.844,因为k>3.841,所以确定主修统计专业与性别有关系,那么这种判断出错的可能性为________.
与销售额(单位:百万元)之间有如下对应数据:
(1)画出散点图;(2)求线性回归方程;(3)试预测
广告费支出为百万元时,销售额多大?
9.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.
(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;(3)已知该厂技改前吨甲产品的生产能耗为吨标准煤,试根据(2)求出的线性回归方程,预测生产吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:
)
9.某大学餐饮中心为了了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:
喜欢甜品不喜欢甜品合计
南方学生602080
北方学生101020
合计7030100
(1)
品的饮食习惯方面有差异”;
(2)已知在被调查的北方学生中有5名数学系学生,其中2名习惯甜品,现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率.
10、我市某校某数学老师这学期分别用两种不同的教学方式试验高一甲、乙两个班(人数均为人,入学数学平均分和优
秀率都相同,勤奋程度和自觉性都一样)。
现
随机抽取甲、乙两班各名的数学期末考试成
绩,并作出茎叶图
(Ⅰ)依茎叶图判断哪个班的平均分高???
(Ⅱ)现从甲班所抽数学成绩不低于分的同
学中随机抽取两名同学,求刚好有1人在85分
以上的概率
(Ⅲ)学校规定:成绩不低于分的为优秀,
作出分类变量成绩与教学方式的列联表,
并判断“能否在犯错误的概率不超过的前
提下认为成绩优秀与教学方式有关?”??下面临界值表仅供参
考:? ??? ???(参考公式:其中)?
复习专题一数列
1、在等差数列中:
(1)已知,,求;
(2)已知,,求.
(3)已知,,,求a 10和S10;
(4)已知,,,求和Sn;
2、等差数列的前项和为,且,.求数列的通项;
3、在等比数列中,
(1)已知,,求;
(2)已知,,求;
4、在等比数列中,.求:
(1)首项和公比;(2)前项的和.。