高中选修1-2 回归分析和独立性检验 知识总结与联系

合集下载

人教版A版高中数学选修1-2课后习题解答

人教版A版高中数学选修1-2课后习题解答

人教版A版高中数学选修1-2课后习题解答高中数学选修1-2课后题答案第一章统计案例1.1 回归分析的基本思想及其初步应用回归分析是一种统计分析方法,用于探究自变量与因变量之间的关系。

它的基本思想是通过建立数学模型,利用已知数据进行拟合,从而预测或解释未知数据。

回归分析的初步应用包括简单线性回归和多元线性回归。

1.2 独立性检验的基本思想及其初步应用独立性检验是一种用于检验两个变量之间是否存在关联的方法。

其基本思想是通过观察两个变量之间的频数或频率分布,来判断它们是否相互独立。

独立性检验的初步应用包括卡方检验和Fisher精确检验。

第二章推理证明2.1 合情推理与演绎推理合情推理是指根据已知事实和常识,推断出可能的结论。

演绎推理是指根据已知的前提和逻辑规则,推导出必然的结论。

两种推理方法都有其适用的场合,需要根据具体情况进行选择。

2.2 直接证明与间接证明直接证明是指通过逻辑推理,直接证明所要证明的命题成立。

间接证明是指采用反证法或归谬法,证明所要证明的命题的否定不成立,从而推出所要证明的命题成立。

第三章数系的扩充与复数的引入3.1 数系的扩充与复数的概念数系的扩充是指在实数系的基础上引入新的数,使得一些原来不可解的方程可以得到解。

复数是指由实部和虚部组成的数,可以表示在平面直角坐标系中的点。

复数的引入扩充了数系,使得一些原本无解的方程可以得到解。

3.2 复数的代数形式的四则运算复数的代数形式是指将复数表示为实部和虚部的和的形式。

复数的四则运算包括加减乘除四种运算,可以通过对实部和虚部分别进行运算来得到结果。

第四章框图4.1 流程图流程图是一种用图形表示算法或过程的方法。

它由各种基本符号和连线构成,用于描述算法或过程的各个步骤及其执行顺序。

流程图可以帮助人们更好地理解算法或过程,从而提高效率。

4.2 结构图结构图是一种用于描述程序结构的图形表示方法。

它包括顺序结构、选择结构和循环结构三种基本结构,可以用来表示程序的控制流程。

第5讲 选修1-2复习小结(教师版)

第5讲  选修1-2复习小结(教师版)
④除法:===(c+di≠0)(2)复数加法的运算定律复数的加法满足交换律、结合律,即对任何z1、z2、z3∈C,有z1+z2=,(z1+z2)+z3=.
二.典例精析
探究点一:线性回归分析
例1 :从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得 =80 =20 =720 =184 (1)求家庭的月储蓄y对月收入x的线性回归方程y=bx+a(2)判断变量x与y之间是正相关还是负相关(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄
2.数学证明方法:(1)综合法①定义:利用已知条件和某些数学定义、公理、定理等,
经过一系列的推理论证,最后推导出所要证明的结论成立,这种证明方法叫做综合法.
②框图表示:→→→…→(其中P表示已知条件、已有的定义、公理、定理等,Q表示要证明的结论).(2)分析法①定义:从要证明的结论出发,逐步寻求使它成立的充分条件,直至最后,把要证明的结论归结为判定一个明显成立的条件(已知条件、定理、定义、公理等)为止.这种证明方法叫做分析法.②框图表示:→→→…→.(3)反证法:假设原命题不成立,经过正确的推理,最后得出矛盾,因此说明假设错误,从而证明了原命题成立,这样的证明方法叫做反证法.
(2)相关系数r①r=;②当r>0时,表明两个变量________;当r<0时,表明两个变量________.r的绝对值越接近于1,表明两个变量的线性__________;r的绝对值越接近于0时,表明两个变量之间________________________________.通常,当r的绝对值大于________时认为两个变量有很强的线性相关关系.
变式迁移3:(1)设等差数列{an}的前n项和为Sn,则S4,S8-S4,S12-S8,S16-S12成等差数列.类比以上结论有:设等比数列{bn}的前n项积为Tn,则T4,,,成等比数列.

2014年人教A版选修1-2课件 1.1 回归分析的基本思想及其初步应用

2014年人教A版选修1-2课件 1.1  回归分析的基本思想及其初步应用
150 155 160 165 170 175 180
例1. 从某大学中随机选取 8 名女大学生, 其身高和 体重数据如下表所示: 1 2 3 4 5 6 7 8 编号 165 165 157 170 175 165 155 170 身高 64 61 43 59 体重/kg 48 57 50 54 由最小二乘法得 求根据女大学生的身高预报体重的回归方程 , 并预报一名 n n n 1 1 身高为 172 cm 的女大学生的体重 . xi , y = yi . x = x y n x y i i n i =1 n i =1 i = 1 由身高预报体重 解: b= n ,, 则以身高为自变量 x, 体重为 2 2 得 b ≈0.849, x n x 因变量 y , 画出散点图 . i 70 i =1 a= 85.712. 60 由图看出样本点呈条状 a = y bx . 50 分布, 于是得回归直线的方程为 身高和体重有较好的 ˆ40 y = 0.849x 85.712. 30 线性相关关系. ˆ = 60.316. 20 当 x=172 时, y 10 设回归直线为 y=bx+a. 0 ∴ 预计这位大学生的体重大约 60 kg. 150 155 160 165 170 175 180
例1. 从某大学中随机选取 8 名女大学生, 其身高和 体重数据如下表所示: 编号 身高 体重/kg 1 2 3 4 5 6 7 8 165 165 157 170 175 165 155 170 48 57 50 54 64 61 43 59
求根据女大学生的身高预报体重的回归方程, 并预报一名 身高为 172 cm 的女大学生的体重. 解: 由身高预报体重, 则以身高为自变量 x, 体重为 因变量 y, 画出散点图. 70 60 由图看出样本点呈条状 50 分布, 身高和体重有较好的 40 30 线性相关关系. 20 10 设回归直线为 y=bx+a. 0

2014年人教A版选修1-2课件 1.2 独立性检验的基本思想及其初步应用

2014年人教A版选修1-2课件 1.2  独立性检验的基本思想及其初步应用

问题1. 下表是对吸烟和不吸烟的人中患肺癌的调 查数据, 你能从中分析吸烟对患肺癌的影响程度吗?
不吸烟 吸烟 总计 不患肺癌 7775 2099 9874 患肺癌 42 49 91 总计 7817 2148 9965
对于某种变量取不同的 “值” 表示不同的类别, 这样的变量称为分类变量. 如: 是否吸烟, 是否信仰宗教, 男性或女性等. 如上表这样, 列出两个分类变量的频数表, 称为 列联表.
不患肺癌 患肺癌 总计 不吸烟 a b a+ b 即 |ad -bc| 越小, 吸烟与患肺癌之间的关系越弱 ; 吸烟 c d c+d 反之越强.总计 a+ c b+ d a+b+c+d
为了使不同容量的数据有统一的评判标准, 我们 我们把列联表中的数字用字母代替, 并计算: 把检查 |ad-bc| 的大小转换成检查 a ; “不吸烟” 样本中 “不患肺癌” 的比例 : n(ad - bc)2 a+ b 2 K , (a + b)(c + d )(a的比例 + c)(b +c “吸烟” 样本中 “不患肺癌” :d ) . c+d 其中 na+b+c+d 为样本容量. 假设 H0: 吸烟与患肺癌没有关系 , 则需 2 若 H0 成立, a则 K c 应该很小. , ad-bc≈0. a + b c + d H0 成立与否呢? 小到什么程度来判断
0.4
0.2 0 不吸烟 吸烟
问题1. 下表是对吸烟和不吸烟的人中患肺癌的调 查数据, 你能从中分析吸烟对患肺癌的影响程度吗?
不吸烟 吸烟 总计 不患肺癌 7775 2099 9874
1

高中数学选修1-2第一章课后习题解答

高中数学选修1-2第一章课后习题解答

新课程标准数学选修1—2第一章课后习题解答第一章统计案例1.1回归分析的基本思想及其初步应用练习(P8)1、画散点图的目的是通过变量的散点图判断两个变量更近似于什么样的函数关系,以确定是否直接用线性回归模型来拟合原始数据.说明:学生在对常用的函数图象比较了解的情况下,通过观察散点图可以判断两个变量的关系更近似于哪种函数.2、分析残差可以帮助我们解决以下两个问题:(1)寻找异常点,就是残差特别大的点,考察相应的样本数据是否有错.(2)分析残差图可以发现模型选择是否合适.说明:分析残差是回归诊断的一部分,可以帮助我们发现样本数据中的错误,分析模型选择是否合适,是否有其他变量需要加入到模型中,模型的假设是否正确等. 本题只要求学生能回答上面两点即可,主要让学生体会残差和残差图可以用于判断模型的拟合效果.3、(1)解释变量和预报变量的关系式线性函数关系.R=.(2)21说明:如果所有的样本点都在一条直线上,建立的线性回归模型一定是该直线,所以每个=+,没有随机误差项,是严样本点的残差均为0,残差平方和也为0,即此时的模型为y bx aR=.格的一次函数关系. 通过计算可得21习题1.1 (P9)1、(1)由表中数据制作的散点图如下:从散点图中可以看出GDP值与年份近似呈线性关系.y表示GDP值,t表示年份. 根据截距和斜率的最小二乘计算公式,得(2)用tˆ14292537.729a≈-,ˆ7191.969b≈从而得线性回归方程ˆ7191.96914292537.729=-.y t残差计算结果见下表.GDP 值与年份线性拟合残差表(年实际GDP 值为117251.9,所以预报与实际相差4275.540-.(4)上面建立的回归方程的20.974R =,说明年份能够解释约97%的GDP 值变化,因此所建立的模型能够很好地刻画GDP 和年份的关系.说明:关于2003年的GDP 值的来源,不同的渠道可能会有所不同.2、说明:本题的结果与具体的数据有关,所以答案不唯一.3、由表中数据得散点图如下:从散点图中可以看出,震级x 与大于或等于该震级的地震数N 之间不呈线性相关关系,随着x 的减少,所考察的地震数N 近似地以指数形式增长. 做变换lg y N =,得到的数据如下表所示.x 和y 的散点图如下:从这个散点图中可以看出x 和y 之间有很强的线性相关性,因此可以用线性回归模型拟合它们之间的关系. 根据截距和斜率的最小二乘计算公式,得ˆ 6.704a≈,ˆ0.741b ≈-, 故线性回归方程为 ˆ0.741 6.704y x =-+. 20.997R ≈,说明x 可以解释y 的99.7%的变化.因此,可以用回归方程 0.741 6.704ˆ10x N-+= 描述x 和N 之间的关系. 1.2独立性检验的基本思想及其初步应用练习(P15)列联表的条形图如图所示.由图及表直观判断,好像“成绩优秀与班级有关系”. 因为2K 的观测值0.653 6.635k ≈<,由教科书中表1-11克重,在犯错误的概率不超过0.01的前提下,不能认为“成绩与班级有关系”.说明:(1)教师应要求学生画出等高条形图后,从图形上判断两个分类变量之间是否有关系. 这里通过图形的直观感觉的结果可能会出错.(2)本题与例题不同,本题计算得到的2K 的观测值比较小,所以没有理由说明“成绩优秀与班级有关系”. 这与反证法也有类似的地方,在使用反证法证明结论时,假设结论不成立的条件下如果没有推出矛盾,并不能说明结论成立也不能说明结论不成立. 在独立性检验中,没有推出小概率事件发生类似于反证法中没有推出矛盾.习题1.2 (P16)1、假设“服药与患病之间没有关系”,则2K 的值应该比较小;如果2K 的值很大,则说明很可能“服药与患病之间没有关系”. 由列联表中数据可得2K 的观测值 6.110 5.024k ≈>,而由教科书表1-11,得2( 5.024)0.025P K ≥≈,所以在犯错误的概率不超过0.025的前提下可以认为“服药与患病之间有关系”. 又因为服药群体中患病的频率0.182小于没有服药群体中患病的频率0.400,所以“服药与患病之间关系”可以解释为药物对于疾病有预防作用. 因此在犯错误的概率不超过0.025的前提下,可以认为药物有效.说明:仿照例1,学生很容易完成此题,但希望学生能理解独立性检验在这里的具体含义,即“服药与患病之间关系”可以解释为“药物对于疾病有预防作用”.2、如果“性别与读营养说明之间没有关系”,由题目中所给数据计算,得2K 的观测值为8.416k ≈,而由教科书中表1-11知2(7.879)0.005P K ≥≈,所以在犯错误的概率不超过0.005的前提下认为“性别与读营养说明之间有关系”.3、说明:需要收集数据,所有没有统一答案. 第一步,要求学生收集并整理数据后得到列联表;第二步,类似上面的习题做出判断.4、说明:需要从媒体上收集数据,学生关心的问题不同,收集的数据会不同. 第一步,要求学生收集并整理数据后得到列联表;第二步,类似上面的习题做出判断.第一章 复习参考题A 组(P19)根据散点图,可以认为中国人口总数与年份呈现很强的线性相关关系,因此选用线性回归模型建立回归方程.由最小二乘法的计算公式,得 2095141.503a ≈-,1110.903b ≈,则线性回归方程为 ˆ1110.9032095141.503yx =-. 由2R 的计算公式,得 20.994R ≈,明线性回归模型对数据的拟合效果很好.根据回归方程,,预计2003年末中国人口总数约为129997万人,而实际情况为129227万人,预测误差为770万人;预计2004年末中国人口总数约为131108万人,而实际情况为129988万人,预测误差为1120万人.说明:数据来源为《中国统计年鉴》(2003). 由于人数为整数,所以预测的数据经过四舍五入的取整运算.2、(1)将销售总额作为横轴,利润作为纵轴,根据表中数据绘制散点图如下:由于散点图中的样本点基本上在一个带形区域内分布,猜想销售总额与利润之间呈现线性相关关系.(2)由最小二乘法的计算公式,得 ˆ1334.5a≈,ˆ0.026b ≈, 则线性回归方程为 ˆ0.0261334.5yx =+ 其残差值计算结果见下表:(3)对于(2)中所建立的线性回归方程,20.457R ≈,说明在线性回归模型中销售总额只能解释利润变化的46%,所以线性回归模型不能很好地刻画销售总额和利润之间的关系. 说明:此题也可以建立对数模型或二次回归模型等,只要计算和分析合理,就算正确.3、由所给数据计算得2K 的观测值为 3.689k ≈,而由教科书中表1-11知2( 2.706)0.10P K ≥=所以在犯错误的概率不超过0.10的前提下认为“婴儿的性别与出生的时间有关系”.第一章 复习参考题B 组(P19)1、因为 21(,)()ni i i Q a b y a bx ==--∑21(()())n i i i y bx y bx a y bx ==--+--+∑ 2211()()n n i i i i y bx y bx a y bx ===--++-+∑∑12()()ni i i y bx y bx a y bx =---+-+∑ 并且221()()n i a y bx n a y bx =-+=-+∑,12()()n i i i y bx y bx a y bx =--+-+∑ 1()(())ni i i a y bx y bx ny nbx ==-+--+∑ ()()0a y b x n y n b xn y n b x=-+--+= 所以 221(,)()()ni i i Q a b y bx y bx n a y bx ==--++-+∑.考察上面的等式,等号右边的求和号中不包含a ,而另外一项非负,所以ˆa和ˆb 必然使得等号右边的最后一项达到最小值,即 ˆˆ0ay bx -+=, 即ˆˆy a bx =+. 2、总偏差平方和21()n i i y y =-∑表示总的效应,即因变量的变化效应;残差平方和21ˆ()ni i y y =-∑表示随机误差的效应,即随机误差的变化效应;回归平方和21ˆ()ni yy =-∑表示表示变量的效应,即自变量的变化效应. 等式 222111ˆˆ()()()n n n i ii i i y y y y y y ===-=-+-∑∑∑ 表示因变量的变化总效应等于随机误差的变化效应与自变量的变化效应之和.3、说明:该题主要是考察学生应用回归分析模型解决实际问题的能力,解答应该包括如何获取数据,如何根据散点图寻找合适的模型去拟合数据,以及所得结果的解释三方面的内容.。

人教版数学选修1-2知识点总结

人教版数学选修1-2知识点总结

数学 选修1-2知识点总结第一章 统计案例1.线性回归方程①变量之间的两类关系:函数关系与相关关系; ②制作散点图,判断线性相关关系③线性回归方程:a bx y +=∧(最小二乘法)其中,1221ni i i nii x y nx y b x nx a y bx==⎧-⎪⎪=⎪⎨-⎪⎪=-⎪⎩∑∑ 注意:线性回归直线经过定点),(y x .2.相关系数(判定两个变量线性相关性):∑∑∑===----=ni ni iini i iy yx xy y x xr 11221)()())((注:⑴r >0时,变量y x ,正相关;r <0时,变量y x ,负相关;⑵①||r 越接近于1,两个变量的线性相关性越强;②||r 接近于0时,两个变量之间几乎不存在线性相关关系。

3.条件概率对于任何两个事件A 和B ,在已知B 发生的条件下,A 发生的概率称为B 发生时A 发生的条件概率. 记为P (A |B ) , 其公式为P (A |B )=P (AB )P (A )4相互独立事件(1)一般地,对于两个事件A ,B ,如果_ P (AB )=P (A )P (B ) ,则称A 、B 相互独立. (2)如果A 1,A 2,…,A n 相互独立,则有P (A 1A 2…A n )=P (A 1)P (A 2)…P (A n ).(3)如果A ,B 相互独立,则A 与B -,A -与B ,A -与B -也相互独立.5.独立性检验(分类变量关系):(1)2×2列联表设,A B 为两个变量,每一个变量都可以取两个值,变量121:,;A A A A =变量121:,;B B B B = 通过观察得到右表所示数据: 并将形如此表的表格称为2×2列联表.(2)独立性检验 根据2×2列联表中的数据判断两个变量A ,B 是否独立的问题叫2×2列联表的独立性检验.(3) 统计量χ2的计算公式χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )第二章框图1.流程图流程图是由一些图形符号和文字说明构成的图示.流程图是表述工作方式、工艺流程的一种常用手段,它的特点是直观、清晰.2.结构图一些事物之间不是先后顺序关系,而是存在某种逻辑关系,像这样的关系可以用结构图来描述.常用的结构图一般包括层次结构图,分类结构图及知识结构图等.第三章推理与证明1.推理⑴合情推理:归纳推理和类比推理都是根据已有事实,经过观察、分析、比较、联想,在进行归纳、类比,然后提出猜想的推理,我们把它们称为合情推理。

高中数学选修1-2知识点总结61389

高中数学选修1-2知识点总结61389

知识点总结选修1-2知识点总结第一章 统计案例1.线性回归方程①变量之间的两类关系:函数关系与相关关系; ②制作散点图,判断线性相关关系 ③线性回归方程:a bx y +=∧(最小二乘法)其中,1221ni i i nii x y nx y b x nx a y bx==⎧-⎪⎪=⎪⎨-⎪⎪=-⎪⎩∑∑ 注意:线性回归直线经过定点),(y x .2.相关系数(判定两个变量线性相关性):∑∑∑===----=ni ni i ini i iy y x xy y x xr 11221)()())((注:⑴r >0时,变量y x ,正相关;r <0时,变量y x ,负相关; ⑵①||r 越接近于1,两个变量的线性相关性越强;②||r 接近于0时,两个变量之间几乎不存在线性相关关系。

3.条件概率对于任何两个事件A 和B ,在已知B 发生的条件下,A 发生的概率称为B 发生时A 发生的条件概率. 记为P (A |B ) , 其公式为P (A |B )=P (AB )P (A )4相互独立事件(1)一般地,对于两个事件A ,B ,如果_ P (AB )=P (A )P (B ) ,则称A 、B 相互独立.(2)如果A 1,A 2,…,A n 相互独立,则有P (A 1A 2…A n )=_ P (A 1)P (A 2)…P (A n ).(3)如果A ,B 相互独立,则A 与B -,A -与B ,A -与B -也相互独立.5.独立性检验(分类变量关系):(1)2×2列联表设,A B 为两个变量,每一个变量都可以取两个值,变量121:,;A A A A =变量121:,;B B B B =通过观察得到右表所示数据:并将形如此表的表格称为2×2列联表.(2)独立性检验根据2×2列联表中的数据判断两个变量A ,B 是否独立的问题叫2×2列联表的独立性检验.(3) 统计量χ2的计算公式χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )第二章 推理与证明考点一 合情推理与类比推理根据一类事物的部分对象具有某种性质,退出这类事物的所有对象都具有这种性质的推理,叫做归纳推理,归纳是从特殊到一般的过程,它属于合情推理根据两类不同事物之间具有某些类似(或一致)性,推测其中一类事物具有与另外一类事物类似的性质的推理,叫做类比推理.类比推理的一般步骤:(1) 找出两类事物的相似性或一致性;(2) 用一类事物的性质去推测另一类事物的性质,得出一个明确的命题(猜想);(3) 一般的,事物之间的各个性质并不是孤立存在的,而是相互制约的.如果两个事物在某些性质上相同或相似,那么他们在另一写性质上也可能相同或类似,类比的结论可能是真的.(4) 一般情况下,如果类比的相似性越多,相似的性质与推测的性质之间越相关,那么类比得出的命题越可靠.考点二 演绎推理(俗称三段论)由一般性的命题推出特殊命题的过程,这种推理称为演绎推理.考点三 数学归纳法:它是一个递推的数学论证方法. 步骤:A.命题在n=1(或0n )时成立,这是递推的基础; B.假设在n=k 时命题成立 C.证明n=k+1时命题也成立,完成这两步,就可以断定对任何自然数(或n>=0n ,且n N ∈)结论都成立。

人教版高中数学 选修1-2 第一章 2独立性检验的基本思想及其初步应用 (共38张PPT)教育课件

人教版高中数学 选修1-2 第一章 2独立性检验的基本思想及其初步应用 (共38张PPT)教育课件
a+b c+d
因此,
|ad-bc|越小,说明吸烟与患肺癌之间关系越弱; |ad-bc|越大,说明吸烟与患肺癌之间关系越强.
为了使不同样本容量的数据有统一的评判 标准,基于上述分析,我们构造一个随机变量:
K2 =
n(ad - bc)n
(a + b)(c + d)(a + c)(b + d)
其中n=a+b+c+d为样本容量.
P(k2>k) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 0.455 0.708 1.323 2.072 2.706 3.84 5.024 6.635 7.879 10.83
(2)利用K2公式,计算随机变量K2的观测值k.
(3)如果k>k0,就推断“X与Y有关系”,这 种推断犯错误的概率不超过a;否则,就认为在犯 错误的概率不超过a的前提下不能推断“X与Y有关 系”.
若H0成立,即“吸烟与患肺癌没有关系”, 则K2应该很小.
不吸烟 吸烟 总计
不患肺癌 7775 2099 9874
患肺癌 42 49 91
总计 7817 2148 9965
利用上述公式得
K2 = 9965(7775 49 - 42 2099)2 56.632 7817 2148 9874 91
不吸烟
吸烟
患肺癌 不患肺癌
探究
通过数据和图形分析,我们得到的直观判 断是“吸烟和患肺癌有关”,那么这种判断是否 可靠呢? 我们先假设
H0:吸烟与患肺癌没有关系. 用A表示不吸烟,B表示不患肺癌,则“吸烟 与患肺癌没有关系”等价于“吸烟与患肺癌独 立”,即假设H0等价于

高中数学选修1-1、1-2、4-1、4-4知识点归纳

高中数学选修1-1、1-2、4-1、4-4知识点归纳
相似三角形的判定: ( 1)两角对应相等,两三角形相似; ( 2)两边对应成比例且夹角相等,两三角形相似; ( 3)三边对应成比例,两三角形相似。
射影定理:直角三角形斜边上的高是两直角边在斜边上射影的比例中项; 两直角边分别是它们在斜边上射影与斜边的比例中项。
圆周角定理:圆上一条弧所对的圆周角等于它所对的圆周角的一半。 圆心角定理:圆心角的度数等于它所对弧的度数。
选修 1- 1、 1-2 数学知识点
第一部分 简单逻辑用语
1. 原命题:“若 p ,则 q ”;逆命题: “若 q ,则 p ”; 否命题:“若 p ,则 q ”;逆否命题: “若 q ,则 p ”
2. 四种命题的真假性之间的关系: ( 1)两个命题互为逆否命题,它们有相同的真假性; ( 2)两个命题为互逆命题或互否命题,它们的真假性没有关系.
3. 若 p 若p
q ,则 p 是 q 的充分条件, q 是 p 的必要条件. q ,则 p 是 q 的充要条件(充分必要条件) .
集合间的包含关系:若 A B ,则 A 是 B 的充分条件或 B 是 A 的必要条件;
若 A=B,则 A 是 B 的充要条件;
4. ⑴全称量词——“所有的” 、“任意一个”等,用“
3. 极坐标与直角坐标的互化:
2 x2 y2 , x y sin , tan
cos , y (x 0) x
3.圆 ( x a) 2 ( y b)2 r 2的参数方程可表示为
x a rcos , ( 为参数 ) .
y b rsin .
2
2
椭圆 x a2
y b2
1 (a b
0) 的参数方程可表示为
x acos , ( 为参数 ) .
nx n

(完整word版)高中数学文科选修1-2知识点总结2,推荐文档

(完整word版)高中数学文科选修1-2知识点总结2,推荐文档

高中数学选修1-2知识点总结⑵①|r|越接近于1,两个变量的线性相关性越强;②|r|接近于0时,两个变量之间几乎不存在线性相关关系。

3•条件概率对于任何两个事件A和B,在已知B发生的条件下,A发生的概率称为B发生时A发生的条件概率•记为P(A|B),其公式为P(A|B)=;(爲4相互独立事件(1) 一般地,对于两个事件A, B,如果_P(AB)= P(A)P(B),则称A、B相互独立.(2) 如果A1, A2,…,An 相互独立,则有P(A1A2…A n)= _ P(A1)P(A2)…P(A n).(3) 如果A, B相互独立,则A与E , A与B,5.独立性检验(分类变量关系):(1) 2 2列联表设代B为两个变量,每一个变量都可以取两个值,变量A:AA A1;变量B:B1,B2 B1; 通过观察得到右表所示数据:并将形如此表的表格称为2X2列联表.(2) 独立性检验根据2X2列联表中的数据判断两个变量 A , B是否独立的问题叫2 X列联表的独立性检验.(3) 统计量x2的计算公式_ n (ad —be) 2 __________x 2_(a + b)( c+ d) ( a+ e)( b+ d) ——Bi恵计b a + bc t/-f-rfa4-c+^+rf独寂性判断疑宥关联2,706死鴨的把握判定变量盹笑联暫悯的祀撮判定变量仁H有棗轶列咄的把握判宦变址九占有关联第一章统计案例疣il' 案1 .线性回归方程①变量之间的两类关系:函数关系与相关关系;②制作散点图,判断线性相关关系③线性回归方程:y bx a (最小二乘法)n ___X i y i nx yb u ____其中,n 2X ii 1-2nxbxa y注意:线性回归直线经过定点(x, y).2 •相关系数(判定两个变量线性相关性)n(X i x)(y i y)i 1n _ n _ (X i x)2 (y i y)2i 1 i 1注:⑴r >0时,变量x, y正相关; r <0时,变量x, y负相关;第四章复数必背结论1.(1) z=a+bi € R b=0 (a,b€ R) z= z z2>0⑵ z=a+bi 是虚数0a,b€ R);⑶ z=a+bi 是纯虚数a=0 且b^0<,b€ R) z+ z = 0 (z工) z2<0;(4) a+bi=c+di a=c 且c=d(a,b,c,d€ R);2 •复数的代数形式及其运算设z i= a + bi , z2 = c + di (a,b,c,d€ R),贝U:(1) z i ± = (a + b) ±c + d)i ;(2) z i • z2 = (a+bi) (・c+di)=( ac-bd) + (ad+bc)i;(3) z1 切=e bi)(c di) di)(cdi)ac bd bc( c2 .2 2c d c3 . 几个重要的结论( 1(1 i)22i ; 1 i.1 i i; i;1 i 1 i⑵i性质:T=4;i 4n 丄・1,i4n 1 ・・4n 2i,i⑶乙1zz 1z1—。

高中数学-选修1-2-3.独立性检验

高中数学-选修1-2-3.独立性检验

3.独立性检验教学目标 班级____姓名________1.了解分类变量、列联表、随机变量2K .2.了解独立性检验的基本思想和方法. 教学过程 一、知识要点.1.分类变量:变量不同的值表示个体所属的类别不同.2.列联表:两个分类变量的频数表.3.随机变量:))()()(()(22d b c a d c b a bc ad n K ++++-=,010.0)635.6(2≈≥K P (小概率事件)4.独立性检验:运用统计分析的方法确定分类变量的关系. (1)要判断“两个分类变量有关系”;(2)假设结论不成立,即“0H :两个分类变量没有关系”;(3)确定一个判断规则的临界值0k :当02k K ≥时,认为“两个分类变量有关系”,否则认为“两个分类变量没有关系”;(0k 是根据允许误判概率的上限来确定的)(4)按照上述规则,误判概率为)(2(5)拓展: ①令||dc cb a a W +-+=,则))(())((22d bc ad c b a n W K ++++⨯=; ②令))(())((00d c b a n d b c a k w ++++⨯=;③02k K ≥等价于0w W ≥,所以)(0w W P ≥等价于)(02k K P ≥;④可以用)(0w W P ≥来作为判断依据.二、例题分析.例1:研究吸烟与患肺癌的关系. 1.确定研究对象:吸烟与患肺癌的关系.(1)由列联表可直观的了解:吸烟群体和不吸烟群体患肺癌的可能性存在差异.. (2)常用等高条形图展示列联表数据的频率特征.(见教科书11P 图) 3.独立性检验:(类似于反证法)(1)假设若“吸烟与患肺癌没有关系”,则dc cb a a +≈+.即“吸烟总数吸烟不患肺癌不吸烟总数不吸烟不患肺癌≈” 得0≈-bc ad ,所以||bc ad -越小,说明吸烟与患肺癌关系越弱,反之越强.(2)构造随机变量))()()(()(22d b c a d c b a bc ad n K ++++-=(其中d c b a n +++=)(3)科学研究表明:010.0)635.6(2≈≥K P . 即“当635.62≥K 时,事件发生的概率为0.010(小概率事件——几乎不可能发生)”(4)根据所采集的数据算得:在0H 成立的情况下,632.562≈K ,远远大于6.635,所以我们断定0H 不成立,即“吸烟与患肺癌有关系”.误判概率不超过010.0)635.6(2≈≥K P .作业:为了探究吸烟习惯与患慢性气管炎是否有关,调查了339名50岁以上的人,数据如下吸烟习惯与患慢性气管炎是否有关?试用独立性检验的思想说明理由.。

高中数学选修1-2知识点及典型题

高中数学选修1-2知识点及典型题

选 修 1-2 知 识 点 总 结第一章:统计案例一.回归分析的基本思想及其初步应用1.正相关:如果点散布在从左下角到右上角的区域,则称这两个变量的关系为正相关。

2.负相关:如果点散布在从左上角到右下角的区域,则称这两个变量的关系为负相关。

3.回归直线方程的斜率和截距公式:⎪⎪⎩⎪⎪⎨⎧-=--=---=∑∑∑∑====xb y a xn x yx n yx x x y yx x b n i i ni ii n i i ini i1221121)()()((此公式不要求记忆)。

4.最小二乘法:求回归直线,使得样本数据的点到它的距离的平方最小的方法。

e :我们把线性回归模型e a bx y ++=,其中b a ,为模型的未知参数,e 称为随机误差。

随机误差a bx y e i i i --=eˆ:我们用回归方程a x b y ˆˆˆ+=中的y ˆ估计a bx +,随机误差)(a bx y e +-=, 所以y y e ˆˆ-=是e 的估计量,故a x b y y y e ii i i i ˆˆˆˆ--=-=,e ˆ称为相应于点),(i i y x 的残差。

2R :∑∑==---=ni ini iy yyy R 12122)()ˆ(1,2R 的表达式中21)(∑=-ni i y y 确定,(1)2R 越大,残差平方和21)ˆ(∑=-ni i yy 越小,即模型的拟合效果越好; (2)2R 越小,残差平方和21)ˆ(∑=-ni i yy 越大,即模型的拟合效果越差。

2R 越接近1,表示回归效果越好。

二.独立性检验的基本思想及其初步应用1.分类变量:这种变量的不同“值”表示个体所属的不同类别的变量。

2.列联表:列出两个分类变量的频数表,称为列联表。

22⨯列联表:2K 的观测值:))()()(()(2d b c a d c b a bc ad n k ++++-=。

0k 表:如果0k k ≥,就推断“Y X ,有关系”,这种推断犯错误的概率不超过α; 否则,在样本数据中没有发现足够证据支持结论“Y X ,有关系”。

选修1-2《独立性检验》课件

选修1-2《独立性检验》课件
独立性检验的一般步骤: (1)假设两个分类变量X与Y没有关系; (2)计算出K2的观测值k; (3)把k的值与临界值比较确定X与Y有关的程度或 无关系.
(2)分类变量的取值有时可用数字来表示,但这时 的数字除了分类以外没有其他的含义,如用“0” 表示“男”,用“1”表示“女”.
某医疗机构为了了解患肺癌与吸烟是否有 关,进行了一次抽样调查,共调查了9965 个成年人,其中吸烟者2148人,不吸烟者 7817人,调查结果是:吸烟的2148人中49 人患肺癌, ;不吸烟的7817人中42人患肺 癌.
由观测 数据计算 得到随机变量K 2的观测 值k.
(3)如果k≥k0 ,就以(1-P(K2≥k0)) ×100%的把握 认为“X与Y有关系”;否则就说样本观测数据 没有提供“X与Y有关系”的充分证据.
反证法原理与假设检验原理
反证法原理:
在一个已知假 设下,如果推 出一个矛盾, 就证明了这个 假设不成立。
问题3:能否用数量刻画出“有关”的程度?
独立性检验
通过数据和图表分析,得到 结论是:吸烟与患呼吸道疾 病有关
H0: 吸烟和患肺癌之间没有关系
结论的可靠 程度如何?
不吸烟 吸烟 总计
吸烟与呼吸道疾病列联表
不患肺癌
患肺癌
a
b
c
d
a+c
b+d
不吸烟的人中不患肺癌的比例: 吸烟的人中不患肺癌的比例:
a ab
假设检验原理:
在一个已知假设 下,如果一个与 该假设矛盾的小 概率事件发生, 就推断这个假设 不成立。
例题解析:
例1、在某医院,因为患心脏病而住院的665名男性病 人中,有214人秃顶,而另外772名不是因为患心脏病而住 院的男性病人中有175人秃顶.(1)利用图形判断秃顶与患 心脏病是否有关系;(2)能否在犯错误的概率不超过0.01 的前提下认为秃顶与患心脏病有关系?
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

11
22211()()()n n i i i i i i n n i i i i x x y y x y nx y b x x x nx a y bx ====⎧
---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑选修1-2第一部分 变量间的相关关系与统计案例
【基础知识】
一、回归分析
1.两个变量的线性相关:判断是否线性相关 ①用散点图
(1)正相关:在散点图中,点散布在从左下角到右上角的区域.对于两个变量的这种相关关系,我们将它称为正相关.
(2)负相关:在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.
(3)线性相关关系、回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. ②用相关系数r
(3)除用散点图外,还可用样本相关系数r 来衡量两个变量x ,y 相关关系的强弱, $
n
i i
x y nx y
r -•=
∑当r >0,表明两个变量正相关,当r <0,表明两个变量负相关,r 的绝对值越接近于1,表明两个变量的线性相关性越强;r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系,通常|r |0.75>时,认为这两个变量具有很强的线性相关关系. 2.回归方程:
两个变量具有线性相关关系,数据收集如下:
可用最小二乘法得到回归方程ˆy bx a =+,其中 】
3.回归分析的基本思想及其初步应用
(1)回归分析是对具有相关关系的两个变量进行统计分析的方法,其常用的 研究方法步骤是画出散点图,求出回归直线方程,并利用回归直线方程进行预报. (2)对n 个样本数据(x 1,y 1)、(x 2,y 2)、…、(xn ,yn ),(,)x y 称为样本点的中心.样本点中心一定落在回归直线上。

4、回归效果的刻画:
用相关指数2R 来刻画回归的效果,公式是2
212
1
()1()
n i i i n
i
i y y R y y ==-=-
-∑∑
2R 的值越大,说明残差平方和越小,也就是说模型拟合效果好
二.独立性检验的基本思想及其初步应用
:
题型一相关关系的判断
【例1】对四组数据进行统计,获得以下散点图,关于其相关系数比较,正
确的是()
A.r2<r4<0<r3<r1

B. r4<r2<0<r1<r3
C. r4<r2<0<r3<r1
D. r2<r4<0<r1<r3
【变式1】根据两个变量x,y之间的观测数据画成
散点图如图所示,这两个变量是否具有线性相关关系
________(填“是”与“否”).

题型二 线性回归方程
【例2】在2013年元旦期间,某市物价部门对本市五个商场销售的某商品一天的销售量及其价格进行调查,五个商场的售价x 元和销售量y 件之间的一组
y 关于商品的价格x 的线性回归方程为________.
(参考公式:b ^= ,a ^=y -b ^
x )
{
【变式3】为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:
则y 对x 的线性回归方程为( ). A .y =x -1 B .y =x +1
C .y =88+1
2x D .y =176
.
题型三 独立性检验
【例4】通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还
走斑马线
20 30 50 /
总计
60 50 110 由K 2=n ad -dc
2a +b c +d a +c b +d

算得K 2=110×40×30-20×20
260×50×60×50≈. 附表:
P (K 2≥k ) -
k
A. 有99%以上的把握认为“选择过马路的方式与性别有关”
B. 有99%以上的把握认为“选择过马路的方式与性别无关”
C. 在犯错误概率不超过%的前提下,认为“选择过马路的方式与性别有关”
D. 在犯错误概率不超过%的前提下,认为“选择过马路的方式与性别无关

【变式2】 某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[,的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺分组
[, 29.90) [, 29.94) [, 29.98) [, . 30.02) [, 30.06) [, 30.10) [, 30.14)
频数 12 63 `
86
182 92 61 4 分组
[, 29.90) [, < 29.94) [, 29.98) [, 30.02) [, 30.06) [, 30.10) [, … 30. 14)
频数
29 71 85 159 76 62 18 "
(2)由以上统计数据填下面2×2列联表,并问是否有99%的把握认为“两个分厂生
甲 厂 乙 厂 合 计 优质品
非优质品 【
合 计
附 错误!,

P (K 2≥k )
( k
巩固提高
1.下列说法:
①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变; …
②设有一个回归方程y ^
=3-5x ,变量x 增加一个单位时,y 平均增加5个单位;
③线性回归方程y ^=b ^x +a ^
必过(x ,y );
④在一个2×2列联表中,由计算得K 2=,则有99%的把握确认这两个变量间有关系;
其中错误的个数是( )
A. 0
B. 1
C. 2
D. 3
2.已知回归直线斜率的估计值为,样本点的中心为点(4,5),则回归直线的方程为( ) A. y ^=+4 B. y ^=+5 C. y ^=+ D. y ^
=+ 3.
从所得的散点图分析可知:y 与x 线性相关,且y =+a ,则a =( ) A. B. C. D.
4.
根据上表可得回归直线方程:y =+a ,据此模型预报身高为172 cm 的高三男生的体重为( )
A. kg
B. kg *
C. kg
D. kg
5.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x
的回归直线方程:y ^
=+.由回归方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
6.利用独立性检验对两个分类变量是否有关系进行研究时,若在犯错误的概率不超过的前提下认为事件A 和B 有关系,则具体计算出的数据应该是( )
A .k≥
B .k <
C .k≥
D .k <
7.某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具体数

7 20 为了判断主修统计专业是否与性别有关系,根据表中数据得到, k =50(13×20-10×7)220×30×23×27
≈,因为k >,所以确定主修统计专业与性别有关
系,那么这种判断出错的可能性为________.
8、某种产品的广告费支出与销售额(单位:百万元)之间有如下对应数据:
(1)画出散点图;(2)求线性回归方程;(3)试预测广告费支出为百万元时,销售额多大
<
9.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.

(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;(3)已知该厂技改前吨甲产品的生产能耗为吨标准煤,试根据(2)求出的线性回归方程,预测生产吨甲产品的生产能耗比技改前降低多少吨标准煤(参考数值:
)




9.某大学餐饮中心为了了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:
< 喜欢甜品不喜欢甜品合计
南方学生602080
北方学生10@1020
合计7030100
(1)根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”;
(2)已知在被调查的北方学生中有5名数学系学生,其中2名习惯甜品,现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率.—
10、我市某校某数学老师这学期分别用两种不同的教学方式试验高一甲、乙两个班(人数均为人,入学数学平均分和优
秀率都相同,勤奋程度和自觉性都一样)。


随机抽取甲、乙两班各名的数学期末考试成
绩,并作出茎叶图
(Ⅰ)依茎叶图判断哪个班的平均分高
(Ⅱ)现从甲班所抽数学成绩不低于分的同
学中随机抽取两名同学,求刚好有1人在85分
以上的概率
(Ⅲ)学校规定:成绩不低于分的为优秀,
作出分类变量成绩与教学方式的列联表,
并判断“能否在犯错误的概率不超过的前
提下认为成绩优秀与教学方式有关”下面临界值表仅供参
考:
(参考公式:其中)
复习专题一数列
1、在等差数列中:
(1)已知,,求;
(2)已知,,求.
(3)已知,,,求a10和S10;
(4)已知,,,求和Sn;
2、等差数列的前项和为,且,.求数列的通项;
3、在等比数列中,
(1)已知,,求;
(2)已知,,求;
4、在等比数列中,.求:
(1)首项和公比;(2)前项的和.。

相关文档
最新文档