新人教高考数学总复习专题训练正态分布线性回归
《7.5 正态分布》(同步训练)高中数学选择性必修第三册_人教A版_2024-2025学年
《7.5 正态分布》同步训练(答案在后面)一、单选题(本大题有8小题,每小题5分,共40分)1、设随机变量(X)服从正态分布(N(μ,σ2)),其中(μ=10),(σ=2)。
若(P(X<8)=a),则(P(12<X<14))等于下列哪个选项?A.(a)B.(1−a)C.(0.5−a)D.(a−0.5)2、某工厂生产的某种产品的重量服从正态分布,平均重量为100克,标准差为10克。
现从该工厂随机抽取一个产品,其重量在90克到110克之间的概率是多少?A. 0.6826B. 0.9544C. 0.9973D. 0.97723、设随机变量(X)服从均值为(μ=50),标准差为(σ=5)的正态分布。
如果要将(X))),那么当(X=60)时,(Z)的一个特定值转换成标准正态分布的(Z)值(即求(Z=X−μσ的值是多少?A.(1.0)B.(2.0)D.(4.0)4、已知某城市成年人的身高X(单位:cm)服从正态分布,其均值μ=170cm,标准差σ=5cm。
现随机抽取一名成年人,其身高在160cm到175cm之间的概率约为:A. 0.6826B. 0.4772C. 0.3414D. 0.99735、设随机变量(X)服从参数为(μ=10)和(σ2=4)的正态分布。
若(P(X<a)=0.8413),则(a)的值大约是?A. 11.64B. 12.00C. 12.36D. 12.686、某工厂生产的零件尺寸服从正态分布,其平均尺寸为10厘米,标准差为2厘米。
现随机抽取一个零件,其尺寸X满足以下哪个概率区间?A. P(8 < X < 12) = 0.6826B. P(9 < X < 11) = 0.6826C. P(8 < X < 11) = 0.9544D. P(9 < X < 12) = 0.95447、某城市成年人的身高服从正态分布,平均身高为170cm,标准差为5cm。
高三数学(理)正态分布、线性回归、复数 知识精讲 人教版
高三数学(理)正态分布、线性回归、复数 知识精讲 人教版一. 本周教学内容:正态分布、线性回归、复数二. 重点、难点:1. 正态分布,N (2,σμ) R x e x f x ∈=--222)(21)(σμσπ (μ、σ为参数,σ>0)(1)曲线在x 轴上方。
(2)关于μ=x 对称。
(3)μ=x 时y 最大。
(4)↓+∞↑-∞),(),(μμ2. 线性回归应验证 样本相关系数3. 复数),(R b a C bi a z ∈∈+=Z n i i i i i i n n n n ∈-=-===+++342414411【典型例题】[例1] 标准正态分布N (0,1),2221)(x e x f -=π,R x ∈的性质 解:R x e x f y x ∈==-2221)(π (1)偶函数(2)0=x π21max =y (3)↑-∞)0,(↓+∞),0((4))(1)()(000x x x P x -Φ-=<=Φ(5))()()(a b b x a P Φ-Φ=<<),(2σμN 转化为 )1,0(2N(6))()()(σμξ-Φ=<=x x P x F[例2] 一台自动包装机向袋中装糖果,标准是每袋64g ,但因随机性误差,每袋具体重量有波动,据以往资料认为袋装糖果的重量ξ服从正态分布)5.1,64(2N 。
试问随机抽一袋糖果,其重量超过65g 的概率是多少? 解:)5.16465()65(->=>t P P ξ )67.0(>=t P )67.0(1)67.0(1Φ-=<-=t P2514.07486.01=-=[例3] 假设数学会考成绩ξ近似服从正态分布)10,70(2N ,现知第100名学生的成绩为60分。
试问第20名的学生成绩为多少分。
(7486.0)67.0(=Φ,8413.0)1(=Φ,8319.0)96.0(=Φ) 解:1070-=ξt )107060(1)60(1)60(-<-=<-=≥t P P P ξξ )1()1(1)1(1Φ=-Φ-=-<-=t P=0.8413∴ 60分以上占总体的84.13% 总人数:1198413.0100≈人 前20名:1681.011920= 设第20名成绩为x∴1681.0)(=≥x P ξ1681.0)(1=<-x P ξ8319.01681.01)1070(=-=-<x t P ∴96.01070=-x 6.970=-x ∴6.79=x[例4] 为研究某市家庭平均收入与月平均生活支出的关系,该市统计调查,随机调查10个求回归直线方程。
高考数学理一轮复习 X1-4正态分布、线性回归精品课件
备选例题1 设随机变量ξ服从正态分布:ξ~ N(1,4),试求:
(1)P(0<ξ≤2); (2)求常数C,使P(ξ≤C)=32·P(ξ>C).
参考数据:Φ(0)=0.5,Φ(1)=0.8413,Φ(2) =0.9772,Φ(0.5)=0.6915,Φ(1.88)= 0.9697,Φ(3)=0.9987.
2.小概率事件是指事件发生的概率很小的事, 通常认为这些情况在一次试验中几乎是不可 能发生的.
3.统计中假设检验的基本思想:根据小概率 事件在一次试验中几乎不可能发生的原理和 从总体中抽测的个体的数值,对事先所作的 统计假设作出判断,是拒绝假设,还是接受 假设.
4.利用线性回归方程,可由一个变量的值预 测或控制另一个变量的值.借助计算器,特 别是含统计的计算器,能简化手工的计算, 迅速得出正确结果.
(函数Φ(x0)实际上是正态总体N(0,1)的累积分
布函数),即Φ(x0)=
.
(5)两个重要公式:ⅰ.Φ(-x)=1Φ(x)
-
;
Φ(a)
ⅱ.P(a<ξ<b)=Φ(b)-
. 小于
(6)对于任一正态分布总体N(μ,σ2)来说,取
值 x的概率为F(x)=Φ(
).
(7)假设检验的基本思想
ⅰ.提出统计假设,如假设随机变量服从正态 分布等;
5.“回归”和“相关”含义是不同的:如果 两个变量中的一个变量是人为可以控制、非 随机的,另一变量的变化是随机的且随着控 制变量的变化而变化,则这两变量间的关系 就称为回归关系;若两个变量都是随机的, 则称它们之间的关系为相关关系,在本教材 中,两者不加区别.
方法规律·归纳
题型 一
正态分布的基本运算
思维 提示
①P(x<x0)=Φ(x0); ②Φ(x0)=1-Φ(-x0);
高考数学第一轮总复习100讲(含同步练习及答案)_同步练习g3.12.4 正态分布、线性回归.
同步练习 g3.1100 正态分布、线性回归1.已知从某批材料中任取一件时,取得的这件材料的强度ε~N (200,18),则取得的这件材料的强度不低于180的概率为( )A .0.9973B .0.8665C .0.8413D .0.2.已知连续型随机变量x 的概率密度函数是⎪⎩⎪⎨⎧>≤≤<=b x 0b x a A a x 0)(x f 其中常数A>0,则A 的值为( )A .1B .bC .ab -1D .b-a3.某工厂某产品产量x (千件)与单位成本y (元)满足回归直线方程x y 82.136.77^-=,则以下说法中正确的是 ( ) A .产量每增加1000件,单位成本下降1.82元 B .产量每减少1000件,单位成本上升1.82元 C .产量每增加1000件,单位成本上升1.82元 D .产量每减少1000件,单位成本下降1.82元4.工人月工资(元)依劳动生产率(千元)变化的回归方程为x y 9060^+=,下列判断正确的是 ( ) A .劳动生产率为1000元时,工资为150元 B .劳动生产率提高1000元时,工资提高150元 C .劳动生产率提高1000元时,工资提高90元 D .劳动生产率为1000元时,工资为90元 5.若随机变量ε~N (5,2),且P(ε<a)=0.9,则a=_____________。
6.已知连续型随机变量x 的分布函数为:⎪⎩⎪⎨⎧≤<≤<=21 a 1x 0ax0)(x x f 其他 则a=___________,=<)23(x P _____________。
7.设随机变量ε服从N (0,1),求下列各式的值:(1)P(ε≥2.55); (2)P(ε<-1.44); (3)P(|ε|<1.52)。
8.某厂生产的圆柱形零件的外径ε~N (4,0.25)。
质检人员从该厂生产的1000件零件中随机抽查一件,测得它的外径为5.7cm 。
高考数学第一轮.110012.4正态分布、线性回归
12.4 正态分布、线性回归一、 知识梳理1.正态分布的重要性正态分布是概率统计中最重要的一种分布,其重要性我们可以从以下两方面来理解:一方面,正态分布是自然界最常见的一种分布。
一般说来,若影响某一数量指标的随机因素很多,而每个因素所起的作用都不太大,则这个指标服从正态分布。
2.正态曲线及其性质正态分布函数:22()2()x f x μσ--=,x ∈(-∞,+∞)3.标准正态曲线标准正态曲线N (0,1)是一种特殊的正态分布曲线,00()1()x x Φ-=-Φ,以及标准正态总体在任一区间(a ,b)内取值概率)()(a b P Φ-Φ=。
4.一般正态分布与标准正态分布的转化由于一般的正态总体),(2σμN 其图像不一定关于y 轴对称,对于任一正态总体),(2σμN ,其取值小于x 的概率)()(σμ-Φ=x x F 。
只要会用它求正态总体),(2σμN 在某个特定区间的概率即可。
5.“小概率事件”和假设检验的基本思想“小概率事件”通常指发生的概率小于5%的事件,认为在一次试验中该事件是几乎不可能发生的。
这种认识便是进行推断的出发点。
关于这一点我们要有以下两个方面的认识:一是这里的“几乎不可能发生”是针对“一次试验”来说的,因为试验次数多了,该事件当然是很可能发生的;二是当我们运用“小概率事件几乎不可能发生的原理”进行推断时,我们也有5%的犯错误的可能。
课本是借助于服从正态分布的有关零件尺寸的例子来介绍假设检验的基本思想。
进行假设检验一般分三步:第一步,提出统计假设。
课本例子里的统计假设是这个工人制造的零件尺寸服从正态分布),(2σμN ;第二步,确定一次试验中的取值a 是否落入范围(μ-3σ,μ+3σ); 第三步,作出推断。
如果a ∈(μ-3σ,μ+3σ),接受统计假设;如果)3,3(σμσμ+-∉a ,由于这是小概率事件,就拒绝统计假设。
6.相关关系研究两个变量间的相关关系是学习本节的目的。
2022年新高考数学总复习:正态分布
2022年新高考数学总复习:正态分布知识点一正态曲线及其性质(1)正态曲线:函数f(x)=12πσe-(x-μ)22σ2,x∈(-∞,+∞),其中实数μ和σ(σ>0)为参数.我们称函数f(x)的图象为正态分布密度曲线,简称正态曲线,期望为μ、标准差为σ的正态分布通常记作__X~N(μ,σ2)__.(2)正态曲线的性质:①曲线位于x轴__上方__,与x轴不相交;②曲线是单峰的,它关于直线__x=μ__对称;③曲线在__x=μ__处达到峰值1σ2π;④曲线与x轴之间的面积为__1__;⑤当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿着x轴平移;⑥当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,表示总体的分布越__集中__;σ越大,曲线越“矮胖”,表示总体的分布越__分散__.知识点二正态分布(1)正态分布的定义及表示.若对于任何实数a,b(a<b),随机变量X满足P(a<X≤b)=__⎠⎛abφμ,σ(x)d x__,则称X 服从正态分布,记作X~N(μ,σ2).(2)正态总体在三个特殊区间内取值的概率值:①P(μ-σ<X≤μ+σ)=__0.682_6__;②P(μ-2σ<X≤μ+2σ)=__0.954_4__;③P(μ-3σ<X≤μ+3σ)=__0.997_4__.归纳拓展对于正态分布N(μ,σ2),由x=μ是正态曲线的对称轴知(1)P(X≥μ)=P(X≤μ)=0.5;(2)对任意的a有P(X<μ-a)=P(X>μ+a);(3)P(X<x0)=1-P(x≥x0);(4)P(a<X<b)=P(X<b)-P(X≤a).注:在X服从正态分布,即X~N(μ,σ2)时,要充分利用正态曲线的关于直线x=μ对称和曲线与x轴之间的面积为1.双基自测题组一 走出误区1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)随机变量的均值是常数,样本的平均数是随机变量,它不确定.( √ )(2)随机变量的方差和标准差都反映了随机变量取值偏离均值的平均程度,方差或标准差越小,则偏离变量的平均程度越小.( √ )(3)正态分布中的参数μ和σ完全确定了正态分布,参数μ是正态分布的均值,σ是正态分布的标准差.( √ )(4)若X ~N (0,1),则P (x <-12)<P (x ≥12).( × )题组二 走进教材2.(P 75B 组T2改编)设随机变量ξ服从正态分布N (4,3),若P (ξ<a -5)=P (ξ>a +1),则实数a 等于( B )A .7B .6C .5D .4[解析] 由题意知(a -5)+(a +1)2=4,∴a =6.题组三 走向高考3.(2015·山东)已知某批零件的长度误差ξ(单位:毫米)服从正态分布N (0,32),从中随机取一件,其长度误差落在区间(3,6)内的概率为( B )(附:正态分布N (μ,σ2)中,P (μ-σ<ξ<μ+σ)=0. 682 7,P (μ-2σ<ξ<μ+2σ)=0.954 5)A .0.045 6B .0.135 9C .0. 271 8D .0.317 4[解析] 因为P (-3<ξ<3)=0. 682 7,P (-6<ξ<6)=0.954 5,所以P (3<ξ<6)=12×(0.954 5-0.682 7)=0.135 9.故选B .4.(2015·湖北,5分)设X ~N (μ1,σ21),Y ~N (μ2,σ22),这两个正态分布密度曲线如图所示,下列结论中正确的是( C )A .P (Y ≥μ2)≥P (Y ≥μ1)B .P (X ≤σ2)≤P (X ≤σ1)C .对任意正数t ,P (X ≤t )≥P (Y ≤t )D .对任意正数t ,P (X ≥t )≥P (Y ≥t )[解析] 由正态分布密度曲线的性质可知,X ~N (μ1,σ21),Y ~N (μ2,σ22)的密度曲线分别关于直线x =μ1,x =μ2对称,因此结合题中所给图象可得,μ1<μ2,所以P (Y ≥μ2)<P (Y ≥μ1),故A 错误.又X ~N (μ1,σ21)的密度曲线较Y ~ N (μ2,σ22)的密度曲线“瘦高”,所以σ1<σ2,所以P (X ≤σ2)>P (X ≤σ1),B 错误.对任意正数t ,P (X ≤t )≥P (Y ≤t ),P (X ≥t )≤P (Y ≥t ),C 正确,D 错误.5.(2017·全国卷Ⅰ)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N (μ,σ2).(1)假设生产状态正常,记X 表示一天内抽取的16个零件中其尺寸在(μ-3σ,μ+3σ)之外的零件数,求P (X ≥1)及X 的数学期望;(2)一天内抽检零件中,如果出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.①试说明上述监控生产过程方法的合理性; ②下面是检验员在一天内抽取的16个零件的尺寸: 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95 经计算得x =116∑16i =1x i=9.97,s =116∑16i =1 (x i -x )2=116∑16i =1(x 2i -16x -2)≈0.212,其中x i 为抽取的第i 个零件的尺寸,i =1,2, (16)用样本平均数x 作为μ的估计值μ^,用样本标准差s 作为σ的估计值σ^,利用估计值判断是否需对当天的生产过程进行检查?剔除(μ^-3σ^,μ^+3σ^)之外的数据,用剩下的数据估计μ和σ(精确到0.01).附:若随机变量Z 服从正态分布N (μ,σ2),则P (μ-3σ<Z <μ+3σ)=0.997 4,0.997 416≈0.959 2,0.008≈0.09.[解析] (1)抽取的一个零件的尺寸在(μ-3σ,μ+3σ)之内的概率为0.997 4,从而零件的尺寸在(μ-3σ,μ+3σ)之外的概率为0.002 6,故X ~B (16,0.002 6).因此P (X ≥1)=1-P (X =0)=1-0.997 416≈0.040 8.X 的数学期望为E (X )=16×0.002 6=0.041 6.(2)①如果生产状态正常,一个零件尺寸在(μ-3σ,μ+3σ)之外的概率只有0.002 6,一天内抽取的16个零件中,出现尺寸在(μ-3σ,μ+3σ)之外的零件的概率只有0.040 8,发生的概率很小.因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.②由x -=9.97,s ≈0.212,得μ的估计值为μ^=9.97,σ的估计值为σ^=0.212,由样本数据可以看出有一个零件的尺寸在(μ^-3σ^,μ^+3σ^)之外,因此需对当天的生产过程进行检查.剔除(μ^-3σ^,μ^+3σ^)之外的数据9.22,剩下数据的平均数为115(16×9.97-9.22)=10.02,因此μ的估计值为10.02.∑16i =1x 2i =16×0.2122+16×9.972≈1 591.134, 剔除(μ^-3σ^,μ^+3σ^)之外的数据9.22,剩下数据的样本方差为115(1 591.134-9.222-15×10.022)≈0.008,因此σ的估计值为0.008≈0.09.考点突破·互动探究考点一 正态分布的性质——自主练透例1 (2021·河北唐山模拟)已知随机变量X 服从正态分布N (0,1),随机变量Y 服从正态分布N (1,1),且P (X >1)=0.158 7,则P (1<Y <2)=( B )A .0.158 7B .0.341 3C .0.841 3D .0.658 7[解析] 由正态曲线的性质知,随机变量X 、Y 的正态曲线形状相同,(如图).由题意P (Y >2)=P (X >1)=0.158 7,∴P (1<Y <2)=0.5-0.158 7=0.341 3.故选B .名师点拨对X ~N (μ,σ2)中的μ,σ的意义不清楚,特别是对μ的认识不清楚,就会在解题时无从下手,导致随便给出一个结果.这里μ是随机变量X 的均值,σ是标准差,x =μ是正态分布密度曲线的对称轴.〔变式训练2〕设两个正态分布N (μ1,σ21)(σ1>0)和N (μ2,σ22)(σ2>0)的密度函数分别为φ1(x )和φ2(x ),其图象如图所示,则下列结论正确的是( C )①μ1<μ2②μ1>μ2③σ1<σ2④σ1>σ2A.①②B.②③C.①③D.③④[解析]f(x)=12πσe-(x-μ)22σ2中x=μ是对称轴,故μ1<μ2;σ越大,曲线越“矮胖”,σ越小曲线越“高瘦”,故σ1<σ2.故选C.考点二正态分布——多维探究例1角度1正态曲线的对称性(1)(2021·山东新高考质量测评联盟联考)在2019年高中学生信息技术测试中,经统计,某校高二学生的测试成绩X~N(86,σ2),若已知P(80<X≤86)=0.36,则从该校高二年级任选一名考生,他的测试成绩大于92分的概率为(D)A.0.86B.0.64C.0.36D.0.14[解析]由题意P(86<x≤92)=P(80<x≤86)=0.36,∴P(X>92)=0.5-0.36=0.14,故选D.角度2确定正态曲线的对称轴(2)(2021·福建模拟)已知随机变量X服从正态分布N(μ,σ2),若P(X<3)+P(X≤1)=1,则μ=__2__.[解析]因为X服从正态分布N(μ,σ2),所以P(X<3)+P(X≥3)=1,所以P(X≤1)=P(X≥3),由正态曲线的对称性知对称轴为X=2,所以μ=2.角度3三个常用数据(3)(2020·安阳二模)2020年2月,受新冠肺炎的影响,医卫市场上出现了“一罩难求”的现象.在政府部门的牵头下,部分工厂转业生产口罩,已知某工厂生产口罩的质量指标ξ~N(15,0.002 5),单位为g,该厂每天生产的质量在(14.9 g,15.05 g)的口罩数量为818 600件,则可以估计该厂每天生产的质量在15.15 g以上的口罩数量为(D)参考数据:若ξ~N(μ,σ2),则P(μ-σ<ξ<μ+σ)=0.682 7,P(μ-2σ<ξ<μ+2σ)=0.954 5,P(μ-3σ<ξ<μ+3σ)=0.997 3.A.158 700B.22 750C .2 700D .1 350[解析] 由题意知,ξ~N (15,0.002 5), 即μ=15,σ2= 0.002 5,即σ=0.05;所以P (14.9<ξ<15.05)=P (μ-2σ<ξ<μ+σ)=0.682 7+0.954 52=0.818 6,所以该厂每天生产的口罩总量为 818 600÷0.818 6=1 000 000(件), 又P (ξ>15.15)=P (ξ>μ+3σ)=1- 0.997 32, 所以估计该厂每天生产的质量在15.15 g 以上的口罩数量为1 000 000×1-0.997 32=1350(件).故选D .[引申]本例(1)中若有1 000名学生参加测试,则测试成绩在80分以上的人数为__860__. [解析] 1 000×P (X >80)=1 000×[1-(0.5-0.36)]=860.名师点拨关于正态总体在某个区间内取值的概率求法(1)熟记P (μ-σ<X ≤μ+σ),P (μ-2σ<X ≤μ+2σ),P (μ-3σ<X ≤μ+3σ)的值; (2)充分利用正态曲线的对称性和曲线与x 轴之间面积为1.①正态曲线关于直线x =μ对称,从而在关于x =μ对称的区间上概率相等;②P (X <a )=1-P (X ≥a ),P (X <μ-a )=P (X ≥μ+a ).〔变式训练2〕(1)(角度1)(2021·江苏苏州调研)已知随机变量ξ服从正态分布N (1,σ2),且P (ξ<4)=0.9,则P (-2<ξ<1)=( C )A .0.2B .0.3C .0.4D .0.6(2)(角度2)(2021·江西模拟)已知随机变量ξ服从正态分布N (μ,σ2),若P (ξ<2)=P (ξ>8)=0.15,则P (2≤ξ<5)=( B )A .0.3B .0.35C .0.5D .0.7(3)(角度3)(2021·青岛模拟)已知某市居民在2019年用于手机支付的个人消费额ξ(单位:元)服从正态分布N (2 000,1002),则该市某居民手机支付的消费额在(1 900,2 200)内的概率为( C )附:随机变量ξ服从正态分布N (μ,σ2),则 P (μ-σ<ξ<μ+σ)=0.682 6,P (μ-3σ<ξ<μ+3σ)=0.997 4. A .0.975 9 B .0.84 C .0.818 5D .0.477 2[解析] (1)由P (ξ<4)=0.9,得P (ξ≥4)=0.1.又正态曲线关于x =1对称. 则P (ξ≤-2)=P (ξ≥4)=0.1,所以P (-2<ξ<1)=1-P (ξ≤-2)-P (ξ≥4)2=0.4.故选C .(2)根据题意,正态分布N (μ,σ2), 若P (ξ<2)=P (ξ>8)=0.15,则μ=5,即这组数据对应的正态曲线的对称轴x =5,则P (ξ<5)=0.5, 又由P (ξ<2)=0.15,得P (2≤ξ<5)=0.5-0.15=0.35.故选B . (3)∵服从正态分布N (2 000,1002), ∴μ=2 000,σ=100,则P (1 900<ξ<2 200)=P (μ-σ<ξ<μ+σ)+12[P (μ-2σ<ξ<μ+2σ)-P (μ-σ<ξ<μ+σ)]=0.682 6+12(0.954 4-0.682 6)=0.818 5.故选C .考点三,正态分布的综合应用例3 (1)(2021·贵州贵阳为明教育集团调研)如图,在正方形ABCD 中的阴影部分的上下边界分别是曲线C 1和C 2,其中C 1是正态分布N (0,0.52)的密度曲线,C 1与C 2关于x 轴对称,若在正方形中随机取一点,则该点取自阴影部分的概率是( C )参考数据:随机变量Z 服从正态分布N (μ,σ2)的概率为:P (μ-2σ<Z ≤μ+2σ)=0.954 4, P (μ-3σ<Z ≤μ+3σ)=0.997 4 A .0.682 6 B .0.954 4 C .0.477 2D .0.498 7(2)(2021·河南六市模拟)十九大以来,某贫困地区扶贫办积极贯彻落实国家精准扶贫的政策要求,带领广大农村地区人民群众脱贫奔小康.经过不懈的奋力拼搏,新农村建设取得巨大进步,农民年收入也逐年增加,为了制定提升农民收入、实现2020年脱贫的工作计划,该地扶贫办统计了2019年50位农民的年收入并制成如下频率分布直方图:(ⅰ)根据频率分布直方图,估计50位农民的平均年收入x -(单位:千元);(同一组数据用该组数据区间的中点值表示);(ⅱ)由频率分布直方图,可以认为该贫困地区农民年收入X 服从正态分布N (μ,σ2),其中μ近似为年平均收入x -,σ2近似为样本方差s 2,经计算得s 2=6.92,利用该正态分布,求:①在扶贫攻坚工作中,若使该地区约有占总农民人数的84.14%的农民的年收入高于扶贫办制定的最低年收入标准,则最低年收入标准大约为多少千元?②为了调研“精准扶贫,不落一人”的政策要求落实情况,扶贫办随机走访了1 000位农民.若每位农民的年收入互相独立,问:这1000位农民中的年收入不少于12.14千元的人数最有可能是多少?附参考数据:6.92≈2.63,若随机变量X 服从正态分布N (μ,σ2),则P (μ-σ<X <μ+σ)=0.6827,P (μ-2σ<X <μ+2σ)=0.9545,P (μ-3σ<X <μ+3σ)=0.9973.[解析] (1)因为C 1是正态分布N (0,0.52)的密度曲线, 且P (μ-2σ<Z ≤μ+2σ)=0.954 4, 所以P (-1<Z ≤1)=0.954 4,则阴影部分的面积S =0.954 4×2=1.908 8,所以若在正方形中随机取一点,则该点取自阴影部分的概率是1.908 84=0.477 2.故选C .(2)(ⅰ)x -=12×0.04+14×0.12+16×0.28+18×0.36+20×0.10+22×0.06+24×0.04=17.40千元.故估计50位农民的年平均收入x -为17.40千元. (ⅱ)由题意知X ~N (17.40,6.92), ①P (X >μ-σ)=12+0.682 72≈0.841 4,所以μ-σ=17.40-2.63=14.77时,满足题意, 即最低年收入大约为14.77千元.②由P (x ≥12.14)=P (x ≥μ-2σ)=0.5+0.954 52≈0.977 3,每个农民的年收入不少于12.14千元的事件的概率为0.977 3, 记1 000个农民的年收入不少于12.14千元的人数为ξ 则ξ~B (1 000,p ),其中p =0.977 3于是恰好有k 个农民的年收入不少于12.14千元的事件概率为P (ξ=k )=C k 1 000p k (1-p )1 000-k , 从而由P (ξ=k )P (ξ=k -1)=(1 001-k )×p k ×(1-p )>1,得k <1 001p而1 001p =978.277 3,所以,当0≤k ≤978时,P (ξ=k -1)<P (ξ=k ); 当979≤k ≤1 000时,P (ξ=k -1)>P (ξ=k ),由此可知,在所走访的1 000位农民中,年收入不少于12.14千元的人数最有可能是978人.名师点拨解决正态分布问题的三个关键点 若随机变量ξ~N (μ,σ2),则 (1)对称轴x =μ; (2)标准差σ;(3)分布区间.利用对称性可求指定范围内的概率值;由μ,σ,分布区间的特征进行转化,使分布区间转化为3σ特殊区间,从而求出所求概率〔变式训练3〕(2021·广西柳州铁路一中、玉林一中联考)从某公司生产线生产的某种产品中抽取1 000件,测量这些产品的一项质量指标,由检测结果得如图所示的频率分布直方图:(1)求这1 000件产品质量指标的样本平均数x -和样本方差s 2(同一组中的数据用该组区间的中点值作代表);(2)由直方图可以认为,这种产品的质量指标值Z 服从正态分布N (μ,σ2),其中μ近似为样本平均数x -,σ2近似为样本方差s 2.①利用该正态分布,求P (175.6<Z <224.4);②已知每件该产品的生产成本为10元,每件合格品(质量指标值Z ∈(175.6,224.4))的定价为16元;若为次品(质量指标值Z ∉(175.6,224.4)),除了全额退款外且每件次品还须赔付客户48元,若该公司卖出100件这种产品,记Y 表示这些产品的利润,求E (Y ).附:150≈12.2,若Z ~N (μ,σ2),则P (μ-σ<Z <μ+σ)≈0.68,P (μ-2σ<Z <μ+2σ)≈0.95. [解析] (1)由题意得x -=170×0.02+180×0.09+190×0.22+200×0.33+210×0.24+220×0.08+230×0.02=200s 2=(170-200)2×0.02+(180-200)2×0.09+(190-200)2×0.22+(200-200)2×0.33+(210-200)2×0.24+(220-200)2×0.08+(230-200)2×0.02=150.即样本平均数为200,样本方差为150. (2)①由(1)可知,μ=200,σ=150≈12.2, ∴Z ~N (200,12.22),∴P (175.6<Z <224.4) =P (μ-2σ<Z <μ+2σ)≈0.95 ②设X 表示100件产品的正品数, 题意得X ~B (100,0.95),∴E (X )=95, ∴E (Y )=16E (X )-48×5-100×10=280.名师讲坛·素养提升利用均值与方差求解决策性问题例4 (2021·湖南益阳调研)已知6名某疾病病毒密切接触者中有1名感染病毒,其余5名未感染,需要通过化验血液来确定感染者.血液化验结果呈阳性的即为感染者,呈阴性即为未感染者.(1)若从这6名密切接触者中随机抽取2名,求抽到感染者的概率;(2)血液化验确定感染者的方法有:方法一是逐一化验;方法二是平均分组混合化验,先将血液样本平均分成若干组,对组内血液混合化验,若化验结果呈阴性,则该组血液不含病毒,若化验结果呈阳性,则对该组的备份血液逐一化验;直至确定感染者.(ⅰ)采取逐一化验,求所需化验次数ξ的分布列及数学期望;(ⅱ)采取平均分成三组混合化验(每组血液份数相同),求该分组方法所需化验次数的数学期望.你认为选择哪种化验方案更合理?请说明理由.[解析] (1)抽到感染者的概率P =C 11C 15C 26=515=13.(2)(ⅰ)按逐一化验法,ξ的可能取值为1,2,3,4,5,P (ξ=1)=C 11C 16=16,P (ξ=2)=C 15C 11A 26=16,P (ξ=3)=A 25C 11A 36=16,P (ξ=4)=A 35C 11A 46=16,P (ξ=5)=A 45C 11+A 55A 56=13, 所以ξ的分布列为数学期望E (ξ)=1×16+2×16+3×16+4×16+5×13=103.(ⅱ)平均分成三组即按(2,2,2)分组, 记所需化验次数为η,则η=2,3, P (η=2)=13,P (η=3)=23×12+23×12=23所以η的分布列为数学期望E (η)=2×13+3×23=83.因为E (ξ)>E (η),所以按平均分组法较合理.名师点拨随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量稳定于均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要理论依据.一般先比较均值,若均值相同,再用方差来决定.〔变式训练4〕(2021·湖南郴州质检)某蔬菜种植基地有一批蔬菜需要两天内采摘完毕,天气预报显示这两天每天是否有雨相互独立,无雨的概率都为0.8.现有两种方案可以选择:方案一:基地人员自己采摘,不额外聘请工人,需要两天完成,两天都无雨收益为2万元,只有一天有雨收益为1万元,两天都有雨收益为0.75万元.方案二:基地额外聘请工人,只要一天就可以完成采摘,当天无雨收益为2万元,有雨收益为1万元.额外聘请工人的成本为a 万元.(1)若不额外聘请工人,写出基地收益X 的分布列及基地的预期收益; (2)该基地是否应该外聘工人?请说明理由. [解析] (1)基地收益X 的可能值为2,1,0.75,则P (X =2)=0.8×0.8=0.64,P (X =1)=0.8×0.2+0.2×0.8=0.32, P (X =0.75)=(1-0.8)×(1-0.8)=0.04, 故X 的分布列为则E (X )=2×0.64(2)设基地额外聘请工人时的收益为Y 万元, 则其预期收益E (Y )=2×0.8+1×0.2-a =1.8 -a E (Y )-E (X )=0.17-a综上可得,当额外聘请工人的成本高于0.17万元时,E (X )>E (Y ),不外聘工人, 当成本低于0.17万元时E (X )<E (Y ),外聘工人,当成本恰为0.17万元时,E (X )=E (Y ),是否外聘工人均可以.高考大题规范解答系列(六)——概率与统计考点一 离散型随机变量的分布列与期望(理)例1 (2021·山西联考)已知甲盒中有三个白球和三个红球,乙盒中仅装有三个白球,球除颜色外完全相同.现从甲盒中任取三个球放入乙盒中.(1)求乙盒中红球个数X 的分布列与期望; (2)求从乙盒中任取一球是红球的概率. 【标准答案】——规范答题 步步得分 (1)由题意知X 的可能取值为0,1,2,3.P (X =0)=C 03C 33C 36=120,P (X =1)=C 13C 23C 36=920,P (X =2)=C 23C 13C 36=920,P (X =3)=C 33C 03C 36=120,所以X 的分布列为所以E (X )=0×120+1×920+2×920+3×120=32.(2)当乙盒中红球个数为0时,P 1=0,当乙盒中红球个数为1时,P 2=920×16=340,当乙盒中红球个数为2,P 3=920×26=320, 当乙盒中红球个数为3时,P 4=120×36=140,所以从乙盒中任取一球是红球的概率为P 1+P 2+P 3+P 4=14.【评分细则】(1)第一问中,正确算出P (X =0),P (X =1),P (X =2),P (X =3)各得1分,列出分布列得1分,求出期望得1分.(2)第二问中,分类讨论,每种情况各占1分. (3)其他方法按步骤酌情给分.例2 (2019·课标Ⅰ,21)为治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈,则甲药得1分,乙药得-1分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈,则乙药得1分,甲药得-1分;若都治愈或都未治愈,则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X .(1)求X 的分布列;(2)若甲药、乙药在试验开始时都赋予4分,p i (i =0,1,…,8)表示“甲药的累计得分为i 时,最终认为甲药比乙药更有效”的概率,则p 0=0,p 8=1,p i =ap i -1+bp i +cp i +1(i =1,2,…,7),其中a =P (X =-1),b =P (X =0),c =P (X =1).假设α=0.5,β=0.8.①证明:{p i +1-p i }(i =0,1,2,…,7)为等比数列; ②求p 4,并根据p 4的值解释这种试验方案的合理性. 【标准答案】——规范答题 步步得分(1)X 的所有可能取值为-1,0,1. P (X =-1)=(1-α)β, P (X =0)=αβ+(1-α)·(1-β), P (X =1)=α(1-β). 所以X 的分布列为(2)①由(1)得a =0.4,b =0.5,c =0.1.因此p i =0.4P i -1+0.5p i +0.1p i +1, 故0.1(p i +1-p i )=0.4(p i -p i -1), 即p i +1-p i =4(p i -p i -1). 又因为p 1-p 0=p 1≠0,所以{p i +1-p i }(i =0,1,2,…,7)是公比为4,首项为p 1的等比数列. ②由①可得p 8=p 8-p 7+p 7-p 6+…+p 1-p 0+p 0=(p 8-p 7)+(p 7-p 6)+…+(p 1-p 0)=48-13p 1.由于p 8=1,故p 1=348-1,所以p 4=(p 4-p 3)+(p 3-p 2)+(p 2-p 1)+(p 1-p 0) =44-13p 1=1257.p 4表示最终认为甲药更有效的概率.由计算结果可以看出,在甲药治愈率为0.5,乙药治愈率为0.8时,认为甲药更有效的概率为p 4=1257≈0.003 9,此时得出错误结论的概率非常小,说明这种试验方案合理. 【评分细则】①每个式子1分,表格1分;给出X 的可能取值给1分; ②得出a 、b 、c 的值(有正确的)得1分; ③得到P i +1-P i =4(P i -P i -1)得1分; ④给出结论得1分;⑤得出P 8,P 4,P 1的表达式各得1分;⑥说明P 4非常小得1分; ⑦说明实验方案合理得1分. 【名师点评】1.核心素养:本题主要考查相互独立事件的概率、随机变量的期望、方差的应用、二项分布、决策问题等,考查数据处理能力、运算求解能力,考查或然与必然思想,考查的核心素养的逻辑推理、数学建模、数学运算、数据分析.2.解题技巧:破解此类题的关键:一是认真读题,读懂题意;二是会利用导数求最值;三是会利用公式求服从特殊分布的离散型随机变量的期望值;四是会利用期望值,解决决策型问题.〔变式训练1〕(2021·湖南五市十校教研教改共同体联考)某学校为了了解学生对新冠病毒的传播和预防知识的掌握情况,学校决定组织一次有关新冠病毒预防知识竞答.竞答分为必答题(共5题)和选答题(共2题)两部分.每位同学答题相互独立,且每道题答对与否互不影响.已知甲同学答对每道必答题的概率为45,答对每道选答题的概率为25.(1)求甲恰好答对4道必答题的概率;(2)在选答阶段,若选择回答且答对奖励5分,答错扣2分,选择放弃回答得0分.已知甲同学对于选答的两道题,选择回答和放弃回答的概率均为12,试求甲同学在选答题阶段,得分X 的分布列.[解析] (1)甲恰好答对4道必答题的概率为 P =C 45⎝⎛⎭⎫454×15=256625.(2)依题意,每道题选择回答并答对的概率为12×25=15,选择回答且答错的概率为12×35=310,选择放弃回答的概率为12.甲得分的可能性为-4分,-2分,0分,3分,5分和10分. 所以P (X =-4)=9100,P (X =-2)=C 1212×12×35=310, P (X =0)=12×12=14,P (X =3)=C 1212×12×25×35=325,P (X =5)=C 1212×12×25=15, P (X =10)=12×12×⎝⎛⎭⎫252=125.所以X 的分布列为考点一 随机抽样、频率分布直方图及其应用(文)例1 (2021·河南质量测评)“不忘初心、牢记使命”主题教育活动正在全国开展,某区政府为统计全区党员干部一周参与主题教育活动的时间,从全区的党员干部中随机抽取n 名,获得了他们一周参加主题教育活动的时间(单位:时)的频率分布直方图,如图所示,已知参加主题教育活动的时间在(12,16]内的人数为92.(1)估计这些党员干部一周参与主题教育活动的时间的平均值;(2)用频率估计概率,如果计划对全区一周参与主题教育活动的时间在(16,24]内的党员干部给予奖励,且参与时间在(16,20],(20,24]内的分别获二等奖和一等奖,通过分层抽样方法从这些获奖人中随机抽取5人,再从这5人中任意选取3人,求3人均获二等奖的概率.【分析】 (1)先利用频率分布“直方图中各小矩形面积为1”求出a 的值,再利用各小矩形中点横坐标与该矩形面积积的和求平均值;(2)利用分层抽样的性质先求出在(16,20],(20,24]内分别抽取的人数,再用列举法求概率.【标准答案】——规范答题 步步得分 (1)由已知可得a =1÷4-(0.025 0+0.047 5+0.050 0+0.012 5)=0.115 0,2分得分点①所以这些党员干部一周参加主题教育活动的时间的平均值为(6×0.025+10×0.047 5+14×0.115+18×0.05+22×0.012 5)×4=13.644分得分点②(2)因为0.115 0×4×n =92,所以n =920.115 0×4=200.6分得分点③故参与主题教育活动的时间在(16,20]的人数为 0.050 0×4×200=40,参与主题教育活动的时间在(20,24]的人数为 0.012 5×4×200=10.8分得分点④则利用分层抽样抽取的人数:在(16,20]内为4人,9分得分点⑤ 设为a ,b ,c ,d ;在(20,24]内为1人,设为A ,从这5人中选取3人的事件空间为:{(a ,b ,c ),(a ,b ,d ),(a ,b ,A ),(a ,c ,d ),(a ,c ,A ),(a ,d ,A ),(b ,c ,d ),(b ,c ,A ),(b ,d ,A ),(c ,d ,A )},共10种情况,10分其中全是二等奖的有4种情况.11分 故P =410=25.12分得分点⑥【评分细则】①列对算式计算错误得1分,全对得2分; ②列对算式计算错误得1分,全对得2分; ③计算错误不得分;④求对(20,24],(16,20]上人数各得1分; ⑤求对(20,24]或(16,20]内抽取人数得1分;⑥列举出事件空间得1分,数对数目得1分;求对概率得1分. 【名师点评】本题主要考查随机抽样、频率分布直方图及概率,考查学生数据处理能力、运算能力. 〔变式训练1〕(2020·四川成都诊断)2019年12月,《生活垃圾分类标志》新标准分布并正式实施.为进一步普及生活垃圾分类知识,了解居民生活垃圾分类情况,某社区开展了一次关于垃圾分类的问卷调查活动,并对随机抽取的1 000人的年龄进行了统计,得到如下的各年龄段频数分布表和各年龄段人数频率分布直方图:(1)请补全各年龄段人数频率分布直方图,并求出各年龄段频数分布表中m ,n 的值; (2)现从年龄在[30,40)段中采用分层抽样的方法选取5名代表参加垃圾分类的知识交流活动,应社区要求,从被选中的这5名代表中任意选2名作交流发言,求选取的2名发言者中恰有1名年龄在[35,40)段中的概率.[解析] (1)∵第三组的频率为1-(0.04+0.06+0.03+0.02+0.01)×5=0.2, ∴第三组直方图的高为0.25=0.04.补全频率分布直方图如下图:由频率分布直方图,知m =0.02×1 000=200, n =0.02×(50-45)×1 000=100.(2)由(1)知年龄在[30,35)段中的人数与年龄在[35,40)段中的人数的比值为300200=32,所以采用分层抽样法抽取5名,年龄在[30,35)段中的有3名,年龄在[35,40)段中的有2名.不妨设年龄在[30,35)段中的3名为A 1,A 2,A 3,年龄在[35,40)段中的2名为B 1,B 2由于从5名代表中任选2名作交流发言的所有可能情况有:{A 1,A 2},{A 1,A 3},{A 1,B 1},{A 1,B 2},{A 2,A 3},{A 2,B 1},{A 2,B 2},{A 3,B 1},{A 3,B 2},{B 1,B 2},共10种,其中选取的2名发言者中恰有1名年龄在[35,40)段的情况有:{A 1,B 1},{A 1,B 2},{A 2,B 1},{A 2,B 2},{A 3,B 2},{A 3,B 2},共6种.故所求概率为P =610=35.考点二 线性回归分析例3 (2018·全国2)下图是某地区2000年至2016年环境基础设施投资y (单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,…,17)建立模型①;y ^=-30.4+13.5t ,根据2010年至2016年的数据(时间变量t 的值依次为1,2,…,7)建立模型②:y ^=99+17.5t .(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.【分析】 (1)模型①中取t =19,模型②中取t =9,求出对应的函数值即可;(2)利用所给折线图中数据的增长趋势,加以分析即可.【标准答案】——规范答题 步步得分(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为 y ^=-30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为 y ^=99+17.5×9=256.5(亿元). (2)利用模型②得到的预测值更可靠.理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y =-30.4+13.5t 上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y ^=99+17.5t 可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.(以上给出了2种理由,答出其中任意一种或其他合理理由均可得分) 12分得分点④ 【评分细则】①根据模型①求出预测值给3分; ②根据模型②求出预测值给3分; ③判断模型②得到的预测值更可靠给2分; ④作出正确的判断,写出合理理由,给4分; 【名师点评】1.核心素养:本题主要考查线性回归方程的实际应用,考查考生的应用意识,分析问题与解决问题的能力以及运算求解能力,考查数学的核心素养是数据分析、数学建模、数学运算.2.解题技巧:统计中涉及的图形较多、常见的有条形统计图、折线图、茎叶图、频率分布直方图、应熟练地掌握这些图形的特点,提高识图与用图的能力.〔变式训练2〕(2021·安徽蚌埠质检)经销商小王对其所经营的某一型号二手汽车的使用年数x (0<x ≤10,x ∈N )与每辆的销售价格y (单位:万元)进行整理,得到如表的对应数据:(1)试求y 关于x 的回归直线方程;(2)已知每辆该型号汽车的收购价格ω(单位:万元)与使用年数x (0<x ≤10,x ∈N )的函数关系为ω=0.05x 2-1.75x +17.2,根据(1)中所求的回归方程,预测x 为何值时,小王销售一辆该型号汽车所获得的利润z 最大.附:回归直线的斜率和截距的最小二乘估计公式分别为b ^=∑i =1nx i y i -n x -·y-∑i =1nx 2i -n x -2,a ^=y --b ^ x -. [解析] (1)由表中数据,得x -=15×(2+4+6+8+10)=6,。
高考数学复习全套课件 第十一章(理) 第四节 正态分布、线性回归
4.若施化肥量x与小麦产量y之间的回归直线方程为 =
250+4x,当施化肥量为50 kg时,预计小麦产量为
________.
解析:把x=50代入
答案:450 kg
=250+4x可求得
=450(kg).
5.设随机变量ξ服从正态分布N(0,1),记Φ(x)=P(ξ<x),给 出下列结论: ①Φ(0)=0.5;②Φ(x)=1-Φ(-x);③P(|ξ|<2)=2Φ (2)-1. 则正确结论的序号是________.
用函数关系式来表示,D中的两个变量之间的关系是相
关关系.
答案:D
3.已知x与y之间的几组数据如下表: x y 0 1 1 3 2 5 3 7 ( )
则y与x的线性回归方程 =bx+a必过 A.点(2,2) C.点(1,2) B.点(1.5,0) D.点(1.5,4)
解析:
∴线性回归方程必过(1.5,4). 答案:D
标准正态分布
①曲线在 x轴 上方,与 x轴 不相交,以 x轴 为渐近线 ②曲线关于直线x=μ对称 ②曲线关于直线 x=0 对称 x=μ ③曲线在 时位于最 ③曲线在 x=0时位于最高点 高点 x<μ ④当 x<0 时,曲线上升, 性 ④当 时,曲线上升, x>μ x>0 当 质 当 时,曲线下降 时,曲线下降 分散 矮胖 ⑤当μ一定时,曲线的形状由σ确定 σ越大,曲线越“ 瘦高 ”,表示总体的分布越 集中 ; σ越小,曲线越“ ”,表示总体的分布越
x
4
9
16
=4;
25
=5; =112.3
36
90
=90;
于是有b= a= -b =5-1.23×4=0.08.
=1.23;
【2020】人教版最新高考数学知识梳理复习题-正态分布附参考答案
附参考答案★ 知 识 梳理 ★1. 正态总体的概率密度函数:式中是参数,分别表示___________与___________;当时得到标准正态分布密度函数:.0μ=()()221,,26x f x e x π-=∈-∞+∞答案: 总体的平均数(期望值); 标准差2.正态曲线的性质:① ______________________; ② ______________________; ③ ______________________; ④ ______________________; 答案:① 曲线位于x 轴上方,与x 轴不相交; ② 曲线是单峰的,关于直线x = 对称;③ 曲线在x =处达到峰值;④ 曲线与x 轴之间的面积为1;3. 是参数是参数的意义:① ______________________; ② ______________________’ 答案:① 当一定时,曲线随质的变化沿x 轴平移;② 当一定时,曲线形状由确定:越大,曲线越“矮胖”,表示总体分布越集中;越小,曲线越“高瘦”,表示总体分布越分散.。
特别提醒: (1)P=0.6826;(2)P=0.9544(3)P=0.99744.对于,取值小于x 的概率.2(,)N μσ()x F x μσ-⎛⎫=Φ ⎪⎝⎭ 21x x μμσσ--⎛⎫⎛⎫=Φ-Φ ⎪ ⎪⎝⎭⎝⎭.★ 重 难 点 突 破 ★1.重点:利用实际问题的直方图,了解正态分布曲线的特点及曲线所表示的意义2.难点:利用正态分布曲线的特点及曲线所表示的意义解决简单问题.3.重难点:.(1) 正态分布与正态曲线问题1:若总体密度曲线就是或近似地是函数的图象,则其分布叫正态分布,常记作.的图象称为正态曲线.R,21)(222)(∈=--x ex f x σμσπ),(2σμN )(x f点拨:画出三条正态曲线:即①;②;③,其图象如下图所示:5.0,1==σμ1,0==σμ2,1==σμ观察以上三条正态曲线,得以下性质: ①曲线在x 轴的上方,与x 轴不相交.②曲线关于直线对称,且在时位于最高点.μ=x μ=x③当时,曲线上升;当时,曲线下降.并且当曲线向左、右两边无限延伸时,以x 轴为渐近线,向它无限靠近.μ<x μ>x④当一定时,曲线的形状由确定.越大,曲线越“矮胖”,表示总体的分布越分散;越小,曲线越“瘦高”,表示总体的分布越集中.μσσσ注意: 当时,正态总体称为标准正态总体,相应的函数表示式是.相应的曲线称为标准正态曲线.1,0==σμR ,21)(22∈=-x e x f x π★ 热 点 考 点 题 型 探 析★考点一: 正态分布的应用题型1. 正态分布公式的应用[例1] 给出下列三个正态总体的函数表达式,请找出其均值μ和标准差σ(1)),(,21)(22+∞-∞∈=-x ex f x π(2)),(,221)(8)1(2+∞-∞∈=--x ex f x π(3)22(1)2(),(,)2x f x e x π-+=∈-∞+∞[解题思路]:考查正态总体的概率密度函数公式, 式中是参数,分别表示总体的平均数(期望值)与标准差解析:(1)0,1;(2)1,2;(3)-1,0.5[例2] 某物体的温度()是一个随机变量,已知,又随机变量()T0F )2,6.98(~N T S 0C满足,求的概率密度.。
高中数学复习学案(第72讲) 正态分布和线性回归人教版选修2
题目 (选修Ⅱ)第一章概率与统计正态分布和线性回归高考要求1.了解正态分布的意义及主要性质2.了解线性回归的方法和简单应用 知识点归纳1.正态分布密度函数:22()21()2x f x eμσπσ--=,(σ>0,-∞<x <∞)其中π是圆周率;e 是自然对数的底;x 是随机变量的取值;μ为正态分布的均值;σ是正态分布的标准差.正态分布一般记为),(2σμN2.正态分布),(2σμN )是由均值μ和标准差σ唯一决定的分布3.正态曲线的性质:正态分布由参数μ、σ唯一确定,如果随机变量ξ~N(μ,σ2),根据定义有:μ=E ξ,σ=D ξ。
正态曲线具有以下性质:(1)曲线在x 轴的上方,与x 轴不相交。
(2)曲线关于直线x =μ对称。
(3)曲线在x =μ时位于最高点。
(4)当x <μ时,曲线上升;当x >μ时,曲线下降。
并且当曲线向左、右两边无限延伸时,以x 轴为渐近线,向它无限靠近。
(5)当μ一定时,曲线的形状由σ确定。
σ越大,曲线越“矮胖”,表示总体越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中。
五条性质中前三条较易掌握,后两条较难理解,因此应运用数形结合的原则,采用对比教学4.标准正态曲线:当μ=0、σ=l 时,正态总体称为标准正态总体,其相应的函数表示式是2221)(x ex f -=π,(-∞<x <+∞)其相应的曲线称为标准正态曲线标准正态总体N (0,1)在正态总体的研究中占有重要的地位任何正态分布的概率问题均可转化成标准正态分布的概率问题5.标准正态总体的概率问题:对于标准正态总体N (0,1),)(0x Φ是总体取值小于0x 的概率, 即 )()(00x x P x <=Φ,其中00>x ,图中阴影部分的面积表示为概率0()P x x <只要有标准正态分布表即可查表解决.从图中不难发现:当00<x 时,)(1)(00x x -Φ-=Φ;而当00=x 时,Φ(0)=0.56.标准正态分布表标准正态总体)1,0(N 在正态总体的研究中有非常重要的地位,为此专门制作了“标准正态分布表”.在这个表中,对应于0x 的值)(0x Φ是指总体取值小于0x 的概率,即 )()(00x x P x <=Φ,)0(0≥x . 若00<x ,则)(1)(00x x -Φ-=Φ.利用标准正态分布表,可以求出标准正态总体在任意区间),(21x x 内取值的概率,即直线1x x =,2x x =与正态曲线、x 轴所围成的曲边梯形的面积1221()()()P x x x x x <<=Φ-Φ.7.非标准正态总体在某区间内取值的概率:可以通过)()(σμ-Φ=x x F 转化成标准正态总体,然后查标准正态分布表即可在这里重点掌握如何转化首先要掌握正态总体的均值和标准差,然后进行相应的转化8.小概率事件的含义:发生概率一般不超过5%的事件,即事件在一次试验中几乎不可能发生假设检验方法的基本思想:首先,假设总体应是或近似为正态总体,然后,依照小概率事件几乎不可能在一次试验中发生的原理对试验结果进行分析 假设检验方法的操作程序,即“三步曲”一是提出统计假设,教科书中的统计假设总体是正态总体;二是确定一次试验中的a 值是否落入(μ-3σ,μ+3σ); 三是作出判断9.相关关系:当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系相关关系与函数关系的异同点如下: 相同点:均是指两个变量的关系不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系.10.回归分析一元线性回归分析: 对具有相关关系的两个变量进行统计分析的方法叫做回归分析通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性 对于线性回归分析,我们要注意以下几个方面:(1)回归分析是对具有相关关系的两个变量进行统计分析的方法。
正态分布和线性回归
专题:正态分布和线性回归一、基础知识回顾1( x)21. 正态分布:若总体密度曲线就是或近似地是函数 f ( x)e 22的图象2, x,其中:π是圆周率; e 是自然对数的底; x 是随机变量的取值 ,为正态分布的平均值; 是正态分布的标准差.这个总体是无限容量的抽样总体,其分布叫做正态分布.正态分布由参数 , 唯一确定,记作 ~ N ( , 2 ) ,E( )= ,D( )=2 .2. 函数 f(x) 图象被称为正态曲线 .(1) 从形态上看,正态分布是一条单峰、对称呈钟形的曲线,其对称轴为 x=μ,并在 x=μ时.... ..........取最大值 。
(2) 从 x=μ点开始,曲线向正负两个方向递减延伸,不断逼近x 轴,但永不与 x....轴相交,因此说曲线在正负两个方向都是以 x 轴为渐近线的 ,(3) 当μ的值一定时 , σ越大,曲线越“矮胖”,总体分布越分散;σ越小,曲线越“高”.总体分布越集中.3. 把 ~ N (0,1) 即μ =0, σ=1 称为标准正态分布,这样的正态总体称为标准正态总体 , 其密度函1 1 x2 数为 f ( x)e22,x ∈(- ∞,+∞) ,相应的曲线称为标准 正态曲线.4. 利用标准正态分布表可求得标准正态总体在某一区间内取值的概率 .(1) 对于标准正态总体 N (0,1) , ( x 0 ) 是总体取值小于 x 0 的概率,即: ( x 0 ) P(xx 0 ) ,其中 x 0 0 ,其值可以通过 “标准正态分布表” 查得,也就是图中阴影部分的面积,它表示总体取值小于 x 0 的概率.(2) 标准正态曲线关于 y 轴对称。
因为当 x 0 0 时, ( x 0 ) P(xx 0 ) ;而当 x 0 0 时,根据正态曲线的性质可得: ( x 0 ) 1( x 0 ) ,并且可以求得在任一区间(x 1 , x 2 ) 内取值的概率: P(x 1 x x 2 ) ( x 2 )( x 1 ) , 显然Φ(0)=0.5.5. 对于任一正态总体 ~ N ( ,2) , 都可以通过使之标准化 ~ N (0,1) , 那么 ,P(x )=P( <x)= (x) ,求得其在某一区间内取值的概率 .例如:~ N(1,4), 那么 , 设 =1, 则~ N (0,1) , 有 P( <3)=P( <1)= (1)=0.8413.26. Φ(1)=0.8413 、Φ (2)=0.9772 、Φ(3)=0.9987二、例题1x2(1) f ( x)2,(- ∞<x<+∞e21( x 1) 2(2) f ( x)8,(- ∞< x<+∞e22(3)f ( x) 2 e2( x 1)2,(- ∞<x<+∞22. 正态总体的函数表示式是 f (x)2e 2( x 1)2,(- ∞< x<+∞) (1)求 f (x)的最大值;2(2)利用指数函数性质说明其单调区间,以及曲线的对称轴.3. 利用标准正态分布表 ( Φ(1)=0.8413 、Φ(2)=0.9772 、Φ(3)=0.9987) 求标准正态总体在下面区间取值的概率.(1)(0,1);(2)(1,3);(3)(-1 ,2).4.利用标准正态分布表 (( Φ (1)=0.8413 、Φ (1.84)=0.9671) ,求正态总体在下面区间取值的概率.(1)在 N(1,4) 下,求 F(3)(2)在 N ( , 2 )下,求P(μ-1.84σ<X<μ+1.84σ)*5 . 对于正态总体 N ( , 2 ) 取值的概率:(1) ( μ - σ,μ +σ):(2) ( μ -2 σ,μ +2σ):(3) ( μ -3 σ,μ +3σ):取值的概率分别为 68.3%、95.4%、99.7%。
2021年高考一轮数学复习 X1-4正态分布、线性回归理 同步练习(名师解析)
选修 第1章 第4节考点一:正态分布的计算与证明1.以Φ(x )表示标准正态分布在区间(-∞,x )内取值的概率,若随机变量ξ服从正态分布N (μ,σ2),则概率P (|ξ-μ|<σ)等于( )A .Φ(μ+σ)-Φ(μ-σ)B .Φ(1)-Φ(-1)C .Φ(1-μσ)D .2Φ(μ+σ)解析:设η=ξ-μσ,η服从标准正态分布.∴P (|ξ-μ|<σ)=P (-1<η<1)=Φ(1)-Φ(-1).答案:B2.在某项测量中,测量结果ξ服从正态分布N (1,σ2)(σ>0).若ξ 在(0,1)内取值的概率为0.4,则ξ在(0,2)内取值的概率为________.解析:如图所示,易得P (0<ξ<1)=P (1<ξ<2).故P (0<ξ<2)=2P (0<ξ<1)=2×0.4=0.8.答案:0.8 3.(2010·广东汕头一模)省实验中学高三共有学生600人,一次数学考试的成绩(试卷满分150分)服从正态分布N (100,σ2),统计结果显示学生考试成绩在80分到100分之间的人数约占总人数的13,则此次考试成绩不低于120分的学生约有________人.答案:1004.设ξ服从N (0,1),求下列各式的值:(1)P (ξ≥2.35);(2)P (ξ<-1.24);(3)P (|ξ|<1.54).解:(1)P (ξ≥2.35)=1-P (ξ<2.35)=1-Φ(2.35)=1-0.9906=0.0094; (2)P (ξ<-1.24)=Φ(-1.24)=1-Φ(1.24)=1-0.8925=0.1075;(3)P (|ξ|<1.54)=P (-1.54<ξ<1.54)=Φ(1.54)=-Φ(-1.54)=Φ(1.54)-[1-Φ(1.54)]=2Φ(1.54)-1=0.8764.考点二:正态分布的应用5.(2010·河北保定模拟)某次抽样调查结果表明,考生的成绩(百分制)近似服从正态分布,平均成绩为72分,96分以上的考生占考生总数的2.3%,则考生成绩在60至84分之间的概率为________.(参考数据:Φ(1)=0.8413,Φ(2)=0.9770,Φ(3)=0.9987)解析:本题考查了正态分布.平均成绩即期望μ=72,96分以上的概率为P (X >96)=1-P (X ≤96)=1-Φ(96-72σ)=1-Φ(24σ)=0.023,则Φ(24σ)=0.977.得出24σ=2,σ=12,考生的成绩在60分至84分之间的概率为P (60≤X ≤84)=Φ(84-7212)-Φ(60-7212)=Φ(1)-Φ(-1)=2Φ(1)-1=0.6826,所以成绩在60分至84分之间的概率为0.6826.答案:0.68266.某人从城市南郊某地乘公共汽车前往北区火车站有两条路线可走,第一条路线穿过市区,路线较短,但交通拥挤,所需时间(单位:分)服从正态分布N (50,102);第二条路线沿环城公路走,路程较长,但交通阻塞少,所需时间服从正态分布N (60,42).(1)若只有70分钟可用,问应走哪条路线? (2)若只有65分钟可用,又应走哪条路线? 解:设ξ为行车时间,(1)走第一条路线,及时赶到的概率为P (0<ξ≤70)=Φ(70-5010)-Φ(0-5010)≈Φ(70-5010)=Φ(2)=0.9722.走第二条路线及时赶到的概率为P (0<ξ≤70)=Φ(70-604)-Φ(0-604)≈Φ(70-604)=Φ(2.5)=0.9938.因此在这种情况下应走第二条路线. (2)走第一条路线及时赶到的概率为P (0<ξ≤65)≈Φ(65-5010)=Φ(1.5)=0.9332.走第二条路线及时赶到的概率为P (0<ξ≤65)≈Φ(65-604)=Φ(1.25)=0.8944.因此在这种情况下应走第一条路线.考点三:回归直线方程7.某调查者从调查中获知某公司近年来科研费用支出(x i )万元与公司所获得利润(y i )万元的统计资料如下表:则利润(y i )对科研费用支出(x i )的线性回归方程为( )A.y ^=2x +20B.y ^=20x +2C.y ^=-2x +40D.y ^=2x +40解析:由线性回归方程的求解公式及步骤得y ^=2x +20. 答案:A8.某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系,从这个工业产量x (万件) 40 42 48 55 65 生产费用(万元) 150 140 160 170 150 产量x (万件) 79 88 100 120 140生产费用(万元) 162 185 165 190185完成下列要求:(1)计算x 与y 的相关系数r ;(2)对这两个变量之间是否线性相关进行相关性检验;(3)求回归直线方程y ^=bx +a 的系数b ,a . 解:(1)制表如下: i 1 2 3 4 5 6 7 8 9 10 x i 40 42 48 55 65 79 88 100 120 140 y i 150 140 160 170 150 162 185 165 190 185 x 2i 1600 1764 2304 3025 4225 6241 77441 10000 14400 19600 y 2i 22500 19600 25600 28900 22500 26244 34225 27225 36100 34225 x i y i 6000 5880 7680 9350 9750 12798 16280 16500 22800 25900x -=77.7 y -=165.7 ∑i =110x 2i =70903∑i =110y 2i =277119 ∑i =110x i y i =132938r =∑i =110x i y i -10x -y-(∑i =110x 2i -10x -2)(∑i =110y 2i -10y -2)=132938-10×77.7×165.7(70903-10×77.72)(277119-10×165.72) ≈0.808.即x 与y 的相关系数r ≈0.808.(2)查表:显著性水平0.05,自由度10-2=8, 相应关系的临界值为r 0.05=0.632,由r >r 0.05知,两个变量之间呈线性相关关系.(3)由公式可得b =132938-10×77.7×165.770903-10×77.72≈0.398, a =165.7-0.398×77.72=134.61.(2008·安徽)设两个正态分布N (μ1, σ21)(σ1 >0)和N (μ2, σ22)(σ2>0)的密度函数图象如图所示,则有( )A .μ1<μ2, σ1<σ2 B. μ1<μ2, σ1>σ2 C .μ1>μ2, σ1<σ2 D .μ1>μ2, σ1>σ2解析:∵μ是平均数,σ21是方差,μ是密度函数图象的对称轴的位置,此图象越瘦高,数据越集中,σ2越小.答案:A2.(2009·上海)发生在某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )A .甲地:总体均值为3,中位数为4B .乙地:总体均值为1,总体方差大于0C .丙地中位数为2,众数为3D .丁地:总体均值为2,总体方差为3解析:逐项验证中,由0,0,0,2,4,4,4,4,4,8可知,A 错;由0,0,0,0,0,0,,0,2,8可知,B 错;由0,0,1,1,2,2,3,3,3,8可知,C 错.D 中x -=2.(x 1-2)2+(x 2-2)2+…+(x 10-2)210=3.即(x 1-2)2+(x 2-2)2+…+(x 10-2)2=30.显然(x i -2)2≤30(i =1,2,…,10),即x i ≤7.故选D.答案:D3.(2009·宁夏,海南)对变量x 、y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图1:对变量u 、v 有观测数据(u i ,v i )(i =1,2,…10),得散点图2.由这两个散点图可以判断( )A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关解析:由题图1可知,各点整体呈递减趋势,x 与y 负相关.由题图2可知,各点整体呈递增趋势,u 与v 正相关.答案:C4.(2009·安徽)若随机变量X ~N (μ,σ2),则P (X ≤μ)=________.解析:∵X ~N (μ,σ2),∴由正态分布图象可知对称轴x =μ,∴P (X ≤μ)=12.答案:12ξ~N (-1,σ2),且P (-3≤ξ≤-1)=0.4,则P (ξ≥1)等于( )A .0.1B .0.2C .0.3D .0.4解析:因为ξ~N (-1,σ2),η=ξ+1σ~N (0,1) 所以,P (-3≤ξ≤-1)=P (ξ≤-1)-P (ξ≤-3)=Φ(-1+1σ)-Φ(-3+1σ)=Φ(0)-Φ(-2σ)=0.5-Φ(-2σ)=0.4,即Φ(-2σ)=0.1,而P (ξ≥1)=1-P (ξ<1)=1-Φ(1+1σ)=1-Φ(2σ)=Φ(-2σ)=0.1.答案:A。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
新人教高考数学总复习专题训练正态分布线性回归 The following text is amended on 12 November 2020.
正态分布、线性回归
1.已知从某批材料中任取一件时,取得的这件材料的强度ε~N (200,18),则取得的这件材料的强度不低于180的概率为( )
A .
B .
C .
D .
2.已知连续型随机变量x 的概率密度函数是⎪⎩⎪
⎨⎧>≤≤<=b x 0b x a A a x 0)(x f
其中常数A>0,则A 的值为 ( )
A .1
B .b
C .
a
b -1
D .b-a 3.某工厂某产品产量x (千件)与单位成本y (元)满足回归直线方程
x y 82.136.77^-=,则以下说法中正确的是
( )
A .产量每增加1000件,单位成本下降元
B .产量每减少1000件,单位成本上升元
C .产量每增加1000件,单位成本上升元
D .产量每减少1000件,单位成本下降元
4.工人月工资(元)依劳动生产率(千元)变化的回归方程为x y
9060^
+=,下列判断正确的是 ( )
A .劳动生产率为1000元时,工资为150元
B .劳动生产率提高1000元时,工资提高150元
C .劳动生产率提高1000元时,工资提高90元
D .劳动生产率为1000元时,工资为90元
5.若随机变量ε~N (5,2),且P(ε<a)=,则a=_____________。
6.已知连续型随机变量x 的分布函数为:⎪⎩
⎪
⎨⎧≤<≤<=21 a 1x 0ax 0)(x x f 其他 则a=___________,=<)2
3
(x P _____________。
7.设随机变量ε服从N (0,1),求下列各式的值:
(1)P(ε≥; (2)P(ε<; (3)P(|ε|<。
8.某厂生产的圆柱形零件的外径ε~N (4,)。
质检人员从该厂生产的1000
件零件中随机抽查一件,测得它的外径为。
试问该厂生产的这批零件是否合格
9.现随机抽取了我校10名学生在入学考试中的数学成绩(x)与入学后的第一
10.某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系,从
(1)计算x与y的相关系数;
(2)对这两个变量之间是否线性相关进行相关性检验;
^,求系数a,b。
(3)设回归直线方程为a
=
y+
bx
同步练习(参考答案):
1.B 2.C 3.A 4.C 5. 6.32=a ,3
2)23(=<x P 提示:
5.因为ε~N (5,2),9.0)2
5()(=-=<a a P φε,查表知
28.12
5=-a ,解
得a=。
6.由1)12(121=-+⨯⨯a a 解得32=a ,)2
3
(<x P 即为图中阴影部分的面积
3
2。
7.分析 一个随机变量若服从标准正态分布,可以借助于标准正态分布表,查出其值。
但在标准正态分布表中只给出了00≥x ,即)()(00x x x P φ=<的情形,对于其它情形一般用公式:φ(-x)=1-φ(x);p(a<x<b)= φ(b)- φ(a)及)(1)(00x x P x x P <-=≥等来转化。
解 (1))55.2(1)55.2(<-=≥εεP P
;
0054.09946.01)
55.2(1=-=-=φ
(2))44.1(1)44.1()44.1(φφε-=-=-<P 0749.09251.01=-=;
(3)1)52.1(2)52.1()52.1()52.152.1()52.1|(|-=--=<<-=-<φφφεεP P 8714.019357.02=-⨯=
说明 从本例可知,在标准正态分布表中只要给出了00≥x 的概率,就可以利用上述三个公式求出其它情形下的概率。
8.分析 欲判定这批零件是否合格,由假设检验基本思想可知,关键是看随机抽查的一件产品的尺寸是在(μ-3σ,μ+3σ)内,还是在(μ-3σ,μ+3σ)之外。
解 由于圆柱形零件的外径ε~N (4,),由正态分布的特征可知,正态分布N (4,)在区间(4-3×,4+3×即,之外取值的概率只有,而
)5.5,5.2(7.5∉,这说明在一次试验中,出现了几乎不可能发生的小概率事件,根据统计中假设检验的基本思想,认为该厂这批产品是不合格的。
说明 判断某批产品是否合格,主要运用统计中假设检验的基本思想。
如记住课本P33表格中三种区间内取值的概率,对我们的解题可以带来很大的帮助。
9.易得∑==10
1
2116584i i x ,∑==10
1
247384i i y ,8.107=x ,=y 68,
7379610
1
∑==i i
i y
x 。
则相关系数为
7506.0)
681047384)(8.10710116584(68
8.10710737962
2
≈⨯-⨯-⨯⨯-=
r 。
查表得自由度为10-2=8相应的相关关系临界值6021.005.0=r ,由05.0r r >知,两次数学考试成绩有显着性的线性相关关系。
10.(1)制表如下:
806.0)
7.16510277119)(7.771070903(7
.1657.77101329292
2
≈⨯-⨯-⨯⨯-=
r 。
即x 与y 的相关系数r ≈。
(2)查表显着水平,自由度10-2=8相应的相关系数临界值6319.005.0=r ,∵05.0r r >,所以x 与y 之间具有线性相关关系。
(3)397.07.7710709037
.1657.77101329292
≈⨯-⨯⨯-=
b , a=。