正态分布、回归、独立性检验(教师)分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

正态分布、回归分析、独立性检验
一、正态分布
1.已知随机变量X 服从正态分布N(a,4),且P(X>1)=0.5,则实数a 的值为 ( ) A.1
B.2
C.3
D.4
【解题指南】画正态曲线图,由对称性得图象关于x=a 对称且P(X>a)=0.5,结合题意得到a 的值. 【解析】选A.
随机变量X 服从正态分布N(a,4),所以曲线关于x=a 对称,且P(X>a)=0.5,由P(X>1)=0.5,可知μ=a=1.故选A. 2.(2014·广州高二检测)已知ξ~N(3,σ2),若P(ξ≤2)=0.2,则P(ξ≤4)等于 ( ) A.0.2
B.0.3
C.0.7
D.0.8
【解析】选D.根据正态曲线的特征:知对称轴为x=3,[来源:学+科+网Z+X+X+K] 所以P(ξ≤3)=0.5,则P(ξ≤2)=P(ξ>4)=0.2, 所以P(ξ≤4)=1-P(ξ>4)=1-0.2=0.8.
3.随机变量ξ服从正态分布N(1,4),若P(2<ξ<3)=a,则P(ξ<-1)+P(1<ξ<2)= ( ) A.
1−a 2
B.1
2-a C.a+0.003a
D.1
2+a
【解析】选B.因为随机变量ξ服从正态分布N(1,4),所以正态曲线关于x=1对称,因为P(2<ξ<3)=a,所以P(-1<ξ<0)=a,P(1<ξ<2)=P(0<ξ<1),P(ξ<-1)+P(1<ξ<2)=1
2-a,故选B.
4.已知随机变量X 服从正态分布N(3,1),且P(2≤X ≤4)=0.6826,则P(X>4)= ( ) A.0.158 8
B.0.158 7
C.0.158 6
D.0.158 5
【解析】选B.P(3≤X ≤4)=1
2P(2≤X ≤4)=0.3413,P(X>4)=0.5-P(3≤X ≤4)=0.5-0.3413=0.1587.
5.设随机变量ξ服从正态分布N(μ,σ2),且二次方程x 2+4x+ξ=0无实数根的概率为1
2,则μ等于 ( ) A.1
B.2
C.4
D.不能确定
【解析】选C.因为方程x 2+4x+ξ=0无实数根的概率为1
2,由Δ=16-4ξ<0,得ξ>4, 即P(ξ>4)=1
2=1-P(ξ≤4),故P(ξ≤4)=1
2,所以μ=4.
6. 设某地区某一年龄段的儿童的身高服从均值为135cm,方差为100的正态分布,令ξ表示从中随机抽取的
一名儿童的身高,则下列概率中最大的是()
A.P(120<ξ<130)
B.P(125<ξ<135)
C.P(130<ξ<140)
D.P(135<ξ<145)
【解析】选C.因为某一年龄段的儿童的身高服从均值为135cm,方差为100的正态分布,即ξ~N(135,100),所以在长度都是10的区间上,概率最大的应该是在对称轴两侧关于对称轴对称的区间,从四个选项可知C最大,故选C.
7.设随机变量ξ服从正态分布N(0,1),则下列结论正确的是.
①P(|ξ|<a)=P(ξ<a)+P(ξ>-a)(a>0);②P(|ξ|<a)=2P(ξ<a)-1(a>0);
③P(|ξ|<a)=1-2P(ξ<a)(a>0);④P(|ξ|<a)=1-P(|ξ|>a)(a>0).
【解析】因为P(|ξ|<a)=P(-a<ξ<a),所以①不正确;
因为P(|ξ|<a)=P(-a<ξ<a)=P(ξ<a)-P(ξ<-a)=P(ξ<a)-P(ξ>a)=P(ξ<a)-(1-P(ξ<a))=2P(ξ<a)-1,所以②正确,③不正确;因为P(|ξ|<a)+P(|ξ|>a)=1,所以P(|ξ|<a)=1-P(|ξ|>a)(a>0),所以④正确.
答案:②④
8.在某次数学考试中,考生的成绩服从正态分布N(90,100),则考试成绩在110分以上的概率是. 【解析】因为考生的成绩X~N(90,100),所以正态曲线关于x=90对称,且标准差为10,
根据3σ原则知P(70<x<110)=P(90-2×10<x<90+2×10)=0.9544,
所以考试成绩X位于区间(70,110)上的概率为0.9544,则考试成绩在110分以上的概率是(1-0.9544)=0.0228.
=1
2
9.某大型国有企业为10000名员工定制工作服,设员工的身高(单位:cm)服从正态分布N(173,52),则适合身高在163~183cm范围内员工穿的服装大约要定制套.
【解析】因为员工的身高(单位:cm)服从正态分布N(173,52),即服从均值为173cm,方差为25的正态分布, 因为适合身高在163~183cm范围内取值即在(μ-2σ,μ+2σ)内取值,其概率为:95.44%,
从而得出适合身高在163~183cm范围内员工穿的服装大约套数是:10000×95.44%=9544套.
10.随机变量ξ服从正态分布N(1,σ2),已知P(ξ<0)=0.3,则P(ξ<2)等于()
A.0.7
B.0.6
C.0.5
D.0.3
【解析】选A.根据图象的对称性知P(ξ>2)=P(ξ<0)=0.3,所以P(ξ<2)=1-P(ξ>2)=0.7.
11.正态分布N (0,4
9)中,数值落在(-∞,-2)∪(2,+∞)内的概率是 ( )
A.0.46
B.0.997
C.0.03
D.0.0026[来源:]
【解析】选D.由题意μ=0,σ=2
3,所以P(-2<X<2)=P (0−3×2
3<X <0+3×2
3)=0.9974, 所以P(X<-2)+P(X>2)=1-P(-2≤X ≤2)=1-0.9974=0.0026.故选D.
12.某中学高考数学成绩近似地服从正态分布N(100,100),则此校数学成绩在80~120分的考生占总人数的百分比为 ( ) A.31.74%
B.68.26%
C.95.44%
D.99.74%
【解析】选C.设此校学生的数学成绩为X,随机变量X ~N(100,100),所以μ=100,σ2=100,即σ=10.则P(μ-2σ<X ≤μ+2σ)=95.44%.故选C.
13.我校在模块考试中约有1000人参加考试,其数学考试成绩ξ~N(90,a 2)(a>0,试卷满分150分),统计结果显示数学考试成绩在70分到110分之间的人数约为总人数的3
5,则此次数学考试成绩不低于110分的学生人数约为 ( ) A.600
B.400
C.300
D.200
【解析】选D.由平均分为90,考试成绩在70分到110分之间的人数为600,则落在90分到110分之间的人数为300人,故数学考试成绩不低于110分的学生人数约为500-300=200.
14.某个部件由三个元件按如图方式连接而成,元件1或元件2正常工作,且元件3正常工作,则部件正常工作,设三个电子元件的使用寿命(单位:小时)均服从正态分布N(1000,502),且各个元件能否正常工作相互独立,那么该部件的使用寿命超过1000小时的概率为 .
【解析】三个电子元件的使用寿命均服从正态分布N(1000,502)得:三个电子元件的使用寿命超过1000小时的概率为p=1
2,超过1000小时时元件1或元件2正常工作的概率p 1=1-(1-p)2=3
4,那么该部件的使用寿命超过1000小时的概率为p 2=p 1×p=3
8. 二、回归分析
1.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是 ( ) A.y 与x 具有正的线性相关关系 B.回归直线过样本点的中心点(x ̅,y ̅)
C.若该大学某女生身高增加1cm,则其体重约增加0.85kg
D.若该大学某女生身高为170cm,则可断定其体重必为58.79kg
【解析】选D.对于A,0.85>0,所以y 与x 具有正的线性相关关系,故正确;对于B,回归直线过样本点的中心点(x ̅,y ̅),故正确;对于C,因为回归方程为=0.85x-85.71,所以该大学某女生身高增加1cm,则其体重约增加
0.85kg,故正确;对于D,x=170cm 时,=0.85×170-85.71=58.79,但这是预测值,不可断定其体重为58.79kg,故
不正确.
2.某单位为了制定节能减排的目标,先调查了用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:
由表中数据,得线性回归方程y=-2x+a,则a= ( )A.20 B.40 C.60 D.80 【解析】选C.根据所给的表格中的数据,求出数据的样本点的中心,根据样本点的中心在线性回归直线上,代入可得a 的值.由表格得x ̅=18+13+10−1
4
=10,y ̅=
24+34+38+64
4
=40,因为(x ̅,y ̅)满足线性回归方程y=-2x+a,则可知
40=10×(-2)+a,解得:a=60,
3.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据
(1)请画出上表数据的散点图.
(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程=x+.
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5) 【解析】(1)如图
(2)由对照数据,计算得:∑i=1
4
x i y i =66.5,∑i=1
n
x i 2
=32+42+52+62=86,x ̅=4.5,y ̅=3.5,
=
66.5−4×4.5×3.586−4×4.52
=
66.5−6386−81
=0.7,=y ̅-x ̅=3.5-0.7×4.5=0.35,
所求的线性回归方程为:=0.7x+0.35. (3)x=100,=100×0.7+0.35=70.35(吨),
预测生产100吨甲产品的生产能耗比技改前降低90-70.35=19.65(吨). 三、独立性检验
1.下面是一个2×2列联表:
则表中a,b 的值分别为 ( ) A.54,103
B.64,103
C.54,93
D.64,93
【解析】选A.由题意,a+40=94,40+63=b,所以a=54,b=103. 2.对于独立性检验,下列说法正确的是 ( )
A.K 2独立性检验的统计假设是各事件之间相互独立
B.K 2可以为负值
C.K 2独立性检验显示“患慢性气管炎和吸烟习惯有关”,这就是指“有吸烟习惯的人必定会患慢性气管炎”
D.2×2列联表中的4个数据可以是任意正数 【解析】选A.由独立性检验的检验步骤可知A 正确;
因为2×2列联表中的数据均为正整数,故K 2不可能为负值,排除B;
因为K 2独立性检验显示“患慢性气管炎和吸烟习惯有关”,是指有一定的出错率,故排除C;
因为2×2列联表中的4个数据是对于某组特定数据的统计数据,故四个数据间有一定的关系,故排除D. 3.在对人们休闲方式的一次调查中,根据数据建立如下的2×2列联表:
为了判断休闲方式是否与性别有关,根据表中数据,得到K 2的观测值k ≈4.667,因为3.841≤k ≤6.635,所以判
定休闲方式与性别有关系,那么这种判断出错的可能性至多为()
A.1%
B.99%
C.5%
D.95%
选C.因为3.841≤k≤6.635,P(K2≥3.841)≈0.05,P(K2≥6.635)≈0.01,所以判断出错的可能性至多为5%.
4.在第29届北京奥运会上,中国健儿取得了51金、21银、28铜的好成绩,稳居金牌榜榜首,由此许多人认为中国进入了世界体育强国之列,也有许多人持反对意见,有网友为此进行了调查,在参加调查的2548名男性中有1560名持反对意见,2452名女性中有1200名持反对意见,在运用这些数据说明性别对判断“中国进入了世界体育强国之列”是否有关系时,用什么方法最有说服力()
A.平均数与方差
B.回归直线方程
C.独立性检验
D.概率
【解析】选C.由于参加调查的人按性别被分成了两组,而且每一组又被分成了两种情况,判断有关与无关,符合2×2列联表的要求,故用独立性检验最有说服力.
5.在列联表中,类1在类B中所占的比例为.
【解析】因为由列联表可以看出类1在类B中有c个,而类B共有(c+d)个,所以类1在类B中所占的比例是c
.
c+d
6.某厂家为调查一种新推出的产品的颜色接受程度是否与性别有关,数据如下表:
根据表中的数据,得到k≈10.653,因为k≥7.879,所以产品的颜色接受程度与性别有关系,那么这种判断出错的可能性为.
【解析】根据k≈10.653,对照临界值表可以得到,这种判断出错的可能性是0.005.
7.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:
已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.根据表中数据,得到K2的观测值k≈4.844.
则可以在犯错误的概率不超过 的前提下认为选修文科与性别有关系. 【解析】因为根据表中数据,得到K 2的观测值k ≈4.844>3.841.
所以可以在犯错误的概率不超过0.05的前提下认为选修文科与性别有关系. 答案:0.05
8.某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:
(1)根据表中数据,问是否在犯错误的概率不超过0.05的前提下认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.
(2)已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品,现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率.
【解析】(1)将2×2列联表中的数据代入计算公式, 得K 2的观测值k=
100×(60×10−20×10)280×20×70×30
=100
21≈4.762,
由于4.762>3.841,所以在犯错误的概率不超过0.05的前提下认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.
(2)从5名数学系学生中抽取3人的一切可能结果所组成的基本事件为下列10个:
(a 1,a 2,b 1),(a 1,a 2,b 2),(a 1,a 2,b 3),(a 1,b 1,b 2),(a 1,b 1,b 3),(a 1,b 2,b 3),(a 2,b 1,b 2),(a 2,b 1,b 3),(a 2,b 2,b 3),(b 1,b 2,b 3),
其中a i (i=1,2)表示喜欢甜品的学生,b j (j=1,2,3)表示不喜欢甜品的学生,这10个基本事件的出现是等可能的. 抽取3人,至多有1人喜欢甜品的事件为以下7个:
(a 1,b 1,b 2),(a 1,b 1,b 3),(a 1,b 2,b 3),(a 2,b 1,b 2),(a 2,b 1,b 3),(a 2,b 2,b 3),(b 1,b 2,b 3), 从这5名学生中随机抽取3人,至多有1人喜欢甜品的概率为7
10.。

相关文档
最新文档