高中数学 1.2 独立性检验的基本思想及其初步应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

独立性查验的大体思想及其初步应用
一、选择题(每题3分,共12分)
1.与表格相较,能更直观地反映出相关数据整体状况的是( )
A.列联表
B.散点图
C.残差图
D.等高条形图
【解析】选只能反映个体数据的情形,B只能反映
数据的相关性,C只能反映数据的相关程度,D能直观地反映出相关数据的整体状况.
2.分类变量X和Y的列联表如下:
Y1Y2总计
X1a b a+b
X2c d c+d
总计a+c b+d a+b+c+d
那么以下说法中正确的是( )
越小,说明X与Y关系越弱
越大,说明X与Y关系越强
C.(ad-bc)2越大,说明X与Y关系越强
D.(ad-bc)2越接近于0,说明X与Y关系越强
【解析】选C.因为K2=(a+b+c+d)(ad−bc)2
(a+b)(c+d)(a+c)(b+d)
,
因此(ad-bc)2越大,那么K2越大,X与Y关系越强,应选C.
3.(2021·临沂高二检测)下面是2×2列联表.
y1y2总计x1332154
x2a1346
总计b34
那么表中a,b处的值应为( )
,66 ,50 ,67 ,56
【解析】选A.由2×2列联表知a+13=46,因此a=33,又b=a+33,因此b=33+33=66. 4.研究生毕业的一个随机样本给出了关于所获取学位类别与学生性别的分类数据如表所示:
硕士博士总计男16227189
女1438151
总计30535340
依照以上数据,那么( )
A.性别与获取学位类别有关
B.性别与获取学位类别无关
C.性别决定获取学位的类别
D.以上都是错误的
【解析】选A.直观上能够看出在博士学位中男的比例远远高于在硕士学位中的比例.
二、填空题(每题4分,共8分)
5.某高校教“统计初步”课程的教师随机调查了选该课的一些学生情形,具体数据如下表:
专业
非统计专业统计专业性别
男1310
女720
为了判定主修统计专业是不是与性别有关系,依照表中的数据,取得K 2的观测值k=50×(13×20−10×7)2
23×27×20×30
≈.
因为k ≥,因此判定主修统计专业与性别有关系,那么这种判定犯错的可能性不超过 .
【解析】依照K 2的临界值表可知,k ≥时在犯错误的概率不超过的前提下以为其有关,也确实是这种判定犯错的可能性不超过5%. 答案:5%
【变式训练】(2021·安庆高二检测)调查某养殖场某段时刻内幼崽诞生的时刻与性别的关系,取得下面的数据表:
晚上 白天 总计 雄性 12 8 20 雌性 2 8 10 总计
14
16
30
从中能够得出在犯错误的概率不超过 的前提下能够以为幼崽诞生的时刻与性别有关系.
附:K 2=
n (ad −bc )2
(a +b )(c +d )(a +c )(b +d )
P(K 2≥k 0) k 0
【解题指南】利用K 2=
n (ad −bc )2
(a +b )(c +d )(a +c )(b +d )
,求出K 2的观测值,与临界值比较,即可取得结论.
【解析】由题意k=30×(12×8−2×8)220×10×14×16
=
307
≈>,
因此犯错误的概率不超过.
答案:
6.在对某小学的学生进行吃零食的调查中,取得如下表数据:
依照上述数据分析,咱们得出的K 2的观测值k 约为 .
【解析】由公式可计算得k=89×(24×26−31×8)2
55×34×32×57
≈.
答案:
【触类旁通】在题目条件不变的情形下,在犯错误的概率不超过量少时以为吃零食与性别有关. 【解析】因为>,且P(K 2≥≈,
因此在犯错误的概率不超过的前提下以为吃零食与性别有关. 三、解答题(每题10分,共20分)
7.为了解铅中毒病人与尿棕色素为阳性是不是有关系,别离对病人组和对照组的尿液作尿棕色素定性检查,结果如下:
试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无不同,铅中毒病人与尿棕色素为阳性是不是有关系. 【解析】等高条形图如下图:
其中两个浅色条的高别离代表铅中毒病人和对照组样本中尿棕色素为阳性的频率.
由图能够直观地看出铅中毒病人与对照组相较较尿棕色素为阳性差异明显,因此铅中毒病人与尿棕色素为阳性有关系.
8.(2021·马鞍山高二检测)某中学共2200名学生中有男生1200名,按男女性别用分层抽样抽出110名学生,询问是不是爱好某项运动.已知男生中有40名爱好该项运动,女生中有30名不爱好该项运动. (1)完成如下的列联表:
男 女 总计 爱好 40 不爱好 30 总计
(2)通过计算说明,是不是在犯错误的概率不超过的前提下以为“爱好该项运动与性别有关”? 【解析】(1)
男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计
60
50
110
(2)K 2的观测值k=110×(40×30−20×20)2
60×50×60×50
≈>.
因此在犯错误的概率不超过的前提下以为“爱好该项运动与性别有关”. 一、选择题(每题4分,共12分)
1.(2021·德州高二检测)假设两个分类变量X 与Y,它们的取值别离为{x 1,x 2},{y 1,y 2},其2×2列联表如下图:关于以下数据,对同一样本能说明X 与Y 有关的可能性最大的一组为( )
y1y2总计
x1a b a+b
x2c d c+d
总计a+c b+d a+b+c+d
=50,b=40,c=30,d=20
=50,b=30,c=20,d=40
=50,b=20,c=40,d=30
=20,b=30,c=50,d=40
【解题指南】ad与bc差距越大,两个变量有关的可能性就越大,查验四个选项中所给的ad与bc的差距,比较即可.
【解析】选B.依照观测值求解的公式能够明白,ad与bc差距越大,两个变量有关的可能性就越大.
选项A,|ad-bc|=|1000-1200|=200;
选项B,|ad-bc|=|2000-600|=1400;
选项C,|ad-bc|=|1500-800|=700;
选项D,|ad-bc|=|800-1500|=700.
2.(2021·合肥高二检测)在一次独立性查验中取得如以下联表:
A A̅总计
B2008001000
B̅180a180+a
总计380800+a1180+a
且最后发觉,两个分类变量A和B没有关系,那么a的可能值是( )
B.720
【解题指南】将选项中的值代入K 2公式,结合临界值表即得答案.
【解析】选B.计算K 2=
(1 180+a )×(200a −180×800)2
380×(800+a )×(180+a )×1 000
,当a=200时,K 2=
(1 180+200)×(200×200−180×800)2380×(800+200)×(180+200)×1 000
≈>,两个分类变量A 和B 有关系.
当a=720时,K 2=
(1 180+720)×(200×720−180×800)2380×(800+720)×(180+720)×1 000
=0,
由K 2<知现在两个分类变量无关系.
3.(2021·菏泽高二检测)春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是不是能做到“光盘”行动,取得如以下联表:
做不到“光盘” 能做到“光盘” 男 45 10 女
30
15
由此列联表取得的正确结论是( )
A.在犯错误的概率不超过1%的前提下,以为“该市居民可否做到′光盘′与性别有关”
B.在犯错误的概率不超过1%的前提下,以为“该市居民可否做到′光盘′与性别无关”
C.在犯错误的概率不超过的前提下,以为“该市居民可否做到′光盘′与性别有关”
D.在犯错误的概率不超过的前提下,以为“该市居民可否做到′光盘′与性别无关” 【解析】选C.由2×2列联表取得a=45,b=10,c=30,d=15. 那么a+b=55,c+d=45,a+c=75,b+d=25,ad=675,bc=300,n=100.
代入K 2=
n (ad −bc )2
(a +b )(c +d )(a +c )(b +d )
得K 2的观测值k=100×(675−300)255×45×75×25
≈.
因为<<,
因此在犯错误的概率不超过的前提下以为“该市居民可否做到′光盘′与性别有关”.应选C. 二、填空题(每题4分,共8分)
4.某研究小组为了研究中学生的躯体发育情形,在某中学随机抽出20名15至16周岁的男生将他们的身高和体重制成2×2列联表,依照列联表中的数据,能够在犯错误的概率不超过 的前提下以为该学校15至16周岁的男生的身高和体重之间有关系.
超重 不超重 总计 偏高 4 1 5 不偏高 3 12 15 总计
7
13
20
【解析】依照公式K 2=
n (ad −bc )2
(a +b )(c +d )(a +c )(b +d )
得,K 2的观测值k=
20×(4×12−1×3)2
5×15×7×13
≈,
因为k>,因此在犯错误的概率不超过的前提下以为该学校15至16周岁的男生的身高和体重之间有关系. 答案:
5.对某校小学生进行心理障碍测试取得如下的列联表
有心理障碍 没有心理障碍 总计 女生 10 20 30 男生 10 70 80 总计
20
90
110
试说明心理障碍与性别的关系: .
【解题指南】依照计算出的临界值,同临界值表进行比较,取得心理障碍与性别是不是有关系的判定. 【解析】由表可知,a=10,b=20,c=10,d=70,
a+b=30,c+d=80,a+c=20,b+d=90,n=110,ad=700,bc=200,
把以上数值代入K 2=
n (ad −bc )2
(a +b )(c +d )(a +c )(b +d )
=
110×(700−200)230×80×20×90
≈.
因为>,因此在犯错误的概率不超过的前提下以为心理障碍与性别有关系. 答案:在犯错误的概率不超过的前提下以为心理障碍与性别有关系 三、解答题(每题10分,共20分)
6.在500个用血清的人身上实验某种血清预防伤风的作用,把一年中的记录与另外500个未用血清的人作比较,取得如下的列联表:
由以上数据可否在犯错误的概率不超过的前提下以为血清能对预防伤风起到必然的作用?
【解析】由列联表中的数据得k=
1 000×(252×276−224×248)2
500×500×476×524
≈.
由于<,故不能在犯错误的概率不超过的前提下以为血清对预防伤风有作用. 【方式技术】利用等高条形图判定两变量相关的方式
等高条形图,能够粗略地判定两个分类变量是不是有关系,可是这种判定无法精准地给出所得结论的可信程度.
在等高条形图中,能够估量知足条件X=x 1的个体中具有Y=y 1的个体所占的比例a
a +b
,也能够估量知足条件
X=x 2的个体中具有Y=y 2的个体所占的比例
c
c +d
,两个比例的值相差越大,结论成立的可能性就越大.
7.某地域甲校高二年级有1100人,乙校高二年级有900人,为了统计两个学校高二年级在学业水平考试中的数学学科成绩,采纳分层抽样的方式在两校共抽取了200名学生的数学成绩,如下表:(已知本次测试合格
线是50分,两校合格率均为100%)
甲校高二年级数学成绩:
分组[50,60)[60,70)[70,80)[80,90)[90,100]
频数10253530x
乙校高二年级数学成绩:
分组[50,60)[60,70)[70,80)[80,90)[90,100]
频数153025y5
(1)计算x,y的值,并别离估量以上两所学校数学成绩的平均分(精准到1分).
(2)假设数学成绩不低于80分为优秀,低于80分为非优秀,依照以上统计数据写下面2×2列联表,并回答可否在犯错误的概率不超过的前提下以为“两个学校的数学成绩有不同”?
甲校乙校总计
优秀
非优秀
总计
【解题指南】(1)依照抽取的人数和两个学校的人数,利用分层抽样取得两个学校要抽取的人数,别离得出x,y 的值,利用平均数的公式得出两个学校的平均分.
(2)依照数学成绩不低于80分为优秀,低于80分为非优秀,得出优秀的人数和不优秀的人数,填出列联表,依照列联表的数据,写出观测值的计算公式,取得观测值,同临界值进行比较,取得结论.
【解析】(1)依题意知甲校应抽取110人,乙校应抽取90人,
因此x=10,y=15,
估量两个学校的平均分,
甲校的平均分为
55×10+65×25+75×35+85×30+95×10
110≈75,
乙校的平均分为
55×15+65×30+75×25+85×15+95×5
90
≈71.
(2)数学成绩不低于80分为优秀,低于80分为非优秀,取得列联表:
因此K 2的观测值k=
200×(40×70−20×70)2
110×90×60×140
≈,
又因为>,故能在犯错误的概率不超过的前提下以为“两个学校的数学成绩有不同”.。

相关文档
最新文档