_高中数学课时练习19独立性检验的基本思想及其初步应用含解析新人教A版选修2_
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
独立性检验的基本思想及其初步应用
基础全面练 (15分钟 30分)
1.与表格相比,能更直观地反映出相关数据总体状况的是( ) A .列联表 B .散点图 C .残差图
D .等高条形图
【解析】选D.对于A ,列联表需要计算K 2
的值,不是直观地分析;对于B ,散点图体现的是变量间相关性的强弱;对于C ,残差图体现预报变量与实际值之间的差距,对于D ,等高条形图能直观地反映两个分类变量是否有关系.
2.某班主任对全班50名学生进行了作业量的调查,数据如表:
则推断“学生的性别与认为作业量大有关”,这种推断犯错误的概率不超过( ) A .0.01 B .0.005 C .0.025 D .0.001
【解析】选C.k =50×(18×15-8×9)
2
26×24×27×23 ≈5.059>5.024.
因为P(K 2
≥5.024)=0.025, 所以犯错误的概率不超过0.025.
3.假设有两个分类变量X 与Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其2×2列联表为:
则当m 取下面何值时,X 与Y 的关系最弱( ) A .8 B .9 C .14 D .19
【解析】选C.由10×26≈18m,解得m≈14.4,所以当m =14时,X 与Y 的关系最弱. 4.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名
未使用血清的人一年中的感冒记录作比较,提出假设H 0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K 2
≈3.918,经查临界值表知P(K 2
≥3.841)≈0.05.则下列结论中,正确结论的序号是________.
①在犯错误的概率不超过0.05的前提下认为“这种血清能起到预防感冒的作用”; ②若某人未使用该血清,那么他在一年中有95%的可能性得感冒; ③这种血清预防感冒的有效率为95%; ④这种血清预防感冒的有效率为5%.
【解析】K 2
≈3.918>3.841,而P(K 2≥3.841)≈0.05,所以在犯错误的概率不超过0.05的前提下认为“这种血清能起到预防感冒的作用”.要注意我们检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆. 答案:①
5.为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:
(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例.
(2)能否在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关? 附:
K 2
=n (ad -bc )(a +b )(c +d )(a +c )(b +d )
【解析】(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估计值为70
500 =14%.
(2)由列联表中数据,得K 2
的观测值为 k =500×(40×270-30×160)2
200×300×70×430
≈9.967.
由于9.967>6.635,所以在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要帮助与性别有关.
综合突破练 (25分钟 50分) 一、选择题(每小题5分,共20分)
1.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列联表: 文化程度与月收入列联表(单位:人)
由上表中数据计算得K 2
的观测值k =105×(10×30-20×45)55×50×30×75 ≈6.109,请估计认为“文
化程度与月收入有关系”,其犯错误的概率为( ) A .1% B .99% C .2.5% D .97.5%
【解析】选C.由于6.109>5.024,故在犯错误的概率不超过0.025的前提下,认为“文化程度与月收入有关系”. 2.下列说法正确的有( )
①分类变量的取值仅表示个体所属的类别,它们的取值一定是离散的;
②分类变量的取值也可以用数字来表示,但这时的数字除了分类以外没有其他的含义; ③2×2列联表是两个分类变量的频数汇总统计表;
④2×2列联表和等高条形图都能反映出两个分类变量间是否相互影响. A .①②③④ B .①② C .②③
D .④
【解析】选 A.由分类变量的定义可知①②正确;由2×2列联表的定义可知③正确;2×2列联表和等高条形图都能展示样本的频率特征,若在一个分类变量所取值的群体中,另一个分类变量所取值的频率相差较小,则说明这两个变量不相互影响,否则就相互影响.故④正确.
3.下面是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图中可以看出( )
A.性别与喜欢理科无关
B.女生中喜欢理科的比例为80%
C.男生比女生喜欢理科的可能性大些
D.男生不喜欢理科的比例为60%
【解析】选C.由等高条形图知:女生喜欢理科的比例为20%,男生不喜欢理科的比例为40%,因此,B、D不正确.还可知男生比女生喜欢理科的可能性大些.
4.为考察某种药物对预防禽流感的效果,在四个不同的实验室取相同的个体进行动物试验,根据四个实验室得到的列联表画出如下四个等高条形图,最能体现该药物对预防禽流感有显著效果的图形是( )
【解析】选D.分析四个等高条形图得选项D中,不服用药物患病的概率最大,服用药物患病的概率最小,所以最能体现该药物对预防禽流感有显著效果.
二、填空题(每小题5分,共10分)
5.某卫生机构对366人进行健康体检,有阳性家族史者糖尿病发病的有16例,不发病的有93例,有阴性家族史者糖尿病发病的有17例,不发病的有240例,认为糖尿病患者与遗传有关系的概率为________.
【解析】列出2×2列联表:
所以随机变量K 2
的观测值
k =366×(16×240-17×93)2
109×257×33×333
≈6.067>5.024,
所以在犯错误的概率不超过0.025的前提下,认为糖尿病患者与遗传有关. 答案:0.975
6.在研究性别(是否为女性)与是否爱吃零食这两个分类变量是否有关系时,下列说法中正确的是________.
①若K 2
的观测值k≈6.635,则我们在犯错误的概率不超过0.01的前提下认为爱吃零食与性别有关系,那么在100个爱吃零食的人中必有99人是女性;
②由独立性检验可知在犯错误的概率不超过0.01的前提下认为爱吃零食与性别有关系时,如果某人爱吃零食,那么此人是女性的可能性为99%;
③由独立性检验可知在犯错误的概率不超过0.01的前提下认为爱吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误.
【解析】K 2的观测值是支持确定有多大把握认为“两个分类变量吃零食与性别有关系”的随机变量值,所以由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误,故填③. 答案:③
三、解答题(每小题10分,共20分)
7.某学生对其亲属30人的饮食进行了一次调查,并用如图所示的茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主)
(1)根据以上数据完成下列2×2列联表:
主食蔬菜 主食肉类 总计 50岁以下 50岁以上 总计
(2)能否在犯错误的概率不超过0.01的前提下认为其亲属的饮食习惯与年龄有关?并写出简要分析.
【解析】(1)2×2列联表如下:
主食蔬菜
主食肉类
总计 50岁以下 4 8 12 50岁以上 16 2 18 总计
20
10
30
(2)因为K 2
的观测值k =30×(8-128)
12×18×20×10
=10>6.635,
P(K 2
>6.635)=0.01,所以可以在犯错误的概率不超过0.01的前提下认为其亲属的饮食习惯与年龄有关.
8.(2020·全国Ⅲ卷)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
锻炼人次
空气质量等级
[0,200]
(200,400]
(400,600]
1(优) 2 16 25 2(良) 5 10 12 3(轻度污染)
6
7
8
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?
附:K 2
=n (ad -bc )(a +b )(c +d )(a +c )(b +d )
,
【解析】(1)由频数分布表可知,该市一天的空气质量等级为1的概率为2+16+25
100 =0.43,
等级为2的概率为5+10+12100 =0.27,等级为3的概率为6+7+8
100 =0.21,等级为4的概率
为7+2+0
100
=0.09.
(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为100×20+300×35+500×45
100 =350.
(3)2×2列联表如下:
K 2
的观测值k =100×33×8-37×222
70×30×55×45
≈5.820>3.841,
因此,有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关. 创新迁移练
1.有两个分类变量X 与Y ,其2×2列联表如表所示:
其中a ,15-a 均为大于5的整数,在犯错误的概率不超过0.05的前提下,认为X 与Y 之间有关,则a 等于( )
A .8
B .9
C .8或9
D .7
【解析】选C.在犯错误的概率不超过0.05的前提下,认为X 与Y 之间有关,需要K 2
的观测值k 大于或等于3.841,
由k =65×[a(30+a )-(20-a )(15-a )]2
20×45×15×50
=13(13a -60)2
5 400 ≥3.841,解得a≥7.69或a≤1.54.而a>5且15-a>5,a ∈Z ,所以a =8
或a =9.
2.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如表:
(1)试分别估计两个分厂生产的零件的优质品率;
(2)由以上统计数据填写下面的2×2列联表,并问能否在犯错误的概率不超过0.01的前提
下认为“两个分厂生产的零件的质量有差异”?
【解析】(1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为360
500
×100%=72%;
乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为320
500 ×100%=
64%.
(2)2×2列联表如下:
由于K 2
的观测值
k =1 000×(360×180-320×140)2
500×500×680×320
≈7.353>6.635,
所以在犯错误的概率不超过0.01的前提下认为“两个分厂生产的零件的质量有差异”.。