高中数学统计案例--独立性检验 同步练习
高中数学同步练习 独立性检验的基本思想及其初步应用
第三章 3.2A 级 基础巩固一、选择题1.给出下列实际问题:①一种药物对某种病的治愈率;②两种药物治疗同一种病是否有区别;③吸烟者得肺病的概率;④吸烟是否与性别有关系;⑤网吧与青少年的犯罪是否有关系.其中用独立性检验可以解决的问题有( B )A .①②③B .②④⑤C .②③④⑤D .①②③④⑤[解析] 独立性检验是判断两个分类变量是否有关系的方法,而①③都是概率问题,不能用独立性检验.2.在2×2列联表中,两个比值________相差越大,两个分类变量之间的关系越强( A ) A .a a +b 与c c +d B .a c +d 与c a +b C .a a +d 与c b +c D .a b +d 与c a +c[解析]a a +b 与c c +d相差越大,说明ad 与bc 相差越大,两个分类变量之间的关系越强. 3.判断两个分类变量是彼此相关还是相互独立的常用方法中,最为精确的是( D ) A .三维柱形图 B .二维条形图 C .等高条形图D .独立性检验[解析] 前三种方法只能直观地看出两个分类变量x 与y 是否相关,但看不出相关的程度.独立性检验通过计算得出相关的可能性,较为准确.4.(2019·天心区校级期末)利用独立性检测来考查两个分类变量X,Y 是否有关系,当随机变量K 2的值( A )A .越大,“X 与Y 有关系”成立的可能性越大B .越大,“X 与Y 有关系”成立的可能性越小C .越小,“X 与Y 有关系”成立的可能性越大D .与“X 与Y 有关系”成立的可能性无关[解析] 用独立性检验来考查两个分类变量是否有关系时,算出的随机变量k 2的值越大,说明“x 与y 有关系”成立的可能性越大,由此可知A 正确.故选A .5.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据如表:心脏病 无心脏病 秃发20300根据表中数据得到k =775×(20×450-5×300)225×750×320×455≈15.968,因为k>6.635,则断定秃发与心脏病有关系,那么这种判断出错的可能性不超过( D )A .0.1B .0.05C .0.025D .0.01[解析] 因为k>6.635,由P(k>6.635)的临界值为0.01,故这种判断出错的可能性不超过0.01,故选D . 6.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( C )①若K 2的观测值满足K 2≥6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知有99%的把握认为吸烟与患病有关系,我们说某人吸烟,那么他有99%的可能患有肺病;③从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误A .①B .①③C .③D .②[解析] ①推断在100个吸烟的人中必有99人患有肺病,说法错误,排除A 、B,③正确.排除D,选C . 7.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:由表中数据直观分析,收看新闻节目的观众是否与年龄有关:__是__.(填“是”或“否”)[解析] 因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即b a +b =1858,d c +d =2742,两者相差较大,所以经直观分析,收看新闻节目的观众与年龄是有关的.8.根据下表计算:K 2的观测值k≈__4.514__(保留3位小数),据此我们所得出的结论是__在犯错误的概率不超过0.05的前提下,我们认为是否看电视与性别有关__.[解析] K2的观测值为k=(37+85+35+143)×(37×143-85×35)2(85+37)×(35+143)×(37+35)×(85+143)≈4.514.由4.514>3.841,知在犯错误的概率不超过0.05的前提下认为是否看电视与性别有关.二、填空题9.下列关于K2的说法中,正确的有__③④__.①K2的值越大,两个分类变量的相关性越大;②K2的计算公式是K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d);③若求出K2=4>3.841,则有95%的把握认为两个分类变量有关系,即有5%的可能性使得“两个分类变量有关系”的推断出现错误;④独立性检验就是选取一个假设H0条件下的小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触的“不合理”现象,则作出拒绝H0的推断.[解析] 对于①,K2的值越大,只能说明我们有更大的把握认为二者有关系,却不能判断相关性大小,故①错;对于②,(ad-bc)应为(ad-bc)2,故②错;③④对.三、解答题10.(2018·全国卷Ⅲ理,18)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由.(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:超过m 不超过m第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),[解析] (1)解:第二种生产方式的效率更高. 理由如下:(ⅰ)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.(ⅱ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.(ⅲ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需平均时间高于80分钟;用第二种生产方式的工人完成生产任务所需平均时间低于80分钟.因此第二种生产方式的效率更高.(ⅳ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.(以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分) (2)解:由茎叶图知m =79+812=80.列联表如下:(3)解:因为K 2=40(15×15-5×5)220×20×20×20=10>6.635,所以有99%的把握认为两种生产方式的效率有差异.B 级 素养提升一、选择题 1.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一条直线的回归方程为y ^=3-5x,变量x 增加一个单位时,y 平均增加5个单位; ③线性回归直线y ^=b ^x +a ^必过点(x -,y -);④在一个2×2列联表中,由计算得K 2=13.079,则有99%的把握确认这两个变量间有关系.其中错误的个数是( B )A .0B .1C .2D .3本题可以参考独立性检验临界值表:[解析] 一组数据都加上或减去同一个常数,数据的平均数有变化,方差不变(方差是反映数据的波动程度的量),①正确;回归方程中x 的系数具备直线斜率的功能,对于回归方程y ^=3-5x,当x 增加一个单位时,y 平均减少5个单位,②错误;由线性回归方程的定义知,线性回归直线y ^=b ^x +a ^必过点(x -,y -),③正确;因为K 2=13.079>10.828,故有99%的把握确认这两个变量有关系,④正确,故选B .2.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( D )表1表2表3表4A .成绩B .视力C .智商D .阅读量[解析] A 中,K 2=52×(6×22-10×14)220×32×16×36=131440;B 中,K 2=52×(4×20-12×16)220×32×16×36=637360;C 中,K 2=52×(8×24-8×12)220×32×16×36=1310;D 中,K 2=52×(14×30-2×6)220×32×16×36=3757160.因此阅读量与性别相关的可能性最大,所以选D . 二、填空题3.某高校《统计初步》课程的教师随机调查了选该课程的学生的一些情况,具体数据如下:为了判断主修统计专业是否与性别有关系,根据表中数据,得到K 2=50×(13×20-10×7)223×27×20×30≈4.844>3.841,所以断定主修统计专业与性别有关系,那么这种判断出错的可能性约是__5%__.[解析] ∵P(k 2≥3.841)≈0.05,故判断出错的可能性为5%.4.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠.在照射后14天内的结果如下表所示:进行统计分析时的统计假设是__小白鼠的死亡与电离辐射的剂量无关__.[解析] 根据独立性检验的基本思想,可知类似于反证法,即要确认“两个分量有关系”这一结论成立的可信程度,首先假设该结论不成立.对于本题,进行统计分析时的统计假设应为“小白鼠的死亡与电离辐射的剂量无关”.三、解答题5.(2018·江西模拟)由中央电视台综合频道(CCTV-1)和唯众传媒联合制作的《开讲啦》是中国首档青年电视公开课.每期节目由一位知名人士讲述自己的故事,分享他们对于生活和生命的感悟,给予中国青年现实的讨论和心灵的滋养,讨论青年们的人生问题,同时也在讨论青春中国的社会问题,受到青年观众的喜爱,为了了解观众对节目的喜爱程度,电视台随机调查了A,B两个地区共100名观众,得到如下的2×2列联表:已知在被调查的100名观众中随机抽取1名,该观众是B地区当中“非常满意”的观众的概率为0.35,且4y=3z.(1)现从100名观众中用分层抽样的方法抽取20名进行问卷调查,则应抽取“满意”的A,B地区的人数各是多少?(2)在(1)抽取的“满意”的观众中,随机选出2人进行座谈,求至少有1名是B地区观众的概率?(3)完成上述表格,并根据表格判断是否有90%的把握认为观众的满意程度与所在地区有关系?附:参考公式:k2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)[解析] (1)由题意,得x100=0.35,解得x=35, ∴y+z=25,又4y=3z,∴y=15,z=20,∴应抽取A 地区的“满意”观众为20100×15=3,抽取B 地区的“满意”观众为20100×20=4;(2)所抽取的A 地区的“满意”观众记为A 、B 、C, 所抽取的B 地区的“满意”观众记为d 、e 、f 、g, 则随机选出2人的不同选法有AB 、AC 、Ad 、Ae 、Af 、Ag 、BC 、Bd 、Be 、Bf 、Bg 、Cd 、Ce 、Cf 、Cg 、de 、df 、dg 、ef 、eg 、fg 共21个结果, 至少有1名是B 地区的结果有18个, 其概率为P =1821=67.(3)根据题意,填写2×2列联表如下:非常满意 满意 合计 A 30 15 45 B 35 20 55 合计6535100计算K 2=100×(30×20-35×15)265×35×45×55=1001007≈0.1<3.841;所以没有90%的把握认为观众的满意程度与所在地区有关系.6.(2018·厦门一模)为了解学生的课外阅读时间情况,某学校随机抽取了 50人进行统计分析,把这50人每天阅读的时间(单位:分钟)绘制成频数分布表,如下表所示:阅读时间 [0,20) [20,40) [40,60) [60,80) [80,100)[100,120]人数 810121172若把每天阅读时间在60分钟以上(含60分钟)的同学称为“阅读达人”,根据统计结果中男女生阅读达人的数据,制作出如图所示的等高条形图.(1)根据抽样结果估计该校学生的每天平均阅读时间(同一组数据用该区间的中点值作为代表); (2)根据已知条件完成下面的2×2列联表,并判断是否有99%的把握认为“阅读达人”跟性别有关?附:参考公式k 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .临界值表:[解析] (1)该校学生的每天平均阅读时间为:10×850+30×1050+50×1250+70×1150+90×750+110×250=1.6+6+12+15.4+12.6+4.4=52(分);(2)由频数分布表得,“阅读达人”的人数是 11+7+2=20人,根据等高条形图作出2×2列联表如下:计算K 2=50×(20×30×24×26=52≈4.327,由于4.327<6.635,故没有99%的把握认为“阅读达人”跟性别有关.。
2021年苏教版高中数学选修1-2全册同步练习及单元检测含答案
2021年苏教版高中数学选修1-2全册同步练习及单元检测含答案苏教版高中数学选修1~2 全册同步练习及检测苏版高中数学课时作业及单元检测题全册合编含答案第1章统计案例§1.1 独立性检验课时目标1.了解独立性检验的基本思想.2.体会由实际问题建模的过程,了解独立性检验的基本方法.1.独立性检验:用______________研究两个对象是否有关的方法称为独立性检验. 2.对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和类B,Ⅱ也有两类取值,即类1和类2.我们得到如下列联表所示的抽样数据:Ⅱ 类A 类B 合计类1 a c a+c 类2 b d b+d 合计 a+b c+d a+b+c+d Ⅰ则χ2的计算公式是________________. 3.独立性检验的一般步骤:(1)提出假设H0:两个研究对象没有关系;(2)根据2×2列联表计算χ2的值;(3)查对临界值,作出判断.一、填空题1.下面是一个2×2列联表:x1 x2 总计 y1 a 8 b y2 21 25 46 总计 73 33 则表中a、b处的值分别为________,________. 2.为了检验两个事件A,B是否相关,经过计算得χ2=8.283,则说明事件A和事件B________(填“相关”或“无关”).3.为了考察高一年级学生的性别与是否喜欢数学课程之间的关系,在高一年级随机抽1苏版高中数学课时作业及单元检测题全册合编含答案取了300名,得到如下2×2列联表.判断学生性别与是否喜欢数学________(填“有”或“无”)关系.男女合计喜欢 37 35 72 不喜欢 85 143 228 合计 122 178 300 4.为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算χ2=99.9,根据这一数据分析,下列说法正确的是________(只填序号).①有99.9%的人认为该栏目优秀;②有99.9%的人认为栏目是否优秀与改革有关系;③有99.9%的把握认为电视栏目是否优秀与改革有关系;④以上说法都不对.5.某班班主任对全班50名学生学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示.从表中数据分析,学生学习积极性与对待班级工作的态度之间有关系的把握有________.学习积极性高学习积极性一般合计 6.给出下列实际问题:①一种药物对某种病的治愈率;②两种药物治疗同一种病是否有区别;③吸烟者得肺病的概率;④吸烟人群是否与性别有关系;⑤网吧与青少年的犯罪是否有关系.其中用独立性检验可以解决的问题有______.7.下列说法正确的是________.(填序号)①对事件A与B的检验无关,即两个事件互不影响;②事件A与B关系越密切,χ2就越大;③χ2的大小是判断事件A与B是否相关的唯一数据;④若判定两事件A与B有关,则A发生B一定发生.8.某市政府在调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了3 000人,计算发现χ2=6.023,根据这一数据查表,市政府断言市民收入增减与旅游愿望有关系,这一断言犯错误的概率不超过____________________________________________________.二、解答题2积极参加班级工作 18 6 24 不太主动参加班级工作 7 19 26 合计 25 25 50 苏版高中数学课时作业及单元检测题全册合编含答案9.在对人们休闲的一次调查中,共调查了124人,其中女性70人,男性54人.女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.(1)根据以上数据建立一个2×2的列联表; (2)检验性别与休闲方式是否有关系.10.有甲、乙两个工厂生产同一种产品,产品分为一等品和二等品.为了考察这两个工厂的产品质量的水平是否一致,从甲、乙两个工厂中分别随机地抽出产品109件,191件,其中甲工厂一等品58件,二等品51件,乙工厂一等品70件,二等品121件.(1)根据以上数据,建立2×2列联表;(2)试分析甲、乙两个工厂的产品质量有无显著差别(可靠性不低于99%)能力提升11.在吸烟与患肺病是否相关的判断中,有下面的说法:3苏版高中数学课时作业及单元检测题全册合编含答案①若χ2的观测值k>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,若某人吸烟,则他有99%的可能患有肺病;③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是________.12.下表是对某市8所中学学生是否吸烟进行调查所得的结果:父母中至少有一人吸烟父母均不吸烟吸烟学生 816 188 不吸烟学生 3 203 1 168 (1)在父母至少有一人吸烟的学生中,估计吸烟学生所占的百分比是多少? (2)在父母均不吸烟的学生中,估计吸烟学生所占的百分比是多少? (3)学生的吸烟习惯和父母是否吸烟有关吗?请简要说明理由. (4)有多大的把握认为学生的吸烟习惯和父母是否吸烟有关?1.对独立性检验思想的理解独立性检验的基本思想类似于数学中的反证法,要确认两个变量有关系这一结论成立的可信程度,首先假设该结论不成立,即假设“两个变量没有关系”成立,在该假设下我们构造的随机变量χ2应该很小,如果由观测数据计算得到的χ2的观测值很大,则在一定程度上4感谢您的阅读,祝您生活愉快。
独立性检验练习含答案
§1.1 独立性检验一、基础过关1.当χ2>2.706时,就有________的把握认为“x 与y 有关系”.2.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶,则χ2≈__________.(结果保留3位小数)3.分类变量X 和Y 的列表如下,则下列说法判断正确的是________.(填序号)y 1 y 2 总计x 1 a b a +b x 2c d c +d 总计a +cb +da +b +c +d①ad -bc 越小,说明X 与Y 的关系越弱; ②ad -bc 越大,说明X 与Y 的关系越强; ③(ad -bc )2越大,说明X 与Y 的关系越强; ④(ad -bc )2越接近于0,说明X 与Y 的关系越强.4.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计6050110由χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )算得,χ2=110×(40×30-20×20)260×50×60×50≈7.8.附表:P (χ2≥k ) 0.050 0.010 0.001 k3.8416.63510.828参照附表,得到的正确结论是________.①在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”; ②在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”; ③有99%以上的把握认为“爱好该项运动与性别有关”; ④有99%以上的把握认为“爱好该项运动与性别无关”.5.为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸烟量每天多于和不多于20支进行分组,如下表:年龄合计 不超过40岁 超过40岁吸烟量不多于20支/天 50 15 65 吸烟量多于20支/天10 25 35 合计6040100则有________的把握确定吸烟量与年龄有关. 二、能力提升6.某高校“统计初步”课程的教师随机调查了选该课的一些情况,具体数据如下表:专业 性别非统计专业统计专业 合计 男 13 10 23 女 7 20 27 合计203050为了判断主修统计专业是否与性别有关,根据表中的数据,得χ2=50×(13×20-10×7)223×27×20×30≈4.844.因为χ2≈4.844>3.841,所以判断主修统计专业与性别有关系,那么这种判断出错的可能性为________.7.在2×2列联表中,若每个数据变为原来的2倍,则卡方值变为原来的________倍. 8.下列说法正确的是________.(填序号)①对事件A 与B 的检验无关,即两个事件互不影响; ②事件A 与B 关系越密切,χ2就越大;③χ2的大小是判断事件A 与B 是否相关的惟一数据; ④若判定两事件A 与B 有关,则A 发生B 一定发生.9.为研究某新药的疗效,给50名患者服用此药,跟踪调查后得下表中的数据:无效 有效 总计 男性患者 15 35 50 女性患者 6 44 50 总计2179100设H 0:服用此药的效果与患者的性别无关,则χ2的值约为________,从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为________.10.某县对在职的71名高中数学教师就支持新的数学教材还是支持旧的数学教材做了调查,结果如下表所示:支持新教材支持旧教材合计 教龄在15年以上的教师122537教龄在15年以下的教师102434合计224971根据此资料,你是否认为教龄的长短与支持新的数学教材有关?11.下表是某地区的一种传染病与饮用水的调查表:得病不得病总计干净水52466518不干净水94218312总计146684830(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;(2)若饮用干净水得病5人,不得病50人;饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水的卫生程度有关,并比较两种样本在反映总体时的差异.三、探究与拓展12.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:甲厂:分组[29.86,29.90) [29.90,29.94) [29.94,29.98)[29.98,30.02)频数126386182分组[30.02,30.06) [30.06,30.10) [30.10,30.14)频数9261 4乙厂:分组[29.86,29.90) [29.90,29.94) [29.94,29.98) [29.98,30.02)频数297185159分组[30.02,30.06) [30.06,30.10) [30.10,30.14)频数766218(1)分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填写2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”.答案1.90% 2.16.373 3.③ 4.③ 5.99.9% 6.5% 7.2 8.② 9.4.882 5%10.解 由公式得χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=71×(12×24-25×10)237×34×22×49≈0.08.∵χ2<2.706.∴我们没有理由说教龄的长短与支持新的数学教材有关. 11.解 (1)假设:传染病与饮用水的卫生程度无关. 由公式得χ2=830×(52×218-466×94)2146×684×518×312≈54.21.因为54.21>10.828.因此我们有99.9%的把握认为该地区这种传染病与饮用水的卫生程度有关. (2)依题意得2×2列联表:得病 不得病 总计 干净水 5 50 55 不干净水 9 22 31 总计147286此时,χ2=86×(5×22-50×9)255×31×14×72≈5.785.由于5.785>5.024,所以我们有97.5%的把握认为该种传染病与饮用水的卫生程度有关. 两个样本都能统计得到传染病与饮用水的卫生程度有关这一相同结论,但(1)问中我们有99.9%的把握肯定结论的正确性,(2)问中我们只有97.5%的把握肯定结论的正确性. 12.解 (1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为360500×100%=72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为320500×100%=64%. (2)甲厂 乙厂 总计 优质品 360 320 680 非优质品 140 180 320 总计5005001 000由列联表中的数据,得χ2=1 000×(360×180-320×140)2680×320×500×500≈7.353>6.635.所以有99%的把握认为“两个分厂生产的零件的质量有差异”.Welcome To Download !!!欢迎您的下载,资料仅供参考!。
2022高中数学第1章统计案例2
第一章DIYIZHANG统计案例§2独立性检验2.1条件概率与独立事件课后篇巩固提升A组1.从1,2,3,4,5中任取2个不同的数,事件A:“取到的2个数之和为偶数”,事件B:“取到的2个数均为偶数”,则P(B|A)=()A. B. C. D.(A)=,P(AB)=,由条件概率计算公式,得P(B|A)=.2.某单位组织开展党史知识竞赛活动,以支部为单位参加比赛,某支部在5道党史题中(有3道选择题和2道填空题),不放回地依次随机抽取2道题作答,设事件A为“第1次抽到选择题”,事件B为“第2次抽到选择题”,则下列结论中不正确的是()A.P(A)=B.P(AB)=C.P(B|A)=D.P(B|)=(A)=,故A正确;P(AB)=,故B正确;P(B|A)=,故C正确;P()=1-P(A)=1-,P(B)=,P(B|)=,故D错误.故选D.3.某地区空气质量监测资料表明,一天的空气质量为优良的概率是0.75,连续两天为优良的概率是0.6,已知某天的空气质量为优良,则随后一天的空气质量为优良的概率是()A.0.8B.0.75C.0.6D.0.45,则随后一天空气质量也优良的概率为p,则得0.6=0.75·p,解得p=0.8,故选A.4.某中学开展主题为“学习宪法知识,弘扬宪法精神”的知识竞赛活动,甲同学答对第一道题的概率为,连续答对两道题的概率为.用事件A表示“甲同学答对第一道题”,事件B表示“甲同学答对第二道题”,则P(B|A)=()A. B. C. D.P(AB)=,P(A)=,∴P(B|A)=.故选D.5.如图,用K,A1,A2三类不同的元件连接成一个系统.当K正常工作且A1,A2至少有一个正常工作时,系统正常工作.已知K,A1,A2正常工作的概率依次为0.9,0.8,0.8,则系统正常工作的概率为()A.0.960B.0.864C.0.720D.0.576:由题意知K,A1,A2正常工作的概率分别为P(K)=0.9,P(A1)=0.8,P(A2)=0.8, ∵K,A1,A2相互独立,∴A1,A2至少有一个正常工作的概率为P(A2)+P(A1)+P(A1A2)=(1-0.8)×0.8+0.8×(1-0.8)+0.8×0.8=0.96.∴系统正常工作的概率为P(K)[P(A2)+P(A1)+P(A1A2)]=0.9×0.96=0.864.方法二:A1,A2至少有一个正常工作的概率为1-P()=1-(1-0.8)(1-0.8)=0.96,∴系统正常工作的概率为P(K)[1-P()]=0.9×0.96=0.864.6.某次知识竞赛规则如下:在主办方预设的5个问题中,选手若能连续正确回答出两个问题,即停止答题,晋级下一轮.假设某选手正确回答每个问题的概率都是0.8,且每个问题的回答结果相互独立,则该选手恰好回答了4个问题就晋级下一轮的概率为..128,该选手的第二个问题必答错,第三、四个问题必答对,故该选手恰好回答了4个问题就晋级下一轮的概率P=1×0.2×0.8×0.8=0.128.7.已知随机事件A和B相互独立,若P(AB)=0.36,P()=0.6(表示事件A的对立事件),则P(B)=..9P(A)=1-P()=0.4,由独立事件的概率乘法公式可得P(AB)=P(A)P(B),因此,P(B)==0.9.8.盒中装有10只乒乓球,其中6只新球,4只旧球,不放回地依次取出2个球使用,在第一次取出新球的条件下,第二次也取到新球的概率为.,则袋中还有9个球,其中5个新球,所以第二次取出新球的概率为.9.集合A={1,2,3,4,5,6},甲、乙两人各从A中任取一个数,若甲先取,乙后取,在甲抽到奇数的条件下,求乙抽到的数比甲抽到的数大的概率.1:将甲抽到数字a,乙抽到数字b,记作(a,b),则所有可能的抽取结果为:(1,2),(1,3),(1,4),(1,5),(1,6),(2,1),(2,3),(2,4),(2,5),(2,6),(3,1),(3,2),(3,4),(3,5),(3,6),(4,1),(4,2),(4,3),(4,5),( 4,6),(5,1),(5,2),(5,3),(5,4),(5,6),(6,1),(6,2),(6,3),(6,4),(6,5),共30个.其中甲抽到奇数的情形有15个,在这15个中,乙抽到的数比甲抽到的数大的有9个,所求概率P=.解法2:设甲抽到奇数的事件为A,甲抽到奇数,且乙抽到的数比甲大为事件B,则P(A)=.P(AB)=,故P(B|A)=.10.某班有两个课外活动小组,其中第一小组有足球票6张,排球票4张;第二小组有足球票4张,排球票6张.甲从第一小组的10张票中任抽1张,乙从第二小组的10张票中任抽1张.(1)两人都抽到足球票的概率是多少?(2)两人中至少有1人抽到足球票的概率是多少?“甲从第一小组的10张票中任抽1张,抽到足球票”为事件A,“乙从第二小组的10张票中任抽1张,抽到足球票”为事件B,则“甲从第一小组的10张票中任抽1张,抽到排球票”为事件,“乙从第二小组的10张票中任抽1张,抽到排球票”为事件,于是P(A)=,P()=;P(B)=,P()=.由于甲(或乙)是否抽到排球票,对乙(或甲)是否抽到足球票没有影响,因此A与B是相互独立事件.(1)两人都抽到足球票的概率为P=P(A)·P(B)=.(2)两人都抽到排球票的概率为P=P()·P()=.故两人至少有1人抽到足球票的概率为P=1-.B组1.已知某产品的次品率为4%,其合格品中75%为一级品,则任选一件为一级品的概率为()A.75%B.96%C.72%D.78.125%“任选一件产品是合格品”为事件A,则P(A)=1-P()=1-4%=96%.记“任选一件产品是一级品”为事件B.由于一级品必是合格品,所以事件A包含事件B,故P(AB)=P(B).由合格品中75%为一级品知P(B|A)=75%;故P(B)=P(AB)=P(A)·P(B|A)=96%×75%=72%.2.从甲袋中摸出一个红球的概率是,从乙袋中摸出一个红球的概率是,从两袋各摸出一个球,下列结论不正确的是()A.2个球都是红球的概率为B.2个球不都是红球的概率为C.至少有1个红球的概率为D.2个球中恰有1个红球的概率为A选项,2个球都是红球的概率为,A选项正确;对于B选项,2个球不都是红球的概率为1-,B 选项错误;对于C选项,至少有1个红球的概率为1-,C选项正确;对于D选项,2个球中恰有1个红球的概率为,D选项正确.故选B.3.已知P(AB)=P(A)P(B),且P()=,P(A)=P(B),则事件A发生的概率是()A. B. C. D.P(AB)=P(A)P(B),知A与B相互独立,故A与与B,都是相互独立的,由P(A)=P(B),得P(A)P()=P(B)P(),即P(A)[1-P(B)]=P(B)[1-P(A)],得P(A)=P(B).∵P()=,∴P()=P()=,∴P(A)=.4.某农业科技站对一批新水稻种子进行试验,已知这批水稻种子的发芽率为0.8,出芽后的幼苗成活率为0.9.在这批水稻种子中,随机地取出一粒,则这粒水稻种子发芽并能成长为幼苗的概率为() A.0.02 B.0.08 C.0.18 D.0.72“这粒水稻种子发芽”为事件A,“这粒水稻种子发芽并成长为幼苗”为事件AB,“这粒水稻种子在发芽的前提下能成长为幼苗”为事件B|A,则P(A)=0.8,P(B|A)=0.9,由条件概率公式,得P(AB)=P(B|A)·P(A)=0.9×0.8=0.72.5.市场上供应的灯泡中,甲厂占70%,乙厂占30%,甲厂产品的合格率是95%,乙厂产品的合格率是80%,则市场上灯泡的合格率是..5%A={甲厂产品},B={乙厂产品},C={合格产品},则C=AC+BC,所以P(C)=P(AC)+P(BC)=P(A)·P(C|A)+P(B)·P(C|B)=70%×95%+30%×80%=0.905=90.5%.6.设甲乘汽车、火车前往目的地的概率分别为0.6,0.4,汽车和火车正点到达目的地的概率分别为0.9,0.8,则甲正点到达目的地的概率为..86P=0.6×0.9=0.54,当甲乘火车时正点到达目的地的概率为P=0.4×0.8=0.32,所以甲正点到达目的地的概率为P=0.54+0.32=0.86.7.从一副不含大小王的52张扑克牌中不放回地抽取2次,每次抽1张,已知第1次抽到A,则第2次也抽到A的概率为多少?1次抽到A为事件M,第2次也抽到A为事件N,则MN表示两次都抽到A, P(M)=,P(MN)=,P(N|M)=.8.制造一机器零件,甲机床生产的废品率是0.04,乙机床生产的废品率是0.05,从它们生产的产品中各任取1件,求:(1)两件都是废品的概率;(2)其中没有废品的概率;(3)其中恰有1件废品的概率;(4)其中至少有1件废品的概率;(5)其中至多有1件废品的概率.“从甲机床生产的产品中抽得1件是废品”为事件A,“从乙机床生产的产品中抽得1件是废品”为事件B.则P(A)=0.04,P(B)=0.05.(1)P(AB)=P(A)P(B)=0.04×0.05=0.002.(2)P()=P()P()=0.96×0.95=0.912.(3)P(B+A)=P()P(B)+P(A)P()=0.96×0.05+0.04×0.95=0.086.(4)至少有一件是废品的对应事件为B+A+AB,易知B,A,AB是彼此互斥的三件事件.故所求概率为P=P(B+A+AB)=P(B+A)+P(AB)=0.086+0.002=0.088.(利用(1),(3)小题的结果)或考虑其对应事件“没有废品”,故P=1-P()=1-0.912=0.088.(5)“至多有一件是废品”即为事件B+A;其对立事件为“两件都是废品”:AB.故所求概率P=P(B+A)=1-P(AB)=1-0.002=0.998.。
人教B版高中数学选择性必修第二册4.3.2独立性检验同步练习
人教B版高中数学选择性必修第二册4.3.2独立性检验同步练习必备知识基础练进阶训练第一层1.假设有两个分类变量x与y的2×2列联表如下表:y1y2x1a bx2c d对于以下数据,对同一样本能说明x与y有关系的可能性最大的一组为()A.a=5,b=4,c=3,d=2B.a=5,b=3,c=4,d=2C.a=2,b=3,c=4,d=5D.a=2,b=3,c=5,d=42.(多选)为了增强学生的身体素质,某校将冬天长跑作为一项制度固定下来,每天大课间例行跑操.为了调查学生喜欢跑步是否与性别有关,研究人员随机调查了相同人数的男、女学生,发现男生中有80%喜欢跑步,女生中有40%不喜欢跑步,且有95%的把握判断喜欢跑步与性别有关,但没有99%的把握判断喜欢跑步与性别有关,则被调查的男、女学生的总人数可能为()A.120B.130C.240D.2503.(多选)疫苗是为预防、控制传染病的发生、流行,用于人体预防接种的预防性生物制品,其前期研发过程中,一般都会进行动物保护测试,为了考察某种疫苗预防效果,在进行动物试验时,得到如下统计数据:未发病发病总计未注射疫苗30注射疫苗40总计7030100附表及公式:α=P(χ2≥k)0.050.010.0050.001k 3.841 6.6357.87910.828χ2=n(ad-bc)2,n=a+b+c+d.(a+b)(c+d)(a+c)(b+d)现从试验动物中任取一只,取得“注射疫苗”的概率为0.5,则下列判断正确的是() A.注射疫苗发病的动物数为10B.某个发病的小动物为未注射疫苗动物的概率为23C.能在犯错概率不超过0.005的前提下,认为疫苗有效D.该疫苗的有效率约为80%4.为了判断某高中学生是否选修文科与性别的关系,现随机抽取50名学生,得到2×2列联表:理科文科男1310女720根据表中数据,得到χ2=50×(13×20-10×7)223×27×20×30≈4.844,则认为选修文科与性别有关系出错的概率约为________.(参考数据:P(χ2≥3.841)=0.05,P(χ2≥6.635)=0.01) 5.某单位主管对50名员工进行了工作量的调查,了解男、女职工对工作量大小的看法是否存在差异,得到的数据如下:请判断认为工作量的大小与性别是否有关.6.2021年9月,教育部印发《关于全面加强和改进新时代学校卫生与健康教育工作的意见》中指出:中小学生各项身体素质有所改善,大学生整体下降.某高校为提高学生身体素质,号召全校学生参加体育锻炼,结合“微信运动”APP每日统计运动情况,对每日平均运动10000步或以上的学生授予“运动达人”称号,低于10000步称为“参与者”,统计了200名学生在某月的运动数据,结果如下:运动达人参与者合计男生70女生80合计80200(1)完善2×2列联表并说明:是否有99%的把握认为获得“运动达人”称号与性别有关?(2)从全校运动“运动达人”中按性别分层抽取8人,再从8人中选取4人参加特训,将男生人数记为X,求X的分布列.参考公式:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.α=P(χ2≥k)0.100.050.0100.0050.001 k 2.706 3.841 6.6357.87910.828关键能力综合练进阶训练第二层7.假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为YX y1y2合计x1101828x2m26m+26总计m+1044m+54则当整数m取()时,X与Y的关系最弱A.8B.9C.14D.198.(多选)千百年来,我国劳动人民在生产实践中根据云的形状,走向,速度,厚度,颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,随机观察了他所在地区的100天日落情况和后半夜天气,得到如下2×2列联表,单位:天并计算得到χ2≈19.05,下列小波对该地区天气的判断正确的是()A.后半夜下雨的概率约为12B.未出现“日落云里走”时,后半夜下雨的概率约为59C.根据α=0.001的独立性检验,可以推断“日落云里走”是否出现与“后半夜是否下雨”有关D.根据α=0.001的独立性检验,若出现“日落云里走”,则后半夜有99.9%的可能会下雨9.北京冬奥会的举办掀起了一阵冰雪运动的热潮.某高校在本校学生中对“喜欢滑冰是否与性别有关”做了一次调查,参与调查的学生中,男生人数是女生人数的3倍,有23的男生喜欢滑冰,有13的女生喜欢滑冰.若根据独立性检验的方法,有95%的把握认为是否喜欢滑冰和性别有关,则参与调查的男生人数可能为()参考公式:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.参考数据:α=P(χ2≥k)0.100.050.0250.010k 2.706 3.841 5.024 6.635A.12B.18C.36D.4810.流感是流行性感冒的简称,是由流感病毒引起的一种呼吸道传染病.接种疫苗是预防流感的主要措施.某医疗研究所为了检验某流感疫苗预防感冒的作用,把500名使用疫苗的人与另外500名未使用疫苗的人一年中的感冒记录作比较,提出假设H0:“注射此种疫苗对预防流感无关”,利用2×2列联表计算得χ2≈6.789,经查临界值表知P(χ2≥6.635)=0.01.则下列结论正确的是()A.若某人未使用该疫苗,那么他在一年中有99%的可能性得感冒B.在犯错误的概率不超过0.01的前提下认为“注射此种疫苗对预防流感有关”C.这种疫苗预防感冒的有效率为99%D.这种疫苗预防感冒的有效率为1%11.为迎接2022年8月8日至8月18日在六盘水市举行的贵州省第十一届运动会,普及体育知识,某校开展了主题为“清凉六盘水·火热十一运”体育知识竞赛活动.现从参加体育知识竞赛活动的学生中随机抽取了100名学生,将他们的比赛成绩(满分为100分),分为6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],得到如图所示的频率分布直方图.(1)求a的值;(2)在抽取的100名学生中,规定比赛成绩不低于80分为“优秀”,比赛成绩低于80分为“非优秀”,请将下面的2×2列联表补充完整,并判断是否有99.9%的把握认为比赛成绩是否优秀与性别有关?优秀非优秀总计男生40女生50总计100附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),(其中n=a+b+c+d)α=P(χ2≥k)0.100.050.0100.0050.001 k 2.706 3.841 6.6357.87910.82812.随着新冠疫情防控进入常态化,人们的生产生活逐步步入正轨.为拉动消费,某市政府分批发行2亿元政府消费券,为了解政府消费券使用人群的年龄结构情况,在发行完第一批政府消费券后,该市政府采用随机抽样的方法在全市市民中随机抽取了200人,对是否使用过政府消费券的情况进行调查,部分结果如下表所示,其中年龄在45岁及以下的人数占样本总数的35,没使用过政府消费券的人数占样本总数的310.使用过政府消费券没使用过政府消费券总计45岁及以下8045岁以上总计200(1)请将题中表格补充完整,并判断是否有90%的把握认为该市市民是否使用政府消费券与年龄有关?(2)现从45岁及以下的样本中按是否使用过政府消费券进行分层抽样,抽取6人做进一步访谈,然后再从这6人中随机抽取2人填写调查问卷,求这2人中至少有1人来自没使用过政府消费券的概率.附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.α=P(χ2≥k)0.150.100.050.025 k 2.072 2.706 3.841 5.024核心素养升级练进阶训练第三层13.PISA是经济合作与发展组织(OECD)于2000年发起的对基础教育进行跨国家(地区)、跨文化的评价项目,主要是对15岁在校生的科学、数学、阅读素养等核心素养进行测评,并对影响学生素养的关键因素进行问卷测查,以科学反映学生参与未来社会生活的能力,为教育教学改进提供有效证据.随着越来越多国家的加入,加之其科学、系统的整体设计,PISA已成为当前最具规模与影响力的国际性教育监测评估项目.某校为了研究高一15岁学生的阅读素养情况是否与科学素养情况有关,随机抽取80名学生(15岁)进行阅读素养和科学素养测试,测试情况统计如下表:科学素养“好”科学素养“不好”合计阅读素养“好”241640阅读素养“不好”172340合计413980(1)试求χ2的值,并判断是否有85%的把握认为阅读素养情况与科学素养情况有关;(2)现从阅读素养“好”的40名学生中,用分层抽样的方法抽取10人组成一个互助小组.再从这10人中任意抽取3人负责沟通协调工作,设其中抽到科学素养“不好”的人数为X,求X的分布列和数学期望.附表及公式:α=P(χ2≥k)0.500.400.250.150.100.050.025 k0.4550.708 1.323 2.072 2.706 3.841 5.024χ2=n(ad-bc)2,其中n=a+b+c+d.(a+b)(c+d)(a+c)(b+d)14.某城市为了了解高中生的身高情况,从某次全市高中生体检中抽取了一所学校的n 名学生的身高数据,整理分组成区间[140,150],(150,160],(160,170],(170,180],(180,190],单位:厘米,并画出了频率分布直方图如下,已知从左到右前三个小组频率之比为2∶3∶4,其中第二小组有15人.(1)求样本频数n的值;(2)以此校的样本数据来估计全市的总体数据,若从全市所有高中学生(人数很多)中任选三人,设X表示身高超过160厘米的学生人数,求X的分布列及期望;(3)某班主任对全班50名学生进行了作业量多少的调查.数据如下表:认为作业多认为作业不多合计喜欢玩游戏18927不喜欢玩游戏81523合计262450试通过计算说明在犯错误的概率不超过多少的前提下认为喜欢玩游戏与作业量的多少有关系.附:α=P(χ2≥k)0.050.0250.0100.0050.001k 3.841 5.024 6.6357.87910.828χ2=n(ad-bc)2,n=a+b+c+d.(a+b)(c+d)(a+c)(b+d)15.大型综艺节目《最强大脑》中,有一个游戏叫做盲拧魔方,就是玩家先观察魔方状态并进行记忆,记住后蒙住眼睛快速还原魔方,盲拧在外人看来很神奇,其实原理是十分简单的,要学会盲拧也是很容易的.根据调查显示,是否喜欢盲拧魔方与性别有关.为了验证这个结论,某兴趣小组随机抽取了50名魔方爱好者进行调查,得到的情况如下表所示:喜欢盲拧不喜欢盲拧总计男2230女12总计50表1并邀请这30名男生参加盲拧三阶魔方比赛,其完成情况如下表所示:成功完成时间(分钟)[0,10)[10,20)[20,30)[30,40]人数101055表2(1)将表1补充完整,并判断能否在犯错误的概率不超过0.025的前提下认为是否喜欢盲拧与性别有关?(2)根据表2中的数据,求这30名男生成功完成盲拧的平均时间(同一组中的数据用该组区间的中点值代替);(3)现从表2中成功完成时间在[0,10)内的10名男生中任意抽取3人对他们的盲拧情况进行视频记录,记成功完成时间在[0,10)内的甲、乙、丙3人中被抽到的人数为X,求X 的分布列及数学期望E(X).附参考公式及数据:χ2=n(ad-bc)2,其中n=a+b+c+d.(a+b)(c+d)(a+c)(b+d)α=P(χ2≥k)0.100.050.0250.0100.0050.001k 2.706 3.841 5.024 6.6357.87910.828参考答案与解析必备知识基础练1.答案:D解析:对于两个分类变量x与y而言,|ad-bc|的值越大,说明x与y有关系的可能性最大.对于A选项,|ad-bc|=|5×2-4×3|=2,对于B选项,|ad-bc|=|5×2-3×4|=2,对于C选项,|ad-bc|=|2×5-3×4|=2,对于D选项,|ad-bc|=|2×4-3×5|=7,显然D中|ad-bc|最大.故选D.2.答案:AB解析:依题意,设男、女学生的人数均为5x(x∈N*),则被调查的男、女学生的总人数为10x.建立如下2×2列联表:喜欢跑步不喜欢跑步总计男4x x5x女3x2x5x总计7x3x10x则χ2=10x(8x2-3x2)25x×5x×3x×7x=10x21,又3.841<10x21≤6.635,所以80.661<10x≤139.335.故选AB.3.答案:ABD解析:完善列联表如下:未发病发病总计未注射疫苗302050注射疫苗401050总计7030100由列联表知,A正确;20 30=23,B正确;χ2=100×(30×10-40×20)270×30×50×50≈4.762∈(3.841,6.635),不能在犯错概率不超过0.005的前提下,认为疫苗有效,C错误;疫苗的有效率约为4050=80%,D正确.故选ABD.4.答案:0.05解析:因为χ2≈4.844>3.841,P(χ2≥3.841)=0.05,所以认为选修文科与性别有关系出错的概率约为0.05.5.解析:P(Y=1|X=1)=n(X=1,Y=1)n(X=1)=1827=23≈0.667.P(Y=1|X=0)=n(X=0,Y=1)n(X=0)=823≈0.348,所以认为工作量的大小与性别有关系,男职工更加认为工作量大.6.解析:(1)由题意完善2×2列联表如下:运动达人参与者合计男生5070120女生305080合计80120200此时:χ2=200×(70×30-50×50)2120×80×120×80=2572≈0.35<6.635.所以没有99%的把握认为获得“运动达人”称号与性别有关.(2)由题意知:选取的8人运动参与者中男生5人,女生3人,X 的所有可能情况为:1、2、3、4,且P (X =1)=C 15C 33C 48=114,P (X =2)=C 25·C 23C 48=37,P (X =3)=C 35C 13C 48=37,P (X =4)=C 45C 03C 48=114.X 的分布列为:X 1234P1143737114关键能力综合练7.答案:C解析:在两个分类变量的列联表中,当|ad -bc |的值越小时,认为两个分类变量有关的可能性越小.令|ad -bc |=0,得10×26=18m ,解得m ≈14.4,又m 为整数,所以当m =14时,X 与Y 的关系最弱.故选C.8.答案:AC解析:由题意,把频率看作概率,可得后半夜下雨的概率约为50100=12,故A 判断正确;未出现“日落云里走”时,后半夜下雨的概率约为2525+45=514,故B 判断错误;由χ2≈19.05>10.828=x 0.001,根据α=0.001的独立性检验,认为“‘日落云里走’是否出现”与“当晚后半夜是否下雨”有关,故C 判断正确,D 判断错误.故选AC.9.答案:C解析:设男生人数为3x ,则女生人数为x ,且x ∈N *,可得列联表如下:男生女生合计喜欢滑冰2x x 37x 3不喜欢滑冰x 2x 35x 3合计3xx4x所以χ27x 3·5x 3·3x ·x=12x 35,因为有95%的把握认为是否喜欢滑冰和性别有关,所以12x 35∈(3.841,5.024],解得11.20<x ≤14.65,所以33.60<3x ≤43.96,结合选项只有36∈(33.60,43.96].故选C.10.答案:B解析:根据独立性检验,可以得到B 正确,其余的理解均不正确.故选B.11.解析:(1)由频率分布直方图各小矩形面积之和为1可知:10×(0.005+0.010+a +0.030+0.025+0.010)=1,解得a =0.020.(2)由图可知:低于80分的频率为:10×(0.005+0.010+0.020+0.030)=0.65,所以非优秀的人数为:100×0.65=65人,据此可知2×2列联表如下:优秀非优秀总计男生104050女生252550总计3565100可知:χ2=100(250-1000)235×65×50×50≈9.890<10.828,所以没有99.9%的把握认为比赛成绩是否优秀与性别有关.12.解析:(1)由题意得,总人数为200人,年龄在45岁及以下的人数为200×35=120人,没使用过政府消费券的人数为200×310=60人,完成表格如下:使用过政府消费券没使用过政府消费券总计45岁及以下804012045岁以上602080总计14060200由列联表可知χ2=200×(80×20-60×40)2140×60×120×80=10063≈1.587<2.706,所以没有90%的把握认为该市市民是否使用政府消费券与年龄有关.(2)由题意可知,从45岁及以下的市民中采用分层抽样的方法可以抽取使用过政府消费券的市民4人,记为A ,B ,C ,D ,没使用过政府消费券的市民2人,记为a ,b ,从这6人中随机抽取2人的方法有:AB ,AC ,AD ,Aa ,Ab ,BC ,BD ,Ba ,Bb ,CD ,Ca ,Cb ,Da ,ab ,Db ,共15种,其中这2人中至少有1人来自没使用过政府消费券的方法有:Aa ,Ab ,Ba ,Bb ,Ca ,Cb ,Da ,Db ,ab ,共9种,故所求的概率为P =915=35.核心素养升级练13.解析:(1)χ2=80×(24×23-17×16)240×40×41×39≈2.452>2.072,有85%的把握认为阅读素养情况与科学素养情况有关.(2)由分层抽样知抽取的10人,科学素养“好”的有6人,科学素养“不好”的有4人,因此X 的取值依次为0,1,2,3,P (X =0)=C 36C 310=16,P (X =1)=C 26C 14C 310=12,P (X =2)=C 16C 24C 310=310,P (X =3)=C 34C 310=130,X 的分布列为:X0123P1612310130E (X )=0×16+1×12+2×310+3×130=65.14.解析:(1)设前三个小组的频率分别为p 1,p 2,p 3,2=32p 13=2p 11+p 2+p 3=1-(0.005+0.020)×10,解得p 1=16,p 2=14,p 3=13,由p 2=14=15n ⇒n =60.(2)由(1)知一个高中生身高超过160厘米的概率为p =p 3+(0.005+0.020)×10=712,X 可取0,1P (X =0)=C 0303=1251728,P (X =1)=C 132=175576,P (X =2)=C 232=245576,P (X =3)=C 333=3431728,故分布列为:X 0123P12517281755762455763431728E (X )=0×1251728+1×175576+2×245576+3×3431728=74.(3)χ2=50×(18×15-8×9)226×24×27×23≈5.059>5.024,所以在犯错误的概率不超过0.025的前提下认为喜欢玩游戏与作业量的多少有关系.15.解析:(1)依题意,补充完整的表1如下:喜欢盲拧不喜欢盲拧总计男22830女81220总计302050所以χ2=50×(22×12-8×8)230×20×30×20=509≈5.556>5.024,所以能在犯错误的概率不超过0.025的前提下认为是否喜欢盲拧与性别有关.(2)依题意,所求平均时间为5×13+15×13+25×16+35×16=503(分钟).(3)依题意,X 的可能取值为0,1,2,3,故P (X =0)=C 37C 310=724,P (X =1)=C 27C 13C 310=2140,P (X =2)=C 17C 23C 310=740,P (X =3)=C 33C 310=1120,故X 的分布列为X0123P72421407401120故E (X )=0×724+1×2140+2×740+3×1120=910.。
【数学】高中数学第三章统计案例31独立性检验课后导练苏教版选修23
【关键字】数学高中数学第三章统计案例 3.1 独立性检验课后导练苏教版选修2-3基础达标1.下列说法正确的个数是( )①对事件A与B的检验无关时,即两个事件互不影响②事件A与B关系越密切,则χ2就越大③x2的大小是判定事件A与B是否相关的唯一根据④若判定两个事件A与B有关,则A发生,B一定发生A.1B.2C.3D.4思路解析:两个事件检验无关,只是说明两事件的影响较小;而判定两事件是否相关除了公式外,还可以用三维柱形图和二维条形图等方法来判定;两事件有关,也只是说明当一个事件发生时,另一个事件发生的概率较大,但不一定必然发生.所以只有命题②正确.答案:A2.为了考察高中生的性别与是否喜欢数学课程之间的关系,在某校高中生中随机抽取了300名学生,得到如下列联表:喜欢数学课程不喜欢数学课程总计男37 85 122女35 143 178总计72 228 300你认为性别与是否喜欢数学课程之间有关系的把握有( )A.0B.95%C.99%D.100%思路解析:利用独立性检验,由公式计算得χ2≈4.514>3.841,所以有95%的把握判定“性别与是否喜欢数学课程之间有关系”.答案:B3.甲、乙两个班级进行一门课程的考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如下的列联表.班级与成绩列联表优秀不优秀总计甲班10 35 45乙班7 38 45总计17 73 90利用列联表的独立性检验判断成绩与班级是否有关系?解析:∵χ2=≈0.625<3.841,∴我们认为成绩与班级没有关系.4.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶.请用独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?解析:根据题目所给数据得到如下列联表:秃顶与患心脏病列联表总计患心脏病患其他病秃顶214 175 389不秃顶451 597 1 048总计665 772 1 437χ2=≈16.373>6.635,所以有99%的把握认为“秃顶与患心脏病有关”.因为这组数据来自住院的病人,因此所得到的结论适合住院的病人群体.5.调查某医院某段时间内婴儿出生时间与性别关系,得到下面的数据表.出生时间晚上白天合计性别男婴24 31 55女婴8 26 34合计32 57 89试问能以多大把握认为婴儿的性别与出生时间有关系?能否判定性别与出生时间有关?解析:根据列联表中的数据代入公式求得χ2的值,进行比较判断得出相应结论.将表中数据代入公式得χ2=≈3.689>2.709,所以我们有90%的把握认为在这次调查中婴儿的性别与出生时间有关系.6.某推销商为某保健药品做广告,在广告中宣传“在服用该药品的105人中有100人未患A 疾病”,经调查发现,在不使用该药品的418人中仅有18人患A疾病.请用所学的知识分析该药品对患A疾病是否有效?解析:将题中条件列成2×2列联表,利用随机变量公式计算出χ2的值,与临界值作比较,从而得出结论.将问题中的数据写成2×2列联表:患A病不患A病合计使用 5 100 105不使用18 400 418合计23 500 523将数据代入公式得χ2=≈0.041 5<0.455.故没有充分理由认为该保健药品对患A疾病有效.7.调查者通过询问男、女大学生在购买食品时是否看营养说明得到的数据如下表所示:看营养说明不看营养说明总计男大学生23 32 55女大学生9 25 34 总计32 57 89利用列联表的独立性检验估计看营养说明是否与性别有关系?思路分析:根据列联表中的数据代入公式求得χ2的值,进行比较判断得出相应结论.解:由公式得χ2=≈2.149<3.841,所以我们没有理由认为看营养说明与男女性别有关,尽管在这次调查中男性看营养说明的比率比女性看营养说明的比率高,但我们不能认为这些男、女大学生中男性比女性看营养说明的多.综合运用8.某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示:积极支持企业改革不太赞成企业改革合计 工作积极 54 40 94 工作一般 32 63 95 合计86103189对于人力资源部的研究项目,根据上述数据能得出什么结论? 解析:由公式,得χ2=≈10.759.因为10.759>6.635,所以有99%的把握说:员工“工作积极”与“积极支持企业改革”是有关的,可以认为企业的全体员工对待企业改革的态度与其工作积极性是有关的.9.某地区羊患某种病的概率是0.4,且每只羊患病与否是彼此独立的.今研制一种新的预防药,任选5只羊做试验,结果这5只羊服用此药后均未患病,问此药是否有效? 解析:现假设药无效,5只羊都不生病的概率是(1-0.4)5≈0.078.这个概率很小,该事件几乎不会发生,但现在它确实发生了,说明我们的假设不对,药是有效的.这里的分析思想有些像反证法,但并不相同.给定假设后,我们发现,一个概率很小几乎不会发生的事件却发生了,从而否定我们的“假设”.应该指出的是,当我们作出判断“药是有效的”时,是可能犯错误的.犯错误的概率是0.078.也就是说,我们有近92%的把握认为药是有效的.10.为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表:性别与喜欢数学课程列联表喜欢数学课程不喜欢数学课程总计 男 37 85 122 女 35 143 178 总计72228300由表中数据计算得χ2≈4.513.高中生的性别与是否喜欢数学课程之间是否有关系?为什么? 解析:可以有约95%以上的把握认为“性别与喜欢数学课之间有关系”.作出这种判断的依据是独立性检验的基本思想,具体过程如下:分别用a ,b ,c,d 表示样本中喜欢数学课的男生人数、不喜欢数学课的男生人数、喜欢数学课的女生人数、不喜欢数学课的女生人数.如果性别与是否喜欢数学课有关系,则男生中喜欢数学课的比例b a a +与女生中喜欢数学课的人数比例dc c+应该相差很多,即))((d c b a bdac d c c b a a ++-=+-+应很大.将上式等号右边的式子乘以常数因子))(())()((d b c a d c b a d c b a +++++++,然后平方得χ2=))()()(()(2d b c a d c b a bd ac n ++++-.此文档是由网络收集并进行重新排版整理.word 可编辑版本!。
高中数学独立性检验精选题
独立性检验精选题26道一.选择题(共18小题)1.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由22()()()()()n a d b cKa b c d a c b d-=++++算得,22110(40302020)7.860506050K⨯⨯-⨯=≈⨯⨯⨯.参照附表,得到的正确结论是()A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动与性别有关”D.有99%以上的把握认为“爱好该项运动与性别无关”2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由22()()()()()n a d b cKa d c d a cb d-=++++算得,22110(40302020)7.860506050K⨯⨯-⨯=≈⨯⨯⨯附表:参照附表,得到的正确结论是()A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”3.某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用22⨯列联表进行独立性检验,经计算2 6.705K=,则所得到的统计学结论是:有()的把握认为“学生性别与支持该活动没有关系”.附:A.99.9%B.99%C.1%D.0.1%4.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:,则下列说法正确的是()已知在全部105人中随机抽取1人,成绩优秀的概率为27A.列联表中c的值为30,b的值为35B.列联表中c的值为15,b的值为50C.根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D.根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”5.有人认为在机动车驾驶技术上,男性优于女性.这是真的么?某社会调查机构与交警合作随机统计了经常开车的100名驾驶员最近三个月内是否有交通事故或交通违法事件发生,得到下面的列联表:附:22()()()()()n a d b cKa b c d a c b d-=++++据此表,可得()A.认为机动车驾驶技术与性别有关的可靠性不足50%B.认为机动车驾驶技术与性别有关的可靠性超过50%C.认为机动车驾驶技术与性别有关的可靠性不足60%D.认为机动车驾驶技术与性别有关的可靠性超过60%6.如表是一个22⨯列联表:则表中a,b的值分别为()A.94,72B.52,50C.52,74D.74,527.为了调查中学生近视情况,某校150名男生中有80名近视,140名女生中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力() A.平均数B.方差C.回归分析D.独立性检验8.针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的45,女生喜欢抖音的人数占女生人数35,若有95%的把握认为是否喜欢抖音和性别有关则调查人数中男生可能有( )人附表:附:22()()()()()n a d b cKa b c d a c b d-=++++A.20B.40C.60D.309.2020年2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为()参考公式附:22()()()()()n a d b cKa b c d a c b d-=++++,其中n a b c d=+++.参考数据:A.130B.190C.240D.25010.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的12,男生追星的人数占男生人数的16,女生追星的人数占女生人数的23.若有95%的把握认为是否追星和性别有关,则男生至少有()人参考数据及公式如下:22()()()()()n a d b cKa b c d a c b d-=++++A.12B.11C.10D.1811.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,下列说法中正确的是()A.100个吸烟者中至少有99人患有肺癌B.1个人吸烟,那么这个人有99%的概率患有肺癌C .在100个吸烟者中一定有患肺癌的人D .在100个吸烟者中可能一个患肺癌的人也没有12.某校团委对“学生性别与中学生追星是否有关”作了一次调查,利用22⨯列联表,由计算得27.218K ≈,参照如表:得到正确结论是( )A .有99%以上的把握认为“学生性别与中学生追星无关”B .有99%以上的把握认为“学生性别与中学生追星有关”C .在犯错误的概率不超过0.5%的前提下,认为“学生性别与中学生追星无关”D .在犯错误的概率不超过0.5%的前提下,认为“学生性别与中学生追星有关” 13.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的12,男生追星的人数占男生人数的16,女生追星的人数占女生人数的23.若有95%的把握认为是否追星和性别有关,则男生至少有()参考数据及公式如下:22()()()()()n a d b c Ka b c d a c b d -=++++A .12B .11C .10D .1814.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如表所示的列联表:已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法.正确的是()参考公式及数据:22()6.109()()()()n a d b c K a b c d a c b d -=≈++++附表:A .列联表中c 的值为30,b 的值为35B .列联表中c 的值为15,b 的值为50C .根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D .根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系” 15.为考察某种药物对预防禽流感的效果,在四个不同的实验室取相同的个体进行动物试验,根据四个实验室得到的列联表画出如下四个等高条形图,最能体现该药物对预防禽流感有效果的图形是()A .B .C .D .16.千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”⋯⋯小波同学为了验证“日落云里走,雨在半夜后”,观察了所在地区A 的100天日落和夜晚天气,得到如下22⨯列联表:临界值表并计算得到219.05K ≈,下列小波对地区A 天气判断不正确的是()A .夜晚下雨的概率约为12B .未出现“日落云里走”夜晚下雨的概率约为514C .有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关D .出现“日落云里走”,有99.9%的把握认为夜晚会下雨 17.有关独立性检验的四个命题,其中不正确的是()A .两个变量的22⨯列联表中,对角线上数据的乘积相差越大,说明两个变量有关系成的可能性就越大B .对分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,“X 与Y 有关系”的可信程度越小C .从独立性检验可知:有95%把握认为秃顶与患心脏病有关,我们说某人秃顶,那么他有95%可能患有心脏病D .从独立性检验可知:有99%把握认为吸烟与患肺癌有关,是指在犯错误的概率不超过1%前提下认为吸烟与患肺癌有关18.为了调查患胃病是否与生活不规律有关,在患胃病与生活不规律这两个分类变量的计算中,下列说法正确的是()A .k 越大,“患胃病与生活不规律没有关系”的可信程度越大.B .k 越大,“患胃病与生活不规律有关系”的可信程度越小.C .若计算得23.918K ≈,经查临界值表知2( 3.841)0.05P K ≈…,则在100个生活不规律的人中必有95人患胃病.D .从统计量中得知有95%的把握认为患胃病与生活不规律有关,是指有5%的可能性使得推断出现错误. 二.填空题(共3小题)19.2020年12月31日,国务院联防联控机制发布,国药集团中国生物的新冠病毒灭活疫苗已获国家药监局批准附条件上市.在新冠病毒疫苗研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对某种新冠病毒疫苗进行实验,得到如下22⨯列联表(部分数据缺失):表中a的值为;计算可知,在犯错误的概率最多不超过的前提下,可认为“给基因编辑小鼠注射该种疫苗能起到预防新冠病毒感染的效果”.参考公式:22()()()()()n a d b cKa b c d a c b d-=++++,n a b c d=+++.参考数据:20.在西非“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:附:22()()()()()n a d b cKa b c d a c b d-=++++根据上表,有的把握认为“小动物是否被感染与服用疫苗有关”21.某学生为了研究高二年级同学的体质健康成绩与学习成绩的关系,从高二年级同学中随机抽取30人,统计其体质健康成绩和学习成绩,得到22⨯列联表如表:有 的把握认为学生的体质健康成绩高低与学习成绩高低有关. 附:22()()()()()n a d b c Ka b c d a c b d -=++++.三.解答题(共5小题)22.某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:)m in 绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m ,并将完成生产任务所需时间超过m 和不超过m 的工人数填入下面的列联表:(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:22()()()()()n a d b c Ka b c d a c b d -=++++,23.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:)k g ,其频率分布直方图如图:(1)设两种养殖方法的箱产量相互独立,记A 表示事件“旧养殖法的箱产量低于50kg ,新养殖法的箱产量不低于50kg ”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01). 附:22()()()()()n a d b c K a b c d a c b d -=++++.24.某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:22()()()()()n a d b cKa b c d a c b d-=++++.25.某高校共有学生15000人,其中男生10500人,女生4500人.为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率.(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.附:22()()()()()n a d b cKa b c d a c b d-=++++.26.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的22⨯列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:22()()()()()n a d b c Ka b c d a c b d -=++++独立性检验精选题26道参考答案与试题解析一.选择题(共18小题)1.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由22()()()()()n a d b cKa b c d a c b d-=++++算得,22110(40302020)7.860506050K⨯⨯-⨯=≈⨯⨯⨯.参照附表,得到的正确结论是()A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动与性别有关”D.有99%以上的把握认为“爱好该项运动与性别无关”【分析】题目的条件中已经给出这组数据的观测值,我们只要把所给的观测值同节选的观测值表进行比较,发现它大于6.635,得到有99%以上的把握认为“爱好这项运动与性别有关”.【解答】解:由题意算得,22110(40302020)7.860506050K⨯⨯-⨯=≈⨯⨯⨯.7.8 6.635>,∴有0.011%=的机会错误,即有99%以上的把握认为“爱好这项运动与性别有关”故选:C.【点评】本题考查独立性检验的应用,这种问题一般运算量比较大,通常是为考查运算能力设计的,本题有创新的地方就是给出了观测值,只要进行比较就可以,本题是一个基础题.2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由22()()()()()n a d b cKa d c d a cb d-=++++算得,22110(40302020)7.860506050K⨯⨯-⨯=≈⨯⨯⨯附表:参照附表,得到的正确结论是()A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”【分析】根据条件中所给的观测值,同题目中节选的观测值表进行检验,得到观测值对应的结果,得到结论有99%以上的把握认为“爱好该项运动与性别有关”.【解答】解:由题意知本题所给的观测值,2 2110(40302020)7.860506050K⨯⨯-⨯=≈⨯⨯⨯7.8 6.635>,∴这个结论有0.011%=的机会说错,即有99%以上的把握认为“爱好该项运动与性别有关”故选:A.【点评】本题考查独立性检验的应用,考查对于观测值表的认识,这种题目一般运算量比较大,主要考查运算能力,本题有所创新,只要我们看出观测值对应的意义就可以,是一个基础题.3.某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用22⨯列联表进行独立性检验,经计算2 6.705K=,则所得到的统计学结论是:有()的把握认为“学生性别与支持该活动没有关系”.附:A.99.9%B.99%C.1%D.0.1%【分析】把观测值同临界值进行比较.得到有99%的把握说学生性别与支持该活动有关系.【解答】解:2 6.705 6.635K=>,对照表格:∴有99%的把握说学生性别与支持该活动有关系,∴有1%的把握说学生性别与支持该活动没有关系,故选:C.【点评】本题考查独立性检验知识,难度不大,属于基础题.4.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是() A.列联表中c的值为30,b的值为35B.列联表中c的值为15,b的值为50C.根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D.根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”【分析】根据成绩优秀的概率求出成绩优秀的学生数,从而求得c和b的值;再根据公式计算相关指数2K的值,比较与临界值的大小,判断“成绩与班级有关系”的可靠性程度.【解答】解:成绩优秀的概率为27,∴成绩优秀的学生数是2105307⨯=,成绩非优秀的学生数是75,20c∴=,45b=,选项A、B错误.又根据列联表中的数据,得到2105(10302045)26.109 3.84155503075K ⨯⨯-⨯=≈>⨯⨯⨯,因此有95%的把握认为“成绩与班级有关系”, 故选:C .【点评】本题考查了独立性检验思想方法,熟练掌握列联表个数据之间的关系及相关指数2K 的计算公式是解题的关键.5.有人认为在机动车驾驶技术上,男性优于女性.这是真的么?某社会调查机构与交警合作随机统计了经常开车的100名驾驶员最近三个月内是否有交通事故或交通违法事件发生,得到下面的列联表:附:22()()()()()n a d b c Ka b c d a c b d -=++++据此表,可得( )A .认为机动车驾驶技术与性别有关的可靠性不足50%B .认为机动车驾驶技术与性别有关的可靠性超过50%C .认为机动车驾驶技术与性别有关的可靠性不足60%D .认为机动车驾驶技术与性别有关的可靠性超过60% 【分析】由表中数据计算观测值,对照临界值得出结论. 【解答】解:由表中数据,计算22100(40103515)0.33670.45555457525K⨯⨯-⨯=≈<⨯⨯⨯,∴认为机动车驾驶技术与性别有关的可靠性不足50%;故选:A .【点评】本题考查独立性检验的应用,关键是理解独立性检验的思路.属中档题. 6.如表是一个22⨯列联表:则表中a ,b 的值分别为()A.94,72B.52,50C.52,74D.74,52【分析】由列联表中数据的关系求得.【解答】解:732152b a=+=+=.a=-=,22522274故选:C.【点评】本题考查了列联表的做法,属于基础题.7.为了调查中学生近视情况,某校150名男生中有80名近视,140名女生中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力() A.平均数B.方差C.回归分析D.独立性检验【分析】这是一个独立性检验应用题,处理本题时要注意根据已知构建方程计算出表格中男性近视与女性近视,近视的人数,并填入表格的相应位置.根据列联表,及2K的计算公式,计算出2K的值,并代入临界值表中进行比较,不难得到答案.【解答】解:分析已知条件,易得如下表格.根据列联表可得:2K,再根据与临界值比较,检验这些中学生眼睛近视是否与性别有关,故利用独立性检验的方法最有说服力.故选:D.【点评】独立性检验,就是要把采集样本的数据,利用公式计算2K的值,比较与临界值的大小关系,来判定事件A与B是否无关的问题.具体步骤:(1)采集样本数据.(2)由公式计算的2K值.(3)统计推断,当2 3.841K>时,有95%的把握说事件A与B有关;当2 6.635K>时,有99%的把握说事件A与B有关;当2 3.841K…时,认为事件A与B是无关的.8.针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的45,女生喜欢抖音的人数占女生人数35,若有95%的把握认为是否喜欢抖音和性别有关则调查人数中男生可能有( )人附表:附:22()()()()()n a d b cKa b c d a c b d-=++++A.20B.40C.60D.30【分析】设男生可能有x人,依题意填写列联表,由2 3.841K>求出x的取值范围,从而得出正确的选项.【解答】解:设男生可能有x人,依题意可得列联表如下;若有95%的把握认为是否喜欢抖音和性别有关,则2 3.841K>,由2242312()255553.841732155x x x x xxKx x x x⋅-⋅==>⋅⋅⋅,解得40.335x>,由题意知0x>,且x是5的整数倍,60∴满足题意.故选:C.【点评】本题考查列联表与独立性检验的应用问题,考查运算求解能力,是基础题.9.2020年2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为( )参考公式附:22()()()()()n a d b c K a b c d a c b d -=++++,其中na b c d=+++.参考数据:A .130B .190C .240D .250【分析】根据题意设男、女生的人数各为5x ,建立22⨯列联表,计算2K ,列不等式组求出x 的取值范围,即可确定满足条件的选项.【解答】解:依题意,设男、女生的人数各为5x ,建立22⨯列联表如下所示:由表中数据,计算2210(423)10557321x x x x x x K x x x x⋅⋅-⋅==⋅⋅⋅,由题可知106.63510.82821x <<,所以139.33510227.388x <<.只有B 符合题意. 故选:B .【点评】本题考查了列联表与独立性检验应用问题,也考查了运算求解能力,是基础题. 10.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的12,男生追星的人数占男生人数的16,女生追星的人数占女生人数的23.若有95%的把握认为是否追星和性别有关,则男生至少有()人参考数据及公式如下:22()()()()()n a d b c Ka b c d a c b d -=++++A .12B .11C .10D .18【分析】设男生人数为x ,依题意填写列联表,计算观测值,列不等式求出x 的取值范围,再根据题意求出男生的人数.【解答】解:设男生人数为x ,依题意可得列联表如下:若在犯错误的概率不超过0.05的前提下认为是否喜欢追星和性别有关,则23.841K >,由2235()326636 3.841822x x x x x K x x x x x ⋅-⋅==>⋅⋅⋅,解得10.24x >,2x ,6x 都为整数,∴若在犯错误的概率不超过0.05的前提下认为是否喜欢追星和性别有关,则男生至少有12人. 故选:A .【点评】本题考查了列联表与独立性检验的应用问题,是基础题.11.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,下列说法中正确的是()A .100个吸烟者中至少有99人患有肺癌B .1个人吸烟,那么这个人有99%的概率患有肺癌C .在100个吸烟者中一定有患肺癌的人D .在100个吸烟者中可能一个患肺癌的人也没有【分析】“吸烟与患肺癌有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,表示有99%的把握认为这个结论成立,与多少个人患肺癌没有关系,得到结论.【解答】解: “吸烟与患肺癌有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,表示有99%的把握认为这个结论成立, 与多少个人患肺癌没有关系, 只有D 选项正确, 故选:D .【点评】本题考查独立性检验的应用,是一个基础题,解题的关键是正确理解有多大把握认为这件事正确,实际上是对概率的理解.12.某校团委对“学生性别与中学生追星是否有关”作了一次调查,利用22⨯列联表,由计算得27.218K ≈,参照如表:得到正确结论是( )A .有99%以上的把握认为“学生性别与中学生追星无关”B .有99%以上的把握认为“学生性别与中学生追星有关”C .在犯错误的概率不超过0.5%的前提下,认为“学生性别与中学生追星无关”D .在犯错误的概率不超过0.5%的前提下,认为“学生性别与中学生追星有关” 【分析】利用已知概率对照表,在2K 大于对应值是认为相关,在小于对应值时不认为相关. 【解答】解:27.218 6.635K ≈>,对应的20()P K k …为0.010,可得有99%以上的把握认为“学生性别与中学生追星有关”, 故选:B .【点评】本题考查了独立性检验的应用问题,考查判断相关性,是基础题目.13.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的12,男生追星的人数占男生人数的16,女生追星的人数占女生人数的23.若有95%的把握认为是否追星和性别有关,则男生至少有( )参考数据及公式如下:22()()()()()n a d b c Ka b c d a c b d -=++++A .12B .11C .10D .18【分析】设男生人数为x ,依题意填写列联表,计算观测值,列不等式求出x 的取值范围,再根据题意求出男生的人数.【解答】解:设男生人数为x ,依题意可得列联表如下:若在犯错误的概率不超过0.05的前提下认为是否喜欢追星和性别有关,则23.841K >,由2235()326663 3.841822xx x x x x K x x x x⨯-⨯==>⨯⨯⨯,解得10.24x>,2x ,6x 都为整数,∴若在犯错误的概率不超过0.05的前提下认为是否喜欢追星和性别有关,则男生至少有12人. 故选:A .【点评】本题考查了列联表与独立性检验的应用问题,属于基础题.14.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如表所示的列联表:。
高中数学统计独立性检验练习题
独立性检验1.某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用2×2列联表进行独立性检验,经计算K2=6.705,则所得到的统计学结论是:有()的把握认为“学生性别与支持该活动没有关系”.P(K2≥k)0.1000.0500.0250.0100.001k 2.7063.8415.0246.63510.828A. 99.9%B. 99%C. 1%D. 0.1%2.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是()A. 100个吸烟者中至少有99人患有肺癌B. 1个人吸烟,那么这人有99%的概率患有肺癌C. 在100个吸烟者中一定有患肺癌的人D. 在100个吸烟者中可能一个患肺癌的人也没有3.某中学兴趣小组为调查该校学生对学校食堂的某种食品喜爱与否是否与性别有关,随机询问了100名性别不同的学生,得到如下的2×2列联表:男生女生总计喜爱 3020 50不喜爱 20 30 50总计 50 50 100附K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)P(K2≥0.150.100.050.0250.010k0)k0 2.072 2.706 3.841 5.024 6.635根据以上数据,该数学兴趣小组有多大把握认为“喜爱该食品与性别有关”?()A. 99%以上B. 97.5%以上C. 95%以上D. 85%以上4.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A表示事件“旧养殖法的箱产量低于50kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量<50kg箱产量≥50kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行比较.P(K2≥K)0.0500.0100.001K 3.841 6.63510.8285.国际奥委会将于2017年9月15日在秘鲁利马召开130次会议决定2024年第33届奥运会举办地,目前德国汉堡,美国波士顿等申办城市因市民担心赛事费用超支而相继退出,某机构为调查我国公民对申办奥运会的态度,选了某小区的100位居民调查结果统计如下:支持不支持合计年龄不大于50岁______ ______ 80年龄大于50岁10______ ______合计______ 70100(1)根据已知数据,把表格数据填写完整;(2)能否在犯错误的概率不超过5%的前提下认为不同年龄与支持申办奥运无关?(3)已知在被调查的年龄大于50岁的支持者中有5名女性,其中2位是女教师,现从这5名女性中随机抽取3人,求至多有1位教师的概率.附:K2=n(ad−bc)2,n=a+b+c+d,(a+b)(c+d)(a+c)(b+d)P(K2>k)0.1000.0500.0250.010k 2.706 3.841 5.024 6.6356.为了解某班学生喜好体育运动是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表:喜好体育运动不喜好体育运动合计______男生______ 5女生10______ ______合计______ ______ 50已知按喜好体育运动与否,采用分层抽样法抽取容量为10的样本,则抽到喜好体育运动的人数为6.(1)请将上面的列联表补充完整;(2)能否在犯错概率不超过0.01的前提下认为喜好体育运动与性别有关?说明你的理由.独立性检验临界值表:P(K2≥k0)0.100.050.0250.010k0 2.7063.8415.0246.6357.某职称晋级评定机构对参加某次专业技术考试的100人的成绩进行了统计,绘制了频率分布直方图(如图所示),规定80分及以上者晋级成功,否则晋级失败.晋级成功晋级失败合计男16女50合计(Ⅰ)求图中a的值;(Ⅱ)根据已知条件完成下面2×2列联表,并判断能否有85%的把握认为“晋级成功”与性别有关?(Ⅲ)将频率视为概率,从本次考试的所有人员中,随机抽取4人进行约谈,记这4人中晋级失败的人数为X,求X的分布列与数学期望E(X).(参考公式:k2=n(ad−bc)2,其中n=a+b+c+d)(a+b)(c+d)(a+c)(b+d)P(K2≥k0)0.400.250.150.100.050.025k00.780 1.323 2.072 2.706 3.841 5.0248.某高校共有学生15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300名学生每周平均体育运动时间的样本数据(单位:小时).(Ⅰ)应收集多少位女生的样本数据?(Ⅱ)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],估计该校学生每周平均体育运动时间超过4小时的概率;(Ⅲ)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”P(K2≥k0)0.100.050.0100.005k0 2.706 3.841 6.6357.879附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)9.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如图:(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50kg,新养殖法的箱产量不低于50kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量<50kg箱产量≥50kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).P(K2≥k)0.0500.0100.001K 3.841 6.63510.828K2=n(ad−bc)2.(a+b)(c+d)(a+c)(b+d)10.通过随机询问某地100名高中学生在选择座位时是否挑同桌,得到如下2×2列联表:男生女生合计挑同桌304070不挑同桌201030总计5050100(1)从这50名男生中按是否挑同桌采取分层抽样的方法抽取一个容量为5的样本,现从这5人中随机选取3人做深度采访,求这3名学生中至少有2名要挑同桌的概率;(2)根据以上2×2列联表,是否有95%以上的把握认为“性别与在选择座位时是否挑同桌”有关?P(K2≥k0)0.100.050.0250.0100.0050.001k0 2.706 3.841 5.024 6.6357.87910.828,其中n=a+b+c+d.参考公式:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)11.某中学拟在高一下学期开设游泳选修课,为了了解高一学生喜欢游泳是否与性别有关,该学校对100名高一新已知在这100人中随机抽取1人抽到喜欢游泳的学生的概率为35.(1)请将上述列联表补充完整;(2)并判断是否有99.9%的把握认为喜欢游泳与性别有关?并说明你的理由;(3)已知在被调查的学生中有5名来自甲班,其中3名喜欢游泳,现从这5名学生中随机抽取2人,求恰好有1人喜欢游泳的概率.下面的临界值表仅供参考:(参考公式:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d)12.某校卫生所成立了调查小组,调查“按时刷牙与不患龋齿的关系”,对该校某年级800名学生进行检查,按患龋齿和不患龋齿分类,得汇总数据:按时刷牙且不患龋齿的学生有160 名,不按时刷牙但不患龋齿的学生有100 名,按时刷牙但患龋齿的学生有 240 名.(1)该校4名校卫生所工作人员甲、乙、丙、丁被随机分成两组,每组 2 人,一组负责数据收集,另一组负责数据处理,求工作人员甲乙分到同一组的概率.(2)是否有99.9%的把握认为该年级学生的按时刷牙与不患龋齿有关系?附:k2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)13.为使政府部门与群众的沟通日常化,某城市社区组织“网络在线问政”活动.2015年,该社区每月通过问卷形式进行一次网上问政;2016年初,社区随机抽取了60名居民,对居民上网参政议政意愿进行调查.已知上网参与问政次数与参与人数的频数分布如表:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)(1)若将参与调查问卷不少于4次的居民称为“积极上网参政居民”,请你根据频数分布表,完成2×2列联表,99%3人为2男1女的概率.14. 近年来,手机已经成为人们日常生活中不可缺少的产品,手机的功能也日趋完善,已延伸到了各个领域,如拍照,聊天,阅读,缴费,购物,理财,娱乐,办公等等,手机的价格差距也很大,为分析人们购买手机的消费情况,现对某小区随机抽取了200人进行手机价格的调查,统计如下:0.025的前提下,认为人们使用手机的价格和年龄有关?(Ⅱ)如果用分层抽样的方法从样本手机价格在5000元及以上的人群中选择5人调查他的收入状况,再从这5人中选3人,求3人的年龄都在45岁及以下的概率. 附K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)15. 高中生在被问及“家,朋友聚集的地方,个人空间”三个场所中“感到最幸福的场所在哪里?”这个问题时,从中国某城市的高中生中,随机抽取了55人,从美国某城市的高中生中随机抽取了45人进行答题.中国高中生答题情况是:选择家的占25、朋友聚集的地方占310、个人空间占310.美国高中生答题情况是:朋友聚集的地方占35、家占15、个人空间占15.(Ⅰ)请根据以上调查结果将下面2×2列联表补充完整;并判断能否有95%的把握认为“恋家(在家里感到最幸福)”与国别有关;4人中随机抽取2人到中国交流学习,求2人中含有在“个人空间”感到幸福的学生的概率. 附:k 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),其中n =a +b +c +d .16.为调查了解某省属师范大学师范类毕业生参加工作后,从事的工作与教育是否有关的情况,该校随机调查了该校80位性别不同的2016年师范类毕业大学生,得到具体数据如表:(n=a+b+c+d).参考公式:k2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)(3)以(2)中的频率作为概率.该校近几年毕业的2000名师范类大学生中随机选取4名,记这4名毕业生从事与教育有关的人数为X,求X的数学期望E(X).17.为了解少年儿童的肥胖是否与常喝碳酸饮料有关,现对30名六年级学生进行了问卷调查,得到如下列联表(平均每天喝500ml以上为常喝,体重超过50kg为肥胖):.已知在全部30人中随机抽取1人,抽到肥胖的学生的概率为415(Ⅰ)请将上面的列联表补充完整;(Ⅱ)是否有99.5%的把握认为肥胖与常喝碳酸饮料有关?说明你的理由;(参考公式:K2=n(ad−bc)2,其中n=a+b+c+d)(a+b)(c+d)(a+c)(b+d)18.为了解某地区观众对大型综艺活动《中国好声音》的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众收看该节目的场数与所对应的人数表:95%的把握认为“歌迷”与性别有关?2名女性,若从“超级歌迷”中任意选取2人,求至少有1名女性观众的概率..附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)19.2017年3月27日,一则“清华大学要求从2017级学生开始,游泳达到一定标准才能毕业”的消息在体育界和教育界引起了巨大反响.游泳作为一项重要的求生技能和运动项目受到很多人的喜爱.其实,已有不少高校将游泳列为必修内容.某中学为了解2017届高三学生的性别和喜爱游泳是否有关,对100名高三学生进行了问卷调查,得到如下列联表:.已知在这100人中随机抽取1人,抽到喜欢游泳的学生的概率为35(Ⅰ)请将上述列联表补充完整;(Ⅱ)判断是否有99.9%的把握认为喜欢游泳与性别有关?附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)。
高中数学同步学案 独立性检验
1.1独立性检验[对应学生用书P2]相互独立事件从分别写有1,2,3,4,5,6的6张卡片中任意抽取一张,设事件A =“抽出的是写有偶数的卡片”,B =“抽出的是写有3的倍数的卡片”.问题1:计算P(A),P(B). 提示:P(A)=36=12,P(B)=26=13.问题2:把事件A,B 同时发生记作AB,计算P(AB). 提示:P(AB)=16.问题3:P(A),P(B),P(AB)之间有什么关系? 提示:P(AB)=P(A)·P(B).1.定义一般地,对于两个事件A,B,如果有P(AB)=P(A)P(B),就称事件A与B相互独立,简称A与B独立.2.性质当事件A与B独立时,事件A与B,A与B,A与B也独立.3.定义的推广如果有P(A1A2…A n)=P(A1)P(A2)…P(A n),则称事件A1,A2,A3,…,A n相互独立.独立性检验1.2×2列联表B B合计A n11n12n1+A n21n22n2+合计n+1n+2n其中:n+1=n11+n21,n+2=n12+n22,n1+=n11+n12,n2+=n21+n22,n=n11+n21+n12+n22.2.独立性检验(1)χ2统计量的表达式χ2=n n11n22-n12n212n1+n2+n+1n+2.(2)经过对χ2统计量分布的研究,已经得到了两个临界值:3.841与6.635①当χ2>3.841时,有95%的把握说事件A与B有关;②当χ2>6.635时,有99%的把握说事件A与B有关;③当χ2≤3.841时,认为事件A与B是无关的.1.事件的独立性,A与B,A与B,A与B,A与B只要有一对相互独立,其余三对必然也相互独立.2.在列联表中,如果两个事件没有关系,则应有n11n22-n12n21≈0,因此|n11n22-n12n21|越小,说明两个事件之间关系越弱;|n11n22-n12n21|越大,说明两个事件之间关系越强.3.利用χ2进行独立性检验,可以对推断的正确性的概率作出估计,样本容量n越大,这个估计值越准确.如果抽取的样本容量很小,那么利用χ2进行独立性检验的结果就不具有可靠性.[对应学生用书P3]事件的独立性[例1] 一个家庭中有若干个小孩,假设生男孩和生女孩是等可能的,设A ={一个家庭中有男孩,又有女孩},B ={一个家庭中最多有一个女孩}.对下列两种情形讨论事件A 与事件B 的独立性.(1)家庭中有两个小孩; (2)家庭中有三个小孩.[思路点拨] 利用P(AB)与P(A)P(B)是否相等来判定.[精解详析] (1)有两个小孩的家庭,对应的样本空间Ω={(男,男),(男,女),(女,男),(女,女)},有4个基本事件,每个基本事件发生的概率均为14,这时A ={(男,女),(女,男)},B ={(男,男),(男,女),(女,男)} AB ={(男,女),(女,男)}, 于是P(A)=12,P(B)=34,P(AB)=12.由此可知P(AB)≠P(A)P(B),所以事件A 与事件B 不相互独立.(2)有三个小孩的家庭,样本空间为Ω={(男,男,男),(男,男,女),(男,女,男),(女,男,男),(男,女,女),(女,男,女),(女,女,男),(女,女,女)},由等可能性知,每个基本事件发生的概率均为18,这时A 中有6个基本事件,B 中有4个基本事件,AB 中含有3个基本事件, 于是P(A)=68=34,P(B)=48=12,P(AB)=38.P (A)P(B)=38,即P(AB)=38=P(A)P(B)成立,所以事件A 与事件B 是相互独立的.[一点通] 事件A 与事件B 相互独立的检验,应充分利用相互独立的定义,验证P(AB)与P(A)P(B)是否相等,若相等则相互独立;若不相等,则不相互独立.解决这一类问题,关键在于准确求出基本事件空间中的基本事件总数,确定事件A 与事件B 的概率.另一个关键点是正确理解题意,分析出事件AB 中的基本事件的个数,求出P(AB),即事件A 与事件B 同时发生的概率.1.从一副52张的扑克牌(不含大小王)中,任意抽出一张,设事件A :“抽到黑桃”,B :“抽到皇后Q”,事件A 与B 及A 与B 是否独立?解:从52张扑克牌中任意抽出一张的基本事件空间Ω中的基本事件总数为52, 事件A“抽到黑桃”的基本事件数为13,所以P(A)=1352=14. 事件B“抽到皇后Q”的基本事件数为4,所以P(B)=452=113.事件AB 为“抽到黑桃Q”,则P(AB)=152,所以P(AB)=P(A)P(B),即有152=14×113, 因此A 与B 相互独立.P(A )=3952=34,P(B )=4852=1213,P(A B )=3652=913,P(A )P(B )=34×1213=913,因此P(A B )=P(A )P(B ). 因此,A 与B 相互独立.2.甲、乙两名篮球运动员分别进行一次投篮,如果两人投中的概率都是0.6.计算: (1)两人都投中的概率; (2)其中恰有一人投中的概率.解:设A =“甲投篮一次,投中”,B =“乙投篮一次,投中”. (1)AB ={两人各投篮一次,都投中},由题意知,事件A 与B 相互独立, 所以P(AB)=P(A)·P(B)=0.6×0.6=0.36.(2)事件“两人各投篮一次,恰好有一人投中”包括两种情况:一种是甲投中,乙未投中(事件A B 发生),另一种是甲未投中,乙投中(事件A B 发生).根据题意,这两种情况在各投篮一次时不可能同时发生,即事件A B 与A B 互斥,并且A 与B ,A 与B 各自相互独立,因而所求概率为P(A B )+P(A B)=P(A)·P(B )+P(A )·P(B)=0.6×(1-0.6)+(1-0.6)×0.6=0.48.独立性检验的应用[例2] (12分)下表是某地区的一种传染病与饮用水的调查表:得病 不得病 合计 干净水 52 466 518 不干净水 94 218 312 合计146684830(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;(2)若饮用干净水得病的有5人,不得病的有50人,饮用不干净水得病的有9人,不得病的有22人.按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异.[精解详析] (1)由公式得: χ2=830×52×218-466×942146×684×518×312≈54.21.∵54.21>6.635,所以有99%的把握说该地区这种传染病与饮用不干净水有关.(6分) (2)依题意得2×2列联表:得病 不得病 合计 干净水 5 50 55 不干净水 9 22 31 合计147286(8分)此时,χ2=86×5×22-50×9214×72×55×31≈5.785.(10分)因为5.785>3.841,所以我们有95%的把握认为该种疾病与饮用不干净水有关.两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但(1)中我们有99%的把握肯定结论的正确性,(2)中我们只有95%的把握肯定.(12分)[一点通] 解决独立性检验问题的基本步骤是:①根据相关数据,作列联表;②求χ2的值;③将χ2与临界值作比较,得出事件有关的可能性大小.3.为了调查某生产线上某质量监督员甲在与不在对产品质量好坏有无影响,现统计数据如下:质量监督员甲在现场时,990件产品中合格品有982件,次品有8件;甲不在现场时,510件产品中合格品有493件,次品有17件.试列出其2×2列联表.解:根据题目所给的数据作出如下的列联表:产品正品数次品数 合计 甲在现场 982 8 990 甲不在现场493 17 510 合计1 475251 5004.在调查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,用独立性检验的方法来判断色盲与性别是否有关,你所得到的结论在什么范围内有效?解:由题意作出如下的列联表:色盲 非色盲 合计 男 38 442 480 女 6 514 520 合计449561 000将列联表中所给的数据,χ2=n n 11n 22-n 12n 212n 1+n 2+n +1n +2,得χ2=1 000×38×514-6×4422480×520×44×956≈27.1.由于χ2≈27.1>6.635,所以我们有99%的把握认为性别与患色盲有关系.这个结论只对所调查的480名男人和520名女人有效.5.同时抛掷两颗均匀的骰子,请回答以下问题: (1)求两颗骰子都出现2点的概率;(2)若同时抛掷两颗骰子180次,其中甲骰子出现20次2点,乙骰子出现30次2点,问两颗骰子出现2点是否相关?解:(1)每颗骰子出现2点的概率都为16,由相互独立事件同时发生的概率公式得两颗骰子都出现2点的概率为16×16=136.(2)依题意,列2×2列联表如下:出现2点 出现其他点合计 甲骰子 20 160 180 乙骰子 30 150 180 合计50310360由公式计算得χ2=360×20×150-160×30250×310×180×180≈2.323.因为2.323<3.841,因此我们没有理由说两颗骰子出现2点相关.1.若事件A 与B 相互独立,则P(AB)=P(A)P(B),即可用P(AB)=P(A)P(B)来求相互独立事件同时发生的概率.2.独立性检验的步骤[对应学生用书P5]1.甲、乙两人分别对一目标射击一次,记“甲射击一次,击中目标”为事件A,“乙射击一次,击中目标”为事件B,则在A与B,A与B,A与B,A与B中,满足相互独立的有( )A.1对B.2对C.3对D.4对解析:由已知:A与B相互独立,则A与B,A与B,A与B均相互独立,故有4对.答案:D2.下面是2×2列联表:则表中a,b的值分别为( )A.94,96 B.52,50C.52,54 D.54,52解析:∵a+21=73,∴a=52.又∵a+2=b,∴b=54.答案:C3.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.则下面的2×2列联表中n12和n+2的值分别是( )A.474,956 B.442,956C.38,44 D.514,994解析:n12=480-n11=480-38=442,n+2=1 000-38-6=956.答案:B4.博士生和硕士生毕业情况的一个随机样本给出了关于所获取的学位类别与学生性别的分类数据如下表.由表中的数据,可得( )硕士博士合计男162 27 189女143 8 151合计305 35 340A.性别与获取学位类别有关B.性别与获取学位类别无关C.性别决定获取学位的类别D.以上说法都不正确解析:χ2=162×8-143×272×340305×35×189×151≈7.34>6.635,所以有99%的把握认为性别与获取学位类别有关.而选项C中的表述不恰当,因为性别与获取学位类别不是因果关系,只是统计学上的一种非确定性关系,故不能用“决定”二字描述.答案:A5.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算χ2=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是的.(有关、无关).解析:∵χ2=27.63,∴χ2>6.635.∴有理由认为打鼾与患心脏病是有关的.答案:有关6.在某段时间内,甲地下雨的概率为0.3,乙地下雨的概率为0.4,假设在这段时间内两地是否下雨相互之间没有影响,则这段时间内,甲、乙两地都不下雨的概率为.解析:设A=“甲地下雨”,B=“乙地下雨”,则P(A)=0.3,P(B)=0.4,P(A)=0.7,P(B)=0.6,且A,B相互独立,故所求概率为P(A B)=P(A)P(B)=0.7×0.6=0.42.答案:0.427.已知甲、乙两袋中分别装有编号为1,2,3,4的四个小球,现从两袋中各取一球,设事件A=“两球的编号都是偶数”,B=“两球的编号之和大于6”.判断事件A,B是否相互独立.解:P(A)=416=14,P(B)=316.又AB=“两球的编号都为4”,P(AB)=1 16 .显然P(AB)≠P(A)P(B), 所以事件A,B 不独立.8.在对人们休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人.女性中有44人主要的休闲方式是看电视,另外26人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.(1)根据以上数据建立一个2×2列联表; (2)判断性别与休闲方式是否有关系. 解:(1)由题意得2×2列联表如下.看电视 运动 合计 女 44 26 70 男 21 33 54 合计6559124(2)由(1)中表格所给数据,代入公式得 χ2=124×44×33-26×21265×59×70×54≈7.021>6.635,所以我们有99%的把握认为性别与休闲方式有关.。
高中数学【统计与统计案例】专题练习
高中数学【统计与统计案例】专题练习1.(多选)下列统计量中,能度量样本x 1,x 2,…,x n 的离散程度的是( ) A.样本x 1,x 2,…,x n 的标准差 B.样本x 1,x 2,…,x n 的中位数 C.样本x 1,x 2,…,x n 的极差 D.样本x 1,x 2,…,x n 的平均数 答案 AC解析 由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义可知,中位数考查的是数据的集中趋势;由极差的定义可知,极差考查的是数据的离散程度;由平均数的定义可知,平均数考查的是数据的集中趋势;故选AC.2.某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下: 旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7 新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为x -和y -,样本方差分别记为s 21和s 22. (1)求x -,y -,s 21,s 22;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y --x -≥2s 21+s 2210,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).解 (1)x -=9.8+10.3+10.0+10.2+9.9+9.8+10.0+10.1+10.2+9.710=10,y -=10.1+10.4+10.1+10.0+10.1+10.3+10.6+10.5+10.4+10.510=10.3,s 21=0.22+0.32+0+0.22+0.12+0.22+0+0.12+0.22+0.3210=0.036,s 22=0.22+0.12+0.22+0.32+0.22+0+0.32+0.22+0.12+0.2210=0.04. (2)由(1)知,y --x -=0.3; 2s 21+s 2210=20.036+0.0410=20.007 6.又(y --x -)2=0.09>(20.007 6)2=0.030 4,则y --x ->2s 21+s 2210,所以新设备生产产品的该项指标的均值较旧设备有显著提高.3.某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i =1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得∑20i =1x i =60,∑20i =1y i =1 200,∑20i =1(x i -x -)2=80,∑20i =1(y i-y -)2=9 000,∑20i =1(x i -x -)(y i -y -)=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i )(i =1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r =∑ni =1 (x i -x -)(y i -y -)∑n i =1(x i -x -)2∑n i =1 (y i -y -)2,2≈1.414.解 (1)由已知得样本平均数y -=120∑20i =1y i =60,从而该地区这种野生动物数量的估计值为60×200=12 000.(2)样本(x i ,y i )(i =1,2,…,20)的相关系数r =∑20i =1 (x i -x -)(y i -y -)∑20i =1(x i -x -)2∑20i =1(y i -y -)2=80080×9 000=223≈0.94.(3)分层随机抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层随机抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关性.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层随机抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.1.抽样方法抽样方法包括简单随机抽样、分层随机抽样,两种抽样方法都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范围. 2.统计中的五个数据特征(1)众数:在样本数据中,出现次数最多的那个数据.(2)中位数:在样本数据中,将数据按大小顺序排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数. (3)平均数:样本数据的算术平均数,即x -=1n (x 1+x 2+…+x n ).(4)第p 百分位数:将一组数据(共n 个)按从小到大排列,计算i =n ×p %,若i 不是整数,而大于i 的比邻整数为j ,则第p 百分位数为第j 项数据;若i 是整数,则第p 百分位数为第i 项与第(i +1)项数据的平均数.(5)方差与标准差.s 2=1n [(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2],s =1n [(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2].3.频率分布直方图的两个结论 (1)小长方形的面积=组距×频率组距=频率. (2)各小长方形的面积之和等于1. 4.回归分析与独立性检验(1)回归直线y ^=b ^x +a ^经过样本点的中心(x -,y -),若x 取某一个值代入回归直线方程y ^=b ^x +a ^中,可求出y 的估计值. (2)独立性检验对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是:X Y 合计 y 1 y 2 x 1 a b a +b x 2 c d c +d 合计a +cb +dn则χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )(其中n =a +b +c +d 为样本容量).热点一 用样本估计总体考向1 数字特征与统计图表的应用【例1】 (1)空气质量指数分为六级,指数越大说明污染的情况越严重,对人体危害越大,其中指数范围[0,50],[51,100],[101,150],[151,200],[201,300]分别对应“优”“良”“轻度污染”“中度污染”“重度污染”五个等级.如图是某市连续14天的空气质量指数趋势图,下列说法不正确的是( )A.这14天中有4天空气质量为“良”B.这14天中空气质量指数的中位数是103C.从2日到5日空气质量越来越差D.连续三天中空气质量指数方差最小的是9日到11日(2)2020年我国突发新冠肺炎疫情,疫情期间中小学生“停课不停学”.已知某地区中小学生人数情况如甲图所示,各学段学生在疫情期间“家务劳动”的参与率如乙图所示.为了进一步了解该地区中小学生参与“家务劳动”的情况,现用分层随机抽样的方法抽取4%的学生进行调查,则抽取的样本容量、抽取的高中生中参与“家务劳动”的人数分别为()A.2 750,200B.2 750,110C.1 120,110D.1 120,200答案(1)B(2)C解析(1)在这14天中,1日、3日、12日、13日的空气质量为良,共4天,故A正确.14天中空气质量指数的中位数为86+1212=103.5,故B错误.从2日到5日,空气质量指数越来越高,故空气质量越来越差,C正确.观察题图可得,9日至11日空气质量指数偏差最小,因此方差最小,D正确.综上知,说法不正确的是B.(2)学生总数为15 500+5 000+7 500=28 000(人),由于抽取4%的学生进行调查,则抽取的样本容量为28 000×4%=1 120.故高中生应抽取的人数为5 000×4%=200,而抽取的高中生中参与“家务劳动”的比率为0.55,故抽取的高中生中参与“家务劳动”的人数为200×0.55=110.探究提高 1.解题的关键是理解统计图表的含义,从中提取数字信息,平均数、众数、中位数描述数据的集中趋势,方差与标准差描述数据的波动大小,标准差、方差越小,数据的离散程度越小,越稳定.2.进行分层随机抽样的相关计算时,常用到的两个关系:(1)样本容量n总体的个数N=该层抽取的个体数该层的个体数;(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.【训练1】(1)以下数据为参加数学竞赛决赛的15人的成绩:(单位:分)78,70,72,86,88,79,80,81,94,84,56,98,83,90,91,则这15人成绩的第80百分位数是()A.90B.90.5C.91D.91.5(2)(多选) 2020年上半年,中国养猪企业受猪价高位的利好影响,大多收获史上最佳半年报业绩,部分企业半年报营业收入同比增长超过1倍.某养猪场抓住机遇,加大了生猪养殖规模,为了检测生猪的养殖情况,该养猪场对2 000头生猪的体重(单位:kg)进行了统计,得到如图所示的频率分布直方图,则下列说法正确的是()A.这2 000头生猪体重的众数为160 kgB.这2 000头生猪中体重不低于200 kg的有80头C.这2 000头生猪体重的中位数落在区间[140,160)内D.这2 000头生猪体重的平均数为152.8 kg答案(1)B(2)BCD解析(1)把成绩按从小到大的顺序排列为:56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,因为15×80%=12,所以这15人成绩的第80百分位数是90+912=90.5.(2)由频率分布直方图可知,[140,160)这一组的数据对应的小长方形最高,所以这2 000头生猪的体重的众数为150 kg,A错误;这2 000头生猪中体重不低于200 kg的有0.002×20×2 000=80(头),B正确;因为生猪的体重在[80,140)内的频率为(0.001+0.004+0.01)×20=0.3,在[140,160)内的频率为0.016×20=0.32,且0.3+0.32=0.62>0.5,所以这2 000头生猪体重的中位数落在区间[140,160)内,C正确;这2 000头生猪体重的平均数为(0.001×90+0.004×110+0.01×130+0.016×150+0.012×170+0.005×190+0.002×210)×20=152.8(kg),D正确.考向2用样本的频率分布估计总体分布【例2】为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解(1)由已知得0.70=a+0.20+0.15,故a=0.35,b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.探究提高 1.平均数与方差都是重要的数字特征,是对数据的一种简明描述,它们所反映的情况有着重要的实际意义.2.在例2中,抓住频率分布直方图各小长方形的面积之和为1,这是求解的关键;本题易混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错.【训练2】(多选)为了更好地支持中小型企业的发展,某市决定对部分企业的税收进行适当的减免,现调查了当地100家中小型企业年收入(单位:万元)情况,并根据所得数据画出了如图所示的频率分布直方图,则下列结论正确的是()A.样本在区间[500,700]内的频数为18B.如果规定年收入在300万元以内的企业才能享受减免税收政策,估计有30%的当地中小型企业能享受到减免税收政策C.样本的中位数大于350万元D.可估计当地中小型企业年收入的平均数超过400万元(同一组中的数据用该组区间的中点值作代表)答案ABC解析依题意,(0.001+0.002+0.002 6×2+a+0.000 4)×100=1,所以a=0.001 4.对于A,样本在[500,700]内的频率为(0.001 4+0.000 4)×100=0.18,故频数为0.18×100=18,故A正确.对于B,年收入在300万元以内的频率为(0.001+0.002)×100=0.3,故B正确. 对于C,设样本的中位数为x,易知中位数位于[300,400]内,则0.3+(x-300)×0.002 6=0.5,解得x≈376.9,376.9>350,故C正确.因为样本的平均数为150×0.1+250×0.2+350×0.26+450×0.26+550×0.14+650×0.04=376<400,所以估计当地中小型企业年收入的平均数小于400万元,故D 错误. 热点二 回归分析【例3】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响,对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据进行了初步处理,得到如图所示散点图及一些统计量的值.x -y -w -∑8i =1(x i -x -)2∑8i =1(w i -w -)2∑8i =1(x i -x -)·(y i -y -) ∑8i =1(w i -w -)·(y i -y -) 46.65636.8289.8 1.61 469108.8表中w i =x i ,w -=18∑8i =1w i .(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个更适宜作为年销售量y 关于年宣传费x 的回归方程?(给出判断即可,不必说明理由) (2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程.(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题:①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为:β^=∑ni =1(u i -u -)(v i -v -)∑n i =1(u i -u -)2,α^=v --β^u -.解 (1)由散点图可以判断,y =c +d x 更适宜作为年销售量y 关于年宣传费x 的回归方程.(2)易知w =x ,则y ^=d ^w +c ^.由题意得d ^=∑8i =1(w i -w -)(y i -y -)∑8i =1(w i -w -)2=108.81.6=68,所以c ^=y --d ^w -=563-68×6.8=100.6.所以y 关于w 的线性回归方程为y ^=100.6+68w , 所以y 关于x 的回归方程为y ^=100.6+68x .(3)①由(2)知,当x =49时,年销售量y 的预报值为y ^=100.6+6849=576.6,年利润z 的预报值为z ^=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z 的预报值z ^=0.2(100.6+68x )-x =-x +13.6x +20.12,所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大. 探究提高 1.求回归直线方程的关键及实际应用 (1)关键:正确理解b ^,a ^的计算公式并准确地计算.(2)实际应用:在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值. 2.相关系数(1)当r >0时,表明两个变量正相关;当r <0时,表明两个变量负相关. (2)当|r |>0.75时,认为两个变量具有较强的线性相关关系.【训练3】 (多选)我国5G 技术研发试验在2016~2018年进行,分为5G 关键技术试验、5G 技术方案验证和5G 系统验证三个阶段.2020年初以来,5G 技术在我国已经进入高速发展的阶段,5G 手机的销量也逐渐上升.某手机商城统计了2021年5个月5G 手机的实际销量,如下表所示:若y 与x 线性相关,且求得线性回归方程为y ^=45x +5,则下列说法正确的是( ) A.a =142 B.y 与x 正相关C.y 与x 的相关系数为负数D.2021年7月该手机商城的5G 手机销量约为365部 答案 AB解析 x -=1+2+3+4+55=3,y -=50+96+a +185+2275=558+a 5,因为点(x -,y -)在回归直线上,所以558+a5=45×3+5,解得a =142,所以选项A 正确;从表格数据看,y 随x 的增大而增大,所以y 与x 正相关,所以选项B 正确;因为y 与x 正相关,所以y 与x 的相关系数为正数,所以选项C 错误;2021年7月对应的月份编号x =7,当x =7时,y ^=45×7+5=320,所以2021年7月该手机商城的5G 手机销量约为320部,所以选项D 错误.故选AB.热点三 独立性检验【例4】 为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO 2浓度(单位:μg/m 3),得下表:(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO 2浓度不超过150”的概率;(2)根据所给数据,完成下面的2×2列联表:(3)根据(2)中的列联表,依据小概率值α=0.01的χ2独立性检验,能否认为该市一天空气中PM2.5浓度与SO 2浓度有关? 附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),解 (1)根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且SO 2浓度不超过150的天数为32+18+6+8=64,因此,该市一天空气中PM2.5浓度不超过75,且SO 2浓度不超过150的概率的估计值为64100=0.64. (2)根据抽查数据,可得2×2列联表:(3)零假设为H 0:该市一天空气中PM2.5浓度与SO 2浓度无关.根据(2)的列联表得χ2=100×(64×10-16×10)280×20×74×26≈7.484>6.635=x 0.01.根据小概率值α=0.01的χ2独立性检验,我们推断H 0不成立,即认为该市一天空气中PM2.5浓度与SO 2浓度有关,此推断犯错误的概率不超过0.01. 探究提高 1.独立性检验的一般步骤 (1)根据样本数据列成2×2列联表; (2)根据公式χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),计算χ2的值;(3)查表比较χ2与临界值的大小关系,作统计判断.2.χ2的值越大,对应假设事件H 0成立(两类变量相互独立)的概率越小,H 0不成立的概率越大.【训练4】 甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)依据小概率值α=0.01的χ2独立性检验,能否认为甲机床的产品质量与乙机床的产品质量有差异?附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),α 0.050 0.010 0.001 x α3.8416.63510.828解 (1)根据2×2列联表知:甲机床生产的产品中一级品的频率为150200=75%, 乙机床生产的产品中一级品的频率为120200=60%.(2)零假设为H 0:甲机床的产品质量与乙机床的产品质量没有差异.由2×2列联表,得χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=400×(150×80-120×50)2270×130×200×200=40039≈10.256>6.635=x 0.01.根据小概率值α=0.01的χ2独立性检验,我们推断H 0不成立,即认为甲机床的产品质量与乙机床的产品质量有差异,此推断犯错误的概率不超过0.01.一、选择题1.设一组样本数据x 1,x 2,…,x n 的方差为0.01,则数据10x 1,10x 2,…,10x n 的方差为( ) A.0.01 B.0.1 C.1 D.10答案 C解析 10x 1,10x 2,…,10x n 的方差为102×0.01=1.2.为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为y ^=b ^x +a ^.已知∑10i =1x i =225,∑10i =1y i =1 600,b ^=4.该班某学生的脚长为24,据此估计其身高为( ) A.160 B.163 C.166 D.170答案 C解析 ∵x -=110∑10i =1x i =110×225=22.5,y -=110∑10i =1y i=160, ∴a ^=y --b ^x -=160-4×22.5=70, ∴回归直线方程为y ^=4x +70. 因此估计其身高y ^=4×24+70=166.3.从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( )A.10B.18C.20D.36答案 B解析 因为直径落在区间[5.43,5.47)内的频率为0.02×(6.25+5.00)=0.225,所以零件的个数为0.225×80=18.4.某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A 点表示十月的平均最高气温约为15 ℃,B 点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是()A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个答案 D解析由雷达图易知A,C正确;七月的平均最高气温超过20 ℃,平均最低气温约为12 ℃,一月的平均最高气温约为6 ℃,平均最低气温约为2 ℃,所以七月的平均温差比一月的平均温差大,B正确;由雷达图知平均最高气温超过20 ℃的月份有3个月,D错误.5.(多选) 5G时代已经到来,5G的发展将直接带动包括运营、制造、服务在内的通信行业整体的快速发展,进而对GDP增长产生直接贡献,并通过产业间的关联效应,间接带动国民经济各行业的发展,创造出更多的经济增加值.如图,某单位结合近年数据,对今后几年的5G经济产出作出预测.由上图提供的信息可知()A.运营商的经济产出逐年增加B.设备制造商的经济产出前期增长较快,后期放缓C.设备制造商在各年的总经济产出中一直处于领先地位D.信息服务商与运营商的经济产出的差距有逐步拉大的趋势 答案 ABD解析 对于A ,由图知,运营商的经济产出逐年增加,故A 正确;对于B ,由图知,设备制造商的经济产出在2020~2023年间增长较快,后几年增长逐渐趋于平缓,故B 正确;对于C ,由图可知,设备制造商在各年的总经济产出中在前期处于领先地位,而后期是信息服务商处于领先地位,故C 错误;对于D ,由图知,在2020~2025年间信息服务商与运营商的经济产出的差距不大,后几年中信息服务商的经济产出增长速度明显高于运营商的经济产出增长速度,两者间的差距有逐步拉大的趋势,故D 正确.综上所述,选ABD.6.已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x -,方差为s 2,则( )A.x -=4,s 2<2B.x -=4,s 2>2 C.x ->4,s 2<2 D.x ->4,s 2>2答案 A解析 ∵某7个数的平均数为4,∴这7个数的和为4×7=28.∵加入一个新数据4,∴x -=28+48=4.又∵这7个数的方差为2,且加入一个新数据4,∴这8个数的方差s 2=7×2+(4-4)28=74<2,故选A.二、填空题 7.给出如下列联表非 30 50 80 合计5060110根据独立性检验,__________在犯错误的概率不超过0.01的前提下认为“高血压与患心脏病有关”(填“能”或“不能”). 答案 能解析 零假设为H 0:高血压与患心脏病无关. 由列联表中的数据可得 χ2=110×(20×50-10×30)230×80×50×60≈7.486>6.635=x 0.01,根据小概率值α=0.01的χ2独立性检验,我们推断H 0不成立,即认为高血压与患心脏病有关,此推断犯错误的概率不超过0.01,即能在犯错误的概率不超过0.01的前提下,认为高血压与患心脏病有关.8.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,测试成绩(单位:分)如图所示,假设得分值的中位数为m e ,众数为m 0,平均值为x -,则m e ,m 0与x -的大小关系是________.答案 m 0<m e <x -解析 由图可知,30名学生的得分情况依次为得3分的有2人,得4分的有3人,得5分的有10人,得6分的有6人,得7分的有3人,得8分的有2人,得9分的有2人,得10分的有2人.中位数为第15、16个数(分别为5、6)的平均数,即m e =5.5.5出现的次数最多,故m 0=5,x -=2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×1030≈5.97.于是得m 0<m e <x -.9.下面的折线图给出的是甲、乙两只股票在某年中每月的收盘价格,已知股票甲的极差是6.88元,标准差为2.04元;股票乙的极差为27.47元,标准差为9.63元,根据这两只股票在这一年中的波动程度,给出下列结论:①股票甲在这一年中波动相对较小,表现的更加稳定;②购买股票乙风险高但可能获得高回报;③股票甲的走势相对平稳,股票乙的收盘价格波动较大;④两只股票在全年都处于上升趋势.其中正确的结论是________(填序号).答案 ①②③解析 由题意可知,甲的标准差为2.04元,乙的标准差为9.63元,可知股票甲在这一年中波动相对较小,表现的更加稳定,故①正确;甲的极差是6.88元,乙的极差为27.47元,可知购买股票乙风险高但可能获得高回报,故②正确;通过折线图可知股票甲的走势相对平稳,股票乙的收盘价格波动较大,故③正确;通过折线图可得乙在6月到8月明显是下降趋势,故④错误. 三、解答题10.某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:性别对该商场的服务 合计满意不满意(1)分别估计男、女顾客对该商场服务满意的概率;(2)依据小概率值α=0.05的χ2独立性检验,能否认为男、女顾客对该商场服务的评价有差异?附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).解 (1)由调查数据,男顾客中对该商场服务满意的比率为4050=0.8,因此男顾客对该商场服务满意的概率的估计值为0.8.女顾客中对该商场服务满意的比率为3050=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6. (2)零假设为H 0:男、女顾客对该商场服务的评价没有差异. 由列联表中的数据,得 χ2=100×(40×20-30×10)250×50×70×30≈4.762>3.841=x 0.05.根据小概率值α=0.05的χ2独立性检验,我们推 断H 0不成立,即认为男、女顾客对商场服务的评价有差异,此推断犯错误的概率不大于0.05.11.某互联网公司为了确定下季度的前期广告投入计划,收集了近6个月广告投入量x (单位:万元)和收益y (单位:万元)的数据如表:他们分别用两种模型①y =bx +a ,②y =a e bx 进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值.x -y -∑6i =1x i y i∑6i =1x 2i7301 464.24 364(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?并说明理由; (2)残差绝对值大于2的数据被认为是异常数据,需要剔除. (ⅰ)剔除异常数据后,求出(1)中所选模型的回归方程; (ⅱ)若广告投入量x =18,则该模型收益的预报值是多少?附:对于一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归直线y ^=b ^x +a ^的斜率和截距的最小二乘估计分别为:b ^=∑n i =1(x i -x -)(y i -y -)∑n i =1(x i -x -)2=∑ni =1x i y i -nx -·y -∑n i =1x 2i -n ·x -2,a ^=y --b ^x -. 解 (1)由于模型①残差波动小,应该选择模型①. (2)(ⅰ)剔除异常数据,即3月份的数据, 剩下数据的平均数为x -=15×(7×6-6)=7.2,y -=15×(30×6-31.8)=29.64,∑5i =1x i y i -5x -·y -=206.4,∑5i =1x 2i -5·x -2=68.8. ∴b ^=206.468.8=3,a ^=y --b ^x -=29.64-3×7.2=8.04.∴所选模型的回归方程为y ^=3x +8.04. (ⅱ)若广告投入量x =18,则该模型收益的预报值是3×18+8.04=62.04(万元).12.(多选)2020年7月国家统计局发布了我国2020年上半年国内经济数据,图1为国内三大产业生产总值的比重,图2为第三产业中各行业生产总值的比重.以下关于我国2020年上半年经济数据的说法正确的是()A.在第三产业中,“批发和零售业”与“金融业”的生产总值之和同“其他服务业”的生产总值基本持平B.若“租赁和商务服务业”生产总值为15 000亿元,则“房地产业”生产总值为32 500亿元C.若“金融业”的生产总值为42 000亿元,则第三产业生产总值为262 500亿元D.若“金融业”的生产总值为42 000亿元,则第一产业生产总值为45 000亿元答案ABC解析对于选项A,在第三产业中,“批发和零售业”与“金融业”的生产总值之和占比为16%+16%=32%,“其他服务业”的生产总值占比为32%,所以“批发和零售业”与“金融业”的生产总值之和同“其他服务业”的生产总值基本持平,故选项A正确.对于选项B,若“租赁和商务服务业”生产总值为15 000亿元,在第三产业中,因为“租赁和商务服务业”生产总值占比为6%,所以第三产业生产总值为15 000=250 000(亿元),又“房地产业”生产总值占比为13%,所以“房地产6%业”生产总值为13%×250 000=32 500(亿元),故选项B正确.对于选项C ,在第三产业中,若“金融业”的生产总值为42 000亿元,因为“金融业”生产总值占比为16%,所以第三产业生产总值为42 00016%=262 500(亿元),故选项C 正确.对于选项D ,第三产业生产总值在三大产业中占比为57%,第一产业生产总值在三大产业中占比为6%,由C 选项知第三产业生产总值为262 500亿元,所以第一产业生产总值为262 50057%×6%≈27 632(亿元),所以选项D 错误.13.由于受到网络电商的冲击,某品牌的洗衣机在线下的销售受到影响,承受了一定的经济损失,现将A 地区200家实体店该品牌洗衣机的月经济损失统计如图所示,估算月经济损失的平均数为m ,中位数为n ,则m -n =________.答案 360解析 第一块小矩形的面积S 1=0.3,第二块小矩形的面积S 2=0.4,故n =2 000+0.5-0.30.000 2=3 000;又第四、五块小矩形的面积均为S =0.06,故a =12 000[1-(0.3+0.4+0.06×2)]=0.000 09,所以m =1 000×0.3+3 000×0.4+5 000×0.18+(7 000+9 000)×0.06=3 360,故m -n =360.14.某公司为了预测下月产品销售情况,找出了近7个月的产品销售量y (单位:万件)的统计表:月份代码t 1 2 3 4 5 6 7 销售量y (万件)y 1y 2y 3y 4y 5y 6y 7但其中数据污损不清,经查证∑7i =1y i =9.32,∑7i =1t i y i =40.17,∑7i =1(y i -y -)2=0.55.。
高二文科习题案
第一章统计案例测试一独立性检验Ⅰ学习目标通过对典型案例的探究,了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用.Ⅱ基础训练题一、选择题1.甲、乙两人分别投篮一次,记“甲投篮一次,投进篮筐”为事件A,“乙投篮一次,投进篮筐”为事件B,则在A与B,与B,A与,与中,满足相互独立的有几对( )(A)1 (B)2 (C)3 (D)42.若由一个2×2列联表中的数据计算得到χ2=3.528,那么( )(A)有95%的把握认为这两个变量有关系(B)有95%的把握认为这两个变量存在因果关系(C)有99%的把握认为这两个变量有关系(D)没有充分的证据显示这两个变量之间有关系3.设A是一随机事件,则下列式子中不正确的是( )(A)P(A+)=P(A)+P( ) (B)P(A+)=1(C)P(A•)=P(A)•P( ) (D)P(A•)=04.针对使用统计量χ2作一个2×2列联表的独立性检验时,以下说法中正确的是( )(A)选取样本的容量没有限制(B)独立性检验结果只对所研究的对象成立(C)若根据数据算出两个分类变量A,B的统计量χ2>6.635,我们就认为有99%的把握说A与B有关(D)若根据数据算出两个分类变量A,B的统计量χ2>6.635,我们就认为有99%的把握说A与B存在因果关系5.为了考察高中生的性别与是否喜欢数学课程之间的关系,北京市西城区教育研修学院在西城区的高中学生中随机地抽取300名学生调查,得到下表:喜欢数学课程不喜欢数学课程合计男47 95 142女35 123 158合计82 218 300则通过计算,可得统计量χ2的值是( )(A)4.512 (B)6.735 (C)3.325 (D)12.624二、填空题6.针对两个分类变量作独立性检验,若χ2统计量的值越大,则说明这两个分类变量间有关系的可能性________________.7.甲、乙两人各自独立练习射击,甲射击击中目标的概率为p1,乙射击击中目标的概率为p2,那么恰好有一人射击击中目标的概率是________________.8.对于两个分类变量X与Y:(1)如果χ2>6.635,就约有________的把握认为“X与Y有关系”;(2)如果χ2>3.841,就约有________的把握认为“X与Y有关系”.9.考察棉花种子是否经过处理跟是否生病之间的关系得到如下表所示的数据:种子经过处理种子未处理合计得病32 101 133不得病61 213 274合计93 314 407根据以上数据,则统计量χ2的值是________.10.2008年北京奥运会期间,北京某五星级宾馆上调了住宿价格.为了调查上调价格与客人的所处地区是否有关系,奥运会后,统计本国客人与外国客人的人数,与2007年同期相比,结果如下:本国客人外国客人合计2007年218 238 4562008年123 354 477合计341 592 933通过计算,可得统计量χ2=________,我们可以得到结论:__________________.三、解答题11.甲、乙两人在同一办公室工作.办公室只有一部电话机,设经过该机打进的电话是打给甲、乙的概率分别为,.若在一段时间内打进两个电话,且这两个电话是相互独立的.(1)求这两个电话是打给同一个人的概率;(2)求这两个电话一个是打给甲、一个是打给乙的概率.12.为了研究儿童性格与血型的关系,先抽取80名儿童测试,血型与性格汇总如下,试判断性格与血型是否相关.血型性格O型或A型B型或AB型合计自然、率性18 16 34天真、感性17 29 46合计35 45 8013.对服用某种维生素对成年人头发稀疏或稠密的影响调查如下:服用维生素的成年人有60人,其中头发稀疏的有5人.不服用维生素的成年人有60人,其中头发稀疏的有46人.请作出列联表,并判断服用维生素与头发稀疏是否相关.测试二回归分析Ⅰ学习目标通过对典型案例的探究,进一步了解回归的基本思想、方法及初步应用.Ⅱ基础训练题一、选择题1.对于一组具有线性相关关系的数据:(x1,y1),(x2,y2),…,(xn,yn),其回归方程的截距和斜率的最小二乘法估计公式分别为和,其中为( )(A)a=y-bx (B)a=(C) (D)2.由一组数据(x1,y1),(x2,y2),…,(xn,yn)得到回归直线=a+bx,下列说法中不正确的是( )(A)直线=a+bx必过点( ,)(B)直线=a+bx至少过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点(C)直线=a+bx的斜率为(D)直线=a+bx和各点(x1,y1),(x2,y2),…,(xn,yn)的偏差是坐标平面上所有直线与这些点的偏差中最小的直线3.两个线性相关变量满足如下关系:x 2 3 4 5 6y 2.2 3.8 5.5 6.5 7.0则y对x的回归方程是( )(A) =0.87x+0.32 (B) =3.42x-3.97(C) =1.23x+0.08 (D) =2.17x+32.14.对于相关系数r,下列说法正确的是( )(A)|r|越大,线性相关程度越强(B)|r|越小,线性相关程度越强(C)|r|越大,线性相关程度越弱,|r|越小,线性相关程度越强(D)|r|≤1且|r|越接近1,线性相关程度越强,|r|越接近0,线性相关程度越弱5.在一次试验中,当变量x取值分别为1,,,时,变量y的值依次为2,3,4,5,则y与之间的回归曲线方程是( )(A)y=+1 (B)y=+3 (C)y=2x+1 (D)y=x-1二、填空题6.在两个变量的回归分析中,作散点图的目的是________.7.一亩水稻田中,施化肥量xkg(x<300)与水稻的产量ykg之间的回归直线方程是=3.16x+300,当施化肥量为50kg时,预计水稻产量为________.8.某医院用光电比色计检验尿汞,得尿汞含量(mg/L)与消化系数如下表:尿汞含量x 2 4 6 8 10消化系数y 64 138 205 285 260若y与x具有线性相关关系,则回归直线方程是________________________.三、解答题9.现有5名同学的物理成绩和数学成绩如下表:物理成绩x 64 61 78 65 71数学成绩y 66 63 88 76 73(1)画出散点图;(2)若x和y具有线性相关关系,试求变量y对x的回归方程.10.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(t)与相应的生产能耗y(t标准煤)的几组对照数据.x 3 4 5 6y 2.5 3 4 4.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程;(3)已知该厂技术改造前100t甲产品的生产能耗为90t标准煤,试根据(2)求出的线性回归方程预测生产100t甲产品的生产能耗比技术改造前降低多少吨标准煤?11.某工业部门进行一项研究,分析该部门的年产量与生产费用的样本,从这个工业部门内随机抽选了10个企业作样本,有如下资料:年产量x/千件40 42 48 55 65 79 88 100 120 140生产费用y/千元150 140 160 170 150 162 185 165 190 185(1)画出散点图;(2)对这两个变量之间是否存在线性相关进行相关性检验;(3)该部门欲建一个年产量为200千件的企业,预测其生产费用.测试三统计案例全章练习一、选择题1.分析身高与体重有关系,可以用( )(A)误差分析(B)回归分析(C)独立性分析(D)上述都不对2.是x1,x2,…,x100的平均数,a是x1,x2,…,x40的平均数,b是x1,x2,…,x60的平均数,则下列各式中正确的是( )(A) (B) (C) (D)3.设有一个线性回归方程为=2-2.5x,则变量x增加一个单位时,则( )(A)y平均增加2.5个单位(B)y平均增加2个单位(C)y平均减少2.5个单位(D)y平均减少2个单位4.为了研究变量x与y的线性相关性,甲乙两人分别做了研究,并利用线性回归方法得到回归方程l1和l2,非常巧合的是,两人计算的相同,也相同,下列说法正确的是( )(A)l1和l2相同(B)l1和l2一定平行(C)l1和l2相交于点( ,) (D)无法判断l1和l2是否相交5.某班主任对全班50名学生进行了作业量多少的调查,数据如下表:认为作业多认为作业不多合计喜欢玩电脑游戏18 9 27不喜欢玩电脑游戏8 15 23合计26 24 50则认为喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为( )(A)99%(B)95%(C)90%(D)无充分依据二、填空题6.下面是2×2列联表:y1 y2 合计x1 a 28 35x2 11 34 45合计 b 62 80则表中a=________,b=________.7.|r|≤1且|r|越接近1,线性相关程度越________,|r|越接近0,线性相关程度越________.8.在一项打鼾与患心脏病的关系的调查中,共调查了2000人,经计算得χ2=20.87,根据这一数据分析,我们有________的把握认为打鼾与患心脏病是________的.9.某工厂的设备使用年限x(年)与维修费用y(万元)之间的回归直线方程为=0.8x+1.5,那么设备使用前3年的维修费用约为________万元.10.在一次实验中,测得(x,y)的4组数值分别是(0,1),(1,2),(3,4),(4,5),那么y与x之间的回归直线方程是________________.三、解答题11.生物学习小组在研究性别与色盲关系时,得到如下列联表:色盲非色盲合计男12 788 800女 5 995 1000合计17 1783 1800试判断性别与色盲是否有关系?12.为了研究高中女生身高与体重的关系,从某高中随机选取8名女生,测量其身高与体重的数据,具体如下表:编号 1 2 3 4 5 6 7 8身高/cm 155 157 165 165 165 170 170 175体重/kg 43 50 48 57 61 54 59 64(1)请根据上表提供的数据,求出体重y关于身高x的线性回归方程;(2)试根据(1)的回归方程,预计一名身高160cm的女高中生的体重.13.在一次实验中,测得(x,y)的5组数值,如下表:xy 360 285 205 138 64试判断y与是否具有线性相关关系?如有,求出线性回归方程.第二章推理与证明测试四合情推理与演绎推理Ⅰ学习目标1.了解合情推理的含义,能利用归纳和类比等进行简单的推理.2.掌握演绎推理的基本模式,并能运用它们进行一些简单推理.3.了解合情推理和演绎推理之间的联系和差异.Ⅱ基础训练题一、选择题1.数列2,5,10,17,x,37,…中的x等于( )(A)25 (B)26 (C)27 (D)282.已知扇形的弧长为l,半径为r.类比三角形的面积公式:底×高,可推知扇形的面积公式S扇形等于( )(A) (B) (C) (D)lr3.在公差为d的等差数列{an}中,我们可以得到an=am+(n-m)d(m,n∈N*).通过类比推理,在公比为q的等比数列{bn}中,我们可得( )(A)bn=bm+qn-m (B)bn=bm+qm-n (C)bn=bm•qm-n (D)bn=bm•qn-m4.将正奇数数列1,3,5,7,9,…进行如下分组:第一组含一个数{1};第二组含两个数{3,5};第三组含3个数{7,9,11};第四组含4个数{13,15,17,19};….记第n 组内各数之和为Sn,则Sn与n的关系为( )(A)Sn=n2 (B)Sn=n3 (C)Sn=2 n+1 (D)Sn=3n-15.数列{an}中,a1=3,a2=6,且an+2=an+1-an,则a33等于( )(A)3 (B)-3 (C)6 (D)-6二、填空题6.已知圆具有性质:圆的切线垂直于经过切点的圆半径.类比这条性质,可得球的一条相关性质为________________________.7.在数列{an}中,a1=1,an+1=(n=1,2,3,…),则此数列的通项公式可归纳为________________________.8.半径为r的圆的面积S(r)=πr2,周长C(r)=2πr,若将r看作(0,+∞)上的变量,则(πr2)′=2πr①,①式用语言可以叙述为:圆的面积函数的导数等于圆的周长函数.对于半径为R的球,若将R看作(0,+∞)上的变量,请写出类比①的等式:________________;上式用语言可以叙述为________________________.9.将“菱形的对角线互相平分”写成三段论的形式为________________________.10.在平面几何中,我们有如下结论:三边相等的三角形内任意一点到三边的距离之和为定值.拓展到空间,类比平面几何的上述结论,我们可得:4个面均为等边三角形的四面体内任意一点________________________________________________.三、解答题11.类比实数的加法和向量的加法,从相加的结果是否为实数(向量),以及运算律、逆运算、0与0(零向量)几个方面考虑,列出他们相似的运算性质.12.下列推理的两个步骤分别遵循哪种推理原则?因为直线a⊥平面α,直线b⊥平面α,所以a∥b.又因为b∥c,所以a∥c.13.设{an}是由正数组成的等比数列,Sn是其前n项的和.证明:Sn•Sn+2<.Ⅲ拓展训练题14.在等差数列{an}中,若a10=0,则有等式a1+a2+…+an=a1+a2+…+a19-n 成立,其中1≤n<19,n∈N*.类比上述性质,相应的:在等比数列{bn}中,若b9=1,试写出相应的一个等式.测试五直接证明与间接证明Ⅰ学习目标1.了解直接证明的两种基本方法:分析法和综合法,能利用它们解决简单问题.2.了解间接证明的一种基本方法——反证法,能利用反证法解决简单问题.Ⅱ基础训练题一、用分析法或综合法证明下列问题1.证明:.2.已知a>b>0,求证:.3.设a,b∈(0,+∞),且a≠b,证明:a3+b3>a2b+ab2.4.已知锐角A,B满足A+B>,证明:sinA>cosB.5.已知数列{an}是等差数列,(n=1,2,3,…).证明:数列{bn}是等差数列.6.在△ABC中,3个内角A,B,C的对边分别是a,b,c,且A,B,C成等差数列,a,b,c成等比数列.求证:△ABC为等边三角形.二、用反证法证明下列问题7.设a,b是平面内的两条直线,证明:这两条直线最多只有一个交点.8.证明:若函数f(x)在区间[a,b]上是增函数,那么方程f(x)=0在区间[a,b]上至多只有一个实数根.9.设p,q∈R,且p3+q3=2,求证:p+q≤2.10.求证:一元二次方程ax2+bx+c=0(a≠0)至多有两个不相等的实数根.Ⅲ拓展训练题11.求证:1,,不能成为同一等差数列中的3项.12.证明:对于函数f(x)=lgx,找不到这样的正数M,使得对于f(x)定义域内任意的x 有|f(x)|<M成立.测试六推理与证明全章练习一、选择题1.观察数列{an}:1,2,2,3,3,3,4,4,4,4,…的特点,则a100是( )(A)14 (B)13 (C)12 (D)112.不等式a>b与>同时成立的充要条件是( )(A)a>b>0 (B)0>a>b (C)a>0>b (D) >>03.已知{an}为等比数列,a5=2,那么有等式a1•a2•…•a9=29成立.类比上述性质,相应的:若{bn}为等差数列,b5=2,则有( )(A)b1+b2+…+b9=29 (B)b1•b2•…•b9=29(C)b1+b2+…+b9=2×9 (D)b1•b2•…•b9=2×94.对于任意正整数n,下列结论正确的是( )(A)当n=2时,2n=n2;当n≠2时,2n>n2(B)当n=2或n=4时,2n=n2;当n≠2且n≠4时,2n>n2(C)当n=3时,2n<n2;当n≠3时,2n>n2(D)当n=3时,2n<n2;当n≠3时,2n≥n25.设a>0,b>0,则以下不等式中不恒成立的是( )(A)(a+b)( )≥4 (B)a3+b3≥2ab2(C)a2+b2+2≥2a+2b (D)6.若用反证法证明命题:三角形的内角中至少有一个大于60°,则与命题结论相矛盾的假设为( )(A)假设三角形的3个内角都大于60°(B)假设三角形的3个内角都不大于60°(C)假设三角形的3个内角中至多有一个大于60°(D)假设三角形的3个内角中至多有两个大于60°二、填空题7.设正实数a,b,c满足a+b+c=1,则a,b,c三者中至少有一个数不小于____________.8.已知数列{an}的通项公式为,记f(n)=(1-a1)(1-a2)…(1-an),其中n∈N*.那么f(1)=________;f(2)=________;f(3)=________;推测f(n)=________.9.若三角形的内切圆半径是r,三边长分别是a,b,c,则三角形的面积是r(a+b+c).类比此结论,若四面体的内切球半径是R,4个面的面积分别是S1,S2,S3,S4,则四面体的体积V=________.10.已知数列{an}的前n项和为Sn,,(n≥2),通过计算S1,S2,S3,S4,可归纳出Sn=________________.三、解答题11.已知a,b,c是正数,且ab+bc+ca=1,求证:a+b+c≥.12.设{an}是公比为q的等比数列,Sn是它的前n项和.证明:数列{Sn}不是等比数列.13.设函数f(x)=|lgx|,若0<a<b,且f(a)>f(b),求证:ab<1.14.设a>0,函数是R上的偶函数.(1)求a的值;(2)证明:f(x)在(0,+∞)上单调递增.第三章数系的扩充与复数的引入测试七数系的扩充与复数的引入Ⅰ学习目标1.了解数系的扩充过程.2.理解复数的基本概念以及复数相等的充要条件.3.了解复数的代数表示法及其几何意义.Ⅱ基础训练题一、选择题1.下列结论中正确的是( )(A)Z N Q R C (B)N Z Q C R(C)N Z Q R C (D)R N Z Q C2.复数1-i的虚部是( )(A)1 (B)-1 (C)i (D)-i3.若复数z=m(m-1)+(m-1)i是纯虚数,则实数m的值为( )(A)0 (B)1 (C)-1 (D)0或14.设x,y∈R,且满足x+y+(x-2y)i=2x-5+(3x+y)i,则xy等于( )(A)-2 (B)2 (C)6 (D)-65.设z∈C,则满足1≤|z|≤3的复数在复平面上的对应点构成图形的面积是( )(A)π(B)4π(C)8π(D)9π二、填空题6.若x是实数,y是纯虚数,且3x+1-2i=y,则x=________;y=________.7.当<m<1时,复数z=3m-2+(m-1)i在复平面上的对应点位于第________象限.8.设x,y∈R,复数z=x-2+yi,=3x-i,则x=________;y=________.9.已知复数z=(1+i)m2-(4+i)m-6i所对应的点位于复平面的第二象限,则实数m 的取值范围是________.10.设集合M={0,1,3,5,7,9},a,b∈M,则形如a+bi的不同虚数共有________个.三、解答题11.已知2x-1+(y+1)i=x-y-(x+y)i,求实数x,y的值.12.实数m取何值时,复数z=(m2-5m+6)+(m2-3m)i是(1)零;(2)虚数;(3)纯虚数.13.设x∈R,若复数z=(x2-3)+i•log2(x+3)在复平面内的对应点在第三象限,求x 的取值范围.14.设z∈C,若|z|=z+2-4i,求复数z.测试八复数的运算Ⅰ学习目标能进行复数代数形式的四则运算,了解复数代数形式的加减运算的几何意义.Ⅱ基础训练题一、选择题1.已知复数z满足z+i-3=3-i,则等于( )(A)2i (B)-2i (C)6+2i (D)6-2i2.若复数z1=3+i,z2=1-i,则z=z1•z2在复平面内的对应点位于( )(A)第一象限(B)第二象限(C)第三象限(D)第四象限3.复数的值是( )(A) (B) (C) (D)4.复数i+i3+i5+…+i33的值是( )(A)i (B)-i (C)1 (D)-15.对于任意两个复数z1=x1+y1i,z2=x2+y2i(x1,y1,x2,y2为实数),定义运算“⊙”为:z1⊙z2=x1x2+y1y2.设非零复数ω1,ω2在复平面内对应的点分别为P1,P2,点O 为坐标原点.如果ω1⊙ω2=0,则△P1OP2中∠P1OP2的大小为( )(A) (B) (C) (D)二、填空题6.复数的共轭复数是________.7.若z∈C,且(3+z)i=1,则复数z=________.8.已知复数,则z4=________.9.复平面上平行四边形ABCD的4个顶点中,A,B,C所对应的复数依次为2+3i,3+2i,-2-3i,则D点对应的复数为________.10.对于n个复数z1,z2,…,zn如果存在n个不全为零的实数k1,k2,…,kn,使得k1z1+k2z2+…+knzn=0,就称z1,z2,…,zn线性相关.若3个复数z1=1+2i,z2=1-i,z3=-2线性相关,那么可取{k1,k2,k3}=________.三、解答题11.设复数,求证:(1)ω2=;(2)1+ω+ω2=0;(3)ω3=1.12.求复数3+4i的平方根.13.已知z是虚数,,求证:ω∈R的充要条件是|z|=1.14.已知复数(a>0),若复数ω=z(z+i)的虚部减去其实部的差等于,求复数ω测试九数系的扩充与复数的引入全章练习一、选择题1.复数z与其共轭复数在复平面内的对应点( )(A)关于实轴对称(B)关于虚轴对称(C)关于原点对称(D)关于直线y=x对称2.复数的实部是( )(A)-2 (B)2 (C)-4 (D)43.若复数z=(x2-6x+5)+(x-2)i在复平面内的对应点位于第三象限,则实数x的取值范围是( )(A)(-∞,2) (B)(1,5) (C)(1,2) (D)(2,5)4.设a,b∈R,则复数(a+bi)(a-bi)(-a+bi)(-a-bi)的值是( )(A)(a2+b2)2 (B)(a2-b2)2 (C)a4+b4 (D)a4-b45.如果复数z满足|z-2i|=1,那么|z|的最大值是( )(A)1 (B)2 (C)3 (D)46.若复数z=cosθ+i•sinθ,则使z2=-1的θ值可能为( )(A) (B) (C) (D)二、填空题7.若z∈C,且i•z=1-i,则复数z=________.8.i+2i2+3i3+…+8i8=________.9.设b∈R,复数(1+bi)(2+i)是纯虚数,则b=________.10.如果1+i是方程x2+bx+c=0(b,c∈R)的一个根,那么b+c=________.三、解答题11.设x,y∈R,且,求x,y的值.12.在复平面内,△ABC的3个顶点依次对应复数1,2i,5+2i,判断△ABC的形状.13.是否存在虚数z,使得,且z+3的实部与虚部互为相反数,证明你的结论.14.设复数z满足|z|=1,且z2+2z+是负实数,求复数z.第四章框图测试十框图Ⅰ学习目标1.了解程序框图.2.了解工序流程图(即统筹图)和结构图.3.能绘制简单实际问题的流程图,了解流程图在解决实际问题中的作用;会运用结构图梳理已学过的知识、整理收集到的资料信息.Ⅱ基础训练题一、选择题1.某人带着包裹进入超市购物的流程图如下图所示,则在空白处应填( )(A)退换物品(B)归还货车(C)取回包裹(D)参加抽奖2.复数分类的框图如下,下列空白处应填( )(A)虚数(B)非纯虚数(C)非实数(D)非纯虚数的虚数(a≠0,b≠0)3.右图是集合的知识结构图,如果要加入“子集”,则应该放在( )(A)“集合的概念”的下位(B)“集合的表示”的下位(C)“基本关系”的下位(D)“基本运算”的下位4.下列结构图中要素之间表示从属关系的是( )5.下面的程序框图的作用是按大小顺序输出两数,则括号处的处理可以是( )(A)A←B,B←A (B)T←B,B←A,A←T(C)T←B,A←T,B←A (D)A←B,T←A,B←T6.某成品的组装工序图如右,箭头上的数字表示组装过程中所需要的时间(小时),不同车间可同时工作,同一车间不能同时做两种或两种以上的工作,则组装该产品所需要的最短时间是( )(A)12小时(B)11小时(C)8小时(D)6小时二、填空题7.按照程序框图(如下图)执行,第3个输出的数是________.8.下面的流程图是交换两个变量的值并输出,则图中空白处应为________.第7题图第8题图9.读下面的流程图,若输入的值为-5时,输出的结果是________.10.某工程的工序流程如图所示(工时单位:天),现已知工程总时数为10天,则工序c 所需工时为________天.三、解答题11.已知画出输入x,打印f(x)的程序框图.12.某公司做人事调整:设总经理一个,配有经理助理一名;设副经理两人,直接对总经理负责,设有6个部门,其中副经理A管理生产部、安全部和质量部,副经理B管理销售部、财务部和保卫部;生产车间由生产部和安全部共同管理,公司配有质检中心和门岗。
高中数学统计案例独立性检验课后演练提升北师大版选修
2016-2017学年高中数学第3章统计案例 2 独立性检验课后演练提升北师大版选修2-3一、选择题1.下列说法正确的个数是( )①对事件A与B的检验无关时,即两个事件互不影响②事件A与B关系越密切,则χ2就越大③χ2的大小是判定事件A与B是否相关的唯一根据④若判定两个事件A与B有关,则A发生B一定发生A.1 B.2C.3 D.4解析:对于①,事件A与B的检验无关,只是说两事件的相关性较小,并不一定两事件互不影响,故①错;②是正确的;对于③,判断A与B是否相关的方式很多,可以用图表,也可以借助于概率运算,故③错;对于④,两事件A与B有关,说明两者同时发生的可能性相对来说较大,但并不是A发生B一定发生,故④错.答案: A2.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,下列说法中正确的是( ) A.100个吸烟者中至少有99人患有肺癌B.1个人吸烟,那么这个人有99%的概率患有肺癌C.在100个吸烟者中一定有患肺癌的人D.在100个吸烟者中可能一个患肺癌的人也没有解析:本题主要考查对独立性检验的结果与实际问题的差异的理解,独立性检验的结论是一个数学统计量,它与实际问题中的问题的确定性是存在差异的.答案: D3.下面是一个2×2列联表则表中a、b处的值分别是( )A.94,96 B.52,50C .52,72D .54,52解析: 由⎩⎪⎨⎪⎧a +21=73b +46=73+45,可得⎩⎪⎨⎪⎧a =52,b =72.答案: C4.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计6050110由K 2=n ad -bc 2a +bc +d a +cb +d算得,K 2=110×40×30-20×20260×50×60×50≈7.8.附表:P (K 2≥k )0.050 0.010 0.001 k3.8416.63510.828参照附表,得到的正确结论是( )A .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C .有99%以上的把握认为“爱好该项运动与性别有关”D .有99%以上的把握认为“爱好该项运动与性别无关” 解析: K 2=110×40×30-20×20260×50×60×50≈7.8>6.635,所以我们有99%以上的把握认为“爱好该项运动与性别有关”. 答案: C 二、填空题5.为了考查长头发与女性头晕是否有关系,随机抽查301名女性,得到如下列联表,试根据表格中已有数据填空.经常头晕 很少头晕 合计 长发 35 ① 121 短发 37 143 ② 合计72③④则空格中的数据应分别为:①________________;②________________;③______________;④______________.解析: 最右侧的合计是对应的行上的两个数据的和,由此可求出①和②;而最下面的合计是相应的列上两个数据的和,由①②的结果可求得③④.答案: ①86 ②180 ③229 ④3016.计算得到χ2的值______________时,才能以95%的把握认为两个分类变量之间相关. 解析: 可以查临界值表,1-95%=0.05,因为0.05对应的值为3.841,所以当χ2的值大于3.841时,才能有95%的把握认为两个分类变量之间相关.答案: 大于3.841 三、解答题7.在大连—烟台的某次航运中,出现了恶劣气候.随机调查男、女乘客在船上晕船的情况如表所示:晕船 不晕船 总计 男人 30 18 48 女人 40 62 102总计7080n =150据此资料,你能否认为在恶劣气候中航行时,男性比女性更容易晕船? 解析: χ2=150×30×62-18×40280×70×48×102≈7.110.因为7.110>6.635,所以有99%的把握说,晕船与否跟男女性别有关,说明在海上旅游中男性比女性更容易晕船.8.为了研究患慢性气管炎与吸烟量的关系调查了228人.其中每天的吸烟支数在10支以上20支以下的调查者中,患者人数有98人,非患者人数有89人;每天的吸烟支数在20支以上的调查者中,患者人数有25人,非患者人数有16人.试问患慢性气管炎是否与吸烟量相互独立?解析: 由已知条件可列出2×2列联表:10支~19支20支以上合计 患者人数 98 25 123 非患者人数 89 16 105 总计18741228由公式得:χ2=228×98×16-89×252123×105×187×41≈0.994,由于0.994<2.706,所以没有理由认为患慢性气管炎与吸烟量有关,即认为患慢性气管炎与吸烟量无关,是相互独立的.尖子生题库☆☆☆9.某生产线上,质量监督员甲在生产现场时,990件产品中有合格品982件,次品8件;不在生产现场时,510件产品中有合格品493件,次品17件.能否有99%的把握认为质量监督员甲在不在场与产品质量好坏有关系?解析: 根据题目所给数据得如下2×2列联表:合格品数 次品数 总计 甲在生产现场 982 8 990 甲不在生产现场493 17 510 总计1 475251 500由列联表中的数据,得χ2=1 500×982×17-8×4932990×510×1 475×25≈13.097>6.635.因此,有99%的把握认为质量监督员甲在不在生产现场与产品质量好坏有关系.。
统计案例之独立性检验
统计案例之独立性检验班级姓名学号参考公式:,其中.1.在中学生综合素质评价某个维度的测评中,分优秀、合格、尚待改进三个等级进行学生互评.某校高一年级有男生500人,女生400人,为了了解性别对该维度测评结果的影响,采用分层抽样方法从高一年级抽取了45名学生的测评结果,并作出频数统计表如下:表一:男生表二:女生(1)从表二的非优秀学生中随机抽取2人交谈,求所选2人中恰有1人测评等级为合格的概率;(2)由表中统计数据填写下面的列联表,并判断是否有90%的把握认为“测评结果优秀与性别有关”.2.东亚运动会将于2013年10月6日在天津举行.为了搞好接待工作,组委会打算学习北京奥运会招募大量志愿者的经验,在某学院招募了16名男志愿者和14名女志愿者,调查发现,男女志愿者中分别有10人和6人喜爱运动,其余人不喜欢运动.(2)根据列联表的独立性检验,能否在犯错误的概率不超过0.10的前提下认为性别与喜爱运动有关?(3)如果从喜欢运动的女志愿者中(其中恰有4人会外语),抽取2名负责翻译工作,那么抽出的志愿者中至少有1人能胜任翻译工作的概率是多少?3.某中学拟在高一下学期开设游泳选修课,为了了解高一学生喜欢游泳是否与性别有关,现从高一学生中抽取人做调查,得到如下列联表:已知在这人中随机抽取一人抽到喜欢游泳的学生的概率为,(Ⅰ)请将上述列联表补充完整,并判断是否有%的把握认为喜欢游泳与性别有关?并说明你的理由;(Ⅱ)针对问卷调查的名学生,学校决定从喜欢游泳的人中按分层抽样的方法随机抽取人成立游泳科普知识宣传组,并在这人中任选两人作为宣传组的组长,求这两人中至少有一名女生的概率,4.某学校高三年级有学生1 000名,经调查,其中750名同学经常参加体育锻炼(称为A 类同学),另外250名同学不经常参加体育锻炼(称为B类同学),现用分层抽样方法(按A 类、B类分两层)从该年级的学生中共抽查100名同学,如果以身高达165 cm作为达标的标(1)完成上表;5.某校进行文科、理科数学成绩对比,某次考试后,各随机抽取100名同学的数学考试成绩进行统计,其频率分布表如下.(Ⅰ)根据数学成绩的频率分布表,求理科数学成绩的中位数的估计值;(Ⅱ)请填写下面的列联表,并根据列联表判断是否有90%的把握认为数学成绩与文理科有关:(Ⅲ)设文理科数学成绩相互独立,记表示事件“文科、理科数学成绩都大于等于120分”,估计的概率.答案:1.(1)设从高一年级男生中抽出人,则,,则从女生中抽取20人,所以,.表二中非优秀学生共5人,记测评等级为合格的3人为,,,尚待改进的2人为,,则从这5人中任选2人的所有可能结果为,,,,,,,,,,共10种,设事件表示“从表二的非优秀学生中随机选取2人,恰有1人测评等级为合格”,则的结果为,,,,,,共6种,所以,即所求概率为.(2)列联表如下:因为,,而,所以没有90%的把握认为“测评结果优秀与性别有关”.(2)根据已知数据可求得:K2=≈1.157 5<2.706,因此,在犯错误的概率不超过0.10的前提下不能判断喜爱运动与性别有关.(3)喜欢运动的女志愿者有6人,设喜欢运动的女志愿者分别为A,B,C,D,E,F,其中A,B,C,D会外语,则从这6人中任取2人,共15种取法.其中两人都不会外语的只有EF一种取法.故抽出的志愿者之中至少有1人能胜任翻译工作的概率是P=1-=.3.5.。
【志鸿优化设计】高中数学 3.2独立性检验的基本思想及其初步应用同步检测 新人教A版选修2-3
独立性检验的基本思想及其初步应用一、选择题1.通过对K2的统计量的研究得到了若干个临界值,当K2≤2.706时,我们认为( ).A.在犯错误的概率不超过0.05的前提下认为X与Y有关系B.在犯错误的概率不超过0.01的前提下认为X与Y有关系C.没有充分理由认为X与Y有关系D.不能确定答案:C解析:∵K2≤2.706,∴没有充分理由认为X与Y有关系.2.班级与成绩2×2列联表:表中数据m,n,p,q的值应分别为( ).A.70,73,45,188B.17,73,45,90C.73,17,45,90D.17,73,45,45答案:B解析:m=10+7=17,n=35+38=73,p=7+38=45,q=45+p=90.故B正确.3.(2014江西高考)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( ).表1表2视力好差总计表3表4A.成绩B.视力C.智商D.阅读量答案:D解析:根据K2=,代入题中数据计算得D选项K2最大.故选D.4.下面是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图可以看出( ).A.性别与喜欢理科无关B.女生中喜欢理科的比为80%C.男生比女生喜欢理科的可能性大些D.男生不喜欢理科的比为60%答案:C解析:由图知女生中喜欢理科的比为20%,男生不喜欢理科的比为40%,故B,D不正确.由图知,男生比女生喜欢理科的可能性大些.5.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:则认为多看电视与人变冷漠有关系的把握大约为( ).A.99.9%B.97.5%C.95%D.90%答案:A解析:可计算K2的观测值k≈11.377>10.828.二、填空题6.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:由表中数据直观分析,收看新闻节目的观众是否与年龄有关:(填“是”或“否”).答案:是解析:因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即,两者相差较大,所以,经直观分析,收看新闻节目的观众与年龄是有关的.7.某中学2013年共910人参加高考,统计数据如下:则考生的户口形式和高考录取的关系是.(填无关或多大把握有关)答案:无关解析:2×2列联表如下:统计假设H0:考生的户口形式对高考录取没有影响.计算K2的观测值k=≈1.13.由于1.13<2.706,所以我们接受统计假设,故考生的户口形式和高考录取无关.8.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.根据表中数据,得到k=≈4.844.则认为选修文科与性别有关系出错的可能性为.答案:5%解析:∵k≈4.844,这表明小概率事件发生.根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为5%.三、解答题9.为了解某班关注NBA是否与性别有关,对该班48人进行了问卷调查得到如下的列联表:已知在全班48人中随机抽取1人,抽到关注NBA的学生的概率为.(1)请将上面的表补充完整(不用写计算过程),并判断是否有95%的把握认为关注NBA与性别有关?(2)现记不关注NBA的6名男生中某两人为a,b,关注NBA的10名女生中某3人为c,d,e,从这5人中选取2人进行调查,求:至少有一人不关注NBA的被选取的概率.下面的临界值表,供参考(参考公式:K2=,其中n=a+b+c+d)解:(1)列联表补充如下:由上表数据,可得K2=≈4.286.因为4.286>3.841,故有95%的把握认为关注NBA与性别有关.(2)从5人中选2人的基本事件有ab,ac,ad,ae,bc,bd,be,cd,ce,de共10种,其中至少有一人不关注NBA的有ab,ac,ad,ae,bc,bd,be共7种,故至少有一人不关注NBA的概率为.10.某校对学生课外活动内容进行调查,结果整理成下表:试用你所学过的知识进行分析,能否在犯错误的概率不超过0.005的前提下认为“喜欢体育还是喜欢文娱与性别有关系”?解:其等高条形图如图:由图可以直观地看出喜欢体育还是喜欢文娱与性别在某种程度上有关系,但只能作粗略的判断,要想搞清两个量在多大程度上有关系,可用下面的方法:假设“喜欢体育还是喜欢文娱与性别没有关系”, 因为a=21,b=23,c=6,d=29,n=79, 所以K 2的观测值k= =≈8.106,且P (K 2≥7.879)≈0.005,因为K 2的观测值k ≈8.106>7.879,所以在犯错误的概率不超过0.005的前提下认为“喜欢体育还是喜欢文娱与性别有关”.11.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表: 甲厂:乙厂:(1)分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填写2×2列联表,并问能否在犯错误的概率不超过0.01的前提下认为两个分厂生产的零件的质量有差异.解:(1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为=72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为=64%.(2)填写表格如下表:由列联表中的数据,得K2的观测值为k=≈7.353>6.635.因此,在犯错误的概率不超过0.01的前提下,认为两个分厂生产的零件的质量有差异.。
高中数学第一章统计案例2独立性检验2.2独立性检验2.3独立性检验的基本思想2.4独立性检验的应用课后巩固提升
2.4 独立性检验的应用[A组基础巩固]1.下列说法正确的个数是( )①对事件A与B的检验无关时,即两个事件互不影响;②事件A与B关系越密切,则χ2就越大;③χ2的大小是判定事件A与B是否相关的唯一根据;④若判定两个事件A与B有关,则A发生B一定发生.A.1 B.2C.3 D.4解析:两个事件检验无关,只是说明两个事件的影响较小;而判定两事件是否相关除了χ2公式外,还有许多方法.两事件有关,也只是说明当一个事件发生时,另一个事件发生的概率较大,但不一定必然发生.所以只有命题②正确.答案:A2.经过对χ2的统计量的研究,得到了若干个临界值,当χ2≤2.706时,我们认为( ) A.有95%的把握认为A与B有关系B.有99%的把握认为A与B有关系C.没有充分理由说明事件A与B有关系D.不能确定解析:利用临界值来判断,当χ2≤2.706时,没有充分理由说明事件A与B有关系.答案:C3.大学生和研究生毕业的一个随机样本给出了关于所获取学位类别与学生性别的分类数据如表所示:根据以上数据,则可以判定A.获取学位类别与性别有关B.获取学位类别与性别无关C.性别决定获取学位的类别D.以上都是错误的解析:χ2=340×(162×8-27×143)2189×151×305×35≈7.343>6.635.故有99%的把握认为获取学位类别与性别有关. 答案:A4.在吸烟与患肺病这两个变量的计算中,下列说法正确的是( )A .若χ2的值大于6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病B .从独立性检验可知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病C .若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D .以上三种说法都不正确 答案:C5.某班主任对全班50名学生进行了作业量的调查,数据如表( ) A .0.1 B .0.05 C .0.9D .0.95解析:∵χ2=50×(18×15-8×9)226×24×27×23≈5.059>3.841.∴有95%的把握认为学生性别与认为作业量大有关,或者说这种推断犯错误的概率不超过0.05. 答案:B6.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算χ2≈27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的.(填“有关”或“无关”) 解析:由χ2≈27.63与临界值比较,我们有99.9%的把握说打鼾与患心脏病有关. 答案:有关7.下列是关于出生男婴与女婴调查的列联表那么A =________,B ==________. 解析:由45+E =98得E =53, 由98+D =180可知D =82, 由A +35=D 知A =47.所以B =45+47=92,C =E +35=88. 答案:47 92 88 82 538.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:为了检验主修统计专业是否与性别有关系,根据表中的数据,得到χ2=50(13×20-10×7)223×27×20×30≈4.84,因为P (χ2>3.841)=0.05,所以断定主修统计专业与性别有关系,这种判断出错的可能性为________.解析:根据题意,如果P (χ2>3.841)=0.05,表示有95%的把握认为“X 与Y ”有关系,则这种判断出错的可能性为5%. 答案:5%9.从发生汽车碰撞事故的司机中抽取2 000名司机.根据他们的血液中是否含有酒精以及他们是否对事故负有责任,将数据整理如下:有关系?解析:根据列联表中的数据可以求得: χ2=2 000×(650×500-700×150)21 350×650×800×1 200≈114.9因为114.9>10.828,所以我们有99.9%的把握认为对事故负有责任与血液中含有酒精有关. 10.某生产线上,质量监督员甲在生产现场时,990件产品中有合格品982件,次品8件;不在生产现场时,510件产品中有合格品493件,次品17件.能否在犯错误的概率不超过0.01的前提下认为质量监督员甲在不在生产现场与产品质量好坏有关系? 解析:根据题目所给数据得如下2×2列联表:χ2=1 500×(982×17-8×493)2990×510×1 475×25≈13.097>10.828.因此,在犯错误的概率不超过0.001的前提下,可以认为质量监督员甲在不在生产现场与产品质量好坏有关系.[B 组 能力提升]1.假设有两个分类变量X 和Y ,它们的值域分别为{x 1,x 2}和{y 1,y 2},其2×2列联表为:) A .a =5,b =4,c =3,d =2 B .a =5,b =3,c =4,d =2 C .a =2,b =3,c =4,d =5 D .a =3,b =2,c =4,d =5解析:对于同一样本,|ad -bc |越小,说明X 与Y 相关性越弱,而|ad -bc |越大,说明X 与Y 相关性越强,通过计算知,对于A ,B ,C 都有|ad -bc |=|10-12|=2.对于选项D 有|ad -bc |=|15-8|=7,显然7>2. 答案:D2.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )表1表3A .成绩B .视力C .智商D .阅读量解析:∵χ21=52×(6×22-14×10)216×36×32×20=52×8216×36×32×20,χ22=52×(4×20-16×12)216×36×32×20=52×112216×36×32×20,χ23=52×(8×24-12×8)216×36×32×20=52×96216×36×32×20,χ24=52×(14×30-6×2)216×36×32×20=52×408216×36×32×20,则有χ24>χ22>χ23>χ21,所以阅读量与性别关联的可能性最大.答案:D3.巴西医生马廷思收集的犯有各种贪污、受贿罪的官员与廉洁官员的寿命的调查资料如下:500名贪官中有348人的寿命小于平均寿命,152人的寿命大于或等于平均寿命;590名廉洁官员中有93人的寿命小于平均寿命,497人的寿命大于或等于平均寿命.这里,平均寿命是指“当地人均寿命”.通过数据分析,说明有________的把握认为贪官寿命小于平均寿命. 解析:根据题意列2×2列联表如下:假设H 0χ2=1 090×(348×497-152×93)2500×590×441×649≈325.635>6.635,因此拒绝H 0,即我们有99%的把握认为官员经济上是否清廉与他们的寿命长短有密切关系. 答案:99%4.在关于人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人,女性中有43人主要的休闲方式是看电视;男性中有21人主要的休闲方式是看电视;男性、女性中另外的人主要的休闲方式是运动. (1)根据以上数据建立一个2×2的列联表; (2)判断性别与休闲方式是否有关系?解析:(1)依据题意得“性别与休闲方式”2×2列联表为:(2)由公式得χ2=70×54×64×60≈6.201.∵6.201>3.841,∴有95%的把握认为休闲方式与性别有关.5.某学校高三年级有学生1 000名,经调查研究,其中750名同学经常参加体育锻炼(称为A 类同学),另外250名同学不经常参加体育锻炼(称为B 类同学),现用分层抽样方法(按A 类、B 类分二层)从该年级的学生中共抽查100名同学,测得这100名同学身高(单位:厘米)频率分布直方图如图:(1)统计方法中,同一组数据常用该组区间的中点值(例如区间[160,170)的中点值为165)作为代表.据此,计算这100名学生身高数据的平均值;(2)如果以身高达170 cm 作为达标的标准,对抽取的100名学生,得到以下2×2列联表: 体育锻炼与身高达标2×2列联表①完成上表;②能否判定体育锻炼与身高达标有关系(χ2值精确到0.01)?解析:(1)数据的平均值为:145×0.03+155×0.17+165×0.30+175×0.30+185×0.17+195×0.03=170(cm). (2)①②χ2=100(75×25×50×50≈1.33<3.841.因此没有理由认为体育锻炼与身高达标有关系,即体育锻炼与身高达标无关.。
高中数学独立性检验精选题目(附解析)
高中数学独立性检验精选题目(附解析)(1)分类变量和列联表①分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.②列联表(ⅰ)定义:列出的两个分类变量的频数表,称为列联表.(ⅱ)2×2列联表.一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为(2)等高条形图①等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.②观察等高条形图发现aa+b和cc+d相差很大,就判断两个分类变量之间有关系.(3)独立性检验一、用2×2列联表分析两分类变量间的关系1.在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用aa+b与cc+d判断二者是否有关系.解:2×2列联表如下:a a+b =4364=0.671 875.cc+d=2760=0.45.显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.注:(1)作2×2列联表时,关键是对涉及的变量分清类别.计算时要准确无误.(2)利用2×2列联表分析两个分类变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将aa+b与cc+d⎝⎛⎭⎪⎫ba+b与dc+d的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.2.假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为:则当m取下面何值时,X)A.8B.9C.14D.19解析:选C由10×26≈18m,解得m≈14.4,所以当m=14时,X与Y的关系最弱.3.分类变量X和Y的列联表如下:则下列说法正确的是()A.ad-bc越小,说明X与Y关系越弱B.ad-bc越大,说明X与Y关系越强C.(ad-bc)2越大,说明X与Y关系越强D.(ad-bc)2越接近于0,说明X与Y关系越强解析:选C|ad-bc|越小,说明X与Y关系越弱,|ad-bc|越大,说明X与Y关系越强.4.假设有两个变量X与Y,它们的取值分别为x1,x2和y1,y2,其列联表为:为()A.a=50,b=40,c=30,d=20B.a=50,b=30,c=40,d=20C.a=20,b=30,c=40,d=50 D.a=20,b=30,c=50,d=40解析:选D当(ad-bc)2的值越大,随机变量K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)的值越大,可知X与Y有关系的可能性就越大.显然选项D中,(ad-bc)2的值最大.5.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:________(填“是”或“否”).解析:因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即ba+b=1858,dc+d=2742,两者相差较大,所以经直观分析,收看新闻节目的观众与年龄是有关的.答案:是二、用等高条形图分析两分类变量间的关系1.某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类型是否有关系.解:作列联表如下:续表考前心情不紧94381475张总计426594 1 020相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的人数的比例,从图中可以看出考前心情紧张的样本中性格内向的人数占的比例比考前心情不紧张样本中性格内向的人数占的比例高,可以认为考前紧张与性格类型有关.注:利用等高条形图判断两个分类变量是否相关的步骤:2.在调查的480名男人中有38人患色盲,520名女人中有6名患色盲,试利用图形来判断色盲与性别是否有关?解:根据题目给出的数据作出如下的列联表:色盲不色盲总计男38442480女6514520总计449561000根据列联表作出相应的等高条形图:从等高条形图来看,在男人中患色盲的比例要比在女人中患色盲的比例大得多,因此,我们认为患色盲与性别是有关系的.3.观察下列各图,其中两个分类变量x,y之间关系最强的是()解析:选D在四幅图中,D图中两个深色条的高相差最明显,说明两个分类变量之间关系最强.4.在独立性检验中,可以粗略地判断两个分类变量是否有关系的是() A.散点图B.等高条形图C.假设检验的思想D.以上都不对解析:选B用等高条形图可以粗略地判断两个分类变量是否有关系,体现了数形结合思想,但是无法给出结论的可信程度,故选B.5.为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:父母吸烟父母不吸烟总计子女吸烟23783320子女不吸烟678522 1 200总计915605 1 520利用等高条形图判断父母吸烟对子女吸烟是否有影响?解:等高条形图如图所示:由图形观察可以看出父母吸烟者中子女吸烟的比例要比父母不吸烟者中子女吸烟的比例高,因此可以在某种程度上认为“子女吸烟与父母吸烟有关系”.三、独立性检验1.研究人员选取170名青年男女大学生为样本,对他们进行一种心理测验.发现有60名女生对该心理测验中的最后一个题目的反应是:作肯定的有22名,否定的有38名;110名男生在相同的项目上作肯定的有22名,否定的有88名.问:性别与态度之间是否存在某种关系?用独立性检验的方法判断.(链接教材P95-例1)附:解:根据2×2k=170×(22×38-22×88)2110×60×44×126≈5.622>5.024.所以在犯错误的概率不超过0.025的前提下,认为“性别与态度有关系”.注:根据题意列出2×2列联表,计算K2的观测值,如果K2的观测值很大,说明两个分类变量有关系的可能性很大;如果K2的观测值比较小,则认为没有充分的证据显示两个分类变量有关系.2.“开门大吉”是某电视台推出的游戏节目.选手面对1~8号8扇大门,依次按响门上的门铃,门铃会播放一段音乐(将一首经典流行歌曲以单音色旋律的方式演绎),选手需正确回答出这首歌的名字,方可获得该扇门对应的家庭梦想基金.在一次场外调查中,发现参赛选手多数分为两个年龄段:20~30;30~40(单位:岁),其猜对歌曲名称与否的人数如图所示.(1)写出2×2列联表;判断能否在犯错误的概率不超过0.10的前提下认为猜对歌曲名称与年龄有关系;说明你的理由;(下面的临界值表供参考)P(K2≥k0)0.100.050.0100.005k0 2.706 3.841 6.6357.879(2)6名选手,并抽取3名幸运选手,求3名幸运选手中至少有一人在20~30岁之间的概率.解:(1)根据所给的二维条形图得到列联表:正确错误总计20~30岁10304030~40岁107080总计20100120k=120×(10×70-10×30)220×100×40×80=3.∵3>2.706,∴在犯错误的概率不超过0.10的前提下认为猜对歌曲名称与年龄有关系.(2)按照分层抽样方法可知,20~30(岁)抽取:6×40120=2(人);30~40(岁)抽取:6×80120=4(人).在上述抽取的6名选手中,年龄在20~30(岁)有2人,年龄在30~40(岁)有4人.记至少有一人年龄在20~30岁为事件A,则P(A)=1-C34C36=1-420=45.故至少有一人年龄在20~30岁之间的概率为4 5.3.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力()A.平均数与方差B.回归分析C.独立性检验D.概率解析:选C判断两个分类变量是否有关的最有效方法是进行独立性检验.4.对于分类变量X与Y的随机变量K2的观测值k,下列说法正确的是() A.k越大,“X与Y有关系”的可信程度越小B.k越小,“X与Y有关系”的可信程度越小C.k越接近于0,“X与Y没有关系”的可信程度越小D.k越大,“X与Y没有关系”的可信程度越大解析:选B k越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大,即k越小,“X与Y有关系”的可信程度越小.5.某班主任对全班50名学生进行了作业量的调查,数据如下表,则学生的性别与认为作业量的大小有关的把握大约为()A.99%C.90% D.无充分证据解析:选B由2×2列联表得K2的观测值k=50×(18×15-8×9)2 27×23×26×24≈5.059>5.024,故有97.5%的把握认为学生性别与认为作业量大小有关,故选B.6.为了解决高二年级统计案例入门难的问题,某校在高一年级的数学教学中设有试验班,着重加强统计思想的渗透,下面是高二年级统计案例的测验成绩统计表(单位:分)的一部分,试分析试验效果.附:解:k=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=100(32×38-18×12)250×50×44×56≈16.234.因为16.234>6.635,所以,在犯错误的概率不超过0.01的前提下认为高二年级统计案例的测试成绩与高一年级数学教学中增加统计思想的渗透有联系.巩固练习:1.下列关于K2的说法不正确的是()A.根据2×2列联表中的数据计算得出K2的观测值k≥6.635,而P(K2≥6.635)≈0,01,则有99%的把握认为两个分类变量有关系B.K2的观测值k越大,两个分类变量的相关性就越大C.K2是用来判断两个分类变量是否有关系的随机变量D.K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d为样本容量解析:选D D选项的公式中分子应该是n(ad-bc)2.故选D.2.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()表1表2A.成绩B.视力C.智商D.阅读量解析:选D因为K21=52×(6×22-14×10)2 16×36×32×20=52×8216×36×32×20,K22=52×(4×20-16×12)216×36×32×20=52×112216×36×32×20,K23=52×(8×24-12×8)216×36×32×20=52×96216×36×32×20,K24=52×(14×30-6×2)216×36×32×20=52×408216×36×32×20,则有K24>K22>K23>K21,所以阅读量与性别有关联的可能性最大.2.在某次独立性检验中,得到如下列联表:最后发现,两个分类变量没有任何关系,则a的值可能是() A.200 B.720C.100 D.180解析:选B由于A和B没有任何关系,根据列联表可知2001 000和180180+a基本相等,检验可知,B满足条件,故选B.3.两个分类变量X,Y,它们的取值分别为{x1,x2}和{y1,y2},其列联表为:若两个分类变量X,Y没有关系,则下列结论正确的是________(填序号).①ad≈bc;②aa+b≈cc+d;③c+da+b+c+d≈b+da+b+c+d;④c+aa+b+c+d≈b+da+b+c+d;⑤(a+b+c+d)(ad-bc)2(a+b)(b+d)(a+c)(c+d)≈0.解析:因为分类变量X,Y独立,所以aa+b ≈cc+d,化简得ad≈bc,所以①②⑤正确,③④显然不正确.答案:①②⑤4.随着生活水平的提高,人们患肝病的越来越多,为了解中年人患肝病与经常饮酒是否有关,现对30名中年人进行了问卷调查得到如下列联表:已知在全部30人中随机抽取1人,抽到肝病患者的概率为4 15.(1)请将上面的列联表补充完整,并判断是否有99.5%的把握认为患肝病与常饮酒有关?说明你的理由;(2)现从常饮酒且患肝病的中年人(恰有2名女性)中,抽取2人参加电视节目,则正好抽到一男一女的概率是多少?解:(1)设患肝病中常饮酒的人有x人,x+230=415,x=6.常饮酒不常饮酒总计患肝病628 不患肝病41822 总计102030由已知数据可求得K2=30×(6×18-2×4)210×20×8×22≈8.523>7.879,因此有99.5%的把握认为患肝病与常饮酒有关.(2)设常饮酒且患肝病的男性为A,B,C,D,女性为E,F,则任取两人有AB,AC,AD,AE,AF,BC,BD,BE,BF,CD,CE,CF,DE,DF,EF,共15种.其中一男一女有AE,AF,BE,BF,CE,CF,DE,DF,共8种.故抽出一男一女的概率是P=8 15.5.某食品厂为了检查甲乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取40件产品作为样本称出它们的质量(单位:克),质量值落在(495,510]的产品为合格品,否则为不合格品.表1是甲流水线样本频数分布表,图1是乙流水线样本频率分布直方图.表1甲流水线样本频数分布表产品质量/克频数(490,495] 6(495,500]8(500,505]14(505,510]8(510,515] 4(1)根据上表数据作出甲流水线样本频率分布直方图;(2)若以频率作为概率,试估计从两条流水线分别任取1件产品,该产品恰好是合格品的概率分别是多少;(3)由以上统计数据作出2×2列联表,并回答在犯错误的概率不超过多少的前提下认为“产品的包装质量与两条要自动包装流水线的选择有关”.解:(1)甲流水线样本频率分布直方图如下:(2)由表1知甲样本合格品数为8+14+8=30,由图1知乙样本中合格品数为(0.06+0.09+0.03)×5×40=36,故甲样本合格品的频率为3040=0.75,乙样本合格品的频率为3640=0.9,据此可估计从甲流水线任取1件产品,该产品恰好是合格品的概率为0.75. 从乙流水线任取1件产品,该产品恰好是合格品的概率为0.9. (3)2×2列联表如下:甲流水线 乙流水线 总计 合格品 a =30 b =36 66 不合格品 c =10 d =4 14 总计4040n =80因为K 2k =n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=80×(120-360)266×14×40×40≈3.117>2.706, 所以在犯错误的概率不超过0.1的前提下认为产品的包装质量与两条自动包装流水线的选择有关.。
高中数学独立性检验例题
高中数学独立性检验例题1 什么是高中数学独立性检验?高中数学独立性检验是一种数学技术,用于检验一组随机变量之间是否具有独立性,而不依赖于其他系统变量,也就是说,是否具有“独立性”。
独立性检验是一项重要的统计推断工作,它根据变量之间的相关关系,来推断系统变量与其他变量之间是否存在某种类型的独立关系。
2 如何进行独立性检验?高中数学独立性检验的具体方法包括:先应用概率模型或统计模型来阐明变量之间的关系,然后使用算法对模型参数进行估计和检验,或者使用分类分析、回归分析、实验设计等技术。
最后,使用统计方法来检验系统变量与其他变量之间的独立关系,比如使用特征分析、因子分析、卡方分析等多种统计方法。
3 高中数学独立性检验的应用场景高中数学独立性检验主要用于处理数据分析过程中发现的变量之间的统计关系。
比如在经济分析中,在考察不同的经济模型时,可以使用这种方法来确定一组因素之间的“独立性”。
其他应用场景还包括行为研究、诊断、信息控制等。
4 例题针对以下问题,我们可以运用高中数学独立性检验来解决:假设学校有一组数学课,每一节数学课都有不同的教学方法。
我们要测试教学方法与学生学习成绩之间的独立性的关系。
首先我们需要收集一组数据,包括每位学生的学习成绩和他们所上的每一节数学课的教学方法。
然后假设他们之间有一个潜在的独立变量,用高中数学的独立性检验来检验教学方法与学生学习成绩之间的关系。
在进行检验时,令检验统计量(比如卡方检验)计算出来后,再和某个临界值进行比较,看看这一组数据与独立假设的拒绝区是否一致,如果不一致,则可以推断出教学方法和学生的学习成绩之间的独立性存在某种关系。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计案例--独立性检验 同步练习
1、下列关于卡方2χ的说法正确的是( ) A.2χ在任何相互独立问题中都可用与检验是否相关 B. 2χ的值越大,两个事件的相关性越大
C.2χ是用来判断两个相互独立事件相关与否的一个统计量,它可以用来判断两个事件是否相关这类问题
D. )
)()()(()
(2d b c a d c b a bc ad n ++++-=
χ.
2、在吸烟与患肺病这两个分类变量的计算中,下列说法中正确的是( )
A. 若统计量635.62>χ,我们有99%的把握说吸烟与患肺病有关,则某人吸烟,那么他有99%的可能患有肺病
B. 若从统计中求出,有99%的把握说吸烟与患肺病有关,则在100个吸烟者中必有99人患有肺病
C. 若从统计量中求出有95%把握说吸烟与患肺病有关,是指有5%的可能性使得推断错误
D. 以上说法均错误
3
A. 种子经过处理跟是否生病有关
B. 种子经过处理跟是否生病无关
C. 种子是否经过处理决定是否生病
D. 以上都是错误的
4、若由一个22⨯列联表中的数据计算得013.42=χ,那么有 的把握认为两个变量有关系.
5、独立性检验所采用的思路是:要研究A 、B 两类型因子彼此相关,首先假设这两类因子彼此 ,在此假设下构造2χ统计量.如果2χ的观测值较大,那么在一定程度上说明假设 .
6、某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该搜集那些数据?
.
7、打鼾不仅影响别人休息,而且可能与患某种疾病有关,下表是一次调查所得数据,试问:每一晚都打与患心脏病有关吗?有多大把握认为你的结论成立?
8、为了研究某种新药的副作用(如恶心等),给50位患者服用此新药,另外50名患者服用
9、某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革的关系,随机抽取了189名员工进行调查,其中支持企业改革的调查者中,工作积极的54人,工作一般的32人,而不太赞成企业改革的调查者中,工作积极的40人,工作一般的63人.
(1)根据以上数据建立一个2
2 的列联表;
(2)对于人力资源部的研究项目,根据以上数据可以认为企业的全体员工对待企业改革的
态度与其工作积极性是否有关系?
参考答案
1、C
2、C
3、B
4、95%
5、无关 不成立
6、女教授人数,男教授人数,女副教授人数,男副教授人数
7、解:提出假设
H :患心脏病与是否每一晚都打鼾没有关系.
根据列联表中的数据,可以求得
033
.6813792541579542422413553016332
2
≈⨯⨯⨯⨯-⨯⨯=)(χ 因为当
H 成立时,
828.102
≥χ的概率约为0.001,所以有99.9%的把握认为:每一晚都打鼾与患心脏病有关系.
8、解:提出假设
H :服用新药与产生副作用之间没有关系
由已知数据可以求得
63
.686.78119505043546151002
2
>=⨯⨯⨯⨯-⨯⨯=)(χ 所以有99%的把握认为新药与产生副作用是相关联的. 9、解:(1)根据题设条件,得22⨯列联表如下:
H :企业的全体员工对待企业改革的态度与其工作积极性无关.
根据(1)中列联表的数据,可以求得
879
.7759.10103869594324063541892
2
>≈⨯⨯⨯⨯-⨯⨯=)(χ所以有99.5%的把握认为抽样员工对待企业改革的态度与其工作积极性是有关的.从而可以认为企业的全体员工对待企业改革的态度与其
工作积极性是有关的。