高中数学统计部分经典题集
(精选试题附答案)高中数学第九章统计经典大题例题
(名师选题)(精选试题附答案)高中数学第九章统计经典大题例题单选题1、某中学高一年级有400人,高二年级有320人,高三年级有280人,若每人被抽到的可能性都为0.2,用随机数表法在该中学抽取容量为n的样本,则n等于()A.80B.160C.200D.280答案:C分析:每个个体被抽的可能性等于样本容量除以总体数,由此列出关于n的方程并求解出结果.=0.2,解得n=200,由题意可知:n400+320+280故选:C.2、某校为了解学生的课外锻炼身体的情况,随机抽取了部分学生,对他们一周的课外锻炼时间进行了统计,统计数据如下表所示:则该校学生一周进行课外锻炼的时间的第40百分位数是()A.8.5B.8C.7D.9答案:A分析:根据百分位数的求法计算即可.抽取的学生人数为6+10+9+8+7=40.由40%×40=16,故第40百分位数为所有数据从小到大排序的第16项与第17项数据的平均数,=8.5.即8+92故选: A.3、下列调查方式较为合适的是()A.为了了解灯管的使用寿命,采用普查的方式B.为了了解我市中学生的视力状况,采用抽样调查的方式C.调查一万张面值为100元的人民币中有无假币,采用抽样调查的方式D.调查当今中学生喜欢什么体育活动,采用普查的方式答案:B分析:根据实际情况选择合适的调查方式即可判断.对A,为了了解灯管的使用寿命,应采用抽样调查的方式,故A错误;对B,为了了解我市中学生的视力状况,采用抽样调查的方式,故B正确;对C,调查一万张面值为100元的人民币中有无假币,采用抽样普查的方式,故C错误;对D,调查当今中学生喜欢什么体育活动,采用抽样普查的方式,故D错误.故选:B.4、2021年3月,树人中学组织三个年级的学生进行“庆祝中国共产党成立100周年”党史知识竞赛.经统计,得到前200名学生分布的饼状图(如图)和前200名中高一学生排名分布的频率条形图(如图),则下列命题错.误.的是()A.成绩前200名的200人中,高一人数比高二人数多30人B.成绩第1-100名的100人中,高一人数不超过一半C.成绩第1-50名的50人中,高三最多有32人D.成绩第51-100名的50人中,高二人数比高一的多答案:D分析:根据饼状图和条形图提供的数据判断.由饼状图,成绩前200名的200人中,高一人数比高二人数多200×(45%−30%)=30,A正确;=45<50,B 由条形图知高一学生在前200名中,前100和后100人数相等,因此高一人数为200×45%×12正确;成绩第1-50名的50人中,高一人数为200×45%×0.2=18,因此高三最多有32人,C正确;第51-100名的50人中,高二人数不确定,无法比较,D错误.故选:D.5、某射击运动员6次的训练成绩分别为:88,91,89,88,86,85,则这6次成绩的第70百分位数为()A.89B.89.5C.90D.90.5答案:A分析:先将数据按从小到大的顺序排列,计算6×70%=4.2不是整数,则所求的是从小到大排列的第5位数6次考试数学成绩从小到大为:85,86,88,88,89,91,6×70%=4.2,∴这名学生6次训练成绩的第70百分位数为89 .故选:A6、某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率直方图如图所示,估计棉花纤维的长度的样本数据的80百分位数是()A.29 mmB.29.5 mmC.30 mmD.30.5 mm答案:A分析:先求得棉花纤维的长度在30 mm以下的比例为85%,在25 mm以下的比例为85%-25%=60%,从而可得80百分位数一定位于[25,30)内,进而可求出答案棉花纤维的长度在30 mm以下的比例为(0.01+0.01+0.04+0.06+0.05)×5=0.85=85%,在25 mm以下的比例为85%-25%=60%,因此,80百分位数一定位于[25,30)内,=29,由25+5×0.80−0.600.85−0.60可以估计棉花纤维的长度的样本数据的80百分位数是29 mm.故选:A7、根据气象学上的标准,连续5天的日平均气温低于10℃即为入冬,将连续5天的日平均温度的记录数据(记录数据都是自然数)作为一组样本,现有4组样本①、②、③、④,依次计算得到结果如下:①平均数x̅<4;②平均数x̅<4且极差小于或等于3;③平均数x̅<4且标准差s≤4;④众数等于5且极差小于或等于4.则4组样本中一定符合入冬指标的共有()A .1组B .2组C .3组D .4组答案:B分析:举反例否定①;反证法证明②符合要求;举反例否定③;直接法证明④符合要求.①举反例:0,0,0,4,11,其平均数x̅=3<4.但不符合入冬指标;②假设有数据大于或等于10,由极差小于或等于3可知,则此组数据中的最小值为10−3=7,此时数据的平均数必然大于7,与x̅<4矛盾,故假设错误.则此组数据全部小于10. 符合入冬指标;③举反例:1,1,1,1,11,平均数x̅=3<4,且标准差s =4.但不符合入冬指标;④在众数等于5且极差小于等于4时,则最大数不超过9.符合入冬指标.故选:B .8、关于圆周率π,数学发展史上出现过许多很有创意的求法,如著名的浦丰实验和查理斯实验.受其启发,我们也可以通过设计下面的实验来估计π的值:先请全校m 名同学每人随机写下一个都小于1的正实数对(x,y );再统计两数能与1构成钝角三角形三边的数对(x,y )的个数a ;最后再根据统计数a 估计π的值,那么可以估计π的值约为( )A .4a mB .a+2mC .a+2m mD .4a+2m m答案:D解析:由试验结果知m 对0~1之间的均匀随机数x,y ,满足{0<x <10<y <1,面积为1,再计算构成钝角三角形三边的数对(x,y),满足条件的面积,由几何概型概率计算公式,得出所取的点在圆内的概率是圆的面积比正方形的面积,即可估计π的值.解:根据题意知,m 名同学取m 对都小于1的正实数对(x,y ),即{0<x <10<y <1, 对应区域为边长为1的正方形,其面积为1,若两个正实数x,y 能与1构成钝角三角形三边,则有{x 2+y 2<1x +y >10<x <10<y <1,其面积S =π4−12;则有a m =π4−12,解得π=4a+2m m故选:D .小提示:本题考查线性规划可行域问题及随机模拟法求圆周率的几何概型应用问题. 线性规划可行域是一个封闭的图形,可以直接解出可行域的面积;求解与面积有关的几何概型时,关键是弄清某事件对应的面积,必要时可根据题意构造两个变量,把变量看成点的坐标,找到试验全部结果构成的平面图形,以便求解.9、某校高一共有10个班,编号为01,02,…,10,现用抽签法从中抽取3个班进行调查,设高一(5)班被抽到的可能性为a ,高一(6)班被抽到的可能性为b ,则( )A .a =310,b =29B .a =110,b =19 C .a =310,b =310D .a =110,b =110答案:C分析:根据简单随机抽样的定义,分析即可得答案.由简单随机抽样的定义,知每个个体被抽到的可能性相等,故高一(5)班和高一(6)班被抽到的可能性均为310. 故选:C10、为调查参加考试的高二级1200名学生的成绩情况,从中抽查了100名学生的成绩,就这个问题来说,下列说法正确的是( )A .1200名学生是总体B .每个学生是个体C .样本容量是100D .抽取的100名学生是样本答案:C分析:根据总体、个体、样本容量、样本的定义,结合题意,即可判断和选择.根据题意,总体是1200名学生的成绩;个体是每个学生的成绩;样本容量是100,样本是抽取的100名学生的成绩;故正确的是C.故选:C.填空题11、某市A、B、C三个区共有高中学生20000人,其中A区高中学生7000人,现采用分层抽样的方法从这三个区所有高中学生中抽取一个容量为600人的样本进行学习兴趣调查,则A区应抽取__________________.答案:210分析:根据总体数和要抽取的样本数,得到每个个体被抽到的概率,利用这个概率乘以A区的人数,得到A区要抽取的人数.解:由题意知A区在样本中的比例为700020000∴A区应抽取的人数是700020000×600=210.所以答案是:210.12、某单位有员工900人,其中女员工有360人,为做某项调查,拟采用分层抽样的方法抽取容量为150的样本,则应抽取的男员工人数是_______________________.答案:90分析:按照分层抽样的定义,按照比例抽取即可由题意,设应抽取的男员工人数是x则900−360900=x150解得:x=90所以答案是:9013、已知一组数据:20,30,40,50,50,60,70,80,记这组数据的第60百分位数为a,众数为b,则a和b的大小关系是______________.(用“<”“>”或“=”连接)答案:a=b##b=a分析:由百分位数求法得50为第60百分位数,并确定数据的众数,即可比较它们的大小关系.因为8×60%=4.8,所以这组数据的第5个数:50为第60百分位数.观察易知这组数据的众数为50,所以a和b的大小关系是a=b.所以答案是:a=b14、某校从高一新生中随机抽取了一个容量为20的身高样本,数据从小到大排序如下(单位:cm):152 ,155,158,164,164,165,165,165,166,167,168,168,169,170,170,170 ,171,x,174,175,若样本数据的第90百分位数是173,则x的值为________.答案:172分析:根据百分位数的意义求解.百分位数的意义就在于,我们可以了解的某一个样本在整个样本集合中所处的位置,=173,x=172本题第90百分位数是173,所以x+1742故答案为:172小提示:本题考查样本数据的第多少百分位数的概念.15、气象意义上从春季进入夏季的标志为连续5天的日平均温度均不低于22℃.现有甲、乙、丙三地连续5天的日平均温度的记录数据:(记录数据都是正整数)①甲地5个数据的中位数为24,众数为22;②乙地5个数据的中位数为27,总体均值为24;③丙地5个数据中有一个数据是32,总体均值为26,总体方差为10.8.则肯定进入夏季的地区有_____.答案:①③分析:根据数据的特点进行估计甲、乙、丙三地连续5天的日平均气温的记录数据,分析数据的可能性进行解答即可得出答案.①甲地:5个数据的中位数为24,众数为22,根据数据得出:甲地连续5天的日平均温度的记录数据可能为:22、22、24、25、26,其连续5天的日平均气温均不低于22;②乙地:5个数据的中位数为27,总体均值为24,当5个数据为19、20、27、27、27,可知其连续5天的日平均温度有低于22,故不确定;③丙地:5个数据中有一个数据是32,总体均值为26,若有低于22,假设取21,此时方差就超出了10.8,可知其连续5天的日平均温度均不低于22,如22、25、25、26、32,这组数据的平均值为26,方差为10.8,但是进一步扩大方差就会超过10.8,故③对.则肯定进入夏季的地区有甲、丙两地,故答案为①③.小提示:本题考查中位数、众数、平均数、方差的数据特征,简单的合情推理,解答此题应结合题意,根据平均数的计算方法进行解答、取特殊值即可.解答题16、为了了解一种植物果实的情况,随机抽取一批该植物果实样本测量重量(单位:克),按照[27.5,32.5),[32.5,37.5),[37.5,42.5),[42.5,47.5),[47.5,52.5]分为5组,其频率分布直方图如图所示.(1)求图中a的值;(2)估计这种植物果实重量的平均数x̅(同一组中的数据用该组区间的中点值作代表);(3)已知这种植物果实重量不低于37.5克的即为优质果实,现对该种植物果实的某批10000个果实进行检测.据此估算这批果实中的优质果实的个数.答案:(1)a=0.050(2)40(3)7000分析:(1)由各组频率之和为1(面积之和为1)可求得;(2)频率分布直方图用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和估计平均数;(3)用样本频率估计总体概率进行求解.(1)由题意,有(0.020+0.040+0.075+a+0.015)×5=1,解得a=0.050;(2)这种植物果实重量的平均数约为:30×0.020×5+35×0.040×5+40×0.075×5+45×0.050×5+50×0.015×5=40,∴这种植物果实重量的平均数x̅的估计值约为40.(3)样本中,这种植物果实重量不低于37.5克,即优质果实的频率为0 .075×5+0.050×5+0.015×5=0.7,由此估计某批10000个果实中,重量不低于37.5克,即优质果实的概率为0.7,∴这批果实中的优质果实的个数约为10000×0.7=7000个.17、第24届北京冬季奥林匹克运动会于2022年2月4日至2月20日在北京和张家口联合举办.这是中国历史上第一次举办冬季奥运会,它掀起了中国人民参与冬季运动的大热潮.某市举办了中学生滑雪比赛,从中抽取40名学生的测试分数绘制成茎叶图和频率分布直方图如下,后来茎叶图受到了污损,可见部分信息如图.(1)求频率分布直方图中a的值,并根据直方图估计该市全体中学生的测试分数的平均数(同一组中的数据以这组数据所在区间中点的值作代表,结果保留一位小数);(2)现要对测试成绩在前26%的中学生颁发“滑雪达人”证书,并制定出能够获得证书的测试分数线,请你用样本来估计总体,给出这个分数线的估计值.答案:(1)a=0.02,平均数为74.5(2)82分析:(1)计算出测试分数位于[90,100]个数,可求得测试分数位于[80,90)的个数,由此可求得a的值,将每个矩形底边的中点值乘以对应矩形的面积,将所得结果全加可得样本的平均数;(2)设能够获得证书的测试分数线为x,分析可得80<x<90,根据已知条件可得出关于x的等式,求解即可. (1)解:由频率分布直方图可知,测试分数位于[90,100]的频率为10×0.01=0.1,则测试分数位于[90,100]个数为40×0.1=4,所以,测试分数位于[80,90)的个数为40−(4+10+14+4)=8,÷10=0.02.所以a=840估计平均数为55×0.1+65×0.25+75×0.35+85×0.2+95×0.1=74.5.(2)解:因为测试分数位于[90,100]的频率为0.1,测试分数位于[80,90)的频率为0.2,能够获得“滑雪达人”证书的中学生测试分数要在前26%,故设能够获得证书的测试分数线为x,则80<x<90,由(90−x)×0.02=0.26−0.1,可得x=82,所以分数线的估计值为82.18、某中学要从高一年级甲乙两个班级中选择一个班参加电视台组织的“环保知识竞赛”,该校对甲乙两班的参赛选手(每班7人)进行了一次环保知识测试,他们取得的成绩(满分100分)的茎叶图如图所示,其中甲班学生的平均分是85,乙班学生成绩的中位数是85.(1)求x,y的值;(2)根据茎叶图,求甲乙两班同学方差的大小,并从统计学角度分析,该校应选择甲班还是乙班参赛.答案:(1)x=9,y=5;(2)乙班成绩比较稳定,故应选乙班参加.分析:(1)利用茎叶图,根据甲班7名学生成绩的平均分是85,乙班7名学生成绩的中位数是85.先求出x,y,(2)求出乙班平均分,再求出甲班7名学生成绩方差和乙班名学生成绩的方差,由此能求出结果.解:(1)甲班的平均分为:17(75+78+80+80+x+85+92+96)=85;解得x=9,∵乙班7名学生成绩的中位数是85,∴y=5,(2)乙班平均分为:17(75+80+80+85+90+90+95)=85;甲班7名学生成绩方差S12=17(102+72+52+42+02+72+112)=3607,乙班名学生成绩的方差S22=17(102+52+52+02+52+52+102)=3007,∵两个班平均分相同,S22<S12,∴乙班成绩比较稳定,故应选乙班参加.小提示:本题考查茎叶图的应用,解题时要认真审题,属于基础题.19、2019年下半年以来,各地区陆续出台了“垃圾分类”的相关管理条例,实行“垃圾分类”能最大限度地减少垃圾处置量,实现垃圾资源利用,改善垃圾资源环境,某部门在某小区年龄处于[20,45]岁的人中随机地抽取x人,进行了“垃圾分类”相关知识掌握和实施情况的调查,并把达到“垃圾分类”标准的人称为“环保族”,得到如图示各年龄段人数的频率分布直方图和表中的统计数据.(1)求x、y、z的值;(2)根据频率分布直方图,估计这x人年龄的平均值(同一组数据用该区间的中点值代替,结果按四舍五入保留整数);(3)从年龄段在[25,35]的“环保族”中采取分层抽样的方法抽取9人进行专访,并在这9人中选取2人作为记录员,求选取的2名记录员中至少有一人年龄在[30,35]中的概率.答案:(1){x=200y=0.625z=6;(2)30.75;(3)1318.分析:(1)由频率分布直方图和频数分布表能求出x、y、z;(2)根据频率分布直方图,能估计这x人年龄的平均值;(3)从年龄段在[25,35]的“环保族”中采取分层抽样的方法抽取9人进行专访,[25,30)中选5人,分别记为A、B、C、D、E,[30,35]中选4人,分别记为a、b、c、d,在这9人中选取2人作为记录员,利用列举法列举出所有的基本事件,然后利用古典概型的概率公式可求得所求事件的概率.(1)由题意得:{x=450.750.06×5=200y=25200×0.04×5=0.625z=200×0.03×5×0.2=6;(2)根据频率分布直方图,估计这x人年龄的平均值为:x=22.5×0.3+27.5×0.2+32 .5×0.2+37.5×0.15+42.5×0.15=30.75;(3)从年龄段在[25,35]的“环保族”中采取分层抽样的方法抽取9人进行专访,从[25,30)中选:9×2525+20=5人,分别记为A、B、C、D、E,从[30,35]中选:9×2025+20=4人,分别记为a、b、c、d,在这9人中选取2人作为记录员,所有的基本事件有:(A,B)、(A,C)、(A,D)、(A,E)、(A,a)、(A,b)、(A,c)、(A,d)、(B,C)、(B,D)、(B,E)、(B,a)、(B,b)、(B,c)、(B,d)、(C,D)、(C,E)、(C,a)、(C,b)、(C,c)、(C,d)、(D,E)、(D,a)、(D,b)、(D,c)、(D,d)、(E,a)、(E,b)、(E,c)、(E,d)、(a,b)、(a,c)、(a,d)、(b,c)、(b,d)、(c,d),共36种,选取的2名记录员中至少有一人年龄在[30,35]包含的基本事件有:(A,a)、(A,b)、(A,c)、(A,d)、(B,a)、(B,b)、(B,c)、(B,d)、(C,a)、(C,b)、(C,c)、(C,d)、(D,a)、(D,b)、(D,c)、(D,d)、(E,a)、(E,b)、(E,c)、(E,d)、(a,b)、(a,c)、(a,d)、(b,c)、(b,d)、(c,d),共26种,因此,选取的2名记录员中至少有一人年龄在[30,35]中的概率P=2636=1318.小提示:本题考查频率、平均数、概率的求法,考查频数分布表、频率分布直方图、分层抽样、古典概型的性质等基础知识,考查数据分析能力、运算求解能力,是基础题.。
高中数学:统计与统计案例练习
高中数学:统计与统计案例练习一、选择题1.某校为了解学生平均每周的上网时间(单位:h),从高一年级1 000名学生中随机抽取100 名进行了调查,将所得数据整理后,画出频率分布直方图(如图),其中频率分布直方图从左到右前3个小矩形的面积之比为1 : 3 : 5,据此估计该校高一年级学生中平均每周上网时间少于4 h的学生人数为()领率组距A. 200 C. 400 0.0350.015B. 240D. 48010平均每周上网时间(h)解析:选C 设频率分布直方图中从左到右前3个小矩形的面积分别为A3K5P.由频率分布直方图可知,最后2个小矩形的面积之和为(0.015+0.035)X2 = 0.1.由于频率分布直方图中各个小矩形的面积之和为1,所以P+3P+5P=0.9,即尸=0.1.所以平均每周上网时间少于4h的学生所占比例为尸+3P=0.4,由此估计学生人数为0.4X1 000 =400.2. AQI(Air Quality Index,空气质量指数)是报告每日空气质量的参数,描述了空气清洁或污染的程度.AQI共分六级,一级优(0〜50),二级良(51〜100),三级轻度污染(101〜150),四级中度污染(151〜200),五级重度污染(201〜300),六级严重污染(大于300).如图是昆明市2021年4月份随机抽取的10天的AQI茎叶图,利用该样本估计昆明市2021年4月份空气质量优的天数为 ()A. 3B. 4C. 12D. 2142解析:选c 从茎叶图知,10天中有4天空气质量为优,所以空气质量为优的频率为 1 V.Z 22所以估计昆明市2021年4月份空气质量为优的天数为30X5=12,应选C.3.〔成都模拟〕某城市收集并整理了该市2021年1月份至10月份各月最低气温与最高气 温〔单位:C 〕的数据,绘制了下面的折线图.该城市各月的最低气温与最高气温具有较好的线性关系,那么根据折线图,以下结论错误 的是〔〕A.最低气温与最高气温为正相关B. 10月的最高气温不低于5月的最高气温C.月温差〔最高气温减最低气温〕的最大值出现在1月D.最低气温低于0C 的月份有4个解析:选D 在A 中,最低气温与最高气温为正相关,故A 正确;在B 中,10月的最高气温 不低于5月的最高气温,故B 正确;在C 中,月温差〔最高气温减最低气温〕的最大值出现在1月, 故C 正确:在D 中,最低气温低于0℃的月份有3个,故D 错误.应选D.4 .〔承德模拟〕为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取 了容量为100的样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体 中倾向选择生育二胎与倾向选择不生育二胎的人数比例图〔如下图〕,其中阴影局部表示倾向 选择生育二胎的对应比例,那么以下表达中错误的选项是〔〕A.是否倾向选择生育二胎与户籍有关B.是否倾向选择生育二胎与性别无关♦最高气温 ♦最低气温C.倾向选择生育二胎的人员中,男性人数与女性人数相同D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数解析:选C 由题图,可得是否倾向选择生育二胎与户籍有关、与性别无关;倾向选择不 生育二胎的人员中,农村户籍人数少于城镇户籍人数;倾向选择生育二胎的人员中,男性人数为 60X60% =36,女性人数为40X60%=24,不相同.应选C.5 .(石家庄模拟)某学校48两个班的兴趣小组在一次对抗赛中的成绩如茎叶图所示,通过 茎叶图比拟两个班兴趣小组成绩的平均值及标准差.3 4 28 8 4 6 8 65152①A 班兴趣小组的平均成绩高于B 班兴趣小组的平均成绩; ②B 班兴趣小组的平均成绩高于A 班兴趣小组的平均成绩; ③A 班兴趣小组成绩的标准差大于B 班兴趣小组成绩的标准差;@B 班兴趣小组成绩的标准差大于A 班兴趣小组成绩的标准差. 其中正确结论的编号为()A.①④C. ®®其方差为白义[(53—78尸+(62—78/ +…+ (95—78)2]=121.6, 那么其标准差为'121.6%11.03;45+48+5H -------- F91B 班兴趣小组的平均成成为'」=66,其方差为表义[(45—66)2+(48 - 66)2 + ... + (91-66)2] =169.2, 那么其标准差为1169.2%13.01.应选A.6 .某商场对某一商品搞活动,该商品每一个的进价为3元,销售价为8元,每天售出的 第20个及之后的半价出售.该商场统计了近10天这种商品的销量,如下图,设M 个)为每天商 品的销量,M 元)为该商场每天箱售这种商品的利润.从日利润不少于96元的几天里任选2天, 那么选出的这2天日利润都是97元的概率为()4 5 5 1 6 2 7 38班8 3 6 4 5 3 4 02B.②③D.①③解析:选A A 班兴趣小组的平均成绩为 53+62+64+…+92+95--------------- ---------------- =785x, x=18, 19, y =<l95+(x-19)(4-3), x=20, 21, J5x, x=18, 19, 即 L176+x, x=20, 21.当日销量不少于20个时,日利泗不少于96元, 当日销量为20个时,日利润为96元, 当日销量为21个时,日利润为97元,日利泗为96元的有3天,记为日利泗为97元的有2天,记为人丛从中任选2天有 (.4),(〃石),(.力),(.1),3/),(48),3«),(c4),(.,8),(48),共 10 种情况.其中选出的这2天日利泗都是97元的有(A,8)1种情况. 故所求概率为关.应选B. 二、填空题7 .某小卖部销售某品牌饮料的零售价与销量间的关系统计如下:单价x/元 3.0 3.2 3.4 3.6 3.8 4.0 销量w 瓶504443403528x,y 的关系符合回归方程£=£+2其中分=-20.假设该品牌饮料的进价为2元,为使利润 最大,零售价应定为 元.解析:依题意得:x =3.5, y =40,A所以.=40—(- 20)X3.5=110,所以回归直线方程为f=-20x+110,利润 L = (A —2)(-20A + 110)= -201+ 150x-220,B 选• •1 - 9 1 - 5 A.C 解BioD.g由题意知频数(天)0 18 19 20 2 俏量〔个〕所以x=* = 3.75元时,利润最大.答案:3.758.某高校调查了200名学生每周的自习时间(单位:小时),制成了如下图的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是.解析:设所求的人数为〃,由频率分布直方图,自习时间不少于22.5小时的频率为(0.04+0.08 +0.16) X 2.5=0.7, n=0.7 X 200=140.答案:1409.为比拟甲乙两地某月11时的气温情况,随机选取该月5天11时的气温数据(单位:C) 制成如下图的茎叶图,甲地该月11时的平均气温比乙地该月11时的平均气温高1 ℃,那么甲地该月11时的平均气温的标准差为.甲9 8 2 62 m 03 I解析:甲地该月11时的气温数据(单位:℃)为28,29,30,30+〃?,32;乙地该月11时的气温数据(单位:℃)为26,28,29,31,31,那么乙地该月11时的平均气温为(26+28+29+31+31计5 = 29(℃),所以甲地该月11时的平均气温为30 ℃,故(28+29+30+30+m + 32)+5 = 30,解得〃?=1,那么甲地该月11时的平均气温的标准差为嗝义[(28 - 30产+(29 - 30)2+(30 - 30/+(31 - 30/+(32 - 30户]=\(2.答案:^2三、解做题10.某篮球运发动的投篮命中率为50%,他想提升自己的投篮水平,制定了一个夏季练习计划,为了了解练习效果,执行练习前他统计了10场比赛的得分,计算出得分的中位数为15,平均得分为15,得分的方差为463执行练习后也统计了10场比赛的得分,茎叶图如下图:0 8 91 2 4 4 5 6 82 1 3(1)请计算该篮球运发动执行练习后统计的10场比赛得分的中位数、平均得分与方差;⑵如果仅从执行练习前后统计的各10场比赛得分数据分析,你认为练习方案对该运发动的投篮水平的提升是否有帮助?为什么?解:(1)练习后得分的中位数为上芋=14.5;平均得分为8+9+12+14+14+15+16+18 + 21+23= 15:10方差为击义[(8—15)2 + (9 — 15>+(12 —15>+(14 — 15)2+(14 — 15> + (15 —15>+(16 — 15产+(18-15)2+(21-15)2+(23 —15)2]=20.6.(2)尽管中位数练习后比练习前稍小,但平均得分一样,练习前方差20.6小于练习前方差46.3, 说明练习后得分稳定性提升了(阐述观点合理即可),这是投篮水平提升的表现.故此练习方案对该篮球运发动的投篮水平的提升有帮助.11.(西安八校联考)在2021年俄罗斯世界杯期间,莫斯科的局部餐厅销售了来自中国的小龙虾,这些小龙虾均标有等级代码.为得到小龙虾等级代码数值x与销售单价y(单位:元)之间的关系,经统计得到如下数据:⑴销售单价),与等级代码数值x之间存在线性相关关系,求),关于x的线性回归方程(系数精确到0.1);(2)假设莫斯科某餐厅销售的中国小龙虾的等级代码数值为98,请估计该等级的中国小龙虾销售单价为多少元?参考公式:对于一组数据(xi1 ),3,光),…其回归直线f=源+2的斜率和截距的最小2Xyi一〃x y八 '। A — A——二乘估计分别为Z? = ----------------- a= y —b x .n _Xxr-n x 26 6参考数据:2>»=8 440, 2e = 25 564.—38+48 + 58 + 68 + 78 + 88解:(1)由题意,得x -■= 63,- 16.8+18.8+20.8 + 22.8 + 24+25.8 _y = 6 =21.5,yA_8 440 - 6X63X21.5〜h = ~~6Z—=25 564—6X63X63「026 A 2A — A 一a= y -bx =21.5-0.2X63 = 8.9.故所求线性回归方程为f=0.2x+8.9.⑵由(1)知,当%=98 时,>=0.2X98+8.9=28.5.・•・估计该等级的中国小龙虾销售单价为28.5元.12.(长沙模拟)某职称晋级评定机构对参加某次专业技术测试的100人的成绩进行了统计, 绘制的频率分布直方图如下图.规定80分以上者晋级成功,否那么晋级失败(总分值为100分).(1)求图中.的值;(2)估计该次测试的平均分不(同一组中的数据用该组的区间中点值代表);(3)根据条件完成下面2X2列联表,并判断能否有85%的把握认为“晋级成功〞与性别有关.P(K?2k)0.40 0.25 0.15 0.1()0.050.025k0.708 1.323 2.072 2.706 3.841 5.024解:(1)由频率分布直方图中各小长方形面积总和为1,得(2.+ 0.020+0.03.+0.040)义10=1,解得〃=0...5.⑵由频率分布直方图知洛小组的中点值依次是55,65,75,85,95, 对应的频率分别为0.05.30,0.40,0.20.05,那么估计该次测试的平均分为 x = 55X0.05 + 65X0.30 + 75X0.40 + 85X0.20 + 95X0.05 = 74(分). ⑶由频率分布直方图知,晋级成功的频率为0.20+0.05=0.25, 故晋级成功的人数为100X0.25 = 25,填写2X2列联表如下:晋级成功 晋级失败合计男 16 34 50 女 9 41 50 合计2575100100X(16X41 ——25X75X50X50^2,613>2.072,所以有85%的把握认为“晋级成功〞与性别有关.1 .为检查某工厂所生产的8万台电风扇的质量,抽查了其中20台的无故障连续使用时限(单 位:小时)如下:248 256 232 243 188 268 278 266 289 312 274296 288 302 295 228 287 217 329 283K 2=n(acl-bc)2(1)完成下面的频率分布表,并作出频率分布直方图;(2)估计8万台电风扇中有多少台无故障连续使用时限不低于280小时;(3)用组中值(同一组中的数据在该组区间的中点值)估计样本的平均无故障连续使用时限.解:(1)频率分布表及频率分布直方图如下所示:0.0100 ——⑵由题意可得8乂(0.30+0.10+0.05) = 3.6,所以估计8万台电风扇中有3.6万台无故障连续使用时限不低于280小时.(3)由频率分布直方图可知x =190X0.05 + 210X0.05 + 230X0.10 + 250X0.15 + 270X0.20 + 290X0.30 + 310X0.10 + 330X0.05 = 269(小时),所以样本的平均无故障连续使用时限为269小时.2 .海水养殖场进行某水产品的新、旧网箱养殖方法的产量比照,收获时各随机抽取了 100 个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A 表示事件“旧养殖法的箱产量低于50kg 〞,估计A 的概率;⑵填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量V50 kg箱产量250 kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比拟. 附:P (心2)0.050 0.010 0.001 k3.841 6.635 10.8280.01500.0125频率 仇距0.0075 0.0050 0.0025.厂工丁丁丁丁厂!无故障连续使用时用/小时新养殖法、n(ad-bc)1 _ .K-= . , , ,,其中〃=a+/?+c+d.(a+Z?)(c 十d)(a十c)(Z?+d)解:⑴旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)X5=0.62.因此,事件A的概率估计值为0.62.⑵根据箱产量的频率分布直方图得到联表:K2=---------- -------------------- 15 705100X100 X 96X104由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图说明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg 之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.3.为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:经计算得x =+£即=9.97,5=、*ZG L x )21 /=1 \ / 1O/=1/ 1 16 _ / 16 16 _=、/讳16 X 2比0.212, / L G-8.5)2^ 18.439,Z (x,- x )(L8.5)=—2.78,其中为为抽取的第i个零件的尺寸,i= 1,2, (16)(1)求⑶,i)(i= 12…,16)的相关系数二并答复是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(假设加V0.25,那么可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);(2)一天内抽检零件中,如果出现了尺寸在(刀-35,7 +3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.①从这一天抽检的结果看,是否需对当天的生产过程进行检查?②在(7 -35,7 +3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(H,v)(i = 12…4的相关系数£(X,-7)(57-7)r=I ______/ / ・、/(),008公丫0・09・、/ £ d )2、/ £ 8 - 5 )216 _Z (XL x )(/—8.5)尸1解:(1)由样本数据得8,i)(i= 1,2,…,16)的相关系数为r= --------- /--- 1/16 _ / 16、/ Z (即- X C-8.5)2 -2.78剔除第13个数据,剩下数据的样本方差为aX 〔1 591.134 —9.22?—15X 10.022〕=0.008,A Q 这条生产线当天生产的零件尺寸的标准差的估计值为廊而比0.09.4.〔昆明模拟〕〞工资条里显红利,个税新政入民心〞.随着2021年新年钟声的敲响,我国 自1980年以来,力度最大的一次个人所得税〔简称个税〕改革迎来了全面实施的阶段.某IT 从业 者为了解自己在个税新政下能享受多少税收红利,绘制了他在26〜35岁〔2021〜2021年〕之间各 年的月平均收入〕,〔单位:千元〕的散点图:20・・・・ 16- ・ , 12- ., 8 ■ •4°123456789 io"年龄代码工注:年龄代码1~10分别对应年的26〜35岁⑴由散点图知,可用回归模型y=h\n x+a 拟合〕,与x 的关系,试根据有关数据建立〕,关于x 的回归方程;〔2〕如果该IT 从业者在个税新政下的专项附加扣除为3 000元/月,试利用〔1〕的结果,将月平 均收入视为月收入,根据新旧个税政策,估计他36岁时每个月少缴纳的个人所得税.1010 10 _10_ _ 10附注:参考数据:= 55,2〕〉= 155.5,N 〔即一x 〕2 =82.5,2 — x〕〔F — y 〕 = 94.9,26= i=li=li=lJ =1io _ io _ _15.1,2 缶- 1〕2=4.84,£〔力一 t 〕〔yi- y 〕 =242其中"=ln 为;取 In 11 =24,In 36=361=1 /=1参考公式:回归方程.=筋+味中斜率和截距的最小二乘估计分别为公= n ______ _X 〔出一〃〕〔.- V 〕 曰 A - A — -------------------------- \a= v —b u .Z 〔3一 〃 〕2月平均收入y千元解:(1)令 f=lnx,那么 y=bf+a10__Z & -,)()L y)24.2, b ~ ~__Z _痴_5ze —)2r=l10Zu-_2__155.5-_2_=而=-^-=15.55, t =苗A — A —a= y —b t = 15.55 —5X 1.51=8,所以〕,关于/的回归方程为〕,=5/+8.1015.1 lo"=L51由于/=lnx,所以y关于x的回归方程为y=51nx+8.⑵由⑴得,该IT从业者36岁时月平均收入为y=51n 11+8 = 5X2.4+8 = 20〔千元〕.旧个税政策下每个月应缴纳的个人所得税为1 500X3%+3 000X10%+4 500X20%+〔20 000-3 500-9 000〕X25% = 3 120〔元〕.新个税政策下每个月应缴纳的个人所得税为3 000X3%+〔20 000-5 OOO-3OOO-3 000〕X 10%=990〔元〕.故根据新旧个税政策,该IT从业者36岁时每个月少缴纳的个人所得税为3 120-990=2 130(70).I— 0 180.212X716X18.439 ',由于lrlV0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)①由于7 =9.97,产0.212,由样本数据可以看出抽取的第13个零件的尺寸在(T—3s,7 + 3s)以外,因此需对当天的生产过程进行检查.②剔除离群值,即第13个数据,剩下数据的平均数为右义(16义9.97—9.22)=10.02,这条生产线当天生产的零件尺寸的均值的估计值为10.02.162X?=16X0.212I2+16X9.972^1 591.134,。
高中统计练习题及讲解
高中统计练习题及讲解一、选择题1. 以下哪个选项是描述数据集中趋势的统计量?- A. 方差- B. 标准差- C. 平均数- D. 极差2. 一组数据的中位数是50,众数是60,这组数据的分布可能是怎样的?- A. 正偏态分布- B. 负偏态分布- C. 对称分布- D. 无法确定二、填空题1. 某班级学生数学成绩的平均数为80分,方差为100,如果一个学生的成绩是90分,那么他的标准分是______。
2. 已知一组数据的中位数为40,如果将这组数据的每个数值都增加10,新的中位数为______。
三、解答题1. 某公司员工的月收入数据如下:4000元,5000元,6000元,7000元,8000元。
请计算这组数据的平均数、中位数和众数。
2. 某班学生期末考试成绩如下:70分,80分,90分,100分。
计算这组数据的方差和标准差。
四、数据分析题某市中学生的身高数据如下(单位:厘米):165,170,175,180,185。
请分析这组数据的分布特征,并计算其平均身高、中位数、众数、方差和标准差。
高中统计练习题讲解一、选择题1. C. 平均数是描述数据集中趋势的统计量,它表示数据集中所有数值的算术平均。
2. A. 如果中位数小于众数,通常意味着数据集呈现正偏态分布。
二、填空题1. 标准分是指一个数值与平均数的差除以标准差。
首先计算平均数:(4000 + 5000 + 6000 + 7000 + 8000) / 5 = 6000。
然后计算标准差:√(100) = 10。
最后计算标准分:(90 - 6000) / 10 = -5。
2. 当数据集中的每个数值都增加一个常数时,中位数也会增加相同的常数。
因此,新的中位数为40 + 10 = 50。
三、解答题1. 平均数 = (4000 + 5000 + 6000 + 7000 + 8000) / 5 = 6000元。
中位数 = 6000元(中间的数值)。
众数 = 6000元(出现次数最多的数值)。
高中统计测试题及答案
高中统计测试题及答案一、选择题(每题3分,共30分)1. 以下哪项是描述数据集中趋势的统计量?A. 方差B. 标准差C. 中位数D. 众数答案:C2. 统计学中,用于衡量数据离散程度的指标是:A. 平均数B. 中位数C. 众数D. 方差答案:D3. 如果一组数据的均值为50,标准差为10,则这组数据的变异系数为:A. 0.2B. 0.5C. 1D. 2答案:A4. 在统计学中,以下哪个选项不是数据的类型?A. 定类数据B. 定序数据C. 定比数据D. 定距数据答案:C5. 以下哪个选项表示的是概率分布?A. 正态分布B. 泊松分布C. 二项分布D. 所有以上选项答案:D6. 统计学中,以下哪项是描述数据位置的统计量?A. 方差B. 标准差C. 均值D. 极差答案:C7. 以下哪个选项是统计学中用于描述数据分布形状的术语?A. 均值B. 中位数C. 偏度D. 众数答案:C8. 在统计学中,以下哪个选项不是数据的收集方法?A. 观察法B. 实验法C. 调查法D. 推断法答案:D9. 以下哪个选项是统计学中用于描述数据集中趋势的术语?A. 方差B. 标准差C. 均值D. 极差答案:C10. 在统计学中,以下哪个选项是用于估计总体参数的样本统计量?A. 总体均值B. 总体标准差C. 样本均值D. 样本方差答案:C二、填空题(每题2分,共20分)1. 统计学中,用来衡量数据集中趋势的三个主要指标是均值、中位数和______。
答案:众数2. 在一组数据中,如果超过一半的数据都集中在某个数值附近,则这个数值被称为______。
答案:众数3. 标准差是方差的______。
答案:平方根4. 变异系数是标准差与______的比值。
答案:均值5. 在统计学中,数据的类型包括定类、定序、定距和______。
答案:定比6. 正态分布是最常见的概率分布,其图形呈______形状。
答案:钟形7. 在统计学中,数据的离散程度可以通过方差、标准差和______来描述。
高中概率统计试题及答案
高中概率统计试题及答案一、选择题(每题3分,共30分)1. 如果一个袋子里有5个红球和3个蓝球,随机抽取一个球,抽到红球的概率是多少?A. 1/3B. 1/2C. 3/5D. 2/5答案:C2. 一枚均匀的硬币连续抛掷两次,出现至少一次正面的概率是多少?A. 1/2B. 3/4C. 1/4D. 1/8答案:B3. 一个班级有30个学生,其中15个男生和15个女生。
随机抽取3名学生,抽到至少1名男生的概率是多少?A. 2/3B. 3/4C. 1/2D. 5/6答案:D4. 一个骰子投掷一次,得到偶数点数的概率是多少?A. 1/2B. 1/3C. 1/6D. 2/3答案:A5. 一个袋子里有3个白球和2个黑球,不放回地连续抽取两次,抽到一白一黑的概率是多少?A. 1/5B. 3/5C. 2/5D. 4/5答案:B6. 一个袋子里有2个红球,3个蓝球和5个绿球,随机抽取一个球,抽到蓝球的概率是多少?A. 1/5B. 3/10C. 1/2D. 1/4答案:B7. 一个班级有50名学生,其中20名是优秀学生。
随机抽取5名学生,抽到至少2名优秀学生的概率是多少?A. 0.7B. 0.3C. 0.5D. 0.9答案:A8. 一个袋子里有5个红球和5个蓝球,随机抽取3个球,抽到至少2个红球的概率是多少?A. 1/2B. 2/3C. 1/3D. 1/4答案:B9. 一个骰子投掷两次,两次都是6点的概率是多少?A. 1/6B. 1/36C. 1/12D. 1/24答案:B10. 一个班级有40名学生,其中10名是优秀学生。
随机抽取4名学生,抽到至少1名优秀学生的概率是多少?A. 1B. 3/4C. 2/5D. 1/4答案:A二、填空题(每题4分,共20分)1. 一个袋子里有10个球,其中4个是红球,6个是蓝球。
随机抽取一个球,抽到红球的概率是________。
答案:2/52. 一个班级有50名学生,其中25名是女生。
高中数学概率统计专题练习题及答案
高中数学概率统计专题练习题及答案一、选择题1. 掷一枚骰子,结果为奇数的概率是多少?A. 1/2B. 1/6C. 2/3D. 1/32. 从1至20这20个数字中随机选出一个数,选出的数是素数的概率是多少?A. 1/5B. 1/4C. 1/2D. 2/53. 一只盒子中有5张红牌和3张蓝牌,从中随机抽取2张牌,同时放回,再随机抽取2张牌,求两次抽取都是红牌的概率是多少?A. 1/16B. 3/8C. 1/4D. 1/8二、计算题1. 一次考试中,甲乙丙三位同学都有70%的概率通过考试。
求三位同学中至少有一位通过考试的概率。
答案:1 - (1 - 0.7)^3 = 0.9732. 从1至100这100个数字中随机选出一个数,选出的数是2的倍数且小于等于50的概率是多少?答案:50/100 = 0.53. 有A、B两个车站,A车站开往B车站的列车间隔是15分钟,B车站开往A车站的列车间隔是10分钟。
现在一个人随机到达A车站,请问他至少要等待几分钟才能搭乘到开往B车站的列车?答案:最小公倍数(15, 10) = 30分钟三、应用题1. 每个学生参加一次足球比赛的概率是0.4,问一个班级20个同学中至少有10个学生参加比赛的概率是多少?答案:利用二项分布公式,计算P(X≥10),其中n=20,p=0.4,k≥10。
答案约为0.599。
2. 一批产品有10%的次品率,现从中随机抽取20个产品,求其中恰好有3个次品的概率。
答案:利用二项分布公式,计算P(X=3),其中n=20,p=0.1,k=3。
答案约为0.201。
3. 一支篮球队最近10场比赛中获胜的概率是0.8,在下一场比赛中,求该队至少获胜8次的概率。
答案:利用二项分布公式,计算P(X≥8),其中n=10,p=0.8,k≥8。
答案约为0.967。
以上为高中数学概率统计专题练习题及答案。
希望对您的学习有所帮助!。
高中数学概率统计难题集
高中数学概率统计难题集
1. 排列组合
1. 某班有10个男生和8个女生,从中选择5位同学参加一次数学竞赛,其中必须至少有2名男生和3名女生参赛。
求参赛人员的组合数。
2. 概率计算
2. 在一副有52张牌的扑克牌中,从中随机抽出5张牌,求抽到四张皇后的概率。
3. 离散型随机变量
3. 一批零件的质量服从正态分布,均值为80,标准差为5。
从中随机抽取一个零件,求质量小于75的概率。
4. 连续型随机变量
4. 一家餐厅餐桌到达的时间符合指数分布,平均每10分钟有一桌。
求在20分钟内没有餐桌到达的概率。
5. 相关性分析
5. 一对骰子同时抛掷,求两个骰子的和为7的概率。
这些难题涵盖了高中数学概率统计的不同概念和技巧,希望能
够提供给学生们一些有趣而具有挑战性的练题。
尝试解答这些问题,不断提升自己的数学思维能力和解题技巧。
> 注意:以上问题解析仅供参考,具体解答可能与题目提供的
信息有关。
在实际解题过程中,请根据题目给出的条件和公式进行
思考和推导,以获得正确的答案。
以上就是一份高中数学概率统计难题集的文档,希望对你有所
帮助!。
高中数学统计试题及答案
高中数学统计试题及答案一、选择题(每题3分,共15分)1. 下列哪个选项是描述统计学中的“总体”概念?A. 某班级所有学生的身高B. 某次考试全班学生的成绩C. 某城市所有居民的年收入D. 某次抽样调查中的样本数据答案:C2. 某班级有50名学生,随机抽取5名学生进行身高测量,这个抽样方法属于:A. 简单随机抽样B. 分层抽样C. 系统抽样D. 整群抽样答案:A3. 某次考试的平均分是85分,标准差是10分,那么这次考试的成绩分布:A. 呈正态分布B. 呈均匀分布C. 呈指数分布D. 呈二项分布答案:A4. 以下哪个统计量是衡量数据集中趋势的指标?A. 方差B. 标准差C. 均值D. 极差答案:C5. 某工厂生产的产品合格率为90%,那么不合格率是:A. 10%B. 90%C. 50%D. 70%答案:A二、填空题(每题2分,共10分)6. 一组数据的平均数是50,中位数是45,众数是30,这组数据的分布情况是________。
答案:右偏7. 某班学生数学成绩的方差是25,这表明该班学生成绩的________。
答案:波动较大8. 某次调查中,样本容量为100,样本均值为80,样本方差为16,那么样本的标准差是________。
答案:49. 某次考试中,有30%的学生成绩在80分以上,70%的学生成绩在80分以下,这符合________分布。
答案:正态分布10. 某商品的销售额为10000元,销售量为200件,那么该商品的平均单价是________。
答案:50元三、简答题(每题7分,共14分)11. 什么是统计中的“样本”和“总体”?请简述它们的区别。
答案:样本是指从总体中随机抽取的一部分个体,用于代表总体进行研究。
总体是指研究对象的全部个体。
区别在于样本是总体的一部分,而总体包含了所有研究对象。
12. 请简述什么是正态分布,并说明其特点。
答案:正态分布是一种连续概率分布,其形状呈钟形曲线,也称为高斯分布。
高中数学统计试题及答案
高中数学统计试题及答案一、选择题(每题3分,共30分)1. 以下哪个选项是描述数据集中趋势的统计量?A. 方差B. 中位数C. 众数D. 标准差答案:B2. 在一组数据中,如果所有数据都相等,则该组数据的方差为:A. 0B. 1C. 无法确定D. 一个正数答案:A3. 以下哪个选项是描述数据离散程度的统计量?A. 平均数B. 众数C. 标准差D. 中位数答案:C4. 一组数据的众数是指:A. 数据中出现次数最多的数B. 数据中最小的数C. 数据中最大的数D. 数据中的平均数答案:A5. 在统计学中,标准差是用来衡量:A. 数据的集中程度B. 数据的离散程度C. 数据的对称性D. 数据的偏态答案:B6. 如果一组数据的平均数是10,标准差是2,则这组数据的方差是:A. 2B. 4C. 10D. 20答案:B7. 以下哪个选项不是描述数据分布的统计量?A. 平均数B. 标准差C. 众数D. 相关系数答案:D8. 一组数据的中位数是:A. 数据中最大的数B. 数据中最小的数C. 数据中居于中间位置的数D. 数据中的平均数答案:C9. 如果一组数据的方差是0,则这组数据的特点是:A. 所有数据都相等B. 所有数据都大于0C. 所有数据都小于0D. 无法确定答案:A10. 在统计学中,相关系数是用来衡量:A. 数据的集中程度B. 数据的离散程度C. 两个变量之间的相关性D. 数据的对称性答案:C二、填空题(每题4分,共20分)1. 一组数据的众数是______,即数据中出现次数最多的数。
答案:众数2. 如果一组数据的方差是4,则这组数据的标准差是______。
答案:23. 在统计学中,数据的中位数是将数据从小到大排序后,位于中间位置的数,如果数据个数为奇数,则中位数是______。
答案:中间的数4. 当一组数据的方差为0时,说明这组数据的特点是所有数据都______。
答案:相等5. 相关系数的取值范围在______之间。
高中数学统计练习题
高中数学统计练习题一、选择题1. 某班级有50名学生,随机抽取5名学生进行数学成绩调查,这种抽样方法属于:A. 简单随机抽样B. 分层抽样C. 系统抽样D. 分群抽样2. 下列哪个选项不是描述统计量?A. 平均数B. 中位数C. 众数D. 方差3. 一组数据的方差是20,如果每个数据都增加10,新的方差是:A. 20B. 30C. 40D. 50二、填空题4. 在一组数据中,如果所有数据都乘以一个常数k,则新的方差是原来的________倍。
5. 某班有30名学生,数学成绩的平均分为80分,标准差为10分。
假设成绩分布接近正态分布,那么成绩在70分到90分之间的学生大约有________人。
三、简答题6. 解释什么是标准差,并说明它在统计学中的作用。
7. 什么是正态分布?请简述其特点。
四、计算题8. 某工厂生产一批零件,测量了10个零件的直径,数据如下(单位:毫米):20.1, 20.2, 20.3, 20.1, 20.4, 20.2, 20.3, 20.2, 20.1, 20.5请计算这组数据的平均数、中位数、众数和标准差。
9. 某学校对100名学生进行了身高测量,得到平均身高为170厘米,标准差为8厘米。
如果将所有数据向上平移10厘米,新的平均身高和标准差是多少?五、应用题10. 某公司对员工的月收入进行调查,得到以下数据(单位:千元): 4, 5, 6, 7, 8, 9, 10, 11, 12, 13请计算这组数据的平均数、中位数、众数,并画出频率分布直方图。
11. 假设某地区有1000名学生参加高考,其中数学成绩的平均分为60分,标准差为15分。
如果一个学生的成绩是75分,请问这个成绩在所有学生中的百分位数是多少?六、论述题12. 论述统计学在现实生活中的应用,并给出至少两个具体的例子。
通过这些练习题,学生可以加深对高中数学统计部分的理解,包括抽样方法、统计量、正态分布等概念,并通过实际计算和应用题来提高解决实际问题的能力。
高中数学第九章统计经典大题例题(带答案)
高中数学第九章统计经典大题例题单选题1、为保障食品安全,某监管部门对辖区内一家食品企业进行检查,现从其生产的某种产品中随机抽取100件作为样本,并以产品的一项关键质量指标值为检测依据,整理得到如下的样本频率分布直方图.若质量指标值在[25,35)内的产品为一等品,则该企业生产的产品为一等品的概率约为()A.0.38B.0.61C.0.122D.0.75答案:B×组距,即可得解.分析:利用频率=频率组距根据频率分布直方图可知,质量指标值在[25,35)内的概率P=(0.080+0.042)×5=0.122×5=0.61故选:B2、为了更好地支持“中小型企业”的发展,某市决定对部分企业的税收进行适当的减免,某机构调查了当地的中小型企业年收入情况,并根据所得数据画出了样本的频率分布直方图,下面三个结论:①样本数据落在区间[300,500)的频率为0.45;②如果规定年收入在500万元以内的企业才能享受减免税政策,估计有55%的当地中小型企业能享受到减免③样本的中位数为480万元.其中正确结论的个数为A.0B.1C.2D.3答案:D解析:根据直方图求出a=0.0025,求出[300,500)的频率,可判断①;求出[200,500)的频率,可判断②;根据中位数是从左到右频率为0.5的分界点,先确定在哪个区间,再求出占该区间的比例,求出中位数,判断③.由(0.001+0.0015+0,002+0.0005+2a)×100=1,a=0.0025,[300,500)的频率为(0.002+0.0025)×100=0.45,①正确;[200,500)的频率为(0.0015+0.002+0.0025)×100=0.55,②正确;[200,400)的频率为0.3,[200,500)的频率为0.55,,中位数在[400,500)且占该组的45×100=480,③正确.故中位数为400+0.5−0.30.25故选:D.小提示:本题考查补全直方图,由直方图求频率和平均数,属于基础题3、某地区对当地3000户家庭的当年所得年收入情况调查统计,年收入(单位:万元)的频率分布直方图如图所示,数据的分组依次为[2,4),[4,6),[6,8),[8,10],则年收入不超过6万元的家庭有( )A.900户B.600户C.300户D.150户分析:根据频率分布直方图求出[2,4)和[4,6)这两组的频率之和,用这个频率之和乘以样本总量3000即可的答案.由图可知,[2,4)和[4,6)这两组的频率之和为(0.05+0.1)×2=0.3,年收入不超过6万元的家庭有3000×0.3=900户.故选:A.4、新莽铜嘉量是由王莽国师刘歆等人设计制造的标准量器,它包括了龠(yuè)、合、升、斗、斛这五个容量单位.每一个量又有详细的分铭,记录了各器的径、深、底面积和容积.现根据铭文计算,当时制造容器时所用的圆周率分别为3.1547,3.1992,3.1498,3.2031,比《周髀算经》的“径一而周三”前进了一大步,则上面4个数据与祖冲之给出的约率(227≈3.1429)、密率(355113≈3.1416)这6个数据的中位数与极差分别为()A.3.1429,0.0615B.3.1523,0.0615C.3.1498,0.0484D.3.1547,0.0484答案:B分析:先对这6个数由小到大(或由大到小)排列,然后利用中位数和极差的定义求解即可所给6个数据由小到大排列依次为3.1416,3.1429,3.1498,3.1547,3.1992,3.2031,所以这6个数据的中位数为(3.1498+3.1547)÷2≈3.1523,极差为3.2031−3.1416=0.0615,故选:B.5、下表是某校校级联欢晚会比赛中12个班级的得分情况,则得分的30百分位数是()答案:D分析:根据百分位数的定义求解即可.12×30%=3.6,把12个班级的得分按照从小到大排序为7,7,8,9,9,10,10,10,11,13,13,14,可得30百分位数是第4个得分数,即9.故选:D6、某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图,90后从事互联网行业岗位分布条形图,则下列结论错误的是()注:90后指1990年及以后出生,80后指1980−1989年之间出生,80前指1979年及以前出生.A.互联网行业从业人员中从事技术和运营岗位的人数占总人数的三成以上B.互联网行业中从事技术岗位的人数超过总人数的20%C.互联网行业中从事运营岗位的人数90后一定比80前多D.互联网行业中从事技术岗位的人数90后一定比80后多答案:D解析:根据整个互联网行业从业者年龄分布饼状图、90后从事互联网行业岗位分布条形图,对四个选项逐一分析,即可得出正确选项.对于选项A,因为互联网行业从业人员中,“90后”占比为56%,其中从事技术和运营岗位的人数占的比分别为39.6%和17%,则“90后”从事技术和运营岗位的人数占总人数的56%×(39.6%+17%)≈31.7%.“80前”和“80后”中必然也有从事技术和运营岗位的人,则总的占比一定超过三成,故选项A正确;对于选项B,因为互联网行业从业人员中,“90后”占比为56%,其中从事技术岗位的人数占的比为39.6%,则“90后”从事技术岗位的人数占总人数的56%×39.6%≈22.2%.“80前”和“80后”中必然也有从事技术岗位的人,则总的占比一定超过20%,故选项B正确;对于选项C,“90后”从事运营岗位的人数占总人数的比为56%×17%≈9.5%,大于“80前”的总人数所占比3%,故选项C正确;选项D,“90后”从事技术岗位的人数占总人数的56%×39.6%≈22.2%,“80后”的总人数所占比为41%,条件中未给出从事技术岗位的占比,故不能判断,所以选项D错误.故选:D.小提示:关键点点睛:本题考查利用扇形统计图和条形统计图解决实际问题,解本题的关键就是利用条形统计图中“90后”事互联网行业岗位的占比乘以“90后”所占总人数的占比,再对各选项逐一分析即可.7、总体由编号01,02,…,29,30的30个个体组成.利用下面的随机数表选取6个个体,选取方法是从如下随机数表的第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出来的第6个个体的编号为()第1行78 16 62 32 08 02 62 42 62 52 53 69 97 28 01 98第2行32 04 92 34 49 35 82 00 36 23 48 69 69 38 74 81A.27B.26C.25D.19答案:D分析:根据随机数表法的步骤即可求得答案.由题意,取出的数有23,20,80(超出范围,故舍去),26,24,26(重复,故舍去),25,25(重复,故舍去),36(超出范围,故舍去),99(超出范围,故舍去),72(超出范围,故舍去),80(超出范围,故舍去),19.故选:D.8、某学校在校学生有2000人,为了增强学生的体质,学校举行了跑步和登山比赛,每人都参加且只参加其中一项比赛,高一、高二、高三年级参加跑步的人数分别为a,b,c,且a:b:c=2:5:3,全校参加登山的人数占总人数的1.为了了解学生对本次比赛的满意程度,按分层抽样的方法从中抽取一个容量为200的样本进4行调查,则应从高三年级参加跑步的学生中抽取()A.15人B.30人C.40人D.45人答案:D分析:由题知全校参加跑步的人数为2000×3=1500,再根据分层抽样的方法求解即可得答案.4=1500,解:由题意,可知全校参加跑步的人数为2000×34=450.所以a+b+c=1500.因为a:b:c=2:5:3,所以c=1500×32+5+3因为按分层抽样的方法从中抽取一个容量为200的样本,所以应从高三年级参加跑步的学生中抽取的人数为450×200=45.2000故选:D多选题9、最近几个月,新冠肺炎疫情又出现反复,各学校均加强了疫情防控要求,学生在进校时必须走测温通道,每天早中晚都要进行体温检测并将结果上报主管部门.某班级体温检测员对一周内甲乙两名同学的体温进行了统计,其结果如图所示,则下列结论正确的是()A.甲同学体温的极差为0.4℃B.乙同学体温的众数为36.4℃,中位数与平均数相等C.乙同学的体温比甲同学的体温稳定D.甲同学体温的第60百分位数为36.4℃答案:ABC分析:根据给定的折线图,逐一分析判断各个选项即可作答.观察折线图知,甲同学体温的极差为36.6−36.2=0.4℃,A正确;乙同学体温从小到大排成一列:36.3℃,36.3℃,36.4℃,36.4℃,36.4℃,36.5℃,36.5℃,(36.3×2+36.4×3+36.5×2)=46.4℃,B正乙同学体温的众数为36.4℃,中位数为36.4℃,平均数x=17确;乙同学的体温波动较甲同学的小,极差为0.2℃,也比甲同学的小,因此乙同学的体温比甲同学的体温稳定,C正确;将甲同学的体温从小到大排成一列:36.2℃,36.2℃,36.4℃,36.4℃,36.5℃,36.5℃,36.6℃,因7×60%=4.2,则甲同学体温的第60百分位数为36.5℃,D不正确.故选:ABC10、下表记录了某地区一年之内的月降水量是53mm和56mmC.该年份月降水量的25%分位数是52mmD.该年份月降水量的中位数是56mm答案:ACD分析:A. 利用极差的定义判断;B.利用众数的定义判断;C.利用百分位数的定义判断;D.利用中位数的定义判断.A. 该年份月降水量的极差是71-46=25mm,故正确;B.该年份月降水量的众数是56mm,故错误;C.该年份月降水量从小到大为46,48,51,53,53,56,56,56,56,58,64,66,71,12×25%=3,=52mm,故正确;所以年份月降水量的25%分位数是51+532D. 该年份月降水量从小到大为46,48,51,53,53,56,56,56,56,58,64,66,71,所以该年份月降水量的中位数是56+56=56mm,故正确;2故选:ACD11、某教育局对全区高一年级的学生身高进行抽样调查,随机抽取了200名学生,他们的身高都处在A,B,C,D,E五个层次内,根据抽样结果得到统计图表如下,则下列结论正确的是().A.男生人数为80人B.B层次男女生人数差值最大C.D层次男生人数多于女生人数D.E层次女生人数最少答案:ABD分析:根据条形图求出抽取女生人,得出抽取男生人,再对照图表判断选项中的命题是否正确即可.解:由条形图知,抽取女生学生有18+48+30+18+6=120(人),所以抽取男生有200−120=80(人),选项A正确;B层次的男生有80×(1−10%−15%−20%−25%)=24(人),A,B,C,D,E五个层次男生人数分别:8,24,20,16,12(人),与女生各层次差值分别为:10,24,10,2,6,选项B正确;D层次的男生有12(人),女生有18人,男生人数少于女生,选项C错误;E层次的女生人数最少,选项D正确.故选:ABD.12、某保险公司为客户定制了5个险种:甲,一年期短险;乙,两全保险;丙,理财类保险;丁,定期寿险:戊,重大疾病保险,各种保险按相关约定进行参保与理赔.该保险公司对5个险种参保客户进行抽样调查,得出如下的统计图例:用该样本估计总体,以下四个选项正确的是()A.54周岁以上参保人数最少B.18~29周岁人群参保总费用最少C.丁险种更受参保人青睐D.30周岁以上的人群约占参保人群20%答案:AC分析:根据选项逐一对相应的统计图进行分析判断即可.解:对A:由扇形图可知,54周岁以上参保人数最少,故选项A正确;对B:由折线图可知,18~29周岁人群人均参保费用最少,但是由扇形图知参保人数并不是最少的,所以参保总费用不是最少,故选项B错误;对C:由柱状图可知,丁险种参保比例最高,故选项C正确;对D:由扇形图可知,30周岁以上的人群约占参保人群80%,故选项D错误.故选:AC.13、睡眠很重要,教育部《关于进一步加强中小学生睡眠管理工作的通知》中强调“小学生每天睡眠时间应达到10小时,初中生应达到9小时,高中生应达到8小时”.某机构调查了1万个学生时间利用信息得出下图,则以下判断正确的有()A .高三年级学生平均学习时间最长B .中小学生的平均睡眠时间都没有达到《通知》中的标准,其中高中生平均睡眠时间最接近标准C .大多数年龄段学生平均睡眠时间长于学习时间D .与高中生相比,大学生平均学习时间大幅下降,释放出的时间基本是在睡眠答案:BC分析:根据图象提供数据对选项进行分析,从而确定正确答案.根据图象可知,高三年级学生平均学习时间没有高二年级学生平均学习时间长,A 选项错误.根据图象可知,中小学生平均睡眠时间都没有达到《通知》中的标准,高中生平均睡眠时间最接近标准,B 选项正确.学习时间大于睡眠时间的有:初二、初三、高一、高二、高三,占比516.睡眠时间长于学习时间的占比1116,C 选项正确.从高三到大学一年级,学习时间减少9.65−5.71=3.94,睡眠时间增加8.52−7.9=0.62,所以D 选项错误. 故选:BC填空题14、已知一组样本数据5、2、3、6,则该组数据的第70百分位数为__________.答案:5分析:首先计算指数,再由百分位数的定义可得答案.解:这组样本数据5、2、3、6,从小到大排列为2、3、5、6,又4×70%=2.8,则该组数据的第70百分位数为第3个数5,所以答案是:5.15、若样本数据x1,x2,⋅⋅⋅,x8的标准差为1,则数据2x1−1,2x2−1,⋅⋅⋅,2x8−1的标准差为_______.答案:2解析:若一组数据x1,x2,x3,⋯,x n的方差为s2,则数据ax1+b,ax2+b,ax3+b,⋯,ax n+b的方差为a2s2.若样本数据x1,x2,⋅⋅⋅,x8的标准差为1,则其方差也为1,所以数据2x1−1,2x2−1,⋅⋅⋅,2x8−1的方差为4,标准差为2.所以答案是:2.16、某车间生产A,B,C三种不同型号的产品,产量之比分别为5:k:3,为检验产品的质量,现用分层抽样的方法抽取一个容量为120的样本进行检验,已知B种型号的产品共抽取了24件,则C种型号的产品抽取的件数为_________.答案:36分析:根据题意可得24120=k5+k+3,解方程求出k的值,再根据C种型号的产品所占的比例,求出C种型号的产品应抽取的数量.由题意,得24120=k5+k+3,所以k=2,所以C种型号的产品抽取的件数为120×35+2+3=36.所以答案是:36.解答题17、在①55%分位数,②众数这两个条件中任选一个,补充在下面问题中的横线上,并解答问题.维生素C又叫L-抗坏血酸,是一种水溶性维生素,是高等灵长类动物与其他少数生物的必需营养素.现从猕猴桃、柚子两种食物中测得每100克维生素C的含量(单位:mg)各10个数据如下,其中猕猴桃的一个数据x被污损.猕猴桃:104,119,106,102,132,107,113,134,116,x;柚子:121,113,109,122,114,116,132,121,131,117.已知x等于柚子的10个数据中的___________.(1)求x的值与猕猴桃的数据的中位数;(2)分别计算上述猕猴桃、柚子两种食物中测得每100克维生素C含量的平均数.答案:(1)121,中位数为114.5(2)115.4mg,119.6mg分析:(1)先将柚子从小到大排序,若选①,利用55%分位数的定义得到x=121,若选②,利用众数的定义进行也得到x=121,接着代入猕猴桃里面,从小到大排序算出中位数;(2)利用平均数的定义进行计算(1)柚子的10个数据按照从小到大的顺序排列为:109,113,114,116,117,121,121,122,131,132.选①,因为10×55%=5.5,所以柚子10个数据的55%分位数为第6个数,即121,所以x=121.猕猴桃的10个数据按照从小到大的顺序排列为:102,104,106,107,113,116,119,121,132,134,则(113+116)=114.5.中位数为12选②,因为柚子的10个数据的众数为121,所以x=121.猕猴桃的10个数据按照从小到大的顺序排列为:102,104,106,107,113,116,119,121,132,134,则(113+116)=114.5.中位数为12(2)×(102+104+106+107+113+116+119+121+由(1)得每100克猕猴桃维生素C含量的平均数为110132+134)=115.4mg×(109+113+114+116+117+121+121+122+131+每100克柚子维生素C含量的平均数为110132)=119.6mg18、从某校高一年级新生中随机抽取一个容量为20的身高样本,数据如下(单位:cm,数据间无大小顺序要求):152,155,158,164,164,165,165,165,166,167,168,168,169,170,170,170,171,x,174,175.(1)若x为这组数据的一个众数,求x的取值集合;(2)若样本数据的第90百分位数是173,求x的值;(3)若x=174,试估计该校高一年级新生的平均身高.答案:(1){164,165,168,170}(2)172(3)166.5(cm)分析:(1)首先排列19个数据,根据众数的定义,即可确定x的取值集合;(2)首先确定第90百分位数是第18项和第19项数据的平均数,再讨论x的取值,根据百分位数,列式求值;(3)根据平均数公式,列式求值.(1)其余十九个数据152,155,158,164,164,165,165,165,166,167,168,168,169,170,170,170,171,174,175中,数据出现的频数为3的数有165,170,出现频数为2的数据有164,168.因为x为这组数据的一个众数,所以x的取值集合为{164,165,168,170}.(2)因为20×90%=18,所以90百分位数是第18项和第19项数据的平均数,若x⩽171,则90百分位数为1(171+174)=17,矛盾.2(x+174)=173,所以x=172.若171<x<175,即12(174+175)=174.5,矛盾.若x⩾175,则90百分位数为12综上,x的值为172.(3)依题意可得152+155+158+164+164+165+165+165+166+167+168+168+169+170+170+170+171+174+174+175=3330所以平均数为3330÷20=166.5(cm),估计该校高一年级学生的平均身高.。
高二数学统计试题答案及解析
高二数学统计试题答案及解析1.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是().A.若k2的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病B.从独立性检验可知,有99%的把握认为吸烟与患肺病有关时,我们说某人吸烟,那么他有99%的可能患有肺病C.若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D.以上三种说法都不正确【答案】C.【解析】若k>6.635,我们有99%的把握认为吸烟与患肺病有关系,但不表示有99%的可能患有肺病,故A错误;也不表示在100个吸烟的人中必有99人患有肺病,故B错误;若从统计量中求出有95%的是吸烟与患肺病的比例,不表示有5%的可能性使得推断出现错误,故C错误;因此选D.【考点】独立性检验的基本思想.2.某考察团对全国10大城市进行职工人均工资水平(千元)与居民人均消费水平(千元)统计调查,与具有相关关系,回归方程为,若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为()A.83%B.72%C.67%D.66%【答案】A【解析】将y=7.675代入回归方程,可计算得x≈9.26,所以该城市人均消费额占人均工资收入的百分比约为7.675÷9.26≈0.83,即约为83%.【考点】回归方程3.回归分析中,相关指数的值越大,说明残差平方和A.越小B.越大C.可能大也可能小D.以上都不对【答案】A【解析】相关系数越大,则相关性越强。
即数据的残差平方和越小。
【考点】线性相关关系的判断。
4.某校现有高一学生210人,高二学生270人,高三学生300人,学校学生会用分层抽样的方法从这三个年级的学生中随机抽取名学生进行问卷调查,如果已知从高一学生中抽取的人数为7,那么从高三学生中抽取的人数应为()A.10B.9C.8D.7【答案】B【解析】分层抽样是按比例进行抽样,据题中所给的学生人数比,可设高三学生中抽取的人数应为,可得,得.故本题选.【考点】分层抽样5.某校为了解1000名高一新生的身体生长状况,用系统抽样法(按等距的规则)抽取40名同学进行检查,将学生从进行编号,现已知第18组抽取的号码为443,则第一组用简单随机抽样抽取的号码为()A.16B.17C.18D.19【答案】C【解析】第一组用简单随机抽样抽取的号码为,选C.【考点】系统抽样法6.若样本数据的标准差为,则数据的标准差为A.B.C.D.【答案】C【解析】样本数据的标准差为,数据的方差为标准差为16【考点】方差与标准差7.下表提供了某厂节能降耗技术改造后,在生产A产品过程中记录的产量x(吨)与相应的生产耗能y(吨)的几组相对应数据.根据上表提供的数据,求出y关于x的线性回归直线方程为,那么表中t=__________.【答案】3【解析】由题意可知,因为回归直线方程,经过样本中心,所以=0.7×4.5+0.35,解得t=3【考点】线性回归方程8.下列两个量之间的关系是相关关系的为()A.匀速直线运动的物体时间与位移的关系B.学生的成绩和体重C.路上酒后驾驶的人数和交通事故发生的多少D.水的体积和重量【答案】C【解析】略9.某射击选手连续射击5枪命中的环数分别为:9.7,9.9,10.1,10.2,10.1,则这组数据的方差为________.【答案】0.032【解析】平均数方差【考点】方差10.已知甲、乙两组数据如茎叶图所示,若它们的中位数相同,平均数也相同,则图中的m,n的比值=()A.1B.C.D.【答案】D【解析】因为乙的中位数是,所以,可求得甲的平均数是,因此乙的平均数也是,进而得,,故选A.【考点】1、茎叶图的应用;2、中位数及平均数的应用.11.下列两个量之间的关系是相关关系的为()A.匀速直线运动的物体时间与位移的关系B.学生的成绩和体重C.路上酒后驾驶的人数和交通事故发生的多少D.水的体积和重量【答案】C【解析】略12.潮州统计局就某地居民的月收入调查了人,并根据所得数据画了样本的频率分布直方图(每个分组包括左端点,不包括右端点,如第一组表示收入在)。
统计考试题目及答案高中
统计考试题目及答案高中一、选择题(每题2分,共20分)1. 下列哪项是描述数据集中趋势的统计量?A. 方差B. 均值C. 标准差D. 极差答案:B2. 在统计学中,以下哪个术语用于描述数据的离散程度?A. 均值B. 方差C. 众数D. 标准差答案:B3. 以下哪个选项是正态分布的特点?A. 所有数据都集中在均值附近B. 均值、中位数和众数相同C. 数据分布是对称的D. 所有数据都远离均值答案:B4. 以下哪个统计图最适合展示数据随时间的变化趋势?A. 条形图C. 散点图D. 线形图答案:D5. 相关系数的取值范围是多少?A. -1到1B. 0到1C. -1到0D. 1到无穷大答案:A6. 以下哪个统计量用于衡量数据的集中趋势?A. 方差B. 均值C. 标准差D. 极差答案:B7. 以下哪项是描述数据分布形状的统计量?A. 均值B. 方差C. 偏度D. 峰度答案:C8. 在统计学中,以下哪个术语用于描述数据的相对位置?B. 中位数C. 众数D. 方差答案:B9. 以下哪个选项是描述数据分布中心位置的统计量?A. 方差B. 均值C. 标准差D. 极差答案:B10. 以下哪个统计图最适合展示部分与整体的关系?A. 条形图B. 饼图C. 散点图D. 线形图答案:B二、填空题(每题2分,共20分)1. 在统计学中,数据的_________是指数据的平均水平。
答案:均值2. 标准差是衡量数据_________的统计量。
答案:离散程度3. 正态分布的图形是_________对称的。
答案:左右4. 线形图主要用于展示数据的_________变化。
答案:趋势5. 相关系数的计算公式是_________。
答案:协方差除以两个变量的标准差乘积6. 众数是指数据集中出现次数_________的数值。
答案:最多7. 偏度是描述数据分布_________的统计量。
答案:偏斜方向8. 箱线图可以展示数据的_________和异常值。
高中的统计试题及答案
高中的统计试题及答案一、选择题1. 以下哪个选项是描述统计数据集中趋势的指标?A. 方差B. 标准差C. 平均数D. 众数答案:C2. 一组数据的方差是衡量数据的:A. 离散程度B. 集中趋势C. 相关性D. 正态分布答案:A3. 以下哪个统计图最适合展示不同类别的数据分布?A. 折线图B. 散点图C. 柱状图D. 饼图答案:C二、填空题1. 统计学中的________是用来衡量数据集中趋势的一个重要指标。
答案:平均数2. 标准差是方差的________,用来衡量数据的离散程度。
答案:平方根3. 一组数据的中位数是将数据从小到大排列后,位于中间位置的数值,如果数据个数是偶数,则中位数是中间两个数值的________。
答案:平均数三、简答题1. 请简述什么是正态分布,并说明其特点。
答案:正态分布是一种连续概率分布,其图形呈钟形曲线,具有对称性。
其特点是数据集中在中间,两端较少,且数据分布的均值、中位数和众数相等。
2. 描述一下如何计算一组数据的平均数。
答案:计算一组数据的平均数,首先需要将所有数据值相加,得到总和,然后将这个总和除以数据的个数,得到的结果即为平均数。
四、计算题1. 给定一组数据:5, 7, 9, 11, 13,计算这组数据的平均数、中位数和众数。
答案:平均数 = (5 + 7 + 9 + 11 + 13) / 5 = 9;中位数 = (9+ 11) / 2 = 10;众数 = 无(因为每个数值都只出现一次)2. 如果某班学生的成绩分布如下:60-69分有5人,70-79分有15人,80-89分有20人,90-100分有10人。
请计算这组数据的平均分。
答案:首先计算每个分数段的平均分,然后乘以对应的人数,最后将所有结果相加并除以总人数。
即:((60+69)/2 * 5 + (70+79)/2 *15 + (80+89)/2 * 20 + (90+100)/2 * 10) / 50 = 81.4结束语:通过以上试题及答案,我们可以看到统计学在数据处理和分析中的重要性。
高中统计试题及答案
高中统计试题及答案一、选择题(每题4分,共40分)1. 下列哪项是描述统计中用于表示数据集中趋势的指标?A. 方差B. 均值C. 标准差D. 极差答案:B2. 在统计学中,中位数是指:A. 数据集中最小的数B. 数据集中最大的数C. 将数据集一分为二的数D. 数据集中所有数的和答案:C3. 标准差是衡量数据:A. 集中程度B. 离散程度C. 相关程度D. 趋势答案:B4. 以下哪个选项不是统计图的类型?A. 条形图B. 折线图C. 饼图D. 流程图答案:D5. 假设检验中,零假设通常表示:A. 研究假设B. 研究假设的对立面C. 没有效应D. 有效应答案:C6. 相关系数的取值范围是:A. -1到1之间B. 0到1之间C. 1到10之间D. 无限制答案:A7. 以下哪个统计量用于衡量数据的变异性?A. 均值B. 方差C. 中位数D. 众数答案:B8. 抽样误差是指:A. 抽样过程中的错误B. 抽样结果与总体结果的差异C. 抽样过程中的随机性D. 抽样过程中的偏差答案:B9. 在回归分析中,回归系数表示:A. 因变量的变化量B. 自变量的变化量C. 自变量对因变量的影响程度D. 因变量对自变量的影响程度答案:C10. 以下哪个统计概念与数据的分布无关?A. 均值B. 方差C. 标准差D. 样本容量答案:D二、填空题(每题4分,共20分)1. 在一组数据中,如果所有数值都相等,则该数据集的方差为______。
答案:02. 如果一组数据的中位数是5,那么数据集被分为两个相等的部分,其中一半的数据小于5,另一半的数据大于5。
答案:错误3. 相关系数为-1表示两个变量之间存在______关系。
答案:完全负相关4. 在进行假设检验时,如果p值小于显著性水平,则我们拒绝______。
答案:零假设5. 回归分析中,如果回归系数为正,则表示自变量和因变量之间存在______关系。
答案:正相关三、简答题(每题10分,共40分)1. 简述统计学中“总体”和“样本”的区别。
全国通用版高中数学第九章统计经典知识题库
(名师选题)全国通用版高中数学第九章统计经典知识题库单选题1、设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为()A.0.01B.0.1C.1D.10答案:C分析:根据新数据与原数据关系确定方差关系,即得结果.因为数据ax i+b,(i=1,2,⋯,n)的方差是数据x i,(i=1,2,⋯,n)的方差的a2倍,所以所求数据方差为102×0.01=1故选:C小提示:本题考查方差,考查基本分析求解能力,属基础题.2、为调查参加考试的高二级1200名学生的成绩情况,从中抽查了100名学生的成绩,就这个问题来说,下列说法正确的是()A.1200名学生是总体B.每个学生是个体C.样本容量是100D.抽取的100名学生是样本答案:C分析:根据总体、个体、样本容量、样本的定义,结合题意,即可判断和选择.根据题意,总体是1200名学生的成绩;个体是每个学生的成绩;样本容量是100,样本是抽取的100名学生的成绩;故正确的是C.故选:C.3、某单位有男职工56人,女职工42人,按性别分层,用分层随机抽样的方法从全体职工中抽出一个样本,如果样本按比例分配,男职工抽取的人数为16人,则女职工抽取的人数为()A.12B.20C.24D.28答案:A分析:根据题意,结合分层抽样的计算方法,即可求解.根据题意,设抽取的样本人数为n,因男职工抽取的人数为56n56+42=16,所以n=28,因此女职工抽取的人数为28−16=12(人).故选:A.4、下列调查方式较为合适的是()A.为了了解灯管的使用寿命,采用普查的方式B.为了了解我市中学生的视力状况,采用抽样调查的方式C.调查一万张面值为100元的人民币中有无假币,采用抽样调查的方式D.调查当今中学生喜欢什么体育活动,采用普查的方式答案:B分析:根据实际情况选择合适的调查方式即可判断.对A,为了了解灯管的使用寿命,应采用抽样调查的方式,故A错误;对B,为了了解我市中学生的视力状况,采用抽样调查的方式,故B正确;对C,调查一万张面值为100元的人民币中有无假币,采用抽样普查的方式,故C错误;对D,调查当今中学生喜欢什么体育活动,采用抽样普查的方式,故D错误.故选:B.5、新莽铜嘉量是由王莽国师刘歆等人设计制造的标准量器,它包括了龠(yuè)、合、升、斗、斛这五个容量单位.每一个量又有详细的分铭,记录了各器的径、深、底面积和容积.现根据铭文计算,当时制造容器时所用的圆周率分别为3.1547,3.1992,3.1498,3.2031,比《周髀算经》的“径一而周三”前进了一大步,则上面4个数据与祖冲之给出的约率(227≈3.1429)、密率(355113≈3.1416)这6个数据的中位数与极差分别为()A .3.1429,0.0615B .3.1523,0.0615C .3.1498,0.0484D .3.1547,0.0484 答案:B分析:先对这6个数由小到大(或由大到小)排列,然后利用中位数和极差的定义求解即可 所给6个数据由小到大排列依次为3.1416,3.1429,3.1498,3.1547,3.1992,3.2031, 所以这6个数据的中位数为(3.1498+3.1547)÷2≈3.1523, 极差为3.2031−3.1416=0.0615, 故选:B.6、已知某6个数据的平均数为4,方差为8,现加入数据2和6,此时8个数据的方差为( ) A .8B .7C .6D .5 答案:B分析:由平均数和方差的计算公式求出平均数和方差即可得出答案.设原数据为a 1,a 2,a 3,a 4,a 5,a 6,则∑a i 6i=1=6×4=24,16∑(a i −4)26i=1=8,加入数据2和6,后,所得8个数据的平均数x̅=∑a i 6i=1+2+68=4,方差s 2=∑(a i −4)26i=1+(2−4)2+(6−4)28=48+4+48=7.故选:B .7、某校高一、高二、高三的学生人数分别为800,750,650,为了解学生的视力情况,现用分层随机抽样的方法从中抽取部分学生进行调查,若样本中高二学生的人数为30,则这次调查的样本容量为( ) A .88B .90C .92D .94 答案:A分析:设样本容量为x ,然后由分层抽样的定义列方程求解即可 设样本容量为x ,则x800+750+650=30750,解得x =88.故选:A8、从某中学随机抽取100名学生,将他们的身高数据(单位cm)绘制成频率分布直方图,若要从身高在[150,160),[160,170),[170,180]三组内的学生中,用分层抽样的方法选取16人参加一次活动.则从身高在[170,180]内的学生中选取的人数应为()A.3B.4C.5D.7答案:B分析:先求得a的值,然后结合分层抽样的知识计算出正确答案.依题意(0.005+0.015+a+0.035+0.02)×10=1,解得a=0.025,身高在[150,160),[160,170),[170,180]三组内的学生比例为0.025:0.035:0.02=5:7:4,用分层抽样的方法选取16人参加一次活动,则从身高在[170,180]内的学生中选取的人数应为4人故选:B9、关于圆周率π,数学发展史上出现过许多很有创意的求法,如著名的浦丰实验和查理斯实验.受其启发,我们也可以通过设计下面的实验来估计π的值:先请全校m名同学每人随机写下一个都小于1的正实数对(x,y);再统计两数能与1构成钝角三角形三边的数对(x,y)的个数a;最后再根据统计数a估计π的值,那么可以估计π的值约为()A.4am B.a+2mC.a+2mmD.4a+2mm答案:D解析:由试验结果知m对0~1之间的均匀随机数x,y,满足{0<x<10<y<1,面积为1,再计算构成钝角三角形三边的数对(x,y),满足条件的面积,由几何概型概率计算公式,得出所取的点在圆内的概率是圆的面积比正方形的面积,即可估计π的值.解:根据题意知,m 名同学取m 对都小于1的正实数对(x,y ),即{0<x <10<y <1,对应区域为边长为1的正方形,其面积为1,若两个正实数x,y 能与1构成钝角三角形三边,则有{x 2+y 2<1x +y >10<x <10<y <1,其面积S =π4−12;则有am =π4−12,解得π=4a+2m m故选:D .小提示:本题考查线性规划可行域问题及随机模拟法求圆周率的几何概型应用问题. 线性规划可行域是一个封闭的图形,可以直接解出可行域的面积;求解与面积有关的几何概型时,关键是弄清某事件对应的面积,必要时可根据题意构造两个变量,把变量看成点的坐标,找到试验全部结果构成的平面图形,以便求解.10、从某网络平台推荐的影视作品中抽取400部,统计其评分数据,将所得400个评分数据分为8组:[66,70)、[70,74)、⋯、[94,98],并整理得到如下的频率分布直方图,则评分在区间[82,86)内的影视作品数量是( )A .20B .40C .64D .80 答案:D分析:利用频率分布直方图可计算出评分在区间[82,86)内的影视作品数量.由频率分布直方图可知,评分在区间[82,86)内的影视作品数量为400×0.05×4=80. 故选:D.11、某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率直方图如图所示,估计棉花纤维的长度的样本数据的80百分位数是()A.29 mmB.29.5 mmC.30 mmD.30.5 mm答案:A分析:先求得棉花纤维的长度在30 mm以下的比例为85%,在25 mm以下的比例为85%-25%=60%,从而可得80百分位数一定位于[25,30)内,进而可求出答案棉花纤维的长度在30 mm以下的比例为(0.01+0.01+0.04+0.06+0.05)×5=0.85=85%,在25 mm以下的比例为85%-25%=60%,因此,80百分位数一定位于[25,30)内,=29,由25+5×0.80−0.600.85−0.60可以估计棉花纤维的长度的样本数据的80百分位数是29 mm.故选:A12、“中国天眼”为500米口径球面射电望远镜,是具有我国自主知识产权、世界最大单口径、最灵敏的射电望远镜.建造“中国天眼”的目的是()A.通过调查获取数据B.通过试验获取数据C.通过观察获取数据D.通过查询获得数据答案:C分析:直接由获取数据的途径求解即可.“中国天眼”主要是通过观察获取数据.故选:C.填空题13、已知一组数据6,7,8,8,9,10,则该组数据的方差是____.答案:53.分析:由题意首先求得平均数,然后求解方差即可.由题意,该组数据的平均数为6+7+8+8+9+106=8,所以该组数据的方差是16[(6−8)2+(7−8)2+(8−8)2+(8−8)2+(9−8)2+(10−8)2]=53.小提示:本题主要考查方差的计算公式,属于基础题.14、为了分析高三年级的8个班400名学生第一次高考模拟考试的数学成绩,决定在8个班中每班随机抽取12份试卷进行分析,这个问题中样本容量是________.答案:96分析:由于每个班抽12份,所以8个班共抽96份,所以样本容量为96本题中,400名学生第一次高考模拟考试的数学成绩是总体,从8个班中每班抽取的12名学生的数学成绩是样本,400是总体个数,96是样本容量.所以答案是:9615、某公司青年、中年、老年员工的人数之比为10∶8∶7,从中抽取100名作为样本,若每人被抽中的概率是0.2,则该公司青年员工的人数为__________.答案:200分析:先根据分层抽样的方法计算出该单位青年职工应抽取的人数,进而算出青年职工的总人数.由题意,从中抽取100名员工作为样本,需要从该单位青年职工中抽取1010+8+7×100=40(人).因为每人被抽中的概率是0.2,所以青年职工共有400.2=200(人).所以答案是:200.16、已知一组数据4,2a,3−a,5,6的平均数为4,则a的值是_____.答案:2分析:根据平均数的公式进行求解即可.∵数据4,2a,3−a,5,6的平均数为4∴4+2a+3−a+5+6=20,即a=2.所以答案是:2.小提示:本题主要考查平均数的计算和应用,比较基础.17、为了了解初中生的身体素质,某地区随机抽取了n名学生进行跳绳测试,根据所得数据画样本的频率分布直方图如图所示,且从左到右第一小组的频数是100,则n=_____ .答案:1000解析:由频率分布直方图求出从左到右第一小组的频率,再利用样本容量等于频数和频率的比值求出n.由频率分布直方图知,从左到右第一小组的频率为0.004×25=0.1,且从左到右第一小组的频数是100,所=1000.以n=1000.1所以答案是:1000解答题18、某商店销售了30双皮鞋,其中各种尺码的销售量如下表所示:(1)计算30双皮鞋尺码的平均数、中位数、众数;(2)从实际出发,问题(1)中的三种统计特征量对商店有无指导意义?答案:(1)平均数为23.55 cm,中位数为23.5 cm,众数为23.5 cm(2)众数对商店进货有实际指导意义分析:(1)直接结合平均数,中位数,众数概念计算即可;(2)结合生活实际考虑,众数对进货量有指导意义.(1)(1)30双皮鞋尺码的平均数为:22+2×22.5+4×23+14×23.5+5×24+3×24.5+25=23.55cm;30由于小于23.5 cm的皮鞋的销售量为1+2+4=7(双),大于23.5 cm的皮鞋的销售量为5+3+1=9(双),故将数据从小到大排序后,处于正中间位置的两个数均为23.5 cm,从而中位数为23.5 cm;又23.5 cm共出现14次,所以众数也为23.5 cm;(2)(2)众数对商店进货有实际指导意义,因为尺码为23.5 cm的皮鞋销量最多,所以商店应多进货,而尺码为22 cm,25 cm的皮鞋销量较少,故应少进货.19、某中学要从高一年级甲乙两个班级中选择一个班参加电视台组织的“环保知识竞赛”,该校对甲乙两班的参赛选手(每班7人)进行了一次环保知识测试,他们取得的成绩(满分100分)的茎叶图如图所示,其中甲班学生的平均分是85,乙班学生成绩的中位数是85.(1)求x,y的值;(2)根据茎叶图,求甲乙两班同学方差的大小,并从统计学角度分析,该校应选择甲班还是乙班参赛.答案:(1)x=9,y=5;(2)乙班成绩比较稳定,故应选乙班参加.分析:(1)利用茎叶图,根据甲班7名学生成绩的平均分是85,乙班7名学生成绩的中位数是85.先求出x,y,(2)求出乙班平均分,再求出甲班7名学生成绩方差和乙班名学生成绩的方差,由此能求出结果.解:(1)甲班的平均分为:17(75+78+80+80+x+85+92+96)=85;解得x=9,∵乙班7名学生成绩的中位数是85,∴y=5,(2)乙班平均分为:17(75+80+80+85+90+90+95)=85;甲班7名学生成绩方差S12=17(102+72+52+42+02+72+112)=3607,乙班名学生成绩的方差S22=17(102+52+52+02+52+52+102)=3007,∵两个班平均分相同,S22<S12,∴乙班成绩比较稳定,故应选乙班参加.小提示:本题考查茎叶图的应用,解题时要认真审题,属于基础题.20、第24届北京冬季奥林匹克运动会于2022年2月4日至2月20日在北京和张家口联合举办.这是中国历史上第一次举办冬季奥运会,它掀起了中国人民参与冬季运动的大热潮.某市举办了中学生滑雪比赛,从中抽取40名学生的测试分数绘制成茎叶图和频率分布直方图如下,后来茎叶图受到了污损,可见部分信息如图.(1)求频率分布直方图中a的值,并根据直方图估计该市全体中学生的测试分数的平均数(同一组中的数据以这组数据所在区间中点的值作代表,结果保留一位小数);(2)现要对测试成绩在前26%的中学生颁发“滑雪达人”证书,并制定出能够获得证书的测试分数线,请你用样本来估计总体,给出这个分数线的估计值.答案:(1)a=0.02,平均数为74.5(2)82分析:(1)计算出测试分数位于[90,100]个数,可求得测试分数位于[80,90)的个数,由此可求得a的值,将每个矩形底边的中点值乘以对应矩形的面积,将所得结果全加可得样本的平均数;(2)设能够获得证书的测试分数线为x,分析可得80<x<90,根据已知条件可得出关于x的等式,求解即可.(1)解:由频率分布直方图可知,测试分数位于[90,100]的频率为10×0.01=0.1,则测试分数位于[90,100]个数为40×0.1=4,所以,测试分数位于[80,90)的个数为40−(4+10+14+4)=8,÷10=0.02.所以a=840估计平均数为55×0.1+65×0.25+75×0.35+85×0.2+95×0.1=74.5.(2)解:因为测试分数位于[90,100]的频率为0.1,测试分数位于[80,90)的频率为0.2,能够获得“滑雪达人”证书的中学生测试分数要在前26%,故设能够获得证书的测试分数线为x,则80<x<90,由(90−x)×0.02=0.26−0.1,可得x=82,所以分数线的估计值为82.。
高一统计测试题及答案
高一统计测试题及答案一、选择题(每题3分,共30分)1. 以下哪个选项是统计学中描述数据集中趋势的度量?A. 方差B. 标准差C. 平均数D. 众数2. 在一组数据中,中位数表示什么?A. 数据的最小值B. 数据的中间值C. 数据的最大值D. 数据的平均值3. 以下哪个选项是统计学中描述数据离散程度的度量?A. 均值B. 中位数C. 众数D. 方差4. 如果一组数据的方差为0,这意味着什么?A. 数据中存在异常值B. 数据完全相同C. 数据分布不均匀D. 数据没有代表性5. 以下哪个选项不是统计学中的图形表示方法?A. 条形图B. 折线图C. 饼图D. 表格6. 在统计学中,相关系数的取值范围是多少?A. -1到1之间B. 0到1之间C. 1到100之间D. 没有固定范围7. 以下哪个选项是统计学中用于检验假设的分析方法?A. 描述性统计B. 推断性统计C. 探索性统计D. 预测性统计8. 一组数据的标准差越大,说明数据的什么特性?A. 集中性B. 离散性C. 均匀性D. 代表性9. 以下哪个选项是统计学中用于预测未来数据的分析方法?A. 描述性统计B. 推断性统计C. 探索性统计D. 预测性统计10. 在统计学中,如果两个变量之间的相关系数为0,这意味着什么?A. 两个变量之间有强相关B. 两个变量之间有中等相关C. 两个变量之间没有相关D. 两个变量之间有弱相关二、填空题(每题2分,共20分)1. 当一组数据的中位数和平均数相等时,这组数据的分布是_________。
2. 标准差是衡量数据_________程度的统计量。
3. 相关系数的绝对值越接近1,表示两个变量之间的_________越强。
4. 在统计学中,_________图用于展示数据的频率分布。
5. 如果一个数据集中有50%的数据小于或等于某个值,那么这个值是数据集的_________。
6. 统计学中的_________分析用于从样本数据推断总体数据。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
某电视台在一次对收看文观众,相关的数据如下表所示(1)由表中数据直观分析,(2)用分层抽样方法在收看新名?
(3)在上述抽取的5名观众中 解:(1)画出二维条形图,通过来分析,得到的直观印象是收(2)在100名电视观众中人,大于40岁的观众故按分层抽样方法,(3)法一:由(2)可知20岁至40岁的观众有2人,的总的基本事件有:),2,1(其中恰有1名观3(),,2(),,2(),,1(),,1(b a b a 故P (“恰有1名观众的年
回归分析与应用这块计算繁琐独立性检验是重点及考点,
高中数学统计部分经典题集
收看文艺节目和新闻节目观众的抽样调查中,随机抽取表所示:
,收看新闻节目的观众是否与年龄有关? 收看新闻节目的观众中随机抽取5名,大于40岁的观观众中任取2名,求恰有1名观众的年龄为20至40通过分析数据的图形,或者联列表的对角线的乘积象是收看新闻节目的观众与年龄有关; 观众中,收看新闻的观众共有45人,其中20至40的观众共有27人。
,在应在大于40岁的观众中中抽取
32745
5
=⨯可知,抽取的5人中,年龄大于40岁的有3人,分别记,分别高为b a ,,若从5人中任取2名观众记作),,3(),,3(),,2(),,2(),3,2(),,1(),,1(),3,1(b a b a b a 众的年龄为20岁至40岁包含的基本),3(),,b a 共6个.
众的年龄为20至40岁”)=
5
3
106=; 算繁琐,学生应量力而行。
,学生务必掌握。
机抽取了100名电视
岁的观众应该抽取几
岁的概率.的乘积的差的绝对值岁的观众有18
人. 分别记作1,2,3;记作),(y x ,则包含),(b a 共10个。
事件有
:
分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量。
如是否吸烟、宗教信仰、国籍等。
列联表
假设0H :吸烟与患肺癌没有关系;
如果“吸烟与患肺癌没有关系”,则在吸烟者中不患肺癌的比例应该与不吸烟者中相应的比例差不多,即
d
c c
b a a +=
+⇒0≈-bc ad ,因此bc ad -越小,说明相关性越弱。
构造随机变量2
K =)
)()()(()(2
d b c a d c b a bc ad n ++++-,d c b a n +++=
经计算2
K 的观测值632.56=k
独立性检验的临界值表
由表可知:在0H 成立的条件下,)635.6(2
≥K P ≈010.0,它是一个小概率事件,所以我们有理由相信假设不成立。
我们有%99把握认为“吸烟与患肺癌有关系”,当然,我们也会判断出错,出错的可能性不会超过010.0
不患癌症 患癌症 总计 不吸烟 a b a+b 吸烟 c d c+d 总计
a+c
b+d
a+b+c+d
)(02k K P ≥
0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005
0k
0.455 0.708 1.323 2.072 2.706 3.841 5.0241 6.635 7.879
练习
1.某车间加工零件的数量x 与加工时间y 的统计数据如表:
零件数x(个)
10
20 30 加工时间y(分钟) 21
30
39
现已求得上表数据的回归方程a x b y
ˆˆˆ+=中的b ˆ值为0.9,则据此回归模型可以预测,加工100个零件所需要的加工时间约为( )
A.84分钟
B.94分钟
C.102分钟
D.112分钟
2.(2011•湖南)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计
60
50
110
附表:
p(k 2
≥k) 0.050 0.010 0.001 k
3.841
6.635
10.828
参照附表,得到的正确结论是( )
A.有99%以上的把握认为“爱好该项运动与性别有关”
B.有99%以上的把握认为“爱好该项运动与性别无关”
C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
3.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()
①若K2的观测值满足K2≥6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;
②从独立性检验可知有99%的把握认为吸烟与患病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;
③从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误.
A.①
B.①③
C.③
D.②
4.(2012•辽宁)电视传媒公司抽取了100名观众进行调查该体育节目时间的频率分布直“体育迷”,已知“体育迷”(Ⅰ)根据已知条件完成下面关?如果有关,我们有多大的
(Ⅱ)将日均收看该体育项目不中有2名女性,若从“超级体
非体育
迷
体育迷 男 女
合计
媒公司为了了解某地区电视观众对某类体育节目的收调查,其中女性有55名.如图是根据调查结果绘制的分布直方图;将日均收看该体育节目时间不低于40”中有10名女性. 成下面的2×2列联表,并据此资料你是否认为“体育多大的把握呢?(如果没有,此问不必做答) 项目不低于50分钟的观众称为“超级体育迷”,已知超级体育迷”中任意选取2人,求至少有1名女性观众
合计
目的收视情况,随机绘制的观众日均收看分钟的观众称为体育迷”与性别有
“超级体育迷”性观众的概率.。