学而思高中题库完整版统计.板块四.统计数据的数字特征.学生版
学而思高中题库完整版函数的图象与性质[1].板块四.函数的图象与数字特征.学生版
题型一:函数的图象【例1】 当a ≠0时,y =ax +b 和y =b ax 的图象只可能是()【例2】 (1996上海,文、理8)在下列图象中,二次函数y =ax 2+bx 与指数函数y =(ba)x的图象只可能是( )【例3】 (06重庆 理)如图所示,单位圆中弧AB 的长为x ,f (x )表示弧AB 与弦AB 所围成的弓形面积的2倍,则函数y =f (x )的图象是( )典例分析板块四.函数的图象与数字特征【例4】定义域和值域均为[],a a-(常数0a>)的函数()y f x=和()y g x=的图像如图所示,给出下列四个命题:(1)方程()0f g x=⎡⎤⎣⎦有且仅有三个解;(2)方程()0g f x=⎡⎤⎣⎦有且仅有三个解;(3)方程()0f f x=⎡⎤⎣⎦有且仅有九个解;(4)方程()0g g x=⎡⎤⎣⎦有且仅有一个解。
那么,其中正确命题的个数是。
【例5】某学生离家去学校,由于怕迟到,所以一开始就跑步,等跑累了,再走余下的路,下图中y轴表示离学校的距离,x轴表示出发后的时间,则适合题意的图形是( )A BC D【例6】 (06江西 12)某地一年内的气温()Q t (单位:℃)与时间t (月份)之间的关系如图所示,已知该年的平均气温为10℃,令()C t 表示时间段[]0,t 的平均气温,()C t 与t 之间的函数关系用下图表示,则正确的应该是( )【例7】 (2002上海文,理16)一般地,家庭用电量(千瓦时)与气温(℃)有一定的关系,如图2—1所示,图(1)表示某年12个月中每月的平均气温.图(2)表示某家庭在这年12个月中每个月的用电量.根据这些信息,以下关于该家庭用电量与其气温间关系的叙述中,正确的是( )A .气温最高时,用电量最多B .气温最低时,用电量最少C .当气温大于某一值时,用电量随气温增高而增加D .当气温小于某一值时,用电量随气温渐低而增加【例8】 函数()y f x =与()y g x =的图像如下图:则函数()()y f x g x =⋅的图像可能是( )y=f(x)oyxy=g(x)o yxoyxoyxoyxoyxA B C D【例9】 如图,点A 、B 、C 都在函数y =x 的图象上,它们的横坐标分别是a 、a +1、a +2.又A 、B 、C 在x 轴上的射影分别是A ′、B ′、C ′,记△AB ′C 的面积为f (a ),△A ′BC ′的面积为g (a ).(1)求函数f (a )和g(a )的表达式;(2)比较f (a )与g(a )的大小,并证明你的结论.【例10】 (2000春季北京、安徽,14)已知函数f (x )=ax 3+bx 2+cx +d 的图象如图,求b的范围。
高中数学第一章统计4数据的数字特征课时作业含解析北师大版必
学习资料第一章统计4数据的数字特征[课时作业][A组基础巩固]1.在一次体育测试中,某班的6名同学的成绩(单位:分)分别为66,83,87,83,77,96。
关于这组数据,下列说法错误的是()A.众数是83B.中位数是83C.极差是30 D.平均数是83解析:由于83出现的次数最多,所以众数是83,故A说法正确;把数据66,83,87,83,77,96按从小到大排列为66,77,83,83,87,96,中间两个数为83,83,所以中位数是83,故B说法正确;极差是96-66=30,故C说法正确;由于平均数为(66+83+87+83+77+96)÷6=82,故D说法错误,故选D。
答案:D2.甲、乙两支女子曲棍球队在去年的国际联赛中,甲队平均每场进球数为3.2,全年比赛进球个数的标准差为3;乙队平均每场进球数为1。
8,全年比赛进球个数的标准差为0。
3,下列说法正确的有()①甲队的总进球比乙队多;②乙队发挥比甲队稳定;③乙队几乎每场都进球;④甲队的表现时好时坏A.1个B.2个C.3个D.4个答案:D3.从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为()A。
错误!C.3 D.错误!解析:∵错误!=错误!=错误!=3,∴s2=错误!×[20×(5-3)2+10×(4-3)2+30×(3-3)2+30×(2-3)2+10×(1-3)2]=错误!=错误!,∴s=错误!,故选B。
答案:B4.已知10名工人生产同一零件,生产的件数分别是16,18,15,11,16,18,18,17,15,13,设其平均数为a,中位数为b,众数为c,则有()A.a〉b〉c B.a〉c>bC.c>a>b D.c〉b〉a答案:D5.某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s 2=________.解析:∵该组数据的平均数错误!=错误!=7,∴该组数据的方差s 2=错误![(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]=错误!=3.2。
学而思高中题库完整版排列与组合.版块三.基本计数原理的综合应用.学生版
1.基本计数原理 ⑴加法原理分类计数原理:做一件事,完成它有n 类办法,在第一类办法中有1m 种不同的方法,在第二类办法中有2m 种方法,……,在第n 类办法中有n m 种不同的方法.那么完成这件事共有12n N m m m =+++L 种不同的方法.又称加法原理.⑵乘法原理分步计数原理:做一件事,完成它需要分成n 个子步骤,做第一个步骤有1m 种不同的方法,做第二个步骤有2m 种不同方法,……,做第n 个步骤有n m 种不同的方法.那么完成这件事共有12n N m m m =⨯⨯⨯L 种不同的方法.又称乘法原理.⑶加法原理与乘法原理的综合运用如果完成一件事的各种方法是相互独立的,那么计算完成这件事的方法数时,使用分类计数原理.如果完成一件事的各个步骤是相互联系的,即各个步骤都必须完成,这件事才告完成,那么计算完成这件事的方法数时,使用分步计数原理.分类计数原理、分步计数原理是推导排列数、组合数公式的理论基础,也是求解排列、组合问题的基本思想方法,这两个原理十分重要必须认真学好,并正确地灵活加以应用. 2. 排列与组合 ⑴排列:一般地,从n 个不同的元素中任取()m m n ≤个元素,按照一定的顺序排成一列,叫做从n 个不同元素中取出m 个元素的一个排列.(其中被取的对象叫做元素)排列数:从n 个不同的元素中取出()m m n ≤个元素的所有排列的个数,叫做从n 个不同元素中取出m 个元素的排列数,用符号A m n 表示.排列数公式:A (1)(2)(1)m n n n n n m =---+L ,m n +∈N ,,并且m n ≤.全排列:一般地,n 个不同元素全部取出的一个排列,叫做n 个不同元素的一个全排列. n 的阶乘:正整数由1到n 的连乘积,叫作n 的阶乘,用!n 表示.规定:0!1=. ⑵组合:一般地,从n 个不同元素中,任意取出m ()m n ≤个元素并成一组,叫做从n 个元素中任取m 个元素的一个组合.组合数:从n 个不同元素中,任意取出m ()m n ≤个元素的所有组合的个数,叫做从n 个不同元素中,任意取出m 个元素的组合数,用符号C m n 表示.组合数公式:(1)(2)(1)!C !!()!m nn n n n m n m m n m ---+==-L ,,m n +∈N ,并且m n ≤. 知识内容基本计数原理的综合应用组合数的两个性质:性质1:C C m n m n n -=;性质2:11C C C m m m n n n -+=+.(规定0C 1n =)⑶排列组合综合问题解排列组合问题,首先要用好两个计数原理和排列组合的定义,即首先弄清是分类还是分步,是排列还是组合,同时要掌握一些常见类型的排列组合问题的解法: 1.特殊元素、特殊位置优先法元素优先法:先考虑有限制条件的元素的要求,再考虑其他元素; 位置优先法:先考虑有限制条件的位置的要求,再考虑其他位置;2.分类分步法:对于较复杂的排列组合问题,常需要分类讨论或分步计算,一定要做到分类明确,层次清楚,不重不漏.3.排除法,从总体中排除不符合条件的方法数,这是一种间接解题的方法.4.捆绑法:某些元素必相邻的排列,可以先将相邻的元素“捆成一个”元素,与其它元素进行排列,然后再给那“一捆元素”内部排列.5.插空法:某些元素不相邻的排列,可以先排其它元素,再让不相邻的元素插空. 6.插板法:n 个相同元素,分成()m m n ≤组,每组至少一个的分组问题——把n 个元素排成一排,从1n -个空中选1m -个空,各插一个隔板,有11m n C --.7.分组、分配法:分组问题(分成几堆,无序).有等分、不等分、部分等分之别.一般地平均分成n 堆(组),必须除以n !,如果有m 堆(组)元素个数相等,必须除以m ! 8.错位法:编号为1至n 的n 个小球放入编号为1到n 的n 个盒子里,每个盒子放一个小球,要求小球与盒子的编号都不同,这种排列称为错位排列,特别当2n =,3,4,5时的错位数各为1,2,9,44.关于5、6、7个元素的错位排列的计算,可以用剔除法转化为2个、3个、4个元素的错位排列的问题.1.排列与组合应用题,主要考查有附加条件的应用问题,解决此类问题通常有三种途径:①元素分析法:以元素为主,应先满足特殊元素的要求,再考虑其他元素; ②位置分析法:以位置为主考虑,即先满足特殊位置的要求,再考虑其他位置;③间接法:先不考虑附加条件,计算出排列或组合数,再减去不符合要求的排列数或组合数.求解时应注意先把具体问题转化或归结为排列或组合问题;再通过分析确定运用分类计数原理还是分步计数原理;然后分析题目条件,避免“选取”时重复和遗漏;最后列出式子计算作答.2.具体的解题策略有:①对特殊元素进行优先安排;②理解题意后进行合理和准确分类,分类后要验证是否不重不漏; ③对于抽出部分元素进行排列的问题一般是先选后排,以防出现重复; ④对于元素相邻的条件,采取捆绑法;对于元素间隔排列的问题,采取插空法或隔板法; ⑤顺序固定的问题用除法处理;分几排的问题可以转化为直排问题处理; ⑥对于正面考虑太复杂的问题,可以考虑反面.⑦对于一些排列数与组合数的问题,需要构造模型.基本计数原理的综合应用【例1】用0,3,4,5,6排成无重复字的五位数,要求偶数字相邻,奇数字也相邻,则这样的五位数的个数是_________.(用数字作答)【例2】若自然数n使得作竖式加法(1)(2)n n n++++均不产生进位现象.则称n为“可连数”.例如:32是“可连数”,因323334++不产生进位现象;23不是“可连数”,因232425++产生进位现象.那么,小于1000的“可连数”的个数为()A.27B.36C.39D.48【例3】由正方体的8个顶点可确定多少个不同的平面?【例4】如图,一个地区分为5个行政区域,现给地图着色,要求相邻地区不得使用同一颜色,现有4种颜色可供选择,则不同的着色方法共有种.(以数字作答)典例分析【例5】如图,一环形花坛分成A B C D,,,四块,现有4种不同的花供选种,要求在每块里种1种花,且相邻的2块种不同的花,则不同的种法总数为()A.96 B.84 C.60 D.48【例6】某城市在中心广场建造一个花圃,花圃分为6个部分(如图).现要栽种4种不同颜色的花,每部分栽种一种且相邻部分不能栽种同样颜色的花,不同的栽种方法有种.(以数字作答)【例7】分母是385的最简真分数一共有多少个?并求它们的和.【例8】某人有4种颜色的灯泡(每种颜色的灯泡足够多),要在如图所示的6个点A、B、C、A1、B1、C1上各装一个灯泡,要求同一条线段两端的灯泡不同色,则每种颜色的灯泡都至少用一个的安装方法共有种(用数字作答)【例9】用0,1,2,3,4,5这6个数字,可以组成_______个大于3000,小于5421的数字不重复的四位数.【例10】某通讯公司推出一组手机卡号码,卡号的前七位数字固定,从“0000⨯⨯⨯⨯⨯⨯⨯”到“9999⨯⨯⨯⨯⨯⨯⨯”共10000个号码.公司规定:凡卡号的后四位带有数字“4”或“7”的一律作为“优惠卡”,则这组号码中“优惠卡”的个数为()A.2000B.4096C.5904D.8320【例11】同室4人各写1张贺年卡,先集中起来,然后每人从中各拿1张别人送出的贺年卡,则4张贺年卡不同的分配方式有()A.6种 B.9种 C.11种 D.23种【例12】某班新年联欢会原定的6个节目已排成节目单,开演前又增加了3个新节目,如果将这3个节目插入原节目单中,那么不同的插法种数为()A.504B.210C.336D.120【例13】某班学生参加植树节活动,苗圃中有甲、乙、丙3种不同的树苗,从中取出5棵分别种植在排成一排的5个树坑内,同种树苗不能相邻,且第一个树坑和第5个树坑只能种甲种树苗的种法共()A.15种B.12种C.9种D.6种【例14】如图所示,画中的一朵花,有五片花瓣.现有四种不同颜色的画笔可供选择,规定每片花瓣都要涂色,且只涂一种颜色.若涂完的花中颜色相同的花瓣恰有三片,则不同涂法种数为(用数字作答).【例15】 用0到9这10个数字,可以组成没有重复数字的三位偶数的个数为( )A .324B .328C .360D .648【例16】 用红、黄、蓝三种颜色之一去涂图中标号为129,,, 的9个小正方形(如图),使得任意相邻(有公共边的)小正方形所涂颜色都不相同,且“3、5、7”号数字涂相同的颜色,则符合条件的所有涂法共有( )种.987654321A .72B .108C .144D .192【例17】 足球比赛的计分规则是:胜一场得3分,平一场得1分,负一场得0分,那么一个队打14场共得19分的情况有( )A .3种B .4种C .5种D .6种。
2021学年高中数学第一章统计1.4数据的数字特征学案含解析北师大版必修3.doc
§4数据的数字特征知识点一众数、中位数、平均数[填一填]1.众数(1)定义:一组数据中出现次数最多的数称为这组数据的众数.(2)特征:一组数据的众数可能多个,也可能没有,它反映了该组数据的频率分布.2.中位数(1)定义:一组数据按从小到大(或从大到小)的顺序排成一列,处于中间位置的数称为这组数据的中位数.(2)特征:一组数据中的中位数是唯一的,反映了该组数据的集中趋势.3.平均数(1)定义:一组数据的和与这组数据的个数的商叫作这组数据的平均数,数据x1,x2,…,x n的平均数为x=x1+x2+…+x nn.(2)特征:平均数对数据有“取齐”的作用,代表该组数据的平均水平.任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有的性质.所以与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的平均水平,但平均数受数据中的每一个数据的影响较大,使平均数在估计总体时可靠性降低.[答一答]1.一组数据的平均数是否一定能说明现实中的平均水平?提示:在用平均数估计总体时,样本中的每一个数据都会影响到平均数的大小,因此在实际操作中,一定要注意异常数据对平均数的影响,以便作出正确估计.比如:某地区的年平均家庭年收入是10万元,给人的印象是这个地区的家庭年收入普遍较高.但是,如果这个平均数是从200户贫困家庭和20户极富有的家庭年收入计算出来的,那么,它就既不能代表贫困家庭的年收入,也不能代表极富有家庭的年收入.知识点二标准差、方差、极差[填一填]4.标准差(1)定义:标准差是样本数据到平均数的一种平均距离,一般用s表示,通常用以下公式来计算s=1n[(x1-x)2+(x2-x)2+…+(x n-x)2].可以用计算器或计算机计算标准差.(2)特征:标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度和离散程度的大小.标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小.5.方差(1)定义:标准差的平方,即s2=1n[(x1-x)2+(x2-x)2+…+(x n-x)2].(2)特征:与标准差的作用相同,描述一组数据围绕平均数波动的大小.(3)取值范围:s2≥0.6.极差(1)定义:一组数据的最大值和最小值的差称为这组数据的极差.(2)特征:表示该组数据之间的差异情况.[答一答]2.怎样正确理解标准差与方差.提示:①标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.②标准差、方差的取值范围:[0,+∞).标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性.③因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.1.三种数字特征应注意以下四点(1)众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量.(2)众数考查各个数据出现的频率,大小只与这组数据中的部分数据有关,当一组数据中有不少数据多次重复出现时,其众数往往更能反映问题.(3)中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响,中位数可能在所给的数据中,也可能不在所给的数据中.当一组数据中的个别数据变动较大时,可用中位数描述它的某种集中趋势.(4)实际问题中求得的平均数、众数和中位数应带上单位.2.关于方差、标准差应注意以下几点(1)样本标准差反映了各样本数据聚集于样本平均值周围的程度,标准差越小,表明各个样本数据在样本平均数周围越集中;反之,表明各样本数据在样本平均数的两边越分散.(2)若样本数据都相等,则s=0.(3)当样本的平均数相等或相差无几时,就要用样本数据的离散程度来估计总体的数字特征,而样本数据的离散程度,就由标准差来衡量.(4)因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差和标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般采用标准差.类型一平均数、中位数、众数【例1】据报道,某销售公司有33名职工,他们所在部门及相应每人所创年利润如下表所示(单位:万元):部门 A B C D E F G人数11215320 每人所创年利润 5.55 3.53 2.52 1.5(2)假设部门A所创年利润从5.5万元提高到30万元,部门B所创年利润由5万元提高到20万元,那么新的平均数、中位数、众数、极差又是多少?(3)你认为哪个统计量更能反映这个公司职工每人所创年利润的平均水平?【思路探究】(1)(2)根据表中数据及平均数、中位数、众数、极差的定义求解.(3)分析各统计量与公司职工每人所创年利润的关系→看其是否偏离一般情况【解】(1)x=5.5+5+3.5×2+3+2.5×5+2×3+1.5×2033≈2.1(万元),中位数为1.5万元,众数为1.5万元,极差为4万元.。
北师大版高中数学必修3第一章统计-4数据的数字特征-典题题库(二)(带详细答案)
北师大版高中数学必修3第一章统计-4数据的数字特征-典题题库(二)一、选择题(共81小题,每小题5.0分,共405分)1.在某次考试中,10名同学得分如下:84,84,77,83,68,78,70,85,79,95.则这组数据的众数和中位数分别是()A. 84,68B. 84,78C. 84,81D. 78,81【答案】C【解析】这10名同学得分从小到大排列:68,70,77,78,79,83,84,84,85,95.众数是84,中位数为中间两数的平均数,即(79+83)÷2=81.2.数据:1,1,3,3的众数和中位数分别是()A. 1和3,2B. 3,2C. 1和3,1或3D. 3,3【答案】A【解析】数据1,1,3,3中,1和3都出现了2次,出现的次数最多,则众数是1或3;最中间的两个数是1与3,则中位数是2.3.一组数据1,2,2,3,下列说法正确的是()A.众数是3B.中位数是2C.极差是3D.平均数是3【答案】B【解析】众数为2,故A错误;中位数是2,故B正确;极差为2,故C错误;平均数为2,故D错误.4.2008年元旦晚会举办的挑战主持人大赛上,七位评委为某选手打出的分数为79,84,85,86,84,87,93,这组数据的众数和中位数分别为()A. 84,85B. 84,84C. 85,84D. 85,86【答案】A【解析】在这一组数据中84是出现次数最多的,故众数是84.而将这组数据从小到大的顺序排列:79,84,84,85,86,87,93.处于中间位置的那个数是85,那么由中位数的定义可知,这组数据的中位数是85.5.为了检查一批手榴弹的杀伤半径,抽取了其中20颗做试验,得到这20颗手榴弹的杀伤半径,并列表如下:在这个问题中,这20颗手榴弹的杀伤半径的众数和中位数分别是()A. 9.5,9.4B. 10,9.5C. 10,10D. 10,9【答案】B【解析】根据所给的表格,看出一共有20个数据,其中有1个7,5个8,4个9,6个10,4个11,∴把这些数字从小到大排列得到中间两个数字的平均数是9.5,出现次数最多的数字是10.6.已知数据①18,32,-6,14,8,12;②21,4,7,14,-3,11;③5,4,6,5,7,3;④-1,3,1,0,0,-3.其中平均数和中位数相等的一组数据是()A.①B.②C.③D.①②③④【答案】D【解析】①18,32,-6,14,8,12;中位数是=13,平均数是13,①中两个数相同.②21,4,7,14,-3,11;中位数是9,平均数是9,②中两个数字相同.③5,4,6,5,7,3;中位数是5,平均数是5,③中两个数字相同.④-1,3,1,0,0,-3.中位数是0,平均数是0,④中两个数字相同.综上可知①②③④都满足条件.7.某天,10名工人生产同一零件,生产的件数分别是16,18,15,11,16,18,18,17,15,13,设其平均数为a,中位数为b,众数为c,则有()A.a>b>cB.a>c>bC.c>a>bD.c>b>a【答案】D【解析】从小到大排列此数据为:11、13、15、15、16、16、17、18、18、18.平均数为a=(11+13+15×2+16×2+17+18×3)=15.7,中位数是最中间两数的平均数,即b=(16+16)÷2=16;众数为c=18.∴c>b>a.8.在某项体育比赛中,七位裁判为一选手打出的分数如下:90899095939493该组数据的中位数和平均数分别为()A. 92,93B. 93,92C. 93,93D. 94,92【答案】B【解析】将90,89,90,95,93,94,93由小到大排列为:89,90,90,93,93,94,95.中间位置的数据是93,中位数是93,平均数为(90+89+90+95+93+94+93)÷7=92.9.当5个整数从小到大排列时,其中中位数是4,如果这组数据的唯一众数是6,则这5个整数可能的和的最大值是()A. 21B. 22C. 23D. 24【答案】A【解析】∵有5个整数,且中位数是4,6是唯一众数,所以6出现了两次,其他两个数字比4小,且不能相等,所以从小到大排列此数据为:2,3,4,6,6,这样它们的和最大为21.10.一组数据:5,3,6,7,5,4,5,8,2,5的众数和平均数分别是()A. 5,5B. 6,5C. 5,6D. 5,4【答案】A【解析】∵数据:5,3,6,7,5,4,5,8,2,5中出现次数最多的数是5,∴这组数据的众数是5,又∵(5+3+6+7+5+4+5+8+2+5)=5,∴这组数据的平均数是5.11.某校篮球班21名同学的身高如下表:则该校篮球班21名同学身高的众数和中位数分别是(单位:cm)()A. 186,186B. 186,187C. 186,188D. 208,188【答案】C【解析】众数是一组数据中出现次数最多的数据,186出现6次,故众数是186;按从小到大的顺序排列,第11位同学的身高即为中位数,中位数是188.12.一组数据20,30,40,50,50,60,70,80的平均数、中位数、众数的大小关系是()A.平均数>中位数>众数B.平均数<中位数<众数C.中位数<众数<平均数D.众数=中位数=平均数【答案】D【解析】从小到大数据排列为20、30、40、50、50、60、70、80,50出现了2次,为出现次数最多的数,故众数为50;共8个数据,第4、5两个数的平均数为50,故中位数是50;平均数=(20+30+40+50+50+60+70+80)÷8=50.∴平均数=中位数=众数.13.云南省五个5A级旅游景区门票如下表所示(单位:元)关于这五个旅游景区门票票价,下列说法错误的是()A.平均数是120B.中位数是105C.众数是80D.极差是95【答案】A【解析】选项A,平均数为(175+105+80+121+80)÷5=112.2,故A错误;选项B,数据从低到高排列为80,80,105,121,175,中位数是105,故B正确;选项C,80出现了两次,出现的次数最多,所以众数是80,故C正确;选项D,极差是175-80=95,故D正确.14.某校高一运动队为了备战校运动会需要购置一批运动鞋.已知该队伍有20名同学,统计表如下.由于不小心弄脏了表格,有两个数据看不到:下列说法正确的是()A.这组数据的中位数是40,众数是39B.这组数据的中位数与众数一定相等C.这组数据的平均数P满足39<P<40D.以上说法都不对【答案】C【解析】选项A,由于38、41、42码的数和为10,而39、40码对应的数不知,故不能确定出中位数和众数,故错误;选项B,由于38、41、42码的数和为10,而39、40码对应的数不知,故不能确定出中位数和众数,也就不能确定出中位数与众数是否相等,故错误;选项C,当39码的数为10,40码的数为0时,平均数=(38×5+39×10+41×3+42×2)÷20=39.35;当39码的数为0,40码的数为10时,平均数=(38×5+40×10+41×3+42×2)÷20=39.85;∴这组数据的平均数P满足39<P<40,故正确;D是错误的.15.10名工人生产同一零件,生产件数分别为15,17,14,10,15,17,17,16,14,12,则中位数,众数,极差依次为()A. 16,15,6B. 14,15,7C. 15,17,7D. 15,16,6【答案】C【解析】10名工人生产同一零件,生产件数从小到大为:10,12,14,14,15,15,16,17,17,17,∴中位数为15,众数为17,极差为17-10=7.16.已知10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12.设其众数为a,中位数为b,则a+b的值为()A. 33.5B. 31.7C. 32D. 33【答案】C【解析】∵生产的件数是15,17,14,10,15,17,17,16,14,12,∴样本数据17出现次数最多,为众数,即a=17;从小到大排列中间二位的平均数,即中位数b=15.∴a+b=32.17.在某项体育比赛中,八位裁判为一选手打出的分数如下:9089909592949390,则这组数据的众数和中位数分别为()A. 90,91B. 90,92C. 93,91D. 93,92【答案】A【解析】数据按从小到大排列:89,90,90,90,92,93,94,95.中位数是(90+92)÷2=91;数据90出现3次,次数最多,所以众数是90.18.已知一组数据为20、30、40、50、60、60、70,则这组数据的众数、中位数、平均数的大小关系为()A.中位数>平均数>众数B.平均数>众数>中位数C.众数>平均数>中位数D.众数>中位数>平均数【答案】D【解析】60出现了2次,为出现次数最多的数,故众数为60;共7个数据,第4个数为50,故中位数是50;平均数=(20+30+40+50+60+60+70)÷7=40.∴众数>中位数>平均数.19.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其众数为a,中位数为b,平均数为c,则有()A.c>a>bB.a>b>cC.b>c>aD.c>b>a【答案】B【解析】将数据从小到大重新排好为10,12,14,14,15,15,16,17,17,17.则众数a=17,中位数b=15,平均数c=15+(-5-3-1-1+0+0+1+2+2+2)=15-0.3=14.7,∴a>b>c.20.假设有一组数据为6,8,3,6,4,6,5,则这些数据的众数与中位数分别是()A. 5,6B. 6,6C. 6,5D.以上都不正确【答案】B【解析】一组数据为6,8,3,6,4,6,5.由数据看出,该组数据的众数是6;把该组数据由小到大排列为3,4,5,6,6,6,8.由数据看出其中位数是6.所以,这些数据的众数与中位数分别是6,6.21.已知一个样本中的数据为0.12,0.15,0.13,0.15,0.14,0.17,0.15,0.16,0.13,0.14,则该样本的众数、中位数分别是()A. 0.15,0.145B. 0.145,0.14C. 0.14,0.145D. 0.145,0.15【答案】A【解析】样本中的数据为0.12,0.15,0.13,0.15,0.14,0.17,0.15,0.16,0.13,0.14,将样本中的数据从小到大排列后,得到0.12,0.13,0.13,0.14,0.14,0.15,0.15,0.15,0.16,0.17,众数是一组数据中出现次数最多的数,在这10个数据中出现次数最多的是0.15,故众数是0.15;而将这组数据按从小到大的顺序排列后,处于中间位置的2个数0.14,0.15的平均数是0.145,那么这组数据的中位数是0.145.22.已知一组数据为0,-1,4,12,6,6,则这组数据的众数与中位数之和是()A. 10B. 11C. 13D. 14【答案】B【解析】数据6出现了2次,出现的次数最多,所以众数是6.先排序得:-1,0,4,6,6,12,中间两个数据的平均数是(4+6)÷2=5,故中位数是5,故这组数据的众数与中位数之和是6+5=11.23.从2013年5月29日开始的一周内,某地每天的最高气温依次是(单位:℃):30,30,34,33,33,31,33,那么这7个数据的众数和中位数分别是()A. 32和33B. 32和32C. 33和33D. 33和32【答案】C【解析】将数据从小到大排列为:30,30,31,33,33,33,34,众数为33;中位数为33.24.已知一组数据为0,3,5,x,9,13,且这组数据的中位数为7,那么这组数据的众数为() A. 13B. 9C. 7D. 0【答案】B【解析】由题意得:=7,解得:x=9,∴这组数据的众数是9.25.已知一组数据为1、5、6、2、6,则这组数据的众数、中位数、平均数的大小关系为()A.中位数>平均数>众数B.众数>中位数>平均数C.众数>平均数>中位数D.平均数>众数>中位数【答案】B【解析】一组数据1、5、6、2、6中,众数为6,平均数=(1+5+6+2+6)=4,从小到大排:1,2,5,6,6,中位数为5,∴众数>中位数>平均数.26.五名学生投篮球,规定每人投20次,统计他们每人投中的次数,得到五个数据,若这五个数据的中位数是6,唯一众数是7,则下列所给数据可能是他们投中次数总和的为()A. 20B. 28C. 30D. 31【答案】B【解析】中位数是6,唯一众数是7,则最大的三个数的和是:6+7+7=20,两个较小的数一定是小于6的非负整数,且不相等,则五个数的和一定大于20且小于30.27.为了解居民用水情况,在某小区随机抽查了15户家庭的月用水量,结果如下表:则这15户家庭的月用水量的众数与中位数分别为()A. 9,6B. 6,6C. 5,6D. 5,5【答案】C【解析】数据5出现的次数最多,为众数;数据6处在第8位,中间位置,所以这组数据的中位数是6.28.已知样本:864711689105,则样本的平均数和中位数a的值分别是()A. 7.3,7.5B. 7.4,7.5C. 7.3,7和8D. 7.4,7和8【答案】B【解析】=(8+6+4+7+11+6+8+9+10+5)=7.4,样本从小到大的排列为:4,5,6,6,7,8,8,9,10,11,所以中位数a=(7+8)=7.5.29.已知一组数据为-8,-1,4,x,10,13,且这组数据的中位数是7,那么数据中的众数是() A. 7B. 6C. 4D. 10【答案】D【解析】∵数据为-8,-1,4,x,10,13,且这组数据的中位数是7,∴(x+4)=7,∴x=10,∴数据中的众数是10.30.某项测试成绩满分为10分,现随机抽取30名学生参加测试,得分如图所示,假设得分值的中位数为me,平均数为,众数为mo,则()A.me=mo=B.me=mo<C.me<mo<D.mo<me<【答案】D【解析】由图知m0=5,由中位数的定义得中位数应该是第15个数与第16个数的平均值,由图知将数据从小到大排第15个数是5,第16个数是6,所以me==5.5,=≈5.97<6,所以mo<me<.31.如图是某高中举办的2010年元旦学生歌曲大赛上,七位评委为某选手打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的众数和中位数分别为()A. 84,85B. 84,84C. 85,84D. 85,85【答案】A【解析】去掉一个最高分和一个最低分后,这组数据是84,85,86,84,87,在这组数据中出现次数最多的是84,∴众数是84,把这组数据按照从小到大的顺序排列,最中间一个是85,∴中位数是85.32.如图表示甲、乙两名篮球运动员的每场比赛得分情况的茎叶图,则甲得分的众数与乙得分的中位数之和为()A. 57B. 58C. 39D. 40【答案】D【解析】由茎叶图可知甲得分出现次数最多的是14,甲得分的众数是14.乙得分数据共有11个,出现在中间第6位的数据是26,乙得分的中位数是26.两数之和14+26=40.33.从人群中随意抽取11人,如图是这11人夏季和冬季体重情况的茎叶图,则夏季体重的众数与冬季体重的中位数分别是()A. 54,55B. 52,55C. 52,57D. 54,57【答案】C【解析】由题意,知夏季体重的数据分别是48,49,52,52,54,55,60,61,64,67,69,统计发现,52出现的次数最多,故其众数是52,冬季体重的数据是51,52,52,54,55,57,58,62,67,68,70,观察发现,57处于中间位置,故其中位数是57,综上夏季体重的众数与冬季体重的中位数分别是52,57.34.某篮球运动员在一个赛季的40场比赛中的得分的茎叶图如图所示,则中位数与众数分别为()A. 23,21B. 23,23C. 23,25D. 25,25【答案】B【解析】由茎叶图知这里有40个数据,这些数据是按照大小顺序排列的,中位数是最中间两个数字的平均数23,在这组数据中出现次数最多的是23.35.如图是2017年某校元旦晚会举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的众数和中位数分别为()A. 84,85B. 84,84C. 85,84D. 85,85【答案】B【解析】2017年某校元旦晚会举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,可得最大值为93,最小值为79,剩余的数为:84,84,84,86,87,可得众数84,中位数为84.36.PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,一般情况下PM2.5浓度越大,大气环境质量越差,茎叶图表示的是成都市区甲、乙两个监测站某10日内每天的PM2.5浓度读数(单位:μg/m3),则下列说法正确的是()A.这10日内甲、乙监测站读数的极差相等B.这10日内甲、乙监测站读数的中位数中,乙的较大C.这10日内乙监测站读数的众数与中位数相等D.这10日内甲、乙监测站读数的平均数相等【答案】C【解析】根据茎叶图中的数据可知,这10日内甲:极差为55,中位数为74,平均数为73.4,这10日内乙:极差为57,中位数为68,众数为68,平均数为68.1,通过以上的数据分析,可知C正确.37.对某同学的6次数学测试成绩(满分100分)进行统计,作出的茎叶图如图所示,给出关于该同学数学成绩的以下说法:①中位数为83;②众数为83;③平均数为85;④极差为12.其中正确的说法是()A.①②B.③④C.②③D.①③【答案】C【解析】由已知中茎叶图,可得:①中位数为84,故错误;②众数为83,故正确;③平均数为85,故正确;④极差为13,故错误.38.如图所示的茎叶图记录了甲、乙两个小组(每小组4人)在期末考试中的数学成绩.乙组记录中有一个数据模糊,无法确认,在图中以α表示.已知甲、乙两个小组的数学成绩的平均分相同,则乙组数学成绩的中位数为()A. 92B. 93C. 93.5D. 94【答案】B【解析】∵甲、乙两个小组的平均分相同,∴=α=2,∴乙组数学成绩的中位数为=93.39.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本中的中位数、众数、极差分别是()A. 46,45,56B. 46,45,53C. 47,45,56D. 45,47,53【答案】A【解析】由已知中的茎叶图可得:中位数为:(45+47)=46,众数为:45,极差为:68-12=56.40.某校高二年级15个班参加成都市调研考试的参考人数的茎叶图如图,则这组数据的中位数和众数分别是()A. 51和51B. 51和52C. 52和51D. 52和52【答案】C【解析】根据茎叶图得高二年级15个班参加成都市调研考试的参考人数为:42,44,47,49,51,51,51,52,52,53,56,58,62,62,65.在这一组数据中51是出现次数最多的,故众数是51;处于这组数据中间位置的数是52,那么由中位数的定义可知,这组数据的中位数是52.41.在如图所示的“茎叶图”表示的数据中,众数和中位数分别是()A. 23与26B. 31与26C. 24与30D. 26与30【答案】B【解析】由茎叶图得到所有的数据从小到大排列:12,14,20,23,25,26,30,31,31,41,42,∴众数和中位数分别为31,26.42.对某杂志社一个月内每天收到的稿件数量进行了统计,得到样本的茎叶图(如图),则该样本的中位数,众数分别为()A. 47,45B. 45,47C. 46,45D. 45,46【答案】C【解析】由题意可知茎叶图共有30个数值,所以中位数为:=46.出现次数最多的数是45,故众数是45.43.一组数据12,15,24,25,31,31,36,36,37,39,44,49,50的众数是()A. 31B. 36C. 37D. 31,36【答案】D【解析】∵一组数据12,15,24,25,31,31,36,36,37,39,44,49,50中,出现次数最多的数是31,36,∴这组数据的众数是31,36.44.已知一组数据为0,3,5,x,9,13,且这组数据的中位数为7,那么这组数据的众数为()A. 13B. 9C. 7D. 0【答案】B【解析】由题意得=7,解得x=9,∴这组数据的众数是9.45.学校商店在一段时间内销售了四种饮料共100瓶,各种饮料的销售量如下表:建议学校商店进货数量最多的品牌是()A.甲品牌B.乙品牌C.丙品牌D.丁品牌【答案】D【解析】根据众数的意义和定义,众数是一组数据中出现次数最多的数据,则进货要进销售量最多的品牌.在四个品牌的销售量中,丁的销售量最多.故选D.46.孔明同学在庆祝建党90周年的演讲比赛中,6位评委给他的打分如下表:则孔明得分的众数为()A. 95B. 90C. 85D. 80【答案】B【解析】根据众数的定义,从表中找出出现次数最多的数即为众数.孔明同学共有6个得分,其中90分出现3次,次数最多,故孔明得分的众数为90分.故选B.47.某市甲、乙、丙、丁四支中学生足球队在市级联赛中进球数分别为7、7、6、5,则这组数据的众数是()A. 5B. 6C. 7D. 6.5【答案】C【解析】众数就是出现次数最多的数,据此即可求解.这组数据的众数是7.故选C.48.数据2,2,3,4,3,1,3中,众数是()A. 1B. 2C. 3D. 4【答案】C【解析】众数是指一组数据中出现次数最多的数据,根据众数的定义就可以解决.本题中数据3出现了3次,出现的次数最多,所以本题的众数是3.故选C.49.数据1,2,4,4,3的众数是()A. 1B. 2C. 3D. 4【答案】D【解析】根据众数的定义,从数据中找出出现次数最多的数解答即可.1,2,4,4,3中,出现次数最多的数是4,故选D.50.在某次考试中,共有100个学生参加考试,如果某题的得分情况如下:那么这些得分的众数是()A. 37.0%B. 20.2%C. 0分D. 4分【答案】C【解析】∵该题得0分的百分率最大为37.0%,∴这些得分的众数为0分.51.某射击小组有20个人,教练根据他们某次射击的数据绘制成如图的统计图,则这组数据的众数是()A. 9B. 8C. 7D. 6【答案】C【解析】由条形统计图中出现频数最大条形最高的数据是在第三组7环,故众数是7环.52.一个样本数据按从小到大的顺序排列为13,14,19,x,23,27,28,31,其中位数为22,则x等于()A. 21B. 22C. 23D. 24【答案】A【解析】由条件可知数字的个数为偶数,∴这组数据的中位数是最中间两个数字的平均数,∴中位数22=,∴x=21.53.一组数据12,15,24,25,31,31,36,36,37,39,44,49,50的中位数是()A. 31B. 36C. 35D. 34【答案】B【解析】由于这组数据12,15,24,25,31,31,36,36,37,39,44,49,50的数据个数13为奇数,所以最中间位置的数36,就是这组数据的中位数.54.某篮球运动员在6场比赛中的得分分别为28,24,14,13,16,25,则该运动员这6场比赛得分的中位数为()A. 20B. 13.5C. 16D. 24【答案】A【解析】∵6场比赛中的得分分别为28、24、14、13、16、25,把得分按照从小到大排列为13、14、16、24、25、28,∵有偶数个数字,∴中位数是中间两个数的平均数=20.55.甲、乙两组数据分别为甲:28,31,39,45,42,55,58,57,66;乙:29,34,35,48,42,46,55,53,55,67,则甲、乙的中位数分别是()A. 45,44B. 45,47C. 42,46D. 42,47【答案】B【解析】将甲组数据按从小到大排列为28,31,39,42,45,55,57,58,66,中位数为中间的45,将乙组数据按从小到大排列为29,34,35,42,46,48,53,55,55,67,中位数为中间的两数平均数(46+48)÷2=47.56.10名工人某天生产同一零件,生产的件数分别是15,17,14,10,15,19,17,16,14,12,则这一天10名工人生产的零件的中位数是()A. 14B. 16C. 15D. 17【答案】C【解析】由题意可得数据共有10个,中位数是按从小到大排列后第5,第6个数的平均数作为中位数,故这组数据的中位数是(15+15)÷2=15.57.为了解某种轮胎的性能,随机抽取了8个进行测试,其最远里程数(单位:1 000 km)为:96,112,97,108,99,104,86,98,则他们的中位数是()A. 100B. 99C. 98.5D. 98【答案】C【解析】从小到大排列此数据为86,96,97,98,99,104,108,112,中间两个数是98,99,所以中位数为(98+99)÷2=98.5.58.由小到大排列的一组数据x1,x2,x3,x4,x5,其中每个数据都小于-1,则对于样本1,x1,-x2,x3,-x4,x5的中位数是()A.B.C.D.【答案】C【解析】根据题意,得x1<x2<x3<x4<x5<-1,∴x1<x3<x5<1<-x4<-x2,∴样本1,x 1,-x2,x3,-x4,x5的中位数是.59.五名同学在“爱心捐助”活动中,捐款数额为8,10,10,4,6(单位:元),这组数据的中位数是() A. 10B. 9C. 8D. 6【答案】C【解析】题目中数据共有5个,故中位数是按从小到大排列后第三个数作为中位数,故这组数据的中位数是8.60.一组数据:1,6,2,2,4,6的中位数为()A. 2B. 3C. 4D. 6【答案】B【解析】因为本题的数据有6个是偶数,所以先排序得:1,2,2,4,6,6,中间两个数据的平均数是(2+4)÷2=3,故中位数是3.61.为了解九年级学生的视力情况,某校随机抽取50名学生进行视力检查,结果如表:这组数据的中位数是()A. 4.6B. 4.7C. 4.8D. 4.9【答案】B【解析】因为共有50名学生,所以只要求出第25和26个学生视力的平均数,由表格得到第25和26个数都是4.7,所以中位数为(4.7+4.7)÷2=4.7.62.某地区连续5天的最高气温(单位:℃)分别是30,33,24,29,24,则这组数据的中位数是() A. 29B. 28C. 24D. 9【答案】A【解析】求中位数要把数据按从小到大的顺序排列,位于最中间的一个数或两个数的平均数为中位数.数据排序为24,24,29,30,33,∴中位数为29,故选A.63.某校男子篮球队10名队员的身高(厘米)如下:179,182,170,174,188, 172,180,195,185,182,则这组数据的中位数和众数分别是()A. 181,181B. 182,181C. 180,182D. 181,182【答案】D【解析】找中位数要把数据按从小到大的顺序排列,位于最中间的一个数或两个数的平均数为中位数,众数是一组数据中出现次数最多的数据,注意众数可以不止一个.在这一组数据中182是出现次数最多的,故众数是182.处于这组数据中间位置的数是180,182,那么由中位数的定义可知,这组数据的中位数是181.故选D.64.汶川发生大地震后,某校开展捐款援助活动,其中7名学生的捐款额(元)分别是5,10,5,25,8,4,12,则这组数据的中位数是()A. 5B. 8C. 10D. 12【答案】B【解析】这组数从小到大的顺序是:4,5,5,8,10,12,25,∴中位数是8.故选B.65.一个样本的容量为60,分成5组,已知第一组、第三组的频数分别是9、10,第二、五组的频率都为,则该样本的中位数在()A.第二组B.第三组C.第四组D.第五组【答案】B【解析】因为一个样本的容量为60,第二、五组的频率都为,所以第二、五组的频数均为12,则第四组的频数为60-9-10-12-12=17,第一组与第二组的频数和为21,第四组与第五组的频数和为29,则该样本的中位数在第三组.66.某射击运动员在一次测试中射击10次,其测试成绩如表:则该运动员测试成绩的中位数为()A. 2B. 8C. 8.5D. 9【答案】C【解析】根据题意,得该运动员射击10次命中环数从小到大的顺序如下:7,7,7,8,8,9,9,10,10,10,∴该运动员测试成绩的中位数为=8.5.67.100名学生进行20秒钟跳绳测试,测试成绩统计如下表:则这次测试成绩的中位数m满足()A. 40<m≤50B. 50<m≤60C. 60<m≤70D.m>70【答案】B【解析】∵一共有100名学生参加测试,∴中位数应该是第50名和第51名成绩的平均数,∵第50名和第51名的成绩均在50<x≤60,∴这次测试成绩的中位数m满足50<x≤60,故选B.68.如下表为72人参加某商店举办的单手抓糖果活动的统计结果,若抓到糖果数的中位数为a,众数为b,则a+b的值为()A. 20B. 21C. 22D. 23【答案】A【解析】第36与第37人抓到的糖果数均为9,故中位数a=9,11出现了13次,次数最多,故众数b=11,所以a+b=9+11=20.故选A.69.下表为某班成绩的次数分配表.已知全班共有38人,且众数为50,中位数为60,求x2-2y的值为()A. 33B. 50C. 69D. 90【答案】B【解析】∵全班共有38人,∴x+y=38-(2+3+5+6+3+4)=15,又∵众数为50,∴x≥8,当x=8时,y=7,中位数是第19,20两个数的平均数,都为60分,则中位数为60,符合题意;当x=9时,y=6,中位数是第19,20两个数的平均数,则中位数为(50+60)÷2=55,不符合题意;同理当x=10,11,12,13,14,15时,中位数都不等于60,不符合题意.则x=8,y=7,x2-2y=64-14=50.故选B.70.如图是根据某校10位高一同学的身高(单位:cm)画出的茎叶图,其中左边的数字从左到右分别表示学生身高的百位数字和十位数字,右边的数字表示学生身高的个位数字,从图中可以得到这10位同学身高的中位数是()A. 161B. 162C. 163D. 164【答案】B【解析】由茎叶图可知10位学生身高为155,155,157,158,161,163,163,165,171,172.中间两个数的平均数是162.∴这10位同学身高的中位数是162.71.某中学初三8个班级参加“红歌”合唱比赛的得分茎叶图如下,则这组数据的中位数是()A. 91.5B. 92C. 91D. 92.5【答案】A【解析】由茎叶图知,8个班级合唱的得分分别是87,89,90,91,92,93,94,96,中间两个得分是91,92,所以这组数据的中位数是=91.5.72.如图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,则甲、乙两人这几场比赛得分的中位数之和是()A. 65B. 64C. 63D. 62【答案】B【解析】∵由茎叶图知甲运动员的得分是13,15,23,26,28,34,37,39,41,把这组数据按照从小到大排列以后,最中间一个数字是28,∴甲运动员得分的中位数是28.∵由茎叶图知乙运动员的得分是24,25,32,33,36,37,38,45,47,把这组数据按照从小到大排列以后,最中间一个数字是36,∴乙运动员得分的中位数是36,∴两个中位数的和是28+36=64.73.PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,如图是据某市某日早7点至晚8点甲、乙两个PM2.5监测点统计的数据(单位:毫克/每立方米)列出的茎叶图,则甲、乙两地浓度的中位数较低的是()A.甲、乙相等B.甲C.乙D.无法确定【答案】C【解析】甲、乙两地数据各有13项,所以甲的中位数是0.066,乙的中位数是0.062.甲、乙两地浓度的中位数较低的是乙.74.茎叶图中,该组数据的中位数是()A. 31B. 33.5C. 36D. 37【答案】C【解析】中位数即将数据从小到大排列,位于中间的数,由图可知该组共有13个数据,第7个数据为36,∴该组数据的中位数是36.75.如图是某运动员在某个赛季得分的茎叶图,则该运动员得分的中位数是()A. 2B. 3C. 22D. 23【答案】D【解析】由茎叶图知,这组数据为12,15,22,23,25,26,31,所以其中位数为23.76.雾霾天气对我们身体影响巨大,据统计我市2015年12月份某8天的空气质量指数(AQI)茎叶图如图,则该组数据的中位数为()A. 360B. 361C. 362D. 363【答案】B【解析】由茎叶图得,该组数据为259,300,306,360,362,364,375,430,故中位数为(360+362)÷2=361.77.在如图所示的茎叶图中,该组数据的中位数是()A. 84B. 85C. 86D. 87【答案】A【解析】根据茎叶图,该组数据从小到大排列为79,84,84,84,86,87,93,∴中位数是第4个数据84.78.如图是2016年我校在红歌比赛上,七位评委为某班打出的分数的茎叶图,这组数据的中位数是()A. 85B. 84C. 82D. 81【答案】B【解析】根据茎叶图中的数据,按从小到大的顺序排列是79,81,82,84,85,88,93,所以这组数据的中位数是84.79.某篮球运动员在某几场比赛中得分的茎叶图如图所示,则他在这几场比赛中得分的中位数为()A. 26B. 27C. 26.5D. 27.5【答案】C【解析】由茎叶图得,这组数据为13,14,16,23,26,27,28,33,38,39,故中位数是=26.5.80.某赛季甲、乙两名运动员都参加了11场比赛,他们每场比赛得分的茎叶图如图所示,则甲、乙两名运动员比赛得分的中位数之和是()A. 32B. 30C. 36D. 41【答案】A【解析】由题意知,甲运动员的得分按照从小到大排列是7,8,9,15,17,19,23,24,26,32,41,共有11个数字,最中间一个是19,乙运动员得分按照从小到大的顺序排列是5,7,8,11,11,13,20,22,30,31,40,共有11个数据,最中间一个是13,∴甲、乙两名运动员比赛得分的中位数之和是19+13=32.81.根据某市环境保护局公布2008~2013这六年的空气质量优良的天数,绘制成折线图如图,根据图中的信息可知,这六年的每年空气质量优良天数的中位数是()A. 300B. 302.5C. 305D. 310【答案】B【解析】该组数据为290,295,300,305,305,315,共六个数据,所以其中位数为(300+305)=302.5.二、填空题(共16小题,每小题5.0分,共80分)82.如图是某市举办青少年运动会上,7位裁判为某武术队员打出的分数的茎叶图,左边数字表示十位数字,右边数字表示个位数字,则这些数据的中位数是________,若去掉一个最低分和最高分,则所剩数据的平均数是________.。
统计试题及答案高中
统计试题及答案高中一、单选题(每题3分,共30分)1. 统计学中,以下哪项不是描述数据分布特征的指标?A. 中位数B. 众数C. 方差D. 样本容量答案:D2. 在统计学中,以下哪个概念用于描述数据的离散程度?A. 平均数B. 中位数C. 众数D. 标准差答案:D3. 以下哪个统计图最适合展示数据随时间的变化趋势?A. 饼图B. 条形图C. 折线图D. 散点图答案:C4. 如果一组数据的平均数是10,中位数是8,众数是5,那么这组数据的分布可能是:A. 正偏态分布B. 负偏态分布C. 正态分布D. 均匀分布答案:A5. 在统计学中,相关系数的取值范围是:A. -1到1之间B. 0到1之间C. -1到0之间D. 0到正无穷答案:A6. 以下哪个统计量可以用来衡量数据的集中趋势?A. 方差B. 标准差C. 众数D. 极差答案:C7. 在统计学中,以下哪个概念用于描述数据的对称性?B. 峰度C. 标准差D. 变异系数答案:A8. 如果一组数据的方差为0,那么这组数据的特点是:A. 所有数据都相等B. 数据分布不均匀C. 数据分布均匀D. 数据分布无规律答案:A9. 在统计学中,以下哪个概念用于描述数据的峰值高低?A. 偏度B. 峰度D. 变异系数答案:B10. 以下哪个统计图最适合展示两个变量之间的关系?A. 饼图B. 条形图C. 折线图D. 散点图答案:D二、填空题(每题2分,共20分)11. 一组数据的中位数是将数据从小到大排列后,位于中间位置的数值。
如果数据个数为奇数,则中位数是第____个数值;如果数据个数为偶数,则中位数是中间两个数值的平均数。
答案:(n+1)/212. 标准差是方差的平方根,用于衡量数据的离散程度。
一组数据的标准差越大,说明数据的____程度越高。
答案:离散13. 相关系数的绝对值越接近1,说明两个变量之间的____越强。
答案:相关性14. 在统计学中,正态分布是一种常见的连续型概率分布,其图形呈____形状。
学而思高中题库完整版程序框图与算法.板块一.算法的含义与描述.学生版
题型一:算法的含义 【例1】 下面对算法描述正确的一项是( )A .算法只能用自然语言来描述B .算法只能用图形方式来表示C .同一问题可以有不同的算法D .同一问题的算法不同,结果必然不同【例2】 关于算法的说法中,正确的是( )A .算法就是某个问题的解题过程B .算法执行后可以产生不确定的结果C .解决某类问题的算法不是唯一的D .算法可以无限地操作下去不停止【例3】 下面四种叙述能称为算法的是( )A .在家里一般是妈妈做饭B .做米饭要需要刷锅.添水.加热这些步骤C .在野外做饭叫野炊D .做饭必需要有米【例4】 下面的结论正确的是( )A .一个程序算法步骤是可逆的B .一个算法可以无止境的运算下去C .完成一件事的算法有且只有一种D .设计算法要本着简单方便的原则【例5】 算法的有穷性是指( )A .算法最后包含输出B .算法的每个操作步骤都是可执行的C .算法的步骤必须有限D .以上都不正确【例6】 指出下列哪一个不是算法 ( )A .解方程260x -=的过程是移项和系数化为1B .从济南到温哥华需要先乘火车到北京,再从北京乘飞机到温哥华C .解方程2210x x +-=D .利用公式2πS r =,计算半径为3的圆的面积为2π3⨯【例7】 看下面的四段话,其中不是解决问题的算法的是( )A .从济南到北京旅游,先坐火车,再坐飞机抵达B .解一元一次方程的步骤是去分母.去括号.移项.合并同类项.系数化为1C .方程210x -=有两个实根D .求12345++++的值,先计算123+=,再由于336+=,6410+=,10515+=,最终结典例分析板块一.算法的含义与描述果为15【例8】不能描述算法的是()A.流程图B.伪代码C.数据库D.自然语言【例9】早上从起床到出门需要洗脸刷牙(5min).刷水壶(2min).烧水(8min).泡面(3min).吃饭(10min).听广播(8min)几个步骤,下列选项中最好的一种算法为()A.s1洗脸刷牙s2刷水壶s3烧水s4泡面s5吃饭s6听广播B.s1刷水壶s2烧水的同时洗脸刷牙s3泡面s4吃饭s5听广播C.s1刷水壶s2烧水的同时洗脸刷牙s3泡面s4吃饭的同时听广播D.s1吃饭的同时听广播s2泡面s3烧水的同时洗脸刷牙s4刷水壶【例10】已知直角三角形两直角边长为a,b,求斜边长c的一个算法分下列三步:①计算22=+;②输入直角三角形两直角边长a,b的值;c a b③输出斜边长c的值,其中正确的顺序是()A.①②③B.②③①C.①③②D.②①③题型二:算法分析(自然语言与数学语言)【例11】算法:S1 输入nS2 判断n是否是2,若2n>,则执行S3n=,则n满足条件,若2S3 依次从2到1n-检验能不能整除n,若不能整除n,满足上述条件的是()A.质数B.奇数C.偶数D.约数【例12】“鸡兔同笼“是我国隋朝时期的数学著作《孙子算经》中的一个有趣而具有深远影响的题目:“今有雉兔同笼,上有三十五头,下有九十四足,问雉兔各几何.用方程组的思想不难解决这一问题,请你设计一个这类问题的通用算法.【例13】某人带着一只狼和一只羊及一捆青菜过河,只有一条船,船仅可载重此人和狼.羊及青菜中的一种,没有人在的时候,狼会吃羊,羊会吃青菜,设计安全过河的算法.【例14】人鬼过河现在河的岸边有三个人和三个鬼,河上只有一条小船,船上最多能坐两个“人”,在河的任何一边,当鬼的个数比人多时,鬼就会吃掉人.请问如何才能使人和鬼都平安的到达对岸.【例15】现在有三个油瓶,分别能装8kg.5kg.3kg的油,当8kg的瓶子装满油时,设计一个用这三个瓶子倒油的算法,怎样倒能使这些油被平分到两个瓶子里.(注:没有其它瓶子)【例16】设计一个算法求解方程组37 4513 x yx y+=⎧⎨+=⎩【例17】用二分法设计一个求方程220x-=的近似根的算法.【例18】分别用自然语言.数学语言写出对任意四个整数a.b.c.d,求出最小值的算法.【例19】某批发商按客户订单数额的大小分别给予不同的优惠折扣.计算客户应付货款的算法步骤如下:S1 输入订单数额x(单位:件);输入单价A(单位:元);S2 若250x<,则折扣率0d=;若250500x<≤,则折扣率0.05d=;若5001000x<≤,则折扣率0.10d=;若1000x≥,则折扣率0.15d=;S3 计算应付货款()1T Ax d=-(单位:元);S4 输出应付货款T.已知一客户买400件时付款38000元,则应付货款为88200元时订单数额是.题型三:算法的三种基本逻辑结构与程序框图【例20】流程图中表示判断框的是()A.矩形框B.菱形框C.圆形框D.椭圆形框【例21】框图与算法相比,下列判断正确的是()A.程序框图将算法的基本逻辑展现得很清楚B.算法使用自然语言描述解决问题的步骤,程序框图使得这些步骤更为直观C.实质不变,形势变复杂了D.程序框图更接近于计算机理解【例22】尽管算法千差万别,程序框图按逻辑结构分类有()类A.2 B.3 C.4 D.5【例23】算法的三种基本结构是()A.顺序结构、选择结构、循环结构B.顺序结构、流程结构、循环结构C.顺序结构、分支结构、流程结构.D.流程结构、循环结构、分支结构【例24】下列关于框图的逻辑结构正确的是()A.用顺序结构画出电水壶烧开水的框图是唯一的B.条件结构中不含顺序结构C .条件结构中一定含有循环结构D .循环结构中一定含有条件结构【例25】 下面的问题中必须用条件结构才能实现的个数是( )(1)已知三角形三边长,求三角形的面积;(2)求方程0ax b +=(,a b 为常数)的根;(3)求三个实数,,a b c 中的最大者;(4)求123100++++L 的值.A .4个B .3个C .2个D .1个【例26】 已知函数()|3|f x x =-,以下程序框图表示的是给定x 值,求相应的函数值的算法,请将该程序框图补充完整.【例27】 写出下边程序框图的运行结果:否是输出ss=s+i i =i +2i <20s =0i =2结束开始【例28】 如图给出的是计算13599++++L 的一个程序框图,其中判断框内应填入的条件是( )i=i+2T = T + i否i = 1T= 0是输出T结束开始99i <.99i > C .100i < D .100i >【例29】 写出右边框图中的运算结果,____S =. a = 2b = 4S=ab +ba输出S结束开始【例30】 写出右面的程序框图所表示的函数.y =1+ x *xy = 2*x +4输出y结束否是x > 0输入x开始【例31】 如右图给出的是计算1112420+++L 的值的一个程序框图,其中判断框内应填入的条件是( ) i=i + 1结束输出S否是n=n +2S=S+1nS =0,i =1,n =2开始C .20i >D .20i <【例32】 如图是一个算法的程序框图,若该程序输出的结果为45,则判断框中应填入的条件是( ) A .4?T > B .4?T < C .3?T > D .3?T <S = S +1T ⋅ i T =T +1i =i+1S =0T =0i =1输出S 否是结束开始【例33】 按如图所示的程序框图运算,若输入6x =,则输出k 的值是( )A .3B .4C .5D .6结束输出k否是x >100?k =k +1x =2x +1k =0输入x开始【例34】 已知程序框图如图所示,则该程序框图的功能是( )A .求数列1n ⎧⎫⎨⎬⎩⎭的前10项和()n *∈NB .求数列12n ⎧⎫⎨⎬⎩⎭的前10项和()n *∈N C .求数列1n ⎧⎫⎨⎬的前11项和()n *∈N D .求数列12n ⎧⎫⎨⎬⎩⎭的前11项和()n *∈N 开始0S =2n =1k = 10k ≤ 输出S结束1S S n=+ 2n n =+1k k =+ 是否【例35】 阅读右面的程序框图,运行相应的程序,输出的结果为( )A .1321B .2113C .813D .138输出y x y = z x = yz<20z = x +yx =1, y =1否是结束开始【例36】 已知某程序框图如图所示,则执行该程序后输出的结果是( )第 7 题结束输出 ai = i +1否是a = 1- 1a i ≥ 2010a = 2 , j = 1开始A .1-B .1C .2D .12【例37】 已知程序框图如图所示,则执行该程序后输出的结果是_______________. 结束输出 ai = i +1否是a = 1- 1a i ≥ 20a = 2 , j = 1开始【例38】 如图,下程序框图的程序执行后输出的结果是 .S=S+nn=n+1n=1S=0n 10否是输出S 结束开始【例39】 右边程序框图的程序执行后输出的结果是 .n=n+2S=0n=1S=S+nn 50否是输出S 结束【例40】 执行如图程序框图,输出S 的值等于 .12题图否是输出Si <=4i=i + 1S =S + AA=A + iA=0,S=0,i=1结束开始【例41】 某程序框图如图所示,该程序运行后输出,M N 的值分别为 . 【例42】 在右边的程序框图中,若输出i 的值是4,则输入x 的取值范围是 .N Y 结束输出 ix > 82i = i +1x = 3x -2i = 0输入 x【例43】 在右面的程序框图中,若5x =,则输出i 的值是( )x > 109i = i + 1N Y输出i结束x = 3x -2i = 0输入x开始 A .2 B .3 C .4 D .5【例44】 执行如图所示的程序框图,输出的T 等于( )A .10B .15C .20D .30【例45】 在数列{}n a 中,11a =,1n n a a n -=+,2n ≥.为计算这个数列前10项的和,现给出该问题算法的程序框图(如图所示),则图中判断框(1)处合适的语句是( )A .8i ≥B .9i ≥C .10i ≥D .11i ≥【例46】 执行右图所示的程序框图,输出结果y 的值是_________. 否是结束输出yy = e x - 2x > 2x = xx = 16开始【例47】 按照如图的程序框图执行,若输出结果为15,则M 处条件为( ) C .16k < D .8k ≥【例48】 若某程序的框图如图,若输入的x 的值为12,则执行该程序后,输出的y 值为 . 开始S =0MS =S +k 2k k =⨯结束 输出S是 否k =1y=4xy=1y=x 2x < 1x > 1Y YNN 结束输出y输入x开始【例49】 某程序框图如图所示,该程序运行后,输出的x 值为31,则a 等于( )A .B .0C .1D .2x=1,x =an ≤4否是n=n+1x=2x+1输出x 结束开始【例50】 右面的程序框图,如果输入三个实数a .b .c ,要求输出这三个数中最大的数,那么在空白的判断框中,应该填入下面四个选项中的( ) x c > C .c b > D .b c >x =cx =b输出xb >xx =a输入a , b , c否否是是结束开始【例51】 某地区为了了解70~80岁老人的日平均睡眠时间(单位:h ).随机选择了50位老人的进行调查.下表是这50位老人日睡眠时间的频率分布表.序号 (i ) 分组 (睡眠时间) 组中值 (i G ) 频数 (人数) 频率(i F )1 [4,5)4.5 6 0.12 2 [5,6)5.5 10 0.20 3 [6,7)6.5 20 0.40 4 [7,8)7.5 10 0.20 5 [8,9]8.5 4 0.08 S 的值是 .i i ≥ 5?S+G i ×F i S ,F iG i i i +110S N Y输出S输入结束开始【例52】 执行下边的程序框图,若0.8p =,则输出的n = .n =n +1S =S +12n S < p ?n =1, S =0输入 p输出m 否是结束开始【例53】 阅读如图的程序框图,若输入4m =,6n =,则输出a = ,i =(注:框图中的赋值符号“=”也可以写成“←”或“:=”)否i =i + 1输出a ,in 整除a ?a =m x ii = 1输入m ,n结束开始【例54】 执行右边的程序框图,输出的T = .输出TT = T+nn = n+2S =S+5S=0 ,T=0, n=0T > S 否是结束开始【例55】 阅读右面的程序框图,则输出的S =( )A .26B .35C .40D .57输出Si >5?i = i+1S=S+TT = 3i -1S =0 , i =1否是结束开始【例56】 随机抽取某产品n 件,测得其长度分别为12n a a a L ,,,.则如图所示的程序框图输出的s = ,s 表示的样本的数字特征是 . (注:框图中的赋值符号“=”也可以写成“←”“:=”)i =i +1S =(i -1)×S+a ii 否是开始结束输 出 Si ≤ n ? S=0, i=1输入 n ,a 1,a 2,...,a n【例57】 某程序框图如图所示,该程序运行后输出的k 的值是( )A .4B .5C .6D .7k=k+1S=S+2SS <100?S=0k=0输出k否是结束开始【例58】 如果执行右边的程序框图,输入2x =-,0.5h =,那么输出的各个数的和等于( )D .4.5x ≥ 2输出 yx = x + hy = 1y = x y = 0x<1x < 0输入x, h否否否是是是结束开始【例59】 2010年上海世博会园区每天9:00开园,20:00停止入园.在右边的框图中,S 表示上海世博会官方网站在每个整点报道的入园总人数,a 表示整点报道前1个小时内入园人数,则空白的执行框内应填入 .开始T ←9,S ←0输出T ,S否是T ≤19T ←T +1输出a结束【例60】 阅读右边的程序框图,若输出s 的值为7-,则判断框内可填写( )A .3?i <B .4?i <C .5?i <D .6?i <否是结束输出 ss =s -ii =i +2s =2i =1开始【例61】 某程序框图如图所示,若输出的57S =,则判断框内为( ) B .5?k > C .6?k > D .7?k >否是结束输出SS =2S +kk =k +1S =1,k =1开始【例62】 如图所示,程序框图(算法流程图)的输出x =__ __.开始x =1x=x +1x 是奇数x=x +2x >8?输出x结束是否否【例63】 阅读右图所示的程序框图,运行相应的程序,输出的i 值等于( )A .2B .3C .4D .5结束输出i否是s>11?i=i+1s=s+aa =i ∙2at =1s =0开始【例64】 某城市缺水问题比较突出,为了制定节水管理办法,对全市居民某年的月均用水量进行了抽样调查,其中n 位居民的月均用水量分别为1x ,…,4x (单位:吨).根据图2所示的程序框图,若1x ,2x ,分别为1,2,则输出的结果s 为 .开始输入 n,x 1,x 2,…x ns 1=0,s 2=0,i =1i ≤ n输出s结束i=i +1s =1i s 2-1i s 12()s 1=s 1+x i s 2=s 2+x i 2是否【例65】 如果执行右面的程序框图,输入正整数,n m ,满足n m ≥,那么输出的p 等于( )A .1C mn - B .1A m n - C .C m n D .A m n 开始输入 n,mk =1,p =1p=p (n-m+k )k<m 输出pk=k+1结束是否【例66】 如果执行下面的框图,输入5N =,则输出的数等于( )否是k =k +1结束输入Sk <NS =S +1k (k +1)k =1,S =0输入N开始 A .4 B .45 C .65 D .56【例67】 下面程序框图所表示的算法的功能是( )A .计算11112349++++L 的值B .计算11113549++++L 的值 C .计算11113599++++L 的值 D .计算11112399++++L 的值 第9题图否是结束输出Si=i+1n=n+2S=S+1n i>50S=0,n=1,i=1开始【例68】 右图是一个程序框图,其中判断框①处缺少一个判断条件,②为一输出框.⑴若在①处填空“2009n =”,请求出在输出框②处输出的y 的值; ⑵若在①处填空“2008②处输出的n 的值.是否否是结束②输入x=4,y=2,n=1x=x+3n=n+1①y=y+2x=4xn=n+1n 为偶数开始【例69】 程序program-3的任务为输入100个产品的内径尺寸数据,并找出其中的最值.该程序流程图如下,否是否否是是结束输出M1 , M2值i = i +1(2)(1)M2 < aM1 < a输入a 值i < 100M1= a , M2 = a , i = 1输入 a 值开始;(2)________.程序program-3执行完毕,M1,M2的输出值中是最大值的是______.【例70】 任意给定一个正数,设计一个算法求以这个数为半径的圆的周长,并画出程序框图.【例71】 半径为r 的圆面积计算公式为2πS r =,写出计算圆面积的算法,并画出框图.【例72】 画出计算123⨯⨯的程序框图.【例73】 分别用数学语言和程序框图写出计算13579++++的算法.【例74】 三角形的面积公式12S ah =,用算法描述求7.18.5a h ==,时的三角形面积, 并画出算法的程序框图.【例75】 设计一个算法计算ABC ∆的面积,并画出算法的程序框图.【例76】 画出求1220⨯⨯⨯L 的程序框图.【例77】 画出求123100++++L 的程序框图.【例78】 写出计算3333123100++++L 的值的一个程序框图.【例79】 写出求解一般的二元一次方程组11112212112222a x a xb a x a x b +=⎧⎨+=⎩的程序框图。
北师大版数学高一(北师大)必修3试题 1.4数据的数字特征
1.4数据的数字特征一、选择题1.一个样本数据按从小到大的顺序排列为13,14,19,x,23,27,28,31,其中位数为22,则x 为( )A .21B .22C .20D .23[答案] A[解析] 由x +232=22得x =21.2.下列说法正确的是( )A .在两组数据中,平均值较大的一组方差较大B .平均数反映数据的集中趋势,标准差则反映数据离平均值的波动大小C .方差的求法是求出各个数据与平均值的差的平方后再求和D .在记录两个人射击环数的两组数据中,方差大的表示射击水平高 [答案] B[解析] 平均数、中位数、众数都是反映一组数据的“集中趋势”的统计量,方差、标准差、极差都是反映数据的离散程度的统计量,故选B.3.在一次歌声大奖赛上,七位评委为歌手打出的分数如下: 9.4 8.4 9.4 9.9 9.6 9.4 9.7去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( ) A .9.4 0.484 B .9.4 0.016 C .9.5 0.04 D .9.5 0.016 [答案] D[解析] 去掉一个最高分和一个最低分后剩余分数为9.4,9.4,9.6,9.4,9.7. 其平均数为x =3×9.4+9.6+9.75=9.5.方差s 2=15(0.12+0.12+0.12+0.12+0.22)=15×0.08=0.016. 4.在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( )A .众数B .平均数C .中位数D .标准差[答案] D[解析] 本题考查样本的数字特征. A 的众数88,B 则为88+2=90.“各样本都加2”后,平均数显然不同.A 的中位数86+862=86,B 的中位数88+882=88,而由标准差公式s =1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2]知D 正确. 5.甲、乙两支女子曲棍球队在去年的国际联赛中,甲队平均每场进球数为3.2,全年比赛进球个数的标准差为3;乙队平均每场进球数为1.8,全年比赛进球个数的标准差为0.3,下列说法正确的有( )①甲队的技术比乙队好; ②乙队发挥比甲队稳定; ③乙队几乎每场都进球; ④甲队的表现时好时坏 A .1个 B .2个 C .3个 D .4个[答案] D[解析] s 甲>s 乙,说明乙队发挥比甲队稳定,x 甲>x 乙,说明甲队平均进球多于乙队,但乙队平均进球数为1.8,标准差仅有0.3,说明乙队的确很少不进球.6.期中考试后,班长算出了全班40人数学成绩的平均分为M ,如果把M 当成一个同学的分数,与原来的40个分数一起,算出这41个分数的平均数为N ,那么M ∶N 为( )A.4041 B .1 C.4140 D .2[答案] B[解析] 平均数是用所有数据的和除以数据的总个数而得到的.设40位同学的成绩为x i (i =1,2,,…,40),则M =x 1+x 2+…+x 4040,N =x 1+x 2+…+x 40+M 41.故M ∶N =1.二、填空题7.若样本x1+2,x2+2,…,x n+2的平均值为10,则样本2x1+3,2x2+3,…,2x n+3的平均值为________.[答案]19[解析]∵x1+2,x2+2,…,x n+2的平均值为10,∴x1,x2,…,x n的平均值为8,∴2x1+3,2x2+3,…,2x n+3的平均值为2×8+3=19.8.某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,若甲运动员的中位数为a,乙运动员的众数为b,则a-b=________.甲乙798078 5579111 33462202310140[答案]8[解析]由茎叶图知a=19,b=11,∴a-b=8.三、解答题9.某校为了了解甲、乙两班的数学学习情况,从两班各抽出10名学生进行数学水平测试,成绩如下(单位:分):甲班:82,84,85,89,79,80,91,89,79,74;乙班:90,76,86,81,84,87,86,82,85,83.(1)求两个样本的平均数x甲和x乙;(2)求两个样本的方差和标准差;(3)比较两组数据的平均数,并估计哪个班的平均分较高;(4)比较两组数据的标准差,并估计哪个班的数学成绩比较整齐.[解析](1)x甲=110(82+84+85+89+79+80+91+89+79+74)=83.2(分),x乙=110(90+76+86+81+84+87+86+82+85+83)=84(分).(2)s2甲=110[(82-83.2)2+(84-83.2)2+(85-83.2)2+(89-83.2)2+(79-83.2)2+(80-83.2)2+(91-83.2)2+(89-83.2)2+(79-83.2)2+(74-83.2)2]=26.36(分2),s2乙=110[(90-84)2+(76-84)2+(86-84)2+(81-84)2+(84-84)2+(87-84)2+(86-84)2+(82-84)2+(85-84)2+(83-84)2]=13.2(分2),所以s 甲=26.36≈5.13(分), s 乙=13.2≈3.63(分).(3)因为x 甲<x 乙,所以据此估计乙班的平均分较高. (4)因为s 甲>s 乙,所以据此估计乙班的数学成绩比甲班整齐.一、选择题1.某人5次上班途中所花的时间(单位:分钟)分别为x ,y,10,11,9,已知这组数据的平均数为10,方差为2,则|x -y |的值为( )A .1B .2C .3D .4[答案] D[解析] 依题意,可得⎩⎨⎧10=x +y +10+11+95,2=15[(x -10)2+(y -10)2+(10-10)2+(11-10)2+(9-10)2],⇒⎩⎪⎨⎪⎧ x +y =20,(x -10)2+(y -10)2=8,⇒⎩⎪⎨⎪⎧ x =12y =8,或⎩⎪⎨⎪⎧x =8y =12, 所以|x -y |=4.2.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e ,众数为m o ,平均值为x ,则( )A .m e =m o =xB .m e =m o <xC .m e <m o <xD .m o <m e <x[答案] D[解析] 30个数中第15个数是5,第16个数是6,故中位数为5+62=5.5,众数为5,x -=3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×230=17930,所以m o <m e <x -,故选D. 二、填空题3.某企业职工的月工资数统计如下:元.如何选取该企业的月工资代表数呢?企业法人主张用平均值,职工代表主张用众数,监督部门主张用中位数.请你站在其中一立场说明理由:________________________________________. [答案] 1200 900 企业法人主张用平均值是为了显示本企业员工的收入高 [解析] 用中位数与众数的定义易求得答案.4.已知样本7,8,9,x ,y 的平均数是8,标准差是2,则xy 的值为________. [答案] 60[解析] 由已知得7+8+9+x +y =5×8, 则x +y =16, 所以x 2+y 2+2xy =256.又15[(7-8)2+(8-8)2+(9-8)2+(x -8)2+(y -8)2]=2, 整理,得x 2+y 2=16(x +y )-120=136, 所以136+2xy =256,则xy =60. 三、解答题5.给出以下10个数据:12 9 9 10 8 10 12 9 14 7写出这组数据的平均数、中位数、众数、极差、方差. [解析] 这组数据的平均数是12+9+9+10+8+10+12+9+14+710=10,将这组数据按从小到大的顺序排列: 7 8 9 9 9 10 10 12 12 14则中位数是9+102=9.5,众数是9,极差是14-7=7,方差是s 2=110[(12-10)2+(9-10)2+(9-10)2+(10-10)2+(8-10)2+(10-10)2+(12-10)2+(9-10)2+(14-10)2+(7-10)2]=4.6.个体户李某经营一家快餐店,下面是快餐店所有人员8月份的工资表:(2)计算出的平均工资能否反映打工人员这个月收入的一般水平?为什么?(3)去掉李某的工资后,再计算平均工资.这个平均工资能代表打工人员这个月的收入水平吗?(4)根据以上计算,以统计的观点,你对(3)的结果有什么看法?[解析] (1)这7人8月份的平均工资是x 1=17×(30 000+4 500+3 500+4 000+3 200+3 200+4 100)=7 500(元).(2)计算出的平均工资不能反映打工人员这个月收入的一般水平.理由:可以看出,打工人员的工资都低于该平均工资,因为李某的工资特别高,所以他的工资对平均工资的影响较大,同时他也不是打工人员.(3)去掉李某的工资后的平均工资x 2=16×(4 500+3 500+4 000+3 200+3 200+4 100)=3 750(元).这个平均工资能代表打工人员这个月的收入水平.(4)从本题的计算可以看出,个别特殊值对平均数有很大的影响,因此选择样本时,样本中尽量不用特殊数据.7.某农场计划种植某种新作物,为此对这种作物的两个品种(分别称为品种甲和品种乙)进行田间试验. 选取两大块地,每大块地分成n 小块地,在总共2n 小块地中,随机选n 小块地种植品种甲,另外n 小块地种植品种乙.试验时每大块地分成8小块,即n =8,试验结束后得到品种甲和品种乙在各小块地上的每公顷产量(单位:kg/hm 2)如下表:你认为应该种植哪一品种?[解析] 品种甲的每公顷产量的样本平均数和样本方差分别为: x -甲=18(403+397+390+404+388+400+412+406)=400,s 2甲=18(32+(-3)2+(-10)2+42+(-12)2+02+122+62)=57.25. 品种乙的每公顷产量的样本平均数和样本方差分别为: x -乙=18(419+403+412+418+408+423+400+413)=412,s 2乙=18(72+(-9)2+02+62+(-4)2+112+(-12)2+12)=56. 由以上结果可以看出,品种乙的样本平均数大于品种甲的样本平均数,且两品种的样本方差差异不大,故应该选择种植品种乙.。
学而思高中数学统计.板块六.回归分析.学生版
一.随机抽样1.随机抽样:满足每个个体被抽到的机会是均等的抽样,共有三种经常采用的随机抽样方法:⑴简单随机抽样:从元素个数为N 的总体中不放回地抽取容量为n 的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样. 抽出办法:①抽签法:用纸片或小球分别标号后抽签的方法.②随机数表法:随机数表是使用计算器或计算机的应用程序生成随机数的功能生成的一张数表.表中每一位置出现各个数字的可能性相同. 随机数表法是对样本进行编号后,按照一定的规律从随机数表中读数,并取出相应的样本的方法.简单随机抽样是最简单、最基本的抽样方法.⑵系统抽样:将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本的抽样方法.抽出办法:从元素个数为N 的总体中抽取容量为n 的样本,如果总体容量能被样本容量整除,设Nk n=,先对总体进行编号,号码从1到N ,再从数字1到k 中随机抽取一个数s 作为起始数,然后顺次抽取第2(1)s k s k s n k +++-L ,,,个数,这样就得到容量为n 的样本.如果总体容量不能被样本容量整除,可随机地从总体中剔除余数,然后再按系统抽样方法进行抽样.系统抽样适用于大规模的抽样调查,由于抽样间隔相等,又被称为等距抽样.⑶分层抽样:当总体有明显差别的几部分组成时,要反映总体情况,常采用分层抽样,使总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样,这种抽样方法叫做分层抽样.分层抽样的样本具有较强的代表性,而且各层抽样时,可灵活选用不同的抽样方法,应用广泛.2.简单随机抽样必须具备下列特点:⑴简单随机抽样要求被抽取的样本的总体个数N 是有限的. ⑵简单随机样本数n 小于等于样本总体的个数N . ⑶简单随机样本是从总体中逐个抽取的. ⑷简单随机抽样是一种不放回的抽样.⑸简单随机抽样的每个个体入样的可能性均为nN.3.系统抽样时,当总体个数N 恰好是样本容量n 的整数倍时,取Nk n=;若Nn不是整数时,先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量n 整除.因为每个个体被剔除的机会相等,因而整个抽样过程中每个个体被抽取的机会仍知识内容板块六.回归分析然相等,为N n.二.频率直方图列出样本数据的频率分布表和频率分布直方图的步骤:①计算极差:找出数据的最大值与最小值,计算它们的差;②决定组距与组数:取组距,用极差组距决定组数;③决定分点:决定起点,进行分组;④列频率分布直方图:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.⑤绘制频率分布直方图:以数据的值为横坐标,以频率组距的值为纵坐标绘制直方图,知小长方形的面积=组距×频率组距=频率.频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,频率分布直方图可以用一条光滑曲线()y f x =来描绘,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域内取值的规律.三.茎叶图制作茎叶图的步骤:①将数据分为“茎”、“叶”两部分;②将最大茎与最小茎之间的数字按大小顺序排成一列,并画上竖线作为分隔线; ③将各个数据的“叶”在分界线的一侧对应茎处同行列出.四.统计数据的数字特征用样本平均数估计总体平均数;用样本标准差估计总体标准差. 数据的离散程序可以用极差、方差或标准差来描述.极差又叫全距,是一组数据的最大值和最小值之差,反映一组数据的变动幅度; 样本方差描述了一组数据平均数波动的大小,样本的标准差是方差的算术平方根. 一般地,设样本的元素为12n x x x L ,,,样本的平均数为x , 定义样本方差为222212()()()n x x x x x x s n-+-++-=L ,样本标准差22212()()()n x x x x x x s n-+-++-=L 简化公式:22222121[()]n s x x x nx n=+++-L .五.独立性检验1.两个变量之间的关系;常见的有两类:一类是确定性的函数关系;另一类是变量间存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有一定随机性的.当一个变量取值一定时,另一个变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.2.散点图:将样本中的n 个数据点()(12)i i x y i n =L ,,,,描在平面直角坐标系中,就得到了散点图.散点图形象地反映了各个数据的密切程度,根据散点图的分布趋势可以直观地判断分析两个变量的关系.3.如果当一个变量的值变大时,另一个变量的值也在变大,则这种相关称为正相关;此时,散点图中的点在从左下角到右上角的区域.反之,一个变量的值变大时,另一个变量的值由大变小,这种相关称为负相关.此时,散点图中的点在从左上角到右下角的区域.散点图可以判断两个变量之间有没有相关关系.4.统计假设:如果事件A 与B 独立,这时应该有()()()P AB P A P B =,用字母0H 表示此式,即0:()()()H P AB P A P B =,称之为统计假设. 5.2χ(读作“卡方”)统计量:统计学中有一个非常有用的统计量,它的表达式为22112212211212()n n n n n n n n n χ++++-=,用它的大小可以用来决定是否拒绝原来的统计假设0H .如果2χ的值较大,就拒绝0H ,即认为A 与B 是有关的.2χ统计量的两个临界值:3.841、6.635;当2 3.841χ>时,有95%的把握说事件A 与B 有关;当2 6.635χ>时,有99%的把握说事件A 与B 有关;当2 3.841χ≤时,认为事件A 与B 是无关的.独立性检验的基本思想与反证法类似,由结论不成立时推出有利于结论成立的小概率事件发生,而小概率事件在一次试验中通常是不会发生的,所以认为结论在很大程度上是成立的. 1.独立性检验的步骤:统计假设:0H ;列出22⨯联表;计算2χ统计量;查对临界值表,作出判断.2.几个临界值:222()0.10( 3.841)0.05( 6.635)0.01P P P χχχ≈≈≈≥2.706,≥,≥.22⨯联表的独立性检验:如果对于某个群体有两种状态,对于每种状态又有两个情况,这样排成一张22⨯的表,如下:状态B 状态B 合计 状态A 11n 12n 1n + 状态A21n 22n 2n +1n +2n +n如果有调查得来的四个数据11122122n 4个数据来检验上述的两种状态A 与B 是否有关,就称之为22⨯联表的独立性检验.六.回归分析1.回归分析:对于具有相关关系的两个变量进行统计分析的方法叫做回归分析,即回归分析就是寻找相关关系中这种非确定关系的某种确定性. 回归直线:如果散点图中的各点都大致分布在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. 2.最小二乘法:记回归直线方程为:ˆy a bx =+,称为变量Y 对变量x 的回归直线方程,其中a b ,叫做回归系数.ˆy是为了区分Y 的实际值y ,当x 取值i x 时,变量Y 的相应观察值为i y ,而直线上对应于i x 的纵坐标是ˆi i ya bx =+. 设x Y ,的一组观察值为()i i x y ,,12i n =L ,,,,且回归直线方程为ˆya bx =+, 当x 取值i x 时,Y 的相应观察值为i y ,差ˆ(12)i i y yi n -=L ,,,刻画了实际观察值i y 与回归直线上相应点的纵坐标之间的偏离程度,称这些值为离差.我们希望这n 个离差构成的总离差越小越好,这样才能使所找的直线很贴近已知点. 记21()ni i i Q y a bx ==--∑,回归直线就是所有直线中Q 取最小值的那条.这种使“离差平方和为最小”的方法,叫做最小二乘法.用最小二乘法求回归系数a b ,有如下的公式:1221ˆni ii nii x ynxy bxnx ==-=-∑∑,ˆˆa y bx =-,其中a b ,上方加“^”,表示是由观察值按最小二乘法求得的回归系数.3.线性回归模型:将用于估计y 值的线性函数a bx +作为确定性函数;y 的实际值与估计值之间的误差记为ε,称之为随机误差;将y a bx ε=++称为线性回归模型. 产生随机误差的主要原因有:①所用的确定性函数不恰当即模型近似引起的误差; ②忽略了某些因素的影响,通常这些影响都比较小; ③由于测量工具等原因,存在观测误差. 4.线性回归系数的最佳估计值:利用最小二乘法可以得到ˆˆab ,的计算公式为 1122211()()()()nnii iii i nniii i xx y y x ynxybxx xn x ====---==--∑∑∑∑$,ˆˆa y bx =-,其中11n i i x x n ==∑,11nii y y n ==∑ 由此得到的直线ˆˆya bx =+$就称为回归直线,此直线方程即为线性回归方程.其中ˆa ,b $分别为a ,b 的估计值,ˆa称为回归截距,b $称为回归系数,ˆy 称为回归值. 5.相关系数: 2222221111()()()()(())(())nnii i innn nii i i i i i i xx y y x ynx yr xx y y x n x y n y ====---==-⋅---∑∑∑∑∑∑6.相关系数r 的性质:⑴||1r ≤;⑵||r 越接近于1,x y ,的线性相关程度越强; ⑶||r 越接近于0,x y ,的线性相关程度越弱.可见,一条回归直线有多大的预测功能,和变量间的相关系数密切相关. 7.转化思想:根据专业知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数. 8.一些备案 ①回归(regression )一词的来历:“回归”这个词英国统计学家Francils Galton 提出来的.1889年,他在研究祖先与后代的身高之间的关系时发现,身材较高的父母,他们的孩子也较高,但这些孩子的平均身高并没有他们父母的平均身高高;身材较矮的父母,他们的孩子也较矮,但这些孩子的平均身高却比他们父母的平均身高高.Galton 把这种后代的身高向中间值靠近的趋势称为“回归现象”.后来,人们把由一个变量的变化去推测另一个变量的变化的方法称为回归分析.②回归系数的推导过程:22222[()]222i i i i i i i i Q y a bx y a y na b x y ab x b x =--=-+-++∑∑∑∑∑∑ 22222()2i i i i i i na a b x y b x b x y y =+-+-+∑∑∑∑∑,把上式看成a 的二次函数,2a 的系数0n >,因此当2()2i i i ib x y y b x a n n --=-=∑∑∑∑时取最小值. 同理,把Q 的展开式按b 的降幂排列,看成b 的二次函数,当2i iiix y a xb x-=∑∑∑时取最小值.解得:12221()()()ni iii i niii x ynxyx x y y b x x xnx==---==--∑∑∑∑,a y bx =-, 其中1i y y n =∑,1i x x n=∑是样本平均数. 9. 对相关系数r 进行相关性检验的步骤: ①提出统计假设0H :变量x y ,不具有线性相关关系;②如果以95%的把握作出推断,那么可以根据10.950.05-=与2n -(n 是样本容量)在相关性检验的临界值表中查出一个r 的临界值0.05r (其中10.950.05-=称为检验水平); ③计算样本相关系数r ;④作出统计推断:若0.05||r r >,则否定0H ,表明有95%的把握认为变量y 与x 之间具有线性相关关系;若0.05||r r ≤,则没有理由拒绝0H ,即就目前数据而言,没有充分理由认为变量y 与x 之间具有线性相关关系. 说明:⑴对相关系数r 进行显著性检验,一般取检验水平0.05α=,即可靠程度为95%.⑵这里的r 指的是线性相关系数,r 的绝对值很小,只是说明线性相关程度低,不一定不相关,可能是非线性相关的某种关系.⑶这里的r 是对抽样数据而言的.有时即使||1r =,两者也不一定是线性相关的.故在统计分析时,不能就数据论数据,要结合实际情况进行合理解释.题型一 线性相关及回归【例1】 已知变量y 与x 之间的相关系数是0.872r =-,查表得到相关系数临界值0.050.482r =,要使可靠性不低于95%,则变量y 与x 之间( )A .不具有线性相关关系B .具有线性相关关系C .线性相关关系还待进一步确定D .具有确定性关系【例2】 当相关系数0r =时,表明( )A 现象之间完全无关B 相关程度较小C 现象之间完全相关D 无直线相关关系【例3】 下列结论中,能表示变量,x y 具有线性相关关系的是( )A .0.05r r ≥B .0.05r r ≤C .0.05r r >D .0.05r r <典例分析【例4】 下列现象的相关密切程度最高的是( )A .某商店的职工人数与商品销售额之间的相关系数0.87B .流通费用水平与利润率之间的相关关系为0.94-C .商品销售额与利润率之间的相关系数为0.51D .商品销售额与流通费用水平的相关系数为0.81-【例5】 在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )①若2χ的值为6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;③若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得判断出现错误;④以上三种说法都不正确.【例6】 设两个变量x 和y 之间具有线性相关关系,它们的相关系数是r ,y 关于x 的回归直线的斜率是b ,纵截距是a ,那么必有( )A .b 与r 的符号相同B .a 与r 的符号相同C .b 与r 的相反D .a 与r 的符号相反【例7】 定义:点()i i x y ,与直线$y bx a =+的“纵向距离”为()i i y bx a -+.已知(00)(01)(11)A B C -,,,,,三点,存在直线l ,使A B C ,,三点到直线l 的“纵向距离的平方和”Q 最小.⑴求直线l 的方程和Q 的最小值;⑵判断点1(0)3D ,与直线l 的位置关系.【例8】 (2009宁夏海南卷理)对变量x ,y 有观测数据()11x y ,()1210i =L ,,,,得散点图1;对变量u ,v 有观测数据()11u v ,()1210i =L ,,,,得散点图2. 由这两个散点图可以判断.12345677654321A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关【例9】 为了考查两个变量x 和y 之间的线性关系,甲、乙两位同学各自独立做了10次和15次的试验,并且利用线性回归方法求得回归直线分别为12l l ,,已知两人得到的试验数据中,变量x 和y 的数据的平均值都对应相等,那么下列说法正确的是( ) A .直线1l 和2l 一定有交点 B .直线1l 一定平行于直线2l C .直线1l 一定与2l 重合 D .以上都不对【例10】 某地高校教育经费()x 与高校学生人数()y 连续6年的统计资料如下:教育经费(万元)x 316 343 373 393 418 455在校学生(万人)y 11 16 18 20 22 25【例11】 一家庭问题研究机构想知道是否夫妻所受的教育越高越不愿生孩子,现随机抽样了8对夫妻,计算夫妻所受教育的总年数x 与孩子数y ,得结果如下x 19 17 21 18 15 12 14 20 y1 3 11 2 3 2 1试求【例12】某种产品的广告费支出x与销售额y(单位:百万元)之间有如下对应数据:x24568y3040605070⑴画出散点图;⑵求回归直线方程.【例13】某五星级大饭店的住屋率(%)()x与每天每间客房的成本(元)()y如下:x100 75 65 55 50y2000 2500 2800 3200 4000⑴试求⑵若y的表示不变,x以小数表示(如75%表为0.75),求新的回归直线.【例14】某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:日期1月10日2月10日3月10日4月10日5月10日6月10日昼夜温差x(C)1011131286就诊人数y(个)222529261612该兴趣小组确定的研究方案是:先从这六组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验.⑴若选取的1月与6月的两组数据,请根据2至5月份的数据,求出y关于x的线性回归方程;⑵若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?【例15】某种产品的产量与单位在成本的资料如下:产量(千件)x 2 3 4 3 4 5单位成本(元/件)y73 72 71 73 69 68⑴计算相关系数r;⑵y对x直线回归方程;⑶指出产量每增加1000件时,单位成本平均下降了多少元?【例16】求回归直线方程以下是收集到的某城市的新房屋销售价格y与房屋的大小x的数据:房屋大小x(2m)80105110115135销售价格y(万元)18.42221.624.829.2⑵用最小二乘法求回归直线方程;⑶估计该城市一个90平米的房屋销售价格大约为多少?⑷写一个程序,计算出()Q,的值,再比较大小.Q a b,和(20.2)【例17】(07广东)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y (吨标准煤)的几组对照数据 x 3 4 5 6 y2.5344.5⑴请画出上表数据的散点图;⑵请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程ˆˆy bx a =+;⑶已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:3 2.543546 4.566.5⨯+⨯+⨯+⨯=)【例18】 测定某肉鸡的生长过程,每两周记录一次鸡的重量,数据如下表:x (周) 2 4 6 8 10 12 14y (kg )0.3 0.86 1.73 2.2 2.47 2.67 2.8由经验知生长曲线为1xy Aeλ-=+,试求y 对x 的回归曲线方程.【例19】 为了研究某种细菌随时间x 变化的繁殖个数,收集数据如下:天数x 1 2 3 4 5 6 繁殖个数y612254995190⑴作出这些数据的散点图;⑵求出y 对x 的回归方程.。
高中数学 1.4 数据的数字特征课后作业 北师大版必修3
§4数据的数字特征一、非标准1.某射手在一次训练中五次射击的成绩分别为9.4,9.4,9.4,9.6,9.7,则该射手成绩的方差是( )A.0.127B.0.016C.0.08D.0.216解析:∵×(9.4+9.4+9.4+9.6+9.7)=9.5,∴s2=×[(9.4-9.5)2+(9.4-9.5)2+(9.4-9.5)2+(9.6-9.5)2+(9.7-9.5)2]=0.016.答案:B2.某篮球队甲、乙两名运动员练习罚球,每人练习10组,每组罚球40个.命中个数的茎叶图如图所示.则下面结论中错误的是( )A.甲的极差是29B.乙的众数是21C.甲罚球命中率比乙高D.甲的中位数是24解析:甲的极差为37-8=29,A正确;乙的众数为21,B正确;由茎叶图知,甲罚球命中个数集中在20~30之间;而乙罚球命中个数集中在10~20之间,故C正确;甲的中位数为=23.D错误.答案:D3.某商场一天中售出某品牌运动鞋13双,其中各种尺码鞋的销量如下表所示,则这13双鞋的尺码组成的一组数据中,众数和中位数分别为( )鞋的尺码(单位:cm) 23.52424.52526销售量(单位:双)1 2 2 5 3A.25cm,25cmB.24.5cm,25cmC.26cm,25cmD.25cm,24.5cm解析:易知众数为25cm,因为共有13个数据,所以中位数应为第7个数据,而尺码为23.5cm到24.5cm的共有5个数据,且尺码为25cm的有5个数据,因此第7个数据一定是25cm,即中位数为25cm.答案:A4.一组数据中的每一个数据都减去80,得到一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是( )A.81.2,4.4B.78.8,4.4C.81.2,84.4D.78.8,75.6解析:原数据的平均数应为1.2+80=81.2,原数据的方差与新数据的方差相同,即为4.4.答案:A5.已知样本甲和乙分别取自两个不同的总体,它们的样本平均数分别为,样本标准差分别为s甲和s 乙,则( )A.,s甲>s乙B.,s甲>s乙C.,s甲<s乙D.,s甲<s乙解析:甲中的数据都不大于乙中的数据,所以,但甲中的数据比乙中的数据波动幅度大,所以s甲>s乙.答案:B6.在一次数学测验中,某小组10名学生分别与全班的平均分85分的差是:2,3,-3,-5,12,8,2,-10,-2,5,那么这个小组的平均分是分.解析:这个小组的平均分是85+=85+1.2=86.2(分).答案:86.27.已知甲、乙两人在相同条件下练习射击,每人打5发子弹,命中环数如下:甲 6 8 9 9 8乙17 7 7 9则两人射击成绩的稳定程度是.解析:∵=8,=8,而=1.2,=1.6,,∴甲的稳定性较强.答案:甲比乙稳定8.若一组数据x1,x2,…,x n的方差为9,则数据3x1,3x2,…,3x n的方差为,标准差为.解析:数据3x1,3x2,…,3x n的方差为32×9=81,标准差为=9.答案:81 99.从甲、乙两种玉米苗中各抽10株,分别测得它们的株高如下(单位:cm):甲:25,41,40,37,22,14,19,39,21,42;乙:27,16,44,27,44,16,40,40,16,40.问:(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?解:(1)×(25+41+40+37+22+14+19+39+21+42)=×300=30(cm),×(27+16+44+27+44+16+40+40+16+40)=×310=31(cm),所以,即乙种玉米的苗长得高.(2)×[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=×1042=104.2(cm2),×[(27-31)2×2+(16-31)2×3+(44-31)2×2+(40-31)2×3]=×1288=128.8(cm2),所以,即甲种玉米的苗长得齐.10.一名射击运动员射击8次所中环数如下:9.9,10.3,9.8,10.1,10.4,10,9.8,9.7.(1)这8次射击的平均环数是多少?标准差是多少?(2)环数落在①-s与+s之间;②-2s与+2s之间的各有几次?所占百分比各是多少?解:(1)=10(环);s2=[(9.9-10)2+(10.3-10)2+(9.8-10)2+(10.1-10)2+(10.4-10)2+(10-10)2+(9.8-10)2+(9.7-10)2]=(0.01+0.09+…+0.09)==0.055,所以s=≈0.235(环).(2)①-s≈10-0.235=9.765,+s≈10+0.235=10.235,在这两个数据之间的数有5个,占到=62.5%.②-2s≈10-0.235×2=9.53,+2s≈10+0.235×2=10.47,在这两个数据之间的数有8个,占到100%.。
学而思高中题库完整版随机变量及其分布列[1].版块四.事件的独立性2.学生版
1. 离散型随机变量及其分布列⑴离散型随机变量 如果在试验中,试验可能出现的结果可以用一个变量X 来表示,并且X 是随着试验的结果的不同而变化的,我们把这样的变量X 叫做一个随机变量.随机变量常用大写字母,,X Y L 表示.如果随机变量X 的所有可能的取值都能一一列举出来,则称X 为离散型随机变量. ⑵离散型随机变量的分布列将离散型随机变量X 所有可能的取值x 与该取值对应的概率p (1,2,,)i n =L 列表表示:X 1x 2x … i x … n x P1p2p…i p…n pX 的分布列.2.几类典型的随机分布⑴两点分布如果随机变量X 的分布列为X1P p q其中01p <<,1q p =-X 服从参数为p 的二点分布.二点分布举例:某次抽查活动中,一件产品合格记为1,不合格记为0,已知产品的合格率为80%,随机变量X X 的分布列满足二点分布.X1P 0.8 0.2两点分布又称01-布又称为伯努利分布. ⑵超几何分布 一般地,设有总数为N 件的两类物品,其中一类有M 件,从所有物品中任取n 件()n N ≤,这n 件中所含这类物品件数X 是一个离散型随机变量,它取值为m 时的概率为C C ()C m n mM N Mn NP X m --==(0m l ≤≤,l 为n 和M 中较小的一个).我们称离散型随机变量X 的这种形式的概率分布为超几何分布,也称X 服从参数为N ,知识内容依赖于独立性的概率计算M ,n 的超几何分布.在超几何分布中,只要知道N ,M 和n ,就可以根据公式求出X 取不同值时的概率()P X m =,从而列出X 的分布列. ⑶二项分布1.独立重复试验如果每次试验,只考虑有两个可能的结果A 及A ,并且事件A 发生的概率相同.在相同的条件下,重复地做n 次试验,各次试验的结果相互独立,那么一般就称它们为n 次独立重复试验.n 次独立重复试验中,事件A 恰好发生k 次的概率为()C (1)kk n k n n P k p p -=-(0,1,2,,)k n =L . 2.二项分布若将事件A 发生的次数设为X ,事件A 不发生的概率为1q p =-,那么在n 次独立重复试验中,事件A 恰好发生k 次的概率是()C k k n kn P X k p q -==,其中0,1,2,,k n =L .于是得到X 01… k… nP00C nn p q111C n n p q- … C k k n kn p q- 0C n n n p q由式001110()C C C C n n n k k n k nn n n n n q p p q p qp q p q --+=++++L L 各对应项的值,所以称这样的散型随机变量X 服从参数为n ,p 的二项分布, 记作~(,)X B n p .二项分布的均值与方差:若离散型随机变量X 服从参数为n 和p 的二项分布,则()E X np =,()D x npq =(1)q p =-.⑷正态分布1. 概率密度曲线:样本数据的频率分布直方图,在样本容量越来越大时,直方图上面的折线所接近的曲线.在随机变量中,如果把样本中的任一数据看作随机变量X ,则这条曲线称为X 的概率密度曲线.曲线位于横轴的上方,它与横轴一起所围成的面积是1,而随机变量X 落在指定的两个数a b ,之间的概率就是对应的曲边梯形的面积. 2.正态分布⑴定义:如果随机现象是由一些互相独立的偶然因素所引起的,而且每一个偶然因素在总体的变化中都只是起着均匀、微小的作用,则表示这样的随机现象的随机变量的概率分布近似服从正态分布. 服从正态分布的随机变量叫做正态随机变量,简称正态变量. 正态变量概率密度曲线的函数表达式为22()2()2πx f x μσσ--=⋅,x ∈R ,其中μ,σ是参数,且0σ>,μ-∞<<+∞.式中的参数μ和σ分别为正态变量的数学期望和标准差.期望为μ、标准差为σ的正态分布通常记作2(,)N μσ. 正态变量的概率密度函数的图象叫做正态曲线.⑵标准正态分布:我们把数学期望为0,标准差为1的正态分布叫做标准正态分布. ⑶重要结论:①正态变量在区间(,)μσμσ-+,(2,2)μσμσ-+,(3,3)μσμσ-+内,取值的概率分别是68.3%,95.4%,99.7%.②正态变量在()-∞+∞,内的取值的概率为1,在区间(33)μσμσ-+,之外的取值的概率x=μOy x是0.3%,故正态变量的取值几乎都在距x μ=三倍标准差之内,这就是正态分布的3σ原则.⑷若2~()N ξμσ,,()f x 为其概率密度函数,则称()()()xF x P x f t dt ξ-∞==⎰≤为概率分布函数,特别的,2~(01)N ξμσ-,,称22()2t x x e dt φ-=⎰π为标准正态分布函数. ()()x P x μξφσ-<=.标准正态分布的值可以通过标准正态分布表查得.分布函数新课标不作要求,适当了解以加深对密度曲线的理解即可.3.离散型随机变量的期望与方差1.离散型随机变量的数学期望定义:一般地,设一个离散型随机变量X 所有可能的取的值是1x ,2x ,…,n x ,这些值对应的概率是1p ,2p ,…,n p ,则1122()n n E x x p x p x p =+++L ,叫做这个离散型随机变量X 的均值或数学期望(简称期望).离散型随机变量的数学期望刻画了这个离散型随机变量的平均取值水平. 2.离散型随机变量的方差一般地,设一个离散型随机变量X 所有可能取的值是1x ,2x ,…,n x ,这些值对应的概率是1p ,2p ,…,n p ,则2221122()(())(())(())n n D X x E x p x E x p x E x p =-+-++-L 叫做这个离散型随机变量X 的方差.离散型随机变量的方差反映了离散随机变量的取值相对于期望的平均波动的大小(离散程度).()D X ()D x 叫做离散型随机变量X 的标准差,它也是一个衡量离散型随机变量波动大小的量.3.X 为随机变量,a b ,为常数,则2()()()()E aX b aE X b D aX b a D X +=++=,; 4. 典型分布的期望与方差:⑴二点分布:在一次二点分布试验中,离散型随机变量X 的期望取值为p ,在n 次二点分布试验中,离散型随机变量X 的期望取值为np .⑵二项分布:若离散型随机变量X 服从参数为n 和p 的二项分布,则()E X np =,()D x npq =(1)q p =-.⑶超几何分布:若离散型随机变量X 服从参数为N M n ,,的超几何分布,则()nME X N=,2()()()(1)n N n N M M D X N N --=-.4.事件的独立性如果事件A 是否发生对事件B 发生的概率没有影响,即(|)()P B A P B =,这时,我们称两个事件A ,B 相互独立,并把这两个事件叫做相互独立事件.如果事件1A ,2A ,…,n A 相互独立,那么这n 个事件都发生的概率,等于每个事件发生的概率的积,即1212()()()()n n P A A A P A P A P A =⨯⨯⨯I I L I L ,并且上式中任意多个事件i A 换成其对立事件后等式仍成立.5.条件概率对于任何两个事件A 和B ,在已知事件A 发生的条件下,事件B 发生的概率叫做条件概率,用符号“(|)P B A ”来表示.把由事件A 与B 的交(或积),记做D A B =I (或D AB =).【例1】 在一段时间内,甲去某地的概率是14,乙去此地的概率是15,假定两人的行动相互之间没有影响,那么在这段时间内至少有1人去此地的概率是( )A .320B .15C .25D .920【例2】 甲乙两人独立地解同一问题,甲解决这个问题的概率是1p ,乙解决这个问题的概率是2p ,那么恰好有1人解决这个问题的概率是( )A .12p pB .()()122111p p p p -+-C .121p p -D .()()12111p p ---【例3】 在某段时间内,甲地不下雨的概率为0.3,乙地不下雨的概率为0.4,假设在这段时间内两地是否下雨相互无影响,则这段时间内两地都下雨的概率是 ( ) A .0.12 B .0.88 C .0.28 D .0.42【例4】 从甲口袋内摸出1个白球的概率是13,从乙口袋内摸出1个白球的概率是12,从两个口袋内各摸出1个球,那么56等于( )A .2个球都是白球的概率B .2个球都不是白球的概率典例分析C.2个球不都是白球的概率 D.2个球中恰好有1个是白球的概率【例5】从甲口袋摸出一个红球的概率是13,从乙口袋中摸出一个红球的概率是12,则23是()A.2个球不都是红球的概率 B.2个球都是红球的概率C.至少有一个红球的概率 D.2个球中恰好有1个红球的概率【例6】甲,乙两人进行乒乓球比赛,每局甲胜的概率为p,12p≥。
02-5.1 统计-5.1.2 数据的数字特征高中数学必修第二册人教B版
=1
知识点2 中位数、百分位数、众数
例2-3 (2024·陕西省宝鸡市月考)某射击小组有20人,教练将他们某次射击的数据绘
制成如下表格,则这组数据的众数和中位数分别是( C
A.7,7
)
环数
5
6
7
8
9
10
人数
1
2
7
6
3
1
B.8,7.5
C.7,7.5
D.8,6
【解析】从表中数据可知7环有7人,人数最多,所以众数是7;
∴ 甲、乙两个班的体能分数的平均数不相等,故B错误;
对于C,乙班的体能分数的众数为81,故C错误;
对于D,甲、乙两个班体能分数的中位数分别为
86+87
2
= 86.5,
87+88
2
乙两个班体能分数的中位数中,乙班的中位数较大,故D正确.
= 87.5,∴ 甲、
题型2 方差、标准差的计算
例10 (2024·福建省莆田五中月考)某科考试成绩公布后,发现判错一道题,经修改后
1
5
10+6+8+5+6
5
= 7,
∴ 方差 2 = × [(10 − 7)2 + (6 − 7)2 + (8 − 7)2 + (5 − 7)2 + (6 − 7)2 ] =
16
5
= 3.2.
知识点4 平均数、方差的计算方法总结
例4-7 随机调查某校50名学生在学校的午餐费,结果如下表:
午餐费/元
中位数是将数据按照从小到大排列,第10个与第11个数据的平均数,第10个数是7,
第11个数是8,所以中位数是
北师大版高中数学必修3第一章统计-4数据的数字特征-典题题库(三)(带详细答案)
北师大版高中数学必修3第一章统计-4数据的数字特征-典题题库(三)一、选择题(共30小题,每小题5.0分,共150分)1.以下两个茎叶图表示的是15个评委为竞争15亿元的产业转移扶持资金的甲、乙、丙、丁四个市所打出的分,按照规定,去掉一个最高分和一个最低分,平均分排在前三位的市将各获得5亿元,则不能获得这5亿元的是()A.甲市B.乙市C.丙市D.丁市【答案】A【解析】按照规定去掉分数以后,求出四组数据的平均分甲=≈88.54;乙=≈89.6;丙==89;丁=≈88.6.经过比较,甲市的平均分最低,∴甲市将不能获得这5亿元.2.设矩形的长为a,宽为b,其比满足b∶a=≈0.618,这种矩形给人以美感称为黄金矩形.黄金矩形常应用于工艺品设计中.下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:甲批次:0.5980.6250.6280.5950.639乙批次:0.6180.6130.5920.6220.620根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是()A.甲批次的总体平均数与标准值更接近B.乙批次的总体平均数与标准值更接近C.两个批次总体平均数与标准值接近程度相同D.两个批次总体平均数与标准值接近程度不能确定【答案】A【解析】甲批次的平均数为0.617,乙批次的平均数为0.613.故甲批次的总体平均数与标准值更接近.3.已知10个数据:1 203 1 201 1 194 1 200 1 204 1 201 1 199 1 204 1 195 1 199则它们的平均数是()A. 1 400B. 1 300C. 1 200D. 1 100【答案】C【解析】∵已知10个数据:1 203 1 201 1 194 1 2001 204 1 201 1 199 1 204 1 195 1 199∴这10个数据的平均数是=1 200,即这组数据的平均数是1 200.4.如图是歌手大奖赛中,七位评委为甲,乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲,乙两名选手得分的平均数分别为a1,a2,则一定有()A.a1>a2B.a2>a1C.a1=a2D.a1,a2的大小不确定【答案】B【解析】由题意知去掉一个最高分和一个最低分以后,两组数据都有五个数据,代入数据可以求得甲和乙的平均分a 1=+80=84,a 2=+80=85,∴a2>a1.5.数据5,7,7,8,10,11的平均数是()A. 7B. 8C. 10D. 11【答案】B【解析】(5+7+7+8+10+11)÷6=8,∴数据5,7,7,8,10,11的平均数是8.6.从总体中抽取的样本数据共有m个a,n个b,p个c,则总体的平均数的估计值为() A.B.C.D.【答案】D【解析】由样本数据共有m个a,n个b,p个c,得出样本平均数为,则总体的平均数的估计值为.7.若m个数的平均数是x,n个数的平均数是y,则这m+n个数的平均数是()A.B.C.D.【答案】C【解析】∵m个数的平均数是x,n个数的平均数是y,∴m个数的和是mx,n个数的和是ny,∴这m+n个数字的和是mx+ny,∴这m+n个数字的平均数是.8.一位同学用计算器求30个数据的平均数时,错将其中一个数据15输入为105,那么由此求出的平均数与实际平均数的差是()A. 3B. 3.5C. 4D. 4.5【答案】A【解析】因为105-15=90,所以数据比真实数据增加了90,则平均增加90÷30=3.即由此求出的平均数与实际平均数的差是3.9.已知样本x1,x2,…xm的平均数为,样本y1,y2,…yn的平均数,若样本x1,x2,…xm,y 1,y2,…yn的平均数=α+(1-α),其中0<α≤,则m,n的大小关系为()A.m<nB.m>nC.m≤nD.m≥n【答案】C【解析】由题意知,x1+x2+…+xm=m,y1+y2+…+yn=n,故==+,故0<≤,故m≤n.10.五位同学在某次考试的数学成绩如茎叶图,则这五位同学这次考试的数学平均分为()A. 88B. 89C. 90D. 91【答案】C【解析】根据茎叶图中的数据得,这5位同学考试的数学平均数为(84+86+88+95+97)=90.11.数名射击运动员第一轮比赛成绩如下表所示:则他们本轮比赛的平均成绩是()A. 7.8环B. 7.9环C. 8.1环D. 8.2环【答案】C【解析】由题意可知:该运动员的平均成绩为=8.1(环).故选C.12.一组数据的观测值分别为4,3,5,6,出现的次数分别为2,2,4,2,则这组数据的样本平均数为() A. 1.64B. 12.5C. 4.5D. 4.6【答案】D【解析】==4.6.13.某超市购进一批大米,大米的标准包装为每袋30 kg,售货员任选6袋进行了称重检验,超过标准重量的记作“+”,不足标准重量的记作“-”,他记录的结果是+0.5,-0.5,0,-0.5,-0.5,+1,那么这6袋大米重量的平均数和极差分别是()A. 0,1.5B. 29.5,1C. 30,1.5D. 30.5,0【答案】C【解析】平均数为30+(0.5-0.5+0-0.5-0.5+1)÷6=30,极差为(30+1)-(30-0.5)=1.5,故选C.14.为了让人们感受丢弃塑料袋对环境造成的影响,某班环保小组的六名同学记录了自己家中一周内丢弃的塑料袋的数量,结果如下(单位:个):33,25,28,26,25,31.如果该班有45名学生,那么根据提供的数据估计本周全班同学各家总共丢弃塑料袋的数量约为()A. 900个B. 1 080个C. 1 260个D. 1 800个【答案】C【解析】根据平均数的计算方法得:(33+25+28+26+25+31)×45=1 260(个).15.已知样本数据x1,x2,…,x10,其中x1,x2,x3的平均数为a,x4,x5,x6,…,x10的平均数为b,则样本数据的平均数为()A.B.C.D.【答案】B【解析】前3个数据的和为3a,后7个数据的和为7b,样本平均数为10个数据的和除以10. 16.如果5个数x1,x2,x3,x4,x5的平均数是7,那么x1+1,x2+1,x3+1,x4+1,x5+1这5个数的平均数是()A. 5B. 6C. 7D. 8【答案】D【解析】x1,x2,x3,x4,x5的平均数是7,即(x1+x2+x3+x4+x5)÷5=7,从而x1+1,x2+1,x3+1,x4+1,x5+1这5个数的平均数为(x1+1+x2+1+x3+1+x4+1+x5+1)÷5=8.17.已知一组正数x1,x2,x3,x4的平均数为2,则数据x1+2,x2+2,x3+2,x4+2的平均数为()A. 2B. 3C. 4D. 6【答案】C【解析】∵=2,∴=4.18.在一次数学测验中,某小组14名学生分别与全班的平均分85分的差是2,3,-3,-5,12,12,8,2,-1,4,-10,-2,5,5,那么这个小组的平均分是()A. 97.2B. 87.29C. 92.32D. 82.86【答案】B【解析】根据平均数的公式可知这个小组的平均分为85+(2+3-3-5+12+12+8+2-1+4-10-2+5+5)=85+≈87.29.19.一个样本的数据在60左右波动,各个数据都减去60后得到一组新数据,算得其平均数是6,则这个样本的平均数是()A. 6.6B. 6C. 66D. 60【答案】C【解析】样本中的数据都减去60后得到一组新数据,新数据的平均数是6,那么这个样本的平均数是6+60=66.20.已知一组数据x1,x2,x3,…,xn的平均数为2,则数据组2x1+1,2x2+1,2x3+1,…2xn+1的平均数为()A. 2B. 3C. 5D. 6【答案】C【解析】∵x1,x2,x3,…,xn的平均数为2,∴x1+x2+x3+…+xn=2n,∴2x1+1+2x2+1+2x3+1+…+2xn+1=2(x1+x2+x3+…+xn)+n=5n.∴2x1+1,2x2+1,2x3+1,…,2xn+1的平均数为5.21.某住宅小区六月份1日至5日每天用水量变化情况如图所示.那么这5天平均每天的用水量是()A. 30吨B. 31吨C. 32吨D. 33吨【答案】C【解析】由折线图知该住宅小区六月份1日至5日每天用水量分别为30吨,32吨,36吨,28吨,34吨,∴这5天平均每天的用水量为(30+32+36+28+34)=32(吨).22.某一个班全体学生参加物理测试,成绩的茎叶图如图,则该班的平均分估计是()A. 79B. 88C. 85D. 83【答案】C【解析】由茎叶图知,得分数据为79,84,82,85,81,88,93,∴该班的平均分为=85.23.已知8个数的平均值为12,从中取走一个数后,其平均值却增加1,则取走的那个数为() A. 4B. 5C. 7D. 11【答案】B【解析】设取走的那个数为x,由题设知,(8×12-x)=12+1,解得x=5.24.在一次射击训练中,某一小组10名成员的成绩如表:已知该小组的平均成绩为8.3环,则xy的值为()A. 0B. 4C. 5D. 6【答案】B【解析】由题意知,成绩为8环的人数为x,成绩为10环的人数为y,则有7×2+8x+9×3+10y=8.3×10,且2+x+3+y=10.解得x=4,y=1.则xy的值为4.25.将一组以1开头的连续的正整数写在黑板上,擦去其中一个数,余下的数的算术平均数为,则擦去的那个数是()A. 5B. 6C. 7D. 8【答案】B【解析】设共有n个数,去掉的数为x.由已知,n个连续的自然数的和为Sn=,若x=n,剩下的数的平均数是=;若x=1,剩下的数的平均数是=+1.由≤≤+1,解得30≤n≤32,∵n为正整数,∴n=31或32.当n=32时,31×=-x,解得x=21(不符合题意);当n=31时,30×=-x,解得x=6.∴去掉的数是6.26.某次考试,班长算出了全班40人数学成绩的平均分M,如果把M当成一个同学的成绩与原来的40个分数加在一起,算出这41个分数的平均值为N,那么M∶N为()A. 40∶41B. 41∶40C. 2D. 1【答案】D【解析】设全班40人数学成绩的和为S,则M=,即S=40M,因为把M当成一个同学的成绩与原来的40个分数加在一起,算出这41个分数的平均值为N,所以N===M,所以M∶N=1.27.在一次射击训练中,一小组的成绩如下表:已知该小组的平均成绩为8.1环,那么成绩为8环的人数是()A. 5B. 6C. 4D. 7【答案】A【解析】设成绩为8环的人数是x,由平均数的概念,得7×2+8x+9×3=8.1(2+x+3)⇒x=5.28.一次选拔运动员,测得7名选手的身高(单位:cm)分布茎叶图如图,记录的平均身高为177 cm,有一名候选人的身高记录不清楚,其末位数记为x,那么x的值为()A. 5B. 6C. 7D. 8【答案】D【解析】=177,解得x=8.29.在某次测验中,有6位同学的平均成绩为75分.用xn表示编号为n(n=1,2,…,6)的同学所得成绩,且前5位同学的成绩如表,则第6位同学成绩x6是()A. 80B. 90C. 86D. 70【答案】A【解析】根据平均数的定义得,(74+76+72+70+78+x6)÷6=75,解得x6=80.30.已知1,2,3,4,x1,x2,x3的平均数是8,那么x1+x2+x3的值是()A. 14B. 22C. 32D. 46【答案】D【解析】∵1,2,3,4,x1,x2,x3的平均数是8,∴1+2+3+4+x1+x2+x3=8×7,∴x1+x2+x3=46.二、填空题(共56小题,每小题5.0分,共280分)31.数据100,80,75,72,70,50的中位数是________.【答案】73.5【解析】将这组数据按从小到大排列为50,70,72,75,80,100.由于有偶数个数,取最中间两个数的平均数即为中位数,则中位数为=73.5.32.有一组数据:10,50,30,40,70,它们的中位数是________.【答案】40【解析】数据按由大到小排列为:10,30,40,50,70,共有5个数,最中间的数为40,所以这组数据的中位数为40.33.有一组数据:2.78,2.90,3.06,2.74,3.52,2.83,2.89中,它们的中位数是________.【答案】2.89【解析】数据按从小到大的顺序排列:2.74,2.78,2.83,2.89,2.90,3.06,3.52,此组数据有奇数个,所以中位数是2.89.34.数据3,5,8,9,7,6,2的中位数是________.【答案】6【解析】将这组数据从小到大重新排列后为2,3,5,6,7,8,9,最中间的那个数是6,所以中位数是6.35.一个样本数据按从小到大的顺序排列为13,14,19,x,23,27,28,31,其中位数为22,则x=________.【答案】21【解析】数据个数为偶数时,中位数为中间两数的平均值=22,∴x=21.36.在综合实践课上,五名同学做的作品的数量(单位:件)分别是5,7,3,6,4,则这组数据的中位数是________件.【答案】5【解析】按从小到大的顺序排列是3,4,5,6,7.中间的是5,故中位数是5.37.在一次信息技术考试中,某兴趣小组8名同学的成绩(单位:分)分别是7,10,9,8,7,9,9,8,则这组数据的中位数是________.【答案】8.5【解析】题目中数据共有8个,按从小到大排列后为7,7,8,8,9,9,9,10.故中位数是按从小到大排列后第4,第5两个数的平均数,故这组数据的中位数是×(8+9)=8.5.38.某城市在“五一”期间举行了“让城市更美好”大型书画、摄影展览活动,据统计,星期一至星期日参观的人数分别是2 030,3 150,1 320,1 460,1 090,3 150,4 120,则这组数据的中位数和众数分别是________,________.【答案】2 030 3 150【解析】将这组数据按从小到大的顺序排列为1 090,1 320,1 460,2 030,3 150,3 150,4 120,处于中间位置的那个数是2 030,那么由中位数的定义可知,这组数据的中位数是2 030,在这一组数据中3 150是出现次数最多的,故众数是3 150.39.数据9.30,9.05,9.10,9.40,9.20,9.10的众数是________;中位数是________.【答案】9.109.15【解析】出现次数最多的是9.10,故众数是9.10.将这些数按大小顺序排列,中间两个数为9.10,9.20,其平均数为=9.15,则中位数为9.15,故答案为9.10,9.15.40.某公司有25名雇员,他们的工资情况如表所示:他们年薪的中位数是________.(结果精确到0.1)【答案】40.0【解析】由已知可得25个人的工资如下所示:135.0,95.0,80.0,80.0,70.0,60.0,60.0,60.0,52.0,52.0,52.0,52.0,40.0,31.0,31.0,31.0,31.0,31.0,31.0,31.0,31.0,31.0,31.0,31.0,31.0,故其年薪的中位数是40.0.41.某市东城区2016年中考模拟考的总分(均为整数)成绩汇总如下表:所有总分成绩的中位数位于________之间.(填写序号)①521到530;②531到540;③541到550;④551到560.【答案】②【解析】∵所有学生有3 300人,中位数是第1 650与第1651个数据的平均数,∴所有总分成绩的中位数位于531到540之间.42.某班40名同学的年龄情况如下表,则这40名同学的年龄的中位数是________.【答案】15.5【解析】∵一共有40名队员,∴其中位数应是第20和第21名同学的年龄的平均数,∴中位数为(15+16)÷2=15.5,故答案为15.5.43.为了了解学生使用零花钱的情况,小军随机地抽查了他们班的30名学生,结果如下表:这些同学每天使用零花钱的众数是________,中位数是________.【答案】46【解析】∵4出现了10次,它的次数最多,∴众数为4.∵小军随机调查了30名同学,∴根据表格数据可知中位数为(6+6)÷2=6.44.已知某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图如图所示,则甲、乙两人得分的中位数之和为________.技术水平较好的是________.【答案】63乙【解析】根据茎叶图所给的数据可以看出甲的中位数是27,乙的中位数是36,∴两个人的中位数之和是27+36=63,从茎叶图可以看出乙的成绩比较稳定,整体水平也比较高,∴技术水平较好的是乙.45.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是________,________.【答案】4546【解析】甲组数据按从小到大的顺序排列为28,31,39,42,45,55,57,58,66,中位数为45.乙组数据按从小到大的顺序排列为29,34,35,42,46,48,53,55,67,中位数为46.46.在由某电视台举办的歌唱比赛中,由12位评委现场给每位歌手打分,然后将去掉其中的一个最高分和一个最低分之后的其余分数的平均数作为该歌手的最后得分.已知12位评委给某位歌手打出的分数是9.6,9.2,9.4,9.3,9.7,9.6,9.2,9.3,9.2,9.5,9.4,9.5,那么这位歌手的最后得分是________.【答案】9.4【解析】去掉其中的一个最高分9.7和一个最低分9.2之后,其余分数的9.6,9.4,9.3,9.6,9.2,9.3,9.2,9.5,9.4,9.5,最后得分是(9.6+9.4+9.3+9.6+9.2+9.3+9.2+9.5+9.4+9.5)÷10=9.4.47.某篮球运动员在10场比赛中的得分用茎叶图表示如图,则该运动员的平均得分为________.【答案】21.6【解析】由茎叶图知,得分的数据为9,15,17,20,21,21,22,25,32,34,∴该运动员的平均得分为=21.6.48.高一年级某班10名学生的单元测试成绩如下:70,84,68,72,87,92,76,88,73,90,则他们的平均成绩是________分.【答案】80【解析】由平均数公式可得,平均成绩为(70+84+68+72+87+92+76+88+73+90)÷10=80(分).49.某高校有甲、乙两个数学建模兴趣班.其中甲班有40人,乙班50人.现分析两个班的一次考试成绩,算得甲班的平均成绩是90分,乙班的平均成绩是81分,则该校数学建模兴趣班的平均成绩是________分.【答案】85【解析】甲班有40人,乙班50人.现分析两个班的一次考试成绩,算得甲班的平均成绩是90分,乙班的平均成绩是81分,该校数学建模兴趣班的平均成绩是=85(分).50.已知某班级有女生20人,男生30人.一次考试女生的平均分为75分,全班的平均分为72分,则男生的平均分为________分.【答案】70【解析】设男生的平均分为X,则30X+75×20=(20+30)×72,解得X=70,即男生的平均分为70分.51.某水果店一周内甲、乙两种水果每天销售情况茎叶图(单位:斤),则本周内甲、乙两种水果每天销售的平均数之和为________.【答案】99【解析】由茎叶图知甲水果店的平均数是=49,乙水果店的平均数是=50,∴本周内甲、乙两种水果每天销售的平均数之和为49+50=99.52.教育局对某校初二男生的体育项目“俯卧撑”进行抽样调查,被抽到的50名学生的成绩如下:由此可以估计,全校初二男生俯卧撑的平均成绩约为________次(精确到0.1).【答案】7.2【解析】由题意知本题是求一个加权平均数,全校初二男生俯卧撑的平均成绩约为=7.2.53.从某项综合能力测试中抽取100人的成绩,统计如下表,则这100人成绩的平均数为________.【答案】3【解析】由表格可以看出这100个人的成绩的平均数是==3.54.某校在“五四”青年节到来之前,组织了一次关于“五四运动”的知识竞赛.在参加的同学中随机抽取100位同学的回答情况进行统计,答对的题数如下:答对5题的有10人,答对6题的有30人,答对7题的有30人,答对8题的有15人,答对9题的有10人,答对10题的有5人,则可以估计在这次知识竞赛中这所学校的每位学生答对的题数大约为________.【答案】7【解析】由题意知本题要求这次竞赛的答对题目数目的平均数,∵答对5题的有10人,答对6题的有30人,答对7题的有30人,答对8题的有15人,答对9题的有10人,答对10题的有5人,∴答对题目的平均数是=7.55.有50个数它们的平均数为45.若将其中的两个数33和57舍去,则余下的平均数是________.【答案】45【解析】有50个数它们的平均数为45,那么这50个数的和为50×45.若将其中的两个数33和57舍去,则余下的平均数是=45.56.如图是某跳水比赛中,八位评委为某运动员打出的分数的茎叶图,去掉一个最高分和一个最低分后,这位运动员的平均得分为________.【答案】9.34【解析】由茎叶图知,去掉一个最高分9.45和一个最低分9.27后得到分数是9.42,9.31,9.31,9.34,9.37,9.29,则这组数据的平均数是=9.34.57.对某种花卉的开放花期追踪调查,调查情况如表:则这种卉的平均花期约为________天.【答案】16【解析】由表格知,花期平均为12天的有20个,花期平均为15天的有40个,花期平均为18天的有30个,花期平均为21天的有10个,∴这种花卉的平均花期约为≈16.58.根据某运动员在某赛季各场比赛的得分制作得到了如图的茎叶图,则该运动员的平均得分为________.【答案】33【解析】由茎叶图知,得分的数据为12,15,24,25,31,31,36,36,37,39,44,49,50,∴该运动员的平均得分为=33.59.某校在高三年级学生中随机抽出10个学生用视力表进行视力检查,得到的视力数据茎叶图如图所示(以小数点前的一位数字为茎,小数点后的一位数字为叶),则这组视力检查数据的平均数为________.【答案】4【解析】由茎叶图知,这组数据的平均数是=4.60.如图是某小组学生在一次数学测验中的得分茎叶图,则该组男生的平均得分与女生的平均得分之差是________.【答案】2【解析】由茎叶图知女生的平均数是=77,男生的平均数是=79,∴该组男生的平均得分与女生的平均得分之差为79-77=2.61.某校在“爱护地球,绿化祖国”的创建活动中,组织学生开展植树造林活动.为了解全校学生的植树情况,学校随机抽查了100名学生的植树情况,将调查数据整理如下表:则这100名同学平均每人植树________棵;若该校共有1 000名学生,请根据以上调查结果估计该校学生的植树总数是________棵.【答案】5.8 5 800【解析】平均数=(30×4+5×22+6×25+8×15+10×8)÷100=580÷100=5.8(棵),植树总数=5.8×1 000=5 800(棵).62.为建设绿色株洲,某校初三0801、0802、0803、0804四个班同学参加了植树造林,每班植树株数如下表,则这四个班平均每班植树________株.【答案】25【解析】这四个班平均每班植树的株数为(22+25+35+18)÷4=25.63.某校艺术节演出中,5位评委给某个节目打分如下:9分,9.3分,8.9分,8.7分,9.1分,则该节目的平均得分是________分.【答案】9【解析】==9,∴该节目的平均得分是9分.64.如果x1与x2的平均数是4,那么x1+1与x2+5的平均数是________.【答案】7【解析】∵x1与x2的平均数是4,∴x1+x2=4×2=8,∴x 1+1与x2+5的平均数===7.65.从高二学生中任意抽取100名男生,测量他们的身高如下:则这一届高二男生估计其身高平均约为________m.【答案】1.73【解析】66.电池厂从某日生产的电池中抽取10个进行寿命测试,得数据如下(单位:小时):30,35,25,25,30,34,26,25,29,21,则该电池的平均寿命估计为________小时.【答案】28【解析】平均寿命估计是依据抽取的电池的平均寿命,抽取的电池平均寿命为(30+35+25+25+30+34+26+25+29+21)=28.67.某商店的大米价格是3.00元/千克,面粉的价格是3.60元/千克,大米与面粉的销量分别是1 000千克,500千克,则该商店出售的粮食的平均价格是________元/千克.【答案】3.20【解析】平均价格为(3.6×500+3×1 000)=1.20+2=3.20.68.数据a,b,b,b,a,c,a,a,a的平均数为________.【答案】【解析】由加权平均数的公式得.69.为了解某商店的日营业额,抽查了商店某月5天的日营业额,结果如下(单位:元)14 845,25 304,18 954,11 672,16 330.则这5天的日平均营业额为________元.【答案】17 421【解析】a1+a2+a3+a4+a5=14 845+25 304+18 954+11 672+16 330=87 105,∴日平均营业额为=17 421(元).70.在一段时间里,一个学生记录了其中10天他每天完成家庭作业所需要的时间(单位:分钟),结果如下:80707070606080606070在这段时间里,该学生平均每天完成家庭作业所需时间是________分钟.【答案】68【解析】方法一观察数据知,80出现2次,60与70各出现4次,又总次数为2+4+4=10,∴该学生平均每天完成家庭作业所需时间为=68(分钟).方法二观察数据知所有数据均在70附近波动,可将各数据同时减70得一组新数据:10,0,0,0,-10,-10,10,-10,-10,0,这组新数据的平均数为=-2,∴该学生平均每天完成家庭作业所需时间为70+(-2)=68(分钟).71.某几架飞机的最大飞行速度分别是(单位:米/秒):422423410431418417425428413441则这些飞机的平均最大飞行速度为________米/秒.(精确到1米/秒)【答案】423【解析】观察这10个数据,它们都在420左右波动,将它们同时减去420得一组新数据:23-1011-2-358-721求得新数据的平均数约为3,所以这些飞机的平均最大飞行速度约为420+3=423(米/秒).72.在一次京剧表演比赛中,11位评委现场给每一个演员评分,并将11位评委的评分的平均数作为该演员的实际得分.对于某个演员的表演,4位评委给他评10分,7位评委给他评9分,那么这个演员的实际得分是________.(精确到小数点后两位)【答案】9.36【解析】实际得分为≈9.36.73.在总体中抽取了一个样本,为了便于统计,将样本中的每个数据乘以100后进行分析,得出新样本的平均数为3,则估计总体的平均数为________.【答案】0.03【解析】一组数据乘以100后得到的新的平均数3应是原平均数的100倍,∴原来样本平均数为0.03,因此估计总体平均数为0.03.74.已知一组数据x1,x2,…,xn的平均数为=5,则数据3x1+7,3x2+7,…,3xn+7的平均数为________.【答案】22【解析】由题意知,=5,即x1+x2+…+xn=5n,∴(3x1+7)+(3x2+7)+…+(3xn+7)=3(x1+x2+…+xn)+7n=22n,∴所求数据的平均数是22.75.数据x1,x2,x3,…,x8平均数为6,则数据2x1-6,2x2-6,2x3-6,…,2x8-6的平均数为________.【答案】6【解析】∵x1,x2,x3,…,x8平均数为6,∴(x 1+x2+x3+…+x8)=6,∴2x1-6,2x2-6,2x3-6,…,2x8-6的平均数为[(2x1-6)+(2x2-6)+(2x3-6)+…+(2x8-6)]=[2(x 1+x2+x3+…+x8)-6×8]=2×(x 1+x2+x3+x4+x5)-6=2×6-6=6.76.若k1,k2,…,k8的平均数为4,则2(k1-3),2(k2-3),…,2(k8-3)的平均数为________.【答案】2【解析】∵k1,k2,…,k8的平均数为4,∴2(k1-3),2(k2-3),…,2(k8-3)的平均数是2×(4-3)=2.77.已知x1,x2,x3的平均数是,那么3x1+5,3x2+5,3x3+5的平均数是________.【答案】3+5【解析】∵x1,x2,x3的平均数是,即(x 1+x2+x3)=,∴3x1+5,3x2+5,3x3+5的平均数为(3x1+5+3x2+5+3x3+5)=(3x 1+3x2+3x3)+5=3+5.78.某班级在一次身高测量中,第一小组10名学生的身高与全班学生平均身高170 cm的差分别是-4,-7,-8,-2,1,-10,15,10,7,-2.则这个小组10名学生的平均身高是________cm.【答案】170【解析】∵10人的总身高是170×10-4-7-8-2+1-10+15+10+7-2=1 700,∴10名学生的平均身高是=170.79.小李拟将1,2,3,…,n这n个数输入电脑求平均数,当他认为输入完毕时,电脑显示器只输入n-1个数,平均数为35,假设这n-1个数输入无误,则漏输的一个数是________.【答案】56【解析】由题意可得1+2+3+…+n-1<(n-1)<2+3+4+…+n,由等差数列的求和公式可得<(n-1)<,∴<<,解得69<n<71,∴n=70或71.又∵(n-1)为正数,∴n=71,∴漏输的数为-70×=56.80.一个样本1,3,2,5,x,它的平均数是3,则x=________.【答案】4【解析】因为样本平均数是3,所以x=3×5-1-3-2-5,即x=4.81.茎叶图记录了甲、乙两组各四名同学的植树棵数,乙组记录中有一个数据模糊,无法确认,在图中用x表示.若甲组的平均数比乙组多2棵,则x=________.【答案】5【解析】由茎叶图,甲组四名同学的植树棵数为9,9,11,11,甲组的平均数为10,乙组四名同学的植树棵数为x,8,9,10,乙组的平均数为(x+8+9+10)=(x+27),由已知,10-(x+27)=2,解得x=5.82.五个数1,2,3,4,a的平均数是3,则a=_________________________________.【答案】5【解析】由题意知,=3,∴10+a=15,∴a=5.83.已知2,4,2x,4y四个数的平均数是5,而5,7,4x,6y四个数的平均数是9,则xy的值是________.【答案】6【解析】因为2,4,2x,4y四个数的平均数是5,则2+4+2x+4y=4×5,又由5,7,4x,6y四个数的平均数是9,则5+7+4x+6y=4×9,x与y满足的关系式为解得所以xy=6.84.数据1,2,x,-1,-2的平均数是1,则这组数据的中位数是________.【答案】1【解析】由题意可知,(1+2+x-1-2)÷5=1,解得x=5,这组数据从小到大排列-2,-1,1,2,5,∴中位数是1.85.为了了解“预防禽流感疫苗”的使用情况,某市卫生部门对本地区5月份至7月份使用疫苗的所有养鸡场进行了调查,根据下列图表提供的信息,可以得出这三个月本地区平均每月注射了疫苗的鸡的数量为________万只.【答案】90【解析】5月份注射疫苗的鸡的数量是20×1=20(万只),6月份注射疫苗的鸡的数量是50×2=100(万只),7月份注射疫苗的鸡的数量是100×1.5=150(万只),这三个月本地区平均每月注射了疫苗的鸡的数量为=90(万只).86.某媒体在调查某中学学生日睡眠情况活动中,得到一个班的数据如下:则该班学生日睡眠时间平均为________小时.【答案】7.52【解析】三、解答题(共12小题,每小题12.0分,共144分)87.某市对上、下班交通情况做抽样调查,上、下班时间各抽取了12辆机动车行驶时速如下(单位:km/h):上班时速:30,33,18,27,32,40,26,28,21,28,35,20.下班时速:27,19,32,29,36,29,30,22,25,16,17,30.用茎叶图表示上面的数据,并求出样本数据的中位数.【答案】解以十位数为茎,个位数为叶,作出茎叶图由图可见,上班时间行驶时速的中位数是=28;下班时间行驶时速的中位数是=28.【解析】88.某校八年级(1)班50名学生参加2016年贵阳市数学质量检测考试,全班学生的成绩统计如下表:请根据表中提供的信息解答下列问题:(1)该班学生考试成绩的众数是________;(2)该班学生考试成绩的中位数________;(3)该班张华同学在这次考试中的成绩是83分,能不能说张华同学的成绩处于全班中游偏上水平?试说明理由.【答案】解(1)88出现的次数最多,所以众数是88.(2)排序后第25,26个数据的平均数是86,所以中位数是86.(3)用样本来估计总体不能说张华的成绩处于中游偏上的水平,因为全班成绩的中位数是86,83分低于全班成绩的中位数,张华同学的成绩处于全班中游偏下水平.【解析】89.某班进行个人投篮比赛,受污损的下表记录了在规定时间内投进n个球的人数分布情况:同时,已知进球3个或3个以上的人平均每人投进3.5个球,进球4个或4个以下人平均每人投进2.5个球.那么投进3个球和4个球的各有多少人?【答案】解设投进3个球和4个球的各有x,y人,则即解得即投进3个球和4个球的分别有9人和3人.【解析】90.某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示,其中茎为十位数,叶为个位数.(1)根据茎叶图计算样本均值;(2)日加工零件个数大于样本均值的工人为优秀工人.根据茎叶图推断该车间12名工人中有几名优秀工人?【答案】解(1)样本均值为=22.(2)抽取的6名工人中有2名为优秀工人,所以12名工人中有4名优秀工人.【解析】91.某课外活动小组对该市空气含尘调查,下面是一天每隔两小时测得的数据:0.03,0.03,0.04,0.05,0.01,0.03(单位G/M3).。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一.随机抽样1.随机抽样:满足每个个体被抽到的机会是均等的抽样,共有三种经常采用的随机抽样方法:⑴简单随机抽样:从元素个数为N 的总体中不放回地抽取容量为n 的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样. 抽出办法:①抽签法:用纸片或小球分别标号后抽签的方法.②随机数表法:随机数表是使用计算器或计算机的应用程序生成随机数的功能生成的一张数表.表中每一位置出现各个数字的可能性相同. 随机数表法是对样本进行编号后,按照一定的规律从随机数表中读数,并取出相应的样本的方法.简单随机抽样是最简单、最基本的抽样方法.⑵系统抽样:将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本的抽样方法.抽出办法:从元素个数为N 的总体中抽取容量为n 的样本,如果总体容量能被样本容量整除,设Nk n=,先对总体进行编号,号码从1到N ,再从数字1到k 中随机抽取一个数s 作为起始数,然后顺次抽取第2(1)s k s k s n k +++-L ,,,个数,这样就得到容量为n 的样本.如果总体容量不能被样本容量整除,可随机地从总体中剔除余数,然后再按系统抽样方法进行抽样.系统抽样适用于大规模的抽样调查,由于抽样间隔相等,又被称为等距抽样.⑶分层抽样:当总体有明显差别的几部分组成时,要反映总体情况,常采用分层抽样,使总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样,这种抽样方法叫做分层抽样.分层抽样的样本具有较强的代表性,而且各层抽样时,可灵活选用不同的抽样方法,应用广泛.2.简单随机抽样必须具备下列特点:⑴简单随机抽样要求被抽取的样本的总体个数N 是有限的. ⑵简单随机样本数n 小于等于样本总体的个数N . ⑶简单随机样本是从总体中逐个抽取的. ⑷简单随机抽样是一种不放回的抽样.⑸简单随机抽样的每个个体入样的可能性均为nN.3.系统抽样时,当总体个数N 恰好是样本容量n 的整数倍时,取Nk n=;若Nn不是整数时,先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量n 整除.因为每个个体被剔除的机会相等,因而整个抽样过程中每个个体被抽取的机会仍知识内容板块四.统计数据的数字特征然相等,为N n.二.频率直方图列出样本数据的频率分布表和频率分布直方图的步骤:①计算极差:找出数据的最大值与最小值,计算它们的差;②决定组距与组数:取组距,用极差组距决定组数;③决定分点:决定起点,进行分组;④列频率分布直方图:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.⑤绘制频率分布直方图:以数据的值为横坐标,以频率组距的值为纵坐标绘制直方图,知小长方形的面积=组距×频率组距=频率.频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,频率分布直方图可以用一条光滑曲线()y f x =来描绘,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域内取值的规律.三.茎叶图制作茎叶图的步骤:①将数据分为“茎”、“叶”两部分;②将最大茎与最小茎之间的数字按大小顺序排成一列,并画上竖线作为分隔线; ③将各个数据的“叶”在分界线的一侧对应茎处同行列出.四.统计数据的数字特征用样本平均数估计总体平均数;用样本标准差估计总体标准差. 数据的离散程序可以用极差、方差或标准差来描述.极差又叫全距,是一组数据的最大值和最小值之差,反映一组数据的变动幅度; 样本方差描述了一组数据平均数波动的大小,样本的标准差是方差的算术平方根. 一般地,设样本的元素为12n x x x L ,,,样本的平均数为x , 定义样本方差为222212()()()n x x x x x x s n-+-++-=L ,样本标准差22212()()()n x x x x x x s n-+-++-=L 简化公式:22222121[()]n s x x x nx n=+++-L .五.独立性检验1.两个变量之间的关系;常见的有两类:一类是确定性的函数关系;另一类是变量间存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有一定随机性的.当一个变量取值一定时,另一个变量的取值带有一定随机性的两个变量之间的关系叫做相关关系. 2.散点图:将样本中的n 个数据点()(12)i i x y i n =L ,,,,描在平面直角坐标系中,就得到了散点图.散点图形象地反映了各个数据的密切程度,根据散点图的分布趋势可以直观地判断分析两个变量的关系.3.如果当一个变量的值变大时,另一个变量的值也在变大,则这种相关称为正相关;此时,散点图中的点在从左下角到右上角的区域.反之,一个变量的值变大时,另一个变量的值由大变小,这种相关称为负相关.此时,散点图中的点在从左上角到右下角的区域.散点图可以判断两个变量之间有没有相关关系.4.统计假设:如果事件A 与B 独立,这时应该有()()()P AB P A P B =,用字母0H 表示此式,即0:()()()H P AB P A P B =,称之为统计假设. 5.2χ(读作“卡方”)统计量:统计学中有一个非常有用的统计量,它的表达式为22112212211212()n n n n n n n n n χ++++-=,用它的大小可以用来决定是否拒绝原来的统计假设0H .如果2χ的值较大,就拒绝0H ,即认为A 与B 是有关的.2χ统计量的两个临界值:3.841、6.635;当2 3.841χ>时,有95%的把握说事件A 与B 有关;当2 6.635χ>时,有99%的把握说事件A 与B 有关;当2 3.841χ≤时,认为事件A 与B 是无关的.独立性检验的基本思想与反证法类似,由结论不成立时推出有利于结论成立的小概率事件发生,而小概率事件在一次试验中通常是不会发生的,所以认为结论在很大程度上是成立的. 1.独立性检验的步骤:统计假设:0H ;列出22⨯联表;计算2χ统计量;查对临界值表,作出判断.2.几个临界值:222()0.10( 3.841)0.05( 6.635)0.01P P P χχχ≈≈≈≥2.706,≥,≥.22⨯联表的独立性检验:如果对于某个群体有两种状态,对于每种状态又有两个情况,这样排成一张22⨯的表,如下:状态B 状态B 合计 状态A 11n 12n 1n + 状态A21n 22n 2n +1n +2n +n如果有调查得来的四个数据11122122n 4个数据来检验上述的两种状态A 与B 是否有关,就称之为22⨯联表的独立性检验.六.回归分析1.回归分析:对于具有相关关系的两个变量进行统计分析的方法叫做回归分析,即回归分析就是寻找相关关系中这种非确定关系的某种确定性. 回归直线:如果散点图中的各点都大致分布在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. 2.最小二乘法:记回归直线方程为:ˆy a bx =+,称为变量Y 对变量x 的回归直线方程,其中a b ,叫做回归系数.ˆy是为了区分Y 的实际值y ,当x 取值i x 时,变量Y 的相应观察值为i y ,而直线上对应于i x 的纵坐标是ˆi i ya bx =+. 设x Y ,的一组观察值为()i i x y ,,12i n =L ,,,,且回归直线方程为ˆya bx =+,当x 取值i x 时,Y 的相应观察值为i y ,差ˆ(12)i i y y i n -=L ,,,刻画了实际观察值i y 与回归直线上相应点的纵坐标之间的偏离程度,称这些值为离差.我们希望这n 个离差构成的总离差越小越好,这样才能使所找的直线很贴近已知点.记21()ni i i Q y a bx ==--∑,回归直线就是所有直线中Q 取最小值的那条.这种使“离差平方和为最小”的方法,叫做最小二乘法.用最小二乘法求回归系数a b ,有如下的公式:1221ˆni ii nii x ynxy bxnx ==-=-∑∑,ˆˆa y bx =-,其中a b ,上方加“^”,表示是由观察值按最小二乘法求得的回归系数.3.线性回归模型:将用于估计y 值的线性函数a bx +作为确定性函数;y 的实际值与估计值之间的误差记为ε,称之为随机误差;将y a bx ε=++称为线性回归模型. 产生随机误差的主要原因有:①所用的确定性函数不恰当即模型近似引起的误差; ②忽略了某些因素的影响,通常这些影响都比较小; ③由于测量工具等原因,存在观测误差. 4.线性回归系数的最佳估计值:利用最小二乘法可以得到ˆˆab ,的计算公式为 1122211()()()()nnii iii i nniii i xx y y x ynxybxx xn x ====---==--∑∑∑∑$,ˆˆa y bx =-,其中11n i i x x n ==∑,11nii y y n ==∑ 由此得到的直线ˆˆya bx =+$就称为回归直线,此直线方程即为线性回归方程.其中ˆa ,b $分别为a ,b 的估计值,ˆa称为回归截距,b $称为回归系数,ˆy 称为回归值. 5.相关系数: 2222221111()()()()(())(())nnii i innn nii i i i i i i xx y y x ynx yr xx y y x n x y n y ====---==-⋅---∑∑∑∑∑∑6.相关系数r 的性质:⑴||1r ≤;⑵||r 越接近于1,x y ,的线性相关程度越强; ⑶||r 越接近于0,x y ,的线性相关程度越弱.可见,一条回归直线有多大的预测功能,和变量间的相关系数密切相关. 7.转化思想:根据专业知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数. 8.一些备案 ①回归(regression )一词的来历:“回归”这个词英国统计学家Francils Galton 提出来的.1889年,他在研究祖先与后代的身高之间的关系时发现,身材较高的父母,他们的孩子也较高,但这些孩子的平均身高并没有他们父母的平均身高高;身材较矮的父母,他们的孩子也较矮,但这些孩子的平均身高却比他们父母的平均身高高.Galton 把这种后代的身高向中间值靠近的趋势称为“回归现象”.后来,人们把由一个变量的变化去推测另一个变量的变化的方法称为回归分析.②回归系数的推导过程:22222[()]222i i i i i i i i Q y a bx y a y na b x y ab x b x =--=-+-++∑∑∑∑∑∑ 22222()2i i i i i i na a b x y b x b x y y =+-+-+∑∑∑∑∑,把上式看成a 的二次函数,2a 的系数0n >,因此当2()2i i i ib x y y b x a n n --=-=∑∑∑∑时取最小值. 同理,把Q 的展开式按b 的降幂排列,看成b 的二次函数,当2i iiix y a xb x-=∑∑∑时取最小值.解得:12221()()()ni iii i niii x ynxyx x y y b x x xnx==---==--∑∑∑∑,a y bx =-, 其中1i y y n =∑,1i x x n=∑是样本平均数. 9. 对相关系数r 进行相关性检验的步骤: ①提出统计假设0H :变量x y ,不具有线性相关关系;②如果以95%的把握作出推断,那么可以根据10.950.05-=与2n -(n 是样本容量)在相关性检验的临界值表中查出一个r 的临界值0.05r (其中10.950.05-=称为检验水平); ③计算样本相关系数r ;④作出统计推断:若0.05||r r >,则否定0H ,表明有95%的把握认为变量y 与x 之间具有线性相关关系;若0.05||r r ≤,则没有理由拒绝0H ,即就目前数据而言,没有充分理由认为变量y 与x 之间具有线性相关关系. 说明:⑴对相关系数r 进行显著性检验,一般取检验水平0.05α=,即可靠程度为95%.⑵这里的r 指的是线性相关系数,r 的绝对值很小,只是说明线性相关程度低,不一定不相关,可能是非线性相关的某种关系.⑶这里的r 是对抽样数据而言的.有时即使||1r =,两者也不一定是线性相关的.故在统计分析时,不能就数据论数据,要结合实际情况进行合理解释.题型一.数字特征的计算【例1】 (2010海淀二模)某校高中年级开设了丰富多彩的校本课程,甲、乙两班各随机抽取了5名学生的学分,用茎叶图表示(如右图).1s ,2s 分别表示甲、乙两班各自5名学生学分的标准差,则1s 2s .(填“>”、“<”或“=”)乙甲3407602125418典例分析【例2】 (2010崇文二模)甲、乙、丙三名射击运动员在某次测试中各射击20次,三人的测试成绩如下表123,,x x x 分别表示甲、乙、丙三名运动员这次测试成绩的平均数,则123,,x x x 的大小关系为 ;123,,s s s 分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则123,,s s s 的大小关系为 .【例3】 10个正数的平方和是370,方差是33,那么平均数为( )A .1B .2C .3D .4【例4】 若M 个数的平均数是X ,N 个数的平均数是Y ,则这M N +个数的平均数是( )A .2X Y +B .X Y M N ++C .MX NY M N ++D .MX NY X Y++【例5】 已知一组数据1210x x x L ,,,的方差是2,且2221210(3)(3)(3)380x x x -+-++-=L ,则这组数据的平均数x =__________.【例6】 求下列各组数据的方差与标准差(精确到0.1),并分析由这些结果可得出什么更一般的结论.⑴123456789;⑵111213141516171819; ⑶24681012141618【例7】 (2009上海18)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )A .甲地:总体均为3,中位数为4B .乙地:总体均值为1,总体方差大于0C .丙地:中位数为2,众数为3D .丁地:总体均值为2,总体方差为3甲的成绩 环数 7 8 9 10 频数5555乙的成绩 环数 7 8 9 10 频数6446丙的成绩 环数 7 8 9 10 频数4664【例8】(2009四川卷文)设矩形的长为a,宽为b,其比满足510.618b a-≈∶,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中.下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:甲批次:0.5980.6250.6280.5950.639乙批次:0.6180.6130.5920.6220.620根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是A.甲批次的总体平均数与标准值更接近B.乙批次的总体平均数与标准值更接近C.两个批次总体平均数与标准值接近程度相同D.两个批次总体平均数与标准值接近程度不能确定【例9】(2008上海9)已知总体的各个体的值由小到大依次为23371213.718.320a b,,,,,,,,,,且总体的中位数为10.5,若要使该总体的方差最小,则a、b的取值分别是.【例10】(2008山东9)从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为()分数54321人数2010303010A3B.210C.3 D.8【例11】两台机床同时生产直径为10的零件,为了检验产品质量,质量检验员从两台机床的产品中各抽出4件进行测量,结果如下:机床甲109.91010.2机床乙10.1109.910.1机床生产的零件质量更符合要求?。