数据分析初步讲义及习题
数据的分析知识归纳、经典例题及答案

数据的分析知识点归纳、经典例题及答案【知识梳理】1.解统计学的几个基本概念总体、个体、样本、样本容量是统计学中特有的规定,准确把握教材,明确所考查的对象是解决有关总体、个体、样本、样本容量问题的关键。
2.平均数当给出的一组数据,都在某一常数a 上下波动时,一般选用简化平均数公式'x x a =+,其中a 是取接近于这组数据平均数中比较“整”的数;•当所给一组数据中有重复多次出现的数据,常选用加权平均数公式。
3.众数与中位数平均数、众数、中位数都是用来描述数据集中趋势的量。
平均数的大小与每一个数据都有关,任何一个数的波动都会引起平均数的波动,当一组数据中有个数据太高或太低,用平均数来描述整体趋势则不合适,用中位数或众数则较合适。
中位数与数据排列有关,个别数据的波动对中位数没影响;当一组数据中不少数据多次重复出现时,可用众数来描述。
4.极差用一组数据中的最大值减去最小值所得的差来反映这组数据的变化范围,用这种方法得到的差称为极差,极差=最大值-最小值。
5.方差与标准差用“先平均,再求差,然后平方,最后再平均”得到的结果表示一组数据偏离平均值的情况,这个结果叫方差,计算公式是s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2];方差和标准差都是反映一组数据的波动大小的一个量,其值越大,波动越大,也越不稳定或不整齐。
【能力训练】一、填空题:1.甲、乙、丙三台包装机同时分装质量为400克的茶叶.从它们各自分装的茶叶中分别随机抽取了10盒,测得它们的实际质量的方差如下表所示:2.甲、乙、丙三台机床生产直径为60mm 的螺丝,为了检验产品质量,从三台机床生产的螺丝中各抽查了20个测量其直径,进行数据处理后,发现这三组数据的平均数都是60mm ,它们的方差依次为S 2甲=0.162,S 2乙=0.058,S 2丙=0.149.根据以上提供的信息,你认为生产螺丝质量最好的是____机床。
《数据的分析》复习巩固基础提高知识点讲解及练习题解析

数据的分析——巩固练习【巩固练习】一.选择题1.(2015•衢州)某班七个兴趣小组人数分别为4,4,5,x,6,6,7.已知这组数据的平均数是5,则这组数据的中位数是( )A.7 B.6 C.5 D.42.8名学生在一次数学测试中的成绩为80,82,79,69,74,78,,81,这组成绩的平均数是77,则的值为( ).A.76 B.75 C.74 D.733.有8个数的平均数是11,还有12个数的平均数是12,则这20个数的平均数是( ).A.11.6 B.232 C.23.2 D.11.54. 某班体育委员记录了第一小组七位同学定点投篮(每人投10次)的情况,投进篮筐的个数为6,10,5,3,4,8,4,这组数据的中位数和极差分别是( ). A.4,7 B.7,5 C.5,7 D.3,75. 一组数据的方差为,将这组数据中的每个数都除以2,所得新数据的方差是( ). A.B. C. D.6. 已知一组数据,,,,的平均数是2,方差是,那么另一组数据,,,,的平均数和方差分别为( ).A.2,B.2,1 C.4, D.4,3二.填空题7.(2015•安顺)一组数据2,3,x ,5,7的平均数是4,则这组数据的众数是 .8.数据1、2、4、4、3、5、l 、4、4、3、2、3、4、5,它们的众数是____、中位数是____、平均数是_______. 9. 给出一组数据:23,22,25,23,27,25,23,则这组数据的中位数是______;方差是______ (精确到0.1).10.在数据-1,0,4,5,8中插入一个数据,使得该数据组的中位数为3,则=________.11.某次射击训练中,一小组的成绩如下表所示:环数6789人数132若该小组的平均成绩为7.7环,则成绩为8环的人数为_________.12.甲、乙两人比赛射飞镖,两人所得的平均环数相同,其中甲所得环数的方差为13,乙所得环数如下:2,5,6,9,8,则成绩比较稳定的是________.三.解答题13. 一家公司打算招聘一名英文翻译,对甲、乙两名应试者进行了听、说、读、写的英语水平测试.他们的各项成绩(百分制)如下:应试者听说读写x x 2s 212s 22s 214s 24s 1x 2x 3x 4x 5x 13132x -232x -332x -432x -532x -1323x x甲85837875乙73808582(1)如果这家公司想招一名口语能力较强的翻译,听、说、读、写成绩按照3:3:2:2的比确定,计算两名应试者的平均成绩(百分制).从他们的成绩看,应该录取谁?(2)如果这家公司想招一名笔译能力较强的翻译,听、说、读、写成绩按照2:2:3:3的比确定,计算两名应试者的平均成绩(百分制).从他们的成绩看,应该录取谁? 14. 甲、乙两名学生进行射击练习,两人在相同条件下各射10次,将射击结果作统计分析,如下表所示:命中环数5678910平均数众数方差甲命中环数的次数14211176 2.2乙命中环数的次数12421(1)请你填上表中乙学生的相关数据;(2)根据你所学的统计知识,利用上述某些数据评价甲、乙两人的射击水平.15.(2015•桐庐)2014年5月某日,浙江省11个城市的空气质量指数(AQI)如图所示:(1)这11个城市当天的空气质量指数的众数是 60 ;中位数是 55 ;(2)当0≤AQI≤50时,空气质量为优.若在这11个城市中随机抽取一个,求抽到的城市这一天空气质量为优的概率;(3)求杭州、宁波、嘉兴、温州、湖州五个城市当天的空气质量指数的平均数.【答案与解析】一.选择题1.【答案】C;【解析】∵某班七个兴趣小组人数分别为4,4,5,x,6,6,7.已知这组数据的平均数是5,∴x=5×7﹣4﹣4﹣5﹣6﹣6﹣7=3,∴这一组数从小到大排列为:3,4,4,5,6,6,7,∴这组数据的中位数是:5.故选C.2.【答案】D;【解析】由题意,解得.3.【答案】A; 【解析】4.【答案】C ;【解析】把这组数据按从小到大的顺序排列为3,4,4,5,6,8,10,则中位数为5,极差为10-3=7.5.【答案】C;6.【答案】D;【解析】本题可用公式直接计算.虽然此类题可由方差的定义求得,但这道题可推广为:若,…,的平均数是,方差为,则,,…,的平均数为,方差不变;,…,的平均数为,方差为,因此,,的平均数为,方差为,这个结论可直接运用到填空题或选择题.二.填空题7.【答案】解:利用平均数的计算公式,得(2+3+x+5+7)=4×5,解得x=3,则这组数据的众数即出现最多的数为3.故答案为:3.8.【答案】4;3.5;3.21;【解析】 数据中4出现了5次,出现的次数最多,所以众数是4;把数据重新排列,最中间的两个数是3和4,所以这组数据的中位数是3.5;这组数据的平均数是.9.【答案】23 2.6;【解析】先把这组数据按照从小到大的顺序排列,不难发现处于中间的数是23,然后求出平均数是24,再利用公式便可求出方差约为2.6.10.【答案】2 ;11.【答案】4;【解析】设成绩为8环的人数为,则.12.【答案】乙; 【解析】由题意知=6,,则乙的成绩比较稳定.三.解答题13.【解析】解:(1)听、说、读、写的成绩按3:3:2:2的比确定,80827969747881778x +++++++=73x =118121211.620⨯+⨯=2222121[()()()]n s x x x x x x n=-+-++- 12,x x n x x 2s 1x a ±2x a ±n x a ±x a ±12,kx kx n kx k x 22k s 1kx a +2kx a +n kx a +k x a +22k s 1(2122334552) 3.2114x =⨯+⨯+⨯+⨯+⨯=2222121[()()()]n s x x x x x x n=-+-++- x 6218187.7,4132x x x +++==+++22=6s s <乙甲则甲的平均成绩为:(分).乙的平均成绩为:(分). 显然甲的成绩比乙高,所以从成绩看,应该录取甲. (2)听、说、读、写的成绩按照2:2:3:3的比确定,则甲的平均成绩为:(分).乙的平均成绩为:(分). 显然乙的成绩比甲高,所以从成绩看,应该录取乙.14.【解析】解:乙命中10环的次数为0;乙所命中环数的众数为7,其平均数为;故其方差为. 甲、乙两人射击水平的评价:①从成绩的平均数与众数看,甲与乙的成绩相差不多;②从成绩的稳定性看,,乙的成绩波动小,比较稳定;③从良好率(成绩在8环或8环以上)看,甲、乙两人成绩相同;④从优秀率看(成绩在9环及9环以上)看,甲的成绩比乙的成绩好.15.【解析】解:(1)将11个数据按从小到大的顺序排列为:37,42,43,49,52,55,60,60,63,75,80,60出现了两次,次数最多,所以众数是60,第6个数是55,所以中位数是55.故答案为60,55;(2)∵当0≤AQI ≤50时,空气质量为优,由图可知,这11个城市中当天的空气质量为优的有4个,∴若在这11个城市中随机抽取一个,抽到的城市这一天空气质量为优的概率为;(3)杭州、宁波、嘉兴、温州、湖州五个城市当天的空气质量指数的平均数为:(75+63+60+80+52)÷5=66.853*********813322⨯+⨯+⨯+⨯=+++73380385282279.33322⨯+⨯+⨯+⨯=+++852*********79.52233⨯+⨯+⨯+⨯=+++73280285382380.72233⨯+⨯+⨯+⨯=+++5162748291710x ⨯+⨯+⨯+⨯+⨯==乙22221[(57)2(67)(97)] 1.210s =⨯-+-++-= 乙22s s >乙甲数据的分析——知识讲解【学习目标】1、了解加权平均数的意义和求法,会求一组数据的平均数,体会用样本平均数估计总体平均数的思想.2、了解中位数和众数的意义,掌握它们的求法.进一步理解平均数、中位数和众数所代表的不同的数据特征.3、了解极差、方差和标准差的意义及求法,体会它们在刻画数据波动时的不同特征.体会用样本方差估计总体方差的思想,掌握分析数据的思想和方法.4、从事收集、整理、描述和分析数据得出结论的统计活动,经历数据处理的基本过程,体验统计与生活的联系,感受统计在生活和生产中的作用,养成用数据说话的习惯.【要点梳理】要点一、算术平均数和加权平均数一般地,对于个数,我们把叫做这个数的算术平均数,简称平均数,记作.计算公式为.要点诠释:平均数表示一组数据的“平均水平”,反映了一组数据的集中趋势.(1)当一组数据较大时,并且这些数据都在某一常数附近上、下波动时,一般选用简化计算公式.其中为新数据的平均数,为取定的接近这组数据的平均数的较“整”的数.(2)平均数的大小与一组数据里的每个数据均有关系,其中任一数据的变动都会相应引起平均数的变动.所以平均数容易受到个别特殊值的影响.若个数的权分别是,则叫做这个数的加权平均数.要点诠释:(1)相同数据的个数叫做权,越大,表示的个数越多,“权”就越重. 数据的权能够反映数据的相对“重要程度”.(2)加权平均数实际上是算术平均数的另一种表现形式,是平均数的简便运算. 要点二、中位数和众数1.中位数一般地,n 个数据按照大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.要点诠释:(1)一组数据的中位数是唯一的;一组数据的中位数不一定出现在这组数据中. (2)由一组数据的中位数可以知道中位数以上和以下数据各占一半.2.众数一组数据中出现次数最多的那个数据叫做这组数据的众数.要点诠释:(1)一组数据的众数一定出现在这组数据中;一组数据的众数可能不止一个.(2)众数是一组数据中出现次数最多的数据而不是数据出现的次数.n 123n x x x x 、、、…()1231n x x x x n⋅⋅⋅++++n x ()1231n x x x x x n=⋅⋅⋅++++a x x a '=+x 'a n 12n x x x 、、…12n w w w 、、…、112212......n nnx w x w x w w w w ++++++n i x i w i w i x要点三、平均数、中位数与众数的联系与区别联系:平均数、众数、中位数都是用来描述数据集中趋势的量,其中以平均数最为重要.区别:平均数的大小与每一个数据都有关,任何一个数的波动都会引起平均数的波动,当一组数据中有个别数据太高或太低,用平均数来描述整体趋势则不合适,用中位数或众数则较合适.中位数与数据排列位置有关,个别数据的波动对中位数没影响;众数主要研究各数据出现的频数,当一组数据中不少数据多次重复出现时,可用众数来描述.要点四、极差、方差和标准差1.极差一组数据中最大数据与最小数据的差,称为极差,极差=最大数据-最小数据.要点诠释:极差是最简单的一种度量数据波动情况的量,它受极端值的影响较大.一组数据极差越小,这组数据就越稳定.2.方差方差是各个数据与平均数差的平方的平均数.方差的计算公式是:,其中,是,,…的平均数. 要点诠释:(1)方差反映的是一组数据偏离平均值的情况.方差越大,数据的波动越大;方差越小,数据的波动越小.(2)一组数据的每一个数都加上(或减去)同一个常数,所得的一组新数据的方差不变.(3)一组数据的每一个数据都变为原来的倍,则所得的一组新数据的方差变为原来的倍.3.标准差方差的算术平方根叫做这组数据的标准差,用符号表示,即: ;标准差的数量单位与原数据一致.4.极差、方差和标准差的联系与区别联系:极差与方差、标准差都是表示一组数据离散程度的特征数.区别:极差表示一组数据波动范围的大小,它受极端数据的影响较大;方差反映了一组数据与其平均值的离散程度的大小.方差越大,稳定性也越小;反之,则稳定性越好.所以一般情况下只求一组数据的波动范围时用极差,在考虑到这组数据的稳定性时用方差.要点五、用样本估计总体在考察总体的平均水平或方差时,往往都是通过抽取样本,用样本的平均水平或方差近似估计得到总体的平均水平或方差.要点诠释:(1)如果总体数量太多,或者从总体中抽取个体的试验带有破坏性,都应该抽取样本.取样必须具有尽可能大的代表性.(2)用样本估计总体时,样本容量越大,样本对总体的估计也越精确.样本容量的确定既要考虑问题本身的需要,又要考虑实现的可能性所付出的代价.【典型例题】类型一、平均数、中位数、众数2s ()[]222212(...)(1x x x x x x nS n -++-+-=x 1x 2x n x k 2k s1、(2015•福州)若一组数据1,2,3,4,x 的平均数与中位数相同,则实数x 的值不可能是( )A .0B .2.5C .3D .5【答案与解析】解:(1)将这组数据从小到大的顺序排列为1,2,3,4,x ,处于中间位置的数是3,∴中位数是3,平均数为(1+2+3+4+x )÷5,∴3=(1+2+3+4+x )÷5,解得x=5;符合排列顺序;(2)将这组数据从小到大的顺序排列后1,2,3,x ,4,中位数是3,此时平均数是(1+2+3+4+x )÷5=3,解得x=5,不符合排列顺序;(3)将这组数据从小到大的顺序排列后1,x ,2,3,4,中位数是2,平均数(1+2+3+4+x )÷5=2,解得x=0,不符合排列顺序;(4)将这组数据从小到大的顺序排列后x ,1,2,3,4,中位数是2,平均数(1+2+3+4+x )÷5=2,解得x=0,符合排列顺序;(5)将这组数据从小到大的顺序排列后1,2,x ,3,4,中位数,x ,平均数(1+2+3+4+x )÷5=x ,解得x=2.5,符合排列顺序;∴x 的值为0、2.5或5.故选C .【总结升华】考查了确定一组数据的中位数,涉及到分类讨论思想,较难,要明确中位数的值与大小排列顺序有关,一些学生往往对这个概念掌握不清楚,计算方法不明确而解答不完整.注意找中位数的时候一定要先排好顺序,然后再根据奇数和偶数个来确定中位数.如果数据有奇数个,则正中间的数字即为所求;如果是偶数个,则找中间两位数的平均数举一反三:【高清课堂 数据的分析 例8】【变式】若数据3.2,3.4,3.2,,3.9,3.7的中位数是3.5,则其众数是________,平均数是________.【答案】3.2;3.5;解:由题意,所以众数是3.2,平均数是3.5.2、某校欲招聘一名数学教师,学校对甲、乙、丙三位候选人进行了三项能力测试,各项测试成绩满分均为100分,根据结果择优录用.三位候选人的各项测试成绩如下表所示:测试成绩测试项目甲乙丙教学能力857373科研能力707165组织能力647284(1)如果根据三项测试的平均成绩,谁将被录用,说明理由;x 3.43.5, 3.62x x +==(2)根据实际需要,学校将教学、科研和组织三项能力测试得分按5:3:2的比例确定每人的成绩,谁将被录用,说明理由.【思路点拨】(1)运用求平均数公式即可求出三人的平均成绩,比较得出结果;(2)将三人的成绩按比例求出测试成绩,比较得出结果.【答案与解析】解:(1)甲的平均成绩为:(85+70+64)÷3=73,乙的平均成绩为:(73+71+72)÷3=72,丙的平均成绩为:(73+65+84)÷3=74,∴丙将被录用.(2)甲的测试成绩为:(85×5+70×3+64×2)÷(5+3+2)=76.3,乙的测试成绩为:(73×5+71×3+72×2)÷(5+3+2)=72.2,丙的测试成绩为:(73×5+65×3+84×2)÷(5+3+2)=72.8,∴甲将被录用.【总结升华】5、3、2即各个数据的“权”,反映了各个数据在这组数据中的重要程度,按加权平均数来录用.举一反三:【高清课堂 数据的分析 例10】【变式】小王在八年级第一学期的数学成绩分别为:测验一得89分,测验二得78分,测验三得85分,期中考试得90分,期末考试得87分,如果按照平时、期中、期末的10%、30%、60%量分,那么小王该学期的总评成绩应该为多少?【答案】解:小王平时测试的平均成绩(分).所以(分).答:小王该学期的总评成绩应该为87.6分.【高清课堂 数据的分析 例11】3、下表是七年级(2)班30名学生期中考试数学成绩表(已破损).已知该班学生期中考试数学成绩平均分是76分. (1)求该班80分和90分的人数分别是多少?(2)设此班30名学生成绩的众数为,中位数为,求的值.【答案与解析】解:(1)设该班得80分的有人,得90分的有人.根据题意和平均数的定义,得()1231n x x x x n⋅⋅⋅++++897885843x ++==8410%9030%8760%87.610%30%60%⨯+⨯+⨯=++a b a b +x y 257330,763050260570780901003,x y x y +++++=⎧⎨⨯=⨯+⨯+⨯+++⨯⎩整理得 解得 即该班得80分的有8人,得90分的有5人.(2)因为80分出现8次且出现次数最多.所以=80,第15、16两个数均为80分,所以=80,则=80+80=160. 【总结升华】本题为统计题,考查平均数、众数与中位数的意义.解题的关键是准确理解题意,建立等量关系.举一反三:【变式】某教师为了对学生零花钱的使用进行教育指导,对全班50名学生每人一周内的零花钱数额进行了调查统计,并绘制了统计图表如图所示的统计图.零花钱数额(元)5101520学生个数(个)a15205请根据图表中的信息,回答以下问题.(1)求的值;(2)求这50名学生每人一周内的零花钱额的众数和平均数.【答案】解:(1) =50-15-20-5=10.(2)众数是15.平均数为(5×10+10×15+15×20+20×5)=12.类型二、极差、方差和标准差4、(2015•徐州)某中学开展“唱红歌”比赛活动,九年级(1)、(2)班根据初赛成绩,各选出5名选手参加复赛,两个班各选出的5名选手的复赛成绩如图所示.13,89109,x y x y +=⎧⎨+=⎩8,5.x y =⎧⎨=⎩a b a b +a a 150(1)根据图示填写下表;班级平均数(分)中位数(分)众数(分)九(1)85九(2)85100(2)结合两班复赛成绩的平均数和中位数,分析哪个班级的复赛成绩较好;(3)计算两班复赛成绩的方差.【思路点拨】(1)观察图分别写出九(1)班和九(2)班5名选手的复赛成绩,然后根据中位数的定义和平均数的求法以及众数的定义求解即可;(2)在平均数相同的情况下,中位数高的成绩较好;(3)根据方差公式计算即可:s2=[(x1﹣)2+(x2﹣)2+…+(x n﹣)2](可简单记忆为“等于差方的平均数”)【答案与解析】解:(1)由图可知九(1)班5名选手的复赛成绩为:75、80、85、85、100,九(2)班5名选手的复赛成绩为:70、100、100、75、80,∴九(1)的平均数为(75+80+85+85+100)÷5=85,九(1)的中位数为85,九(1)的众数为85,把九(2)的成绩按从小到大的顺序排列为:70、75、80、100、100,∴九(2)班的中位数是80;班级平均数(分)中位数(分)众数(分)九(1)858585九(2)8580100(2)九(1)班成绩好些.因为九(1)班的中位数高,所以九(1)班成绩好些.(回答合理即可给分)(3),【总结升华】本题考查了中位数、众数以及平均数的求法,同时也考查了方差公式,解题的关键是牢记定义并能熟练运用公式.举一反三:【高清课堂数据的分析 例12】【变式】某工厂甲、乙两名工人参加操作技能培训.现分别从他们在培训期间参加的若干次测试成绩中随机抽取8次,数据如下(单位:分)甲9582888193798478乙8375808090859295(1)请你计算这两组数据的平均数、中位数;(2)现要从中选派一人参加操作技能比赛,从统计学的角度考虑,你认为选派哪名工人参加合适?请说明理由.【答案】解:(分), (分). 甲、乙两组数据的中位数分别为83分、84分.(2)由(1)知分,所以,.①从平均数看,甲、乙均为85分,平均水平相同;②从中位数看,乙的中位数大于甲,乙的成绩好于甲;③从方差来看,因为,,所以甲的成绩较稳定;④从数据特点看,获得85分以上(含85分)的次数,甲有3次,而乙有4次,故乙的成绩好些;⑤从数据的变化趋势看,乙后几次的成绩均高于甲,且呈上升趋势,因此乙更具潜力.综上分析可知,甲的成绩虽然比乙稳定,但从中位数、获得好成绩的次数及发展势头等方面分析,乙具有明显优势,所以应派乙参赛更有望取得成绩.类型三、统计思想5、我国是世界上严重缺水的国家之一.为了倡导“节约用水从我做起”,小刚在他所在班的50名同学中,随机调查了10名同学家庭中一年的月均用水量(单位:t),并将调查结果绘成了如图所示的条形统计图.(1)求这10个样本数据的平均数、众数和中位数;(2)根据样本数据,估计小刚所在班50名同学家庭中月均用水量不超过7t 的约有多少户.【思路点拨】(1)根据条形统计图,即可知道每一名同学家庭中一年的月均用水量.再根据加权平均数的计算方法、中位数和众数的概念进行求解;(2)首先计算样本中家庭月均用水量不超过7t 的用户所占的百分比,再进一步估计总体.【答案与解析】解:(1)观察条形图,可知这组样本数据的平均数是.1(9582888193798478)858x =+++++++=甲1(8375808090859295)858x =+++++++=乙85x x ==甲乙22221[(9585)(8285)(7885)]35.58s =-+-++-= 甲22221[(8385)(7585)(9585)]418s =-+-++-= 乙x x =甲乙22s s <乙甲62 6.54717.5281 6.810x ⨯+⨯+⨯+⨯+⨯==∴这组样本数据的平均数为6.8.∴在这组样本数据中,6.5出现了4次,出现的次数最多.∴这组数据的众数是6.5.∵将这组样本数据按从小到大的顺序排列,其中处于中间的两个数都是6.5,有. ∴这组数据的中位数是6.5.(2)∵10户中月均用水量不超过7t 的有7户,有.∴根据样本数据,可以估计出小刚所在班50名同学家庭中月均用水量不超过7t 的约有35户.【总结升华】本题考查的是条形统计图的运用.读懂统计图,从统计图中得到必要的信息是解决问题的关键.条形统计图能清楚地表示出每个项目的数据.掌握平均数、中位数和众数的计算方法.6.5 6.5 6.52+=7503510⨯=。
(完整版)数据分析基础练习

(完整版)数据分析基础练习
介绍
本文档旨在提供一个完整的数据分析基础练,帮助读者进一步理解数据分析的基本概念和技巧。
在本练中,我们将使用一个虚构的销售数据集进行分析,并回答一系列与数据相关的问题。
数据集
我们将使用以下字段的销售数据集进行练:
- 订单号(OrderID): 订单的唯一标识符
- 产品名称(ProductName): 销售的产品名称
- 产品类别(Category): 产品所属的类别
- 销售区域(Region): 销售发生的地区
- 销售额(Sales): 销售金额
- 销售日期(Date): 销售发生的日期
分析问题
在练过程中,我们将回答以下问题:
1. 数据集中包含多少个订单?
2. 有多少个不同的产品被销售?
3. 在销售额最高的产品中,有哪个产品类别占据主导地位?
4. 哪个销售区域的销售额最高?哪个销售区域的销售额最低?
5. 在给定日期范围内的销售总额是多少?
数据分析步骤
以下是完成练的基本步骤:
1. 导入数据集到合适的分析环境中(如Python或R)。
2. 理解数据集的结构和字段含义。
3. 对数据集进行数据清洗,如处理缺失值和异常值。
4. 计算并回答上述问题。
5. 可选:可视化数据以更好地理解分析结果。
总结
通过这个数据分析基础练,读者可以研究如何使用常用的数据分析技术来回答与数据相关的问题。
这将为进一步的数据分析工作奠定坚实的基础。
> 注意:以上步骤仅为示范,实际数据分析过程可能因数据集和问题而异。
第10讲 数据的初步分析 培优讲义

第10讲数据的初步分析培优讲义【知识回顾】1.平均数、中位数和众数(1)定义:①有n个数x1,x2,…,x n,则x= 叫这n个数的平均数.②一组数据中的数据叫这组数据的众数.③将一组数据按大小依次排列,把处在或叫这组数据的中位数.(2)平均数的计算方法①定义法;②加权平均法:x= ;3.方差(1)在一组数据x1,x2,…,x n中,各数据与它们的平均数x的差的平方的平均数,•叫做这组数据的方差.通常用“S2”表示,即S2= .(3)方差的意义:方差都是用来描述一组数据波动情况的特征数,常用来比较两组数据的波动大小,我们所研究的权是这两组数据的个数相等、平均数相等或比较接近时的情况.方差较大的数据波动较大,方差较小的数据波动较小.4.用样本估计总体【典例精讲】10、近期的5次测试成绩如右图所示,则小明5次成绩的方差S 12与小兵5次成绩的方差S 22之间的大小关系为S 12 S 22.(填“>”、“<”、“=”)11、某中学开展“八荣八耻”演讲比赛活动,九(1)、九(2)班根据初赛成绩各选出5名选手参加复赛,两个班各选出的5名选手的复赛成绩(满分为100分)如下图所示。
(1)根据右图填写下表; (2)结合两班复赛成绩的平均数和中位数,分析哪个班级的复赛成绩较好? (3)如果在每班参加复赛的选手中分别选出2人参加决赛,你认为哪个班的实力更强一些,说明理由。
12、为了普及环保知识,增强环保意识,某中学组织了环保知识竞赛活动,初中三个年级根据初赛成绩分别选出了10名同学参加决赛,这些选手的决赛成绩(满分100分)如下表所示:(2)你认为哪个年级的实力更强一些?【巩固提高】一、慎重抉择(每小题3分,共24分)1.数据a,1,2,3,b的平均数为2,则数据a,b的平均数是()A.2 B.3 C.4 D.02这些运动员跳高成绩的中位数和众数分别是()A.1.65,1.70 B.1.70,1.65 C.1.70,1.70 D.3,53.在一组数据3,4,4,6,8中,下列说法正确的是()A.平均数小于中位数B.平均数等于中位数C.平均数大于中位数D.平均数等于众数4.某校七年级有13名同学参加百米竞赛,预赛成绩各不相同,要取前6名参加决赛,小梅已经知道了自己的成绩,她想知道自己能否进入决赛,还需要知道这13名同学成绩的()A.中位数B.众数C.平均数D.极差5.某校初一年级有六个班,一次测试后,分别求得各个班级学生成绩的平均数,它们不完全相同,下列说法正确的是()A.全年级学生的平均成绩一定在这六个平均成绩的最小值与最大值之间B.将六个平均成绩之和除以6,就得到全年级学生的平均成绩C.这六个平均成绩的中位数就是全年级学生的平均成绩D.这六个平均成绩的众数不可能是全年级学生的平均成绩6.已知一组按大小顺序排列的数据-2,3,4,x,6,9的中位数是5,那么这组数据的众数是()A.6 B.5.5 C.5 D.47.有一组数据如下:3、a、4、6、7,它们的平均数是5,那么这组数据的方差是()A、10B、10C、2D、2二、仔细填空(每小题4分,共24分)8.一文具店老板购进一批不同价格的文具盒,它们的售价分别为10元,20元,30元,40元和50元,销售情况如图所示.这批文具盒售价的平均数、众数和中位数分别是 、 、 .第8题图 第10题图9.小明五次数学考试的成绩如下:84,87,x ,90,95,成绩都为整数,其中x 为中位数,已知这组数据的平均数小于中位数,那么x= .10.小张和小李两人去练习射击,第一轮10发子弹打完后,两人的成绩如图所示.设小张和小李两人10次成绩的方差分别为21s 、22s ,根据图中的信息估算,两者的大小关系是21s ____22s (填“>”、“=” 或“<”). 三、技能掌握(每小题8分,共16分)11.甲、乙两人在相同条件下各射靶10次,每次射靶的成绩情况如图所示.(2)请从下列四个不同的角度对这次测试结果进行分析.①从平均数和方差相结合看;②从平均数和中位数相结合看(分析谁的成绩好些);③从平均数和命中9环以上的次数相结合看(分析谁的成绩好些);④从折线图上两人射击命中环数的走势看(分析谁更有潜力).12.新星公司到某大学从应届毕业生中招聘公司职员,对应聘者的专业知识、英语水平、参加社会实践与社团活动等三项进行测试或成果认定,三项的得分满分都为100分,三项的分(1)写出4位应聘者的总分;(2)就表中专业知识、英语水平、参加社会实践与社团活动等三项的得分,分别求出三项中4人所得分数的方差; (3)由(1)和(2),你对应聘者有何建议?① ② ③④⑤ 6% 12% 34% 30%18% ①10元 ②20元③30元 ④40元。
第二十章数据的分析知识点及典型例题8k.doc

一、知识点讲解:1.平均数:(1)算术平均数:一组数据中,有n 个数据,则它们的算术平均数为x x1 x2 x n .(2)加权平均数:n若在一组数字中,出现次,出现次,,出现次,那么叫做、、、的加权平均数。
其中,、、、分别是、、、的权.权的理解 : 反映了某个数据在整个数据中的重要程度。
权的表示方法:比、百分比、频数(人数、个数、次数等)。
2.中位数:将一组数据按照由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数就是这组数据的中位数;如果数据的个数是偶数,则中间两个数据的平均数就是这组数据的中位数。
3.众数:一组数据中出现次数最多的数据就是这组数据的众数。
4.平均数中位数众数的区别与联系相同点平均数、中位数和众数这三个统计量的相同之处主要表现在:都是来描述数据集中趋势的统计量;都可用来反映数据的一般水平;都可用来作为一组数据的代表。
不同点它们之间的区别,主要表现在以下方面。
1)、定义不同平均数:一组数据的总和除以这组数据个数所得到的商叫这组数据的平均数。
中位数:将一组数据按大小顺序排列,处在最中间位置的一个数叫做这组数据的中位数。
众数:在一组数据中出现次数最多的数叫做这组数据的众数。
2)、求法不同平均数:用所有数据相加的总和除以数据的个数, 需要计算才得求出。
中位数:将数据按照从小到大或从大到小的顺序排列,如果数据个数是奇数,则处于最中间位置的数就是这组数据的中位数;如果数据的个数是偶数,则中间两个数据的平均数是这组数据的中位数。
它的求出不需或只需简单的计算。
众数:一组数据中出现次数最多的那个数,不必计算就可求出。
3)、个数不同在一组数据中,平均数和中位数都具有惟一性,但众数有时不具有惟一性。
在一组数据中,可能不止一个众数,也可能没有众数。
4)、代表不同平均数:反映了一组数据的平均大小,常用来一代表数据的总体“平均水平”。
中位数:像一条分界线,将数据分成前半部分和后半部分,因此用来代表一组数据的“中等水平”。
第四章 样本数据分析初步

第四章 样本数据分析初步姓名__________学号__________一、基础知识1、从考察对象中抽取一部分对象作调查分析叫做 .对所有考察对象逐一调查就叫做___________。
2、在统计中,我们将要考察的对象的全体叫做 .其中每一个考察对象叫做 ,从总体中抽取的一部分个体的集体叫做这个总体的一个 , 叫样本容量.3、一般地,如果有n 个数x 1, x 2,… x n , 我们把)x (121n x x n+++ 叫做这n 个数的 ,简称 ,记住 .1.平均数的计算公式___________________________. 2. 加权平均数公式_____________________________. 4、一般地,一组数据中出现次数最多是那个数据叫做这组数据的 .一组数据按大小顺序排列,位于中间的一个数据(当有偶数个数据时,为最中间两个数据的平均数)叫做这组数据的 .设一组按大小顺序排列的数据的个数为n ,当n 为奇数时,第_____个数为中位数;当n 为偶数时,第_____个数与第______个数的_______为中位数;5、一般地,各数据与平均数的差的平方的平均数 叫做这组数据的方差.方差越大,说明数据的波动 ,越 .方差的算术平方根S= 叫做这组数据的 . 已知数据a 1,a 2,a 3,…,a n 的平均数为X ,方差为Y ,则①数据a 1±b ,a 2 ± b ,a 3 ±b ,…,a n ±b 的平均数为______,方差为________,标准差为_______. ③数据m a 1,m a 2 ,m a 3 ,…,m a n 的平均数为______,方差为________, 标准差为_______。
④数据m a 1±b ,m a 2 ±b ,m a 3 ±b ,…,m a n ±b 的平均数为 ____, 方差为_____,标准差为_______。
数值分析讲义

第1章数值分析中的误差一、重点内容误差设精确值x* 的近似值x,差e=x-x* 称为近似值x 的误差(绝对误差)。
误差限近似值x 的误差限 是误差e 的一个上界,即|e|=|x-x*|≤ε。
相对误差e r是误差e 与精确值x* 的比值,。
常用计算。
相对误差限是相对误差的最大限度,,常用计算相对误差限。
绝对误差的运算:ε(x1±x2)=ε(x1)+ε(x2)ε(x1x2)≈|x1|ε(x2)+|x2|ε(x1)有效数字如果近似值x 的误差限ε 是它某一个数位的半个单位,我们就说x 准确到该位。
从这一位起到前面第一个非0 数字为止的所有数字称为x 的有效数字。
关于有效数字:(1) 设精确值x* 的近似值x,x=±0.a1a2…a n×10ma1,a2,…,a n是0~9 之中的自然数,且a1≠0,|x-x*|≤ε=0.5×10m-l,1≤l≤n则x 有l位有效数字.(2) 设近似值x=±0.a1a2…a n×10m有n 位有效数字,则其相对误差限(3) 设近似值x=±0.a1a2…a n×10m的相对误差限不大于则它至少有n 位有效数字。
(4) 要求精确到10-3,取该数的近似值应保留4 位小数。
一个近似值的相对误差是与准确数字有关系的,准确数字是从一个数的第一位有效数字一直数到它的绝对误差的第一位有效数字的前一位,例如具有绝对误差e=0.0926 的数x=20.7426 只有三位准确数字2,0,7。
一般粗略地说,具有一位准确数字,相对于其相对误差为10% 的量级;有二位准确数字,相对于其相对误差为1% 的量级;有三位准确数字,相对于其相对误差为0.1% 的量级。
二、实例例1 设x*= =3.1415926…近似值x=3.14=0.314×101,即m=1,它的误差是0.001526…,有|x-x*|=0.001526…≤0.5×101-3即l=3,故x=3.14 有 3 位有效数字。
人教版初二下册数学第20章《数据的分析》讲义第25讲数据分析(有答案)

人教版初二下册数学第20章《数据的分析》讲义第25讲数据分析(有答案)1、算术平均数:把一组数据的总和除以这组数据的个数所得的商.公式:nx x x n +⋅⋅⋅++21 .当所给数据1x ,2x ,…,n x 中各个数据的重要水平相反时,普通运用该公式计算平均数.2、加权平均数: 假定n 个数1x ,2x ,…,n x 的权区分是1w ,2w ,…,n w ,那么 nn n w w w w x w x w x +⋅⋅⋅+++⋅⋅⋅++212211,叫做这n 个数的加权平均数.当所给数据1x ,2x ,…,n x 中各个数据的重要水平〔权〕不同时,普通选用加权平均数计算平均数. 权的意义:权就是权重即数据的重要水平.罕见的权:1〕数值、2〕百分数、3〕比值、4〕频数等。
将一组数据依照由小到大〔或由大到小〕的顺序陈列,〔1〕假设数据的个数是奇数,那么处于中间位置的数就是这组数据的中位数; 〔2〕假设数据的个数是偶数,那么中间两个数据的平均数就是这组数据的中位数.在一组互不相等的数据中,小于和大于它们的中位数的数据各占一半.一组数据中出现次数最多的数据就是这组数据的众数.可以是一个也可以是多个.当一组数据中有较多的反双数据时,众数往往是人们所关心的一个量.平均数、中位数、众数的区别:平均数:能充沛应用一切数据,但容易受极端值的影响;中位数:计算复杂,它不易受极端值的影响,但不能充沛应用一切数据;众数:当数据中某些数据重复出现时,人们往往关心众数,但当各个数据的重复次数大致相等时,众数往往没有意义.1、极差: 一组数据中的最大数据与最小数据的差叫做这组数据的极差.2、方差:各个数据与平均数之差的平方的平均数,记作2s .用〝先平均,再求差,然后平方,最后再平均〞失掉的结果表示一组数据偏离平均值的状况,这个结果叫方差,计算公式是:()()()[]2222121x x x x x x n s n -+⋅⋅⋅+-+-=方差〔2s 〕越大,数据的动摇性越大,方差越小,数据的动摇性越小.①当一组数据同时加上一个数a 时,其平均数、中位数、众数也添加a ,而其方差不变; ②当一组数据扩展k 倍时,其平均数、中位数和众数也扩展k 倍,其方差扩展2k 倍. 3、规范差:规范差是方差的算术平方根.()()()n x x x x x x s n 22221-+⋅⋅⋅+-+-=依据数据的剖析选择最优方案:〔1〕、数据的代表; 〔2〕、数据的动摇考点1、算术平均数例1、一组数据7,8,10,12,13的平均数是〔 〕A 、7B 、9C 、10D 、12例2、8个数的平均数12,4个数的平均为18,那么这12个数的平均数为〔 〕A、12B、13C、14D、15例3、我市如今一手抓防治非典,一手抓经济开展,下表是利群超市5月份一周的利润状况记载:依据上表,你估量利群超市往年5月份的总利润是〔〕A、6.51万元B、6.4万元C、1.47万元D、5.88万元例4、x1,x2,x3,3,4,7的平均数是6,那么x1+x2+x3=______.例5、一组数据7,a,8,b,10,c,6的平均数为4。
数据分析初步-复习讲义

第三章数据分析初步项目一知识概要1. 平均数、中位数、众数的概念及举例一般地,对于n个数x1,x2,…,x n,我们把,叫做这n个数的算术平均数,简称平均数。
一般地,n个数据按大小顺序排列,处于的一个数据(或 )叫做这组数据的中位数。
一组数据中出现次数的那个数据叫做这组数据的众数。
2. 平均数、中位数、众数的特征(1)平均数、中位数、众数都是表示一组数据“平均水平”的特征数。
(2)平均数能充分利用数据提供的信息,在生活中较为常用,但它容易受极端数字的影响,且计算较繁。
(3)中位数的计算简单,受极端数字影响较小,但不能充分利用所有数字的信息。
当一组数据中个别数据变动较大时,可选择中位数来表示这组数据的“集中趋势”。
(4)众数的可靠性较差,它不受极端数据的影响,求法简便。
当一组数据中某些数据多次重复出现时,众数是我们关心的一种统计量。
3. 加权平均数例1:统计一名射击运动员在某次训练中15次射击的中靶环数,获得如下数据: 6,7,8,7,7,8,10,9,8,8,9,9,8,10,9,求这次训练中该运动员射击的平均成绩。
4、方差与标准差在一组数据中,各数据与它们平均数的差的平方的平均数(即“先平均,再求差,然后平方,最后再平均”)得到的数叫方差,公式是标准差公式是项目二例题精讲【例1】.为了了解学生参加体育活动的情况,学校对学生进行随机抽样调查,其中一个问题是“你平均每天参加体育活动的时间是多少?”,共有4个选项:A.1.5小时以上 B.1~1.5小时C.0.5—1小时 D.0.5小时以下图1、2是根据调查结果绘制的两幅不完整的统计图,请你根据统计图提供的信息,解答以下问题:(1)本次一共调查了多少名学生?(2)在图1中将选项B的部分补充完整;(3)若该校有3000名学生,你估计全校可能有多少名学生平均每天参加体育活动的时间在0.5小时以下.图1 图2【例2】:某商场一天中售出李宁牌运动鞋16双,其中各种尺码的鞋销售如下表所示这组数据的众数和中位数各是多少?【例3】.我市部分学生参加了2004年全国初中数学竞赛决赛,并取得优异成绩. 已知竞赛成绩分数都是整数,试题满分为140分,参赛学生的成绩分数分布情况如下:(1) 全市共有多少人参加本次数学竞赛决赛?最低分和最高分在什么分数范围?(2) 经竞赛组委会评定,竞赛成绩在60分以上 (含60分)的考生均可获得不同等级的奖励,求我市参加本次竞赛决赛考生的获奖比例;(3) 决赛成绩分数的中位数落在哪个分数段内?(4) 上表还提供了其他信息,例如:“没获奖的人数为105人”等等. 请你再写出两条此表提供的信息.【例4】:某班甲小组有6人,数学平均成绩为80分,乙小组有8人,数学平均成绩为75分,这两个小组的平均成绩是多少?【例5】:求数据1,3,8,4,9,7,5的中位数。
二十章数据分析练习题

二十章数据分析练习题一、基础概念题1. 数据分析的定义是什么?2. 数据分析的主要目的是什么?3. 请列举三种常见的数据分析类型。
4. 数据清洗的目的是什么?5. 描述性统计分析主要包括哪些内容?二、数据处理题1. 如何使用Excel对数据进行排序?2. 如何使用Python的Pandas库对数据进行合并?3. 请简述数据清洗的步骤。
4. 如何识别和处理缺失值?5. 如何使用Python对数据进行标准化处理?三、数据分析方法题1. 请简述线性回归模型的原理。
2. 什么是逻辑回归?它适用于哪些场景?3. 如何使用K均值聚类算法对数据进行聚类分析?4. 请解释时间序列分析的基本概念。
5. 主成分分析(PCA)的目的是什么?四、实战应用题2. 给定一组商品的销售数据,如何使用Python计算每种商品的销售额占比?3. 请使用Python对一组数据进行相关性分析,并解释结果。
4. 如何利用Python对一组数据进行异常值检测?5. 请使用Python实现一个简单的线性回归模型,并预测未知数据。
五、综合分析题1. 某公司想要分析用户流失原因,请列出可能的分析步骤。
2. 请简述如何利用数据分析为企业制定营销策略。
3. 如何评估数据分析项目的成功与否?4. 请举例说明数据分析在金融行业的应用。
5. 谈谈大数据时代,数据分析面临的挑战和机遇。
六、统计分析软件应用题1. 如何在SPSS中进行单因素方差分析(ANOVA)?2. 请描述在R语言中如何绘制直方图。
3. 如何使用MATLAB进行数据插值?4. 在SAS中,如何执行多重线性回归分析?5. 请说明在Python的matplotlib库中如何自定义图表的样式。
七、数据可视化题1. 请列举三种常用的数据可视化工具。
2. 如何使用Excel制作折线图?3. 在Python中,如何使用Seaborn库绘制热力图?4. 请简述如何利用Tableau进行数据可视化。
5. 如何在数据可视化中避免常见的误区?八、数据库操作题1. 请写出SQL查询语句,用于从数据库中提取特定时间段的数据。
初二 数据分析初步 讲义

第三章数据分析初步复习稿一、平均数一般地,有n个数x1,x2,…,x n,我们把叫做这n个数的算术平均数,简称。
记做【例1】.我省某市五月份第二周连续七天的空气质量指数分别为:105,98,99,95,107,103,94,则这七天空气质量指数的平均数是。
解法一:x==解法二:这些数据都在上、下波动,所以我们可以以为基准,原数据记为x;则【练一练】:1、数据201,198,196,202,205的平均数是。
2、如果x1与x2的平均数是4,那么x1+1与x2+5的平均数是。
3、若数据2,3,-1,7,x的平均数为2,则x= 。
【例2】.某次能力测试中,10人的成绩统计如下表,则这10人成绩的平均数这种形式的平均数是叫做,其中3,1,2,2, 2表示各相同数据的个数,称为。
【练一练】:1、某商场用加权平均数来确定什锦糖的单价,由单价为15元/千克的甲种糖果10千克,单价为12元/千克的乙种糖果20千克,单价为10元/千克的丙种糖果30千克混合成的什锦糖果的单价应定为( )A.11元/千克B.11.5元/千克C.12元/千克D.12.5元/千克2、某校为了招聘一名优秀教师,对入选的三名候选人进行教学技能与专业知识两种考核,现将甲乙丙三人的考核成绩统计如下:)如果校方认为教师的教学技能水平与专业知识水平同等重要,则候选人将被录用。
(2)如果校方认为教师的教学技能水平比专业知识水平重要,因此分别赋予它们6和4的权。
计算赋权后他们各自的平均成绩,并说明谁将被录用。
二、众数与中位数:1、众数:在一组数据中出现次数的数据叫做众数。
【例3】这组数据:1、1、1、2、2、4中的众数是;这组数据:2、2、5、3、5的众数是;【练一练】:已知一组数据3,,4,5的众数是4,则这组数据的平均数为()A.3B.4C.5D.62、中位数:将一组数据按(或)的顺序排列,位于最中间的一个数据(当数据的个数为时)或最中间两个数据的(当数据为时)叫做这组数据的。
非学科数学学培训-数据分析初步(资料附答案)

自学资料一、平均数【知识探索】1.一般地,如果一组数据:,,…,它们的平均数记作,这时.2.平均数反映了这组数据段平均水平.3.如果一组数据:,,…,它们的平均数为,则,,…,它们的平均数为.4.我们把样本中所有个体的平均数称为样本平均数(sample mean).总体中所有个体的平均数称为总体平均数(population mean).【说明】随机样本的容量越大,样本平均数就越接近于总体平均数.必要时,可以用样本平均数来估计总体平均数.5.①.这里的,,…,在不同的问题中有不同的意义;,,…,分别表示数据,,…,出现的次数.6.设,,…,,则公式①可以写为.其中,,…,叫做权,它们体现了,,…,对平均数所产生的影响.7.如果个数据,,…,,它们相应的权数为,,…,,那么由公式①或②给出的叫做这个数的加权平均数(weighted mean).【说明】通常情况下,加权平均数中的权数的和为1.8.当各数据对平均数产生的影响不同时,可用加权平均数.当时,公式②就与公式①相同,因此公式①是公式②的特例.第1页共14页自学七招之日计划护体神功:每日计划安排好,自学规划效率高非学科培训9.用计算器计算一组数据的加权平均数:例如:用计算器计算下面这组数据的平均数,其操作步骤及按键过程如下:【错题精练】例1.烹饪大赛的菜品的评价按味道,外形,色泽三个方面进行评价(评价的满分均为100分),三个方面的重要性之比依次为7:2:1.某位厨师的菜所得的分数依次为92分、88分、80分,那么这位厨师的最后得分是()A. 90分;B. 87分;C. 89分;D. 86分.【答案】A例2.已知一组数据a、b、c、d、e的平均数是m,则3a+1、3b+1、3c+1、3d+1、3e+1的平均数是.【答案】3m+1.【举一反三】1.有一组数据:2,5,5,6,7,关于这组数据的平均数为()A. 3;B. 4;C. 5;D. 6.第2页共14页自学七招之预习轻身术:预习习惯培养好,课堂轻松没烦恼非学科培训【答案】C2.某地连续9天的最高气温统计如下表,则这9天的平均气温为(∘C).【答案】273.晨光中学规定学生的体育成绩满分为100分,其中早操及体育课外活动占20%,期中考试成绩占30%,期末考试成绩占50%,小惠的三项成绩依次是95分,90分,85分,小惠这学期的体育成绩为__________ 分.【解答】解:小惠这学期的体育成绩=(95×20%+90×30%+85×50%)=88.5(分).故答案为88.5.【答案】88.5二、中位数【知识探索】1.将一组数据按由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,则称处于中间位置的数为这组数据的中位数(median);如果数据的个数是偶数,则称中间两个数的平均数为这组数据的中位数.【错题精练】例1.一组数据按从小到大排列为2,4,8,x,10,14.若这组数据的中位数为9,则x是()A. 7;B. 8;C. 9;D. 10.【答案】D例2.某工厂第一车间有15个工人,每人日均加工螺杆数统计如图.该车间工人日均加工螺杆数的中位数是()第3页共14页自学七招之举一反三剑:总结归纳典型题,多种解法开脑洞非学科培训A. 4;B. 12;C. 13;D. 14.【答案】D【举一反三】1.下表是某校乐团的年龄分布,其中一个数据被遮盖了,下面对于中位数的说法正确的是()A. 中位数是14;B. 中位数可能是14.5;C. 中位数是15或15.5;D. 中位数可能是16.【答案】D三、众数【知识探索】1.一组数据中出现次数最多的数据称为众数(mode).【说明】当一组数据中出现较多的重复数据时,众数往往能更好地反映其集中趋势.【错题精练】例1.在开展“爱心捐助某灾区”的活动中,某支部8名团员捐款的数额(单位:元)分别为:3,5,6,5,5,6,5,10,这组数据的众数是()A. 3元;B. 5元;C. 6元;D. 10元.第4页共14页自学七招之预习轻身术:预习习惯培养好,课堂轻松没烦恼非学科培训例2.某景区在“五一”小长假期间,每天接待的旅客人数统计如下表.表中表示人数的一组数据中,众数和中位数分别为()A. 2.5万,2万;B. 2.5万,2.5万;C. 2万,2.5万;D. 2万,2万.【答案】D例3.在乡村学校舞蹈比赛中,某校10名学生参赛成绩统计如图所示,对于这10名学生的参赛成绩,下列说法中错误的是()A. 众数是90;B. 中位数是90;C. 平均数是90;D. 极差是15.【答案】C【举一反三】1.下表是某校乐团的年龄分布,期中一个数据被遮盖了,下面说法正确的是()A. 中位数可能是14;B. 中位数可能是14.5;C. 平均数可能是14;D. 众数可能是16.【答案】D2.为了筹备班级元旦联欢晚会,班长对全班同学爱吃什么水果进行民意调查,再决定买哪种水果.下面的调查数据中,他最应该关注的是()A. 众数;B. 中位数;C. 平均数;D. 加权平均数.第5页共14页自学七招之举一反三剑:总结归纳典型题,多种解法开脑洞非学科培训3.右图是某市10月1日至7日一周内“日平均气温变化统计图”.在这组数据中,众数和中位数分别是()A. 13,13;B. 14,14;C. 13,14;D. 14,13.【答案】D4.一组数据1,3,2,7,x,2,3的平均数是3,则该组数据的众数为________.【解答】【答案】3四、方差和标准差【知识探索】1.如果一组数据,,…,,它们的平均数为,那么这个数与平均数的差的平方分别为,,…,,它们的平均数叫做这个数的方差(variance),记做.即.【记忆方法】一均,二差,三方、四均.第一步:求数据平均数;第6页共14页自学七招之预习轻身术:预习习惯培养好,课堂轻松没烦恼非学科培训第二步:求每个数据与平均数的差;第三步:求所求得的各个差的平方;第四步:求所得各个平方数的平均数.【说明】如未指明要写方差的单位,通常就将它省略.2.若一组数据,,…,的方差为,那么,,…,的方差为.3.方差的非负平方根叫做标准差(standard deviation),记做.即.4.若一组数据,,…,的标准差为,那么,,…,的标准差为.5.方差与标准差反应了一组数据波动的大小,即一组数据偏离平均数的程度.从计算公式可知,一组数据越接近于它们的平均数,则方差和标准差越小(波动程度越小),这时平均数就越具有代表性.只有一组数据中所有的数都相等时,方差与标准差才可能为零.【说明】(1)方差和标准差反映了一组数据波动的大小.即一组数据偏离平均数的程度;(2)方差和标准差均有单位,方差的单位为数据的单位的平方.但这样的单位有时没有明确的物理意义,而是在运算中形成的,有时计算结果省略了它的单位;标准差的单位与数据的单位相同;(3)一组数据越接近它们的平均数,方差和标准差就越小,这是平均数就越具有代表性;当一组数据中所有的数都相等时,方差和标准差才可能为零;(4)本章不引进样本的方差和标准差,总体的方差和标准差,也不要求由随机样本来估计总体的方差或标准差.用样本估计总体的方差和标准差时,所用的公式与本节中的公式有所不同,在本章不要涉及这类问题.(5)当两组数据平均数相等或较接近时,才能用方差来比较它们的波动程度.6.用计算器计算这组数据的标准差和方差【错题精练】例1.方差是刻画数据波动程度的量.对于一组数据x1,x2,…,x n,可用如下算式计算方差:s2=1[(x1−5)2+(x2−5)2+⋯+(x n−5)2],其中“5”是这组数据的()nA. 最小值;B. 平均数;C. 中位数;D. 众数.第7页共14页自学七招之举一反三剑:总结归纳典型题,多种解法开脑洞非学科培训【答案】B例2.甲、乙、丙、丁四位选手各进行了10次射击,射击成绩的平均数和方差如下表:则这四人中成绩发挥最稳定的是()A. 甲;B. 乙;C. 丙;D. 丁.【答案】B例3.若一组数据x1+1,x2+1,...,x n+1的平均数为17,方差为2,则另一组数据x1+2,x2+ 2,...,x n+2的平均数为和方差分别为()A. 17,2;B. 18,2;C. 17,3;D. 18,3.【答案】B例4.市举行知识大赛,A校、B校各派出5名选手组成代表队参加决赛,两校派出选手的决赛成绩如图所示.(1)根据图示填写下表:(2)结合两校成绩的平均数和中位数,分析哪个学校的决赛成绩较好;(3)计算两校决赛成绩的方差,并判断哪个学校代表队选手成绩较为稳定.第8页共14页自学七招之预习轻身术:预习习惯培养好,课堂轻松没烦恼非学科培训(75+80+85+85+100)=85(分),众数85(分);【解答】(1)解:A校平均数为15B校中位数80(分).填表如下:(2)解:A校成绩好些.因为两个队的平均数都相同,A校的中位数高,∴在平均数相同的情况下中位数高的A校成绩好些.(3)解:∵A校的方差s12=1×[(75−85)2+(80−85)2+(85−85)2+(85−85)2+(100−585)2]=70,×[(70−85)2+(100−85)2+(100−85)2+(75−85)2+(80−85)2]=160.B校的方差s22=15∴s12<s22,因此,A校代表队选手成绩较为稳定.【答案】(1)略;(2)位数高的A校成绩好些;(3)A校代表队选手成绩较为稳定.【举一反三】1.下面是甲、乙两人10次射击成绩(环数)的条形统计图,则下列说法正确的是()A. 甲比乙的成绩稳定;B. 乙比甲的成绩稳定;C. 甲、乙两人的成绩一样稳定;D. 无法确定谁的成绩更稳定.【答案】B2.一组数据1,2,3,3,4,5.若添加一个数据3,则下列统计量中,发生变化的是()A. 平均数;B. 众数;C. 中位数;D. 方差.【答案】D3.若一组数据x1+1,x2+1,x3+1…x n+1的平均数为18,方差为2,则数据x1+2,x2+2,x3+2……,x n+2的平均数和方差分别是()第9页共14页自学七招之举一反三剑:总结归纳典型题,多种解法开脑洞非学科培训第10页共14页自学七招之预习轻身术:预习习惯培养好,课堂轻松没烦恼非学科培训1.下表是某校乐团的年龄分布,其中一个数据被遮盖了,下面对于中位数的说法正确的是()A. 中位数是14;B. 中位数可能是14.5;C. 中位数是15或15.5;D. 中位数可能是16.【答案】D2.学校为了丰富学生课余活动开展了一次“校园歌手大奖赛”的歌咏比赛,共有18名同学入围,他们的决赛成绩如下表:成绩(分)9.409.509.609.709.809.90人数235431则入围同学决赛成绩的中位数和众数分别是()A. 9.70,9.60;B. 9.60,9.60;C. 9.60,9.70;D. 9.65,9.60.【解答】根据中位数和众数的概念求解.解:∵共有18名同学,则中位数为第9名和第10名同学成绩的平均分,即中位数为:(9.60+9.60)=9.60,众数为:9.60.故选:B.【答案】B3.我区某中学举办了一次以“我的中国梦”为主题的演讲比赛,最后确定7名同学参加决赛,他们的决赛成绩各不相同,其中李华已经知道自己的成绩,但能否进前四名,他还必须清楚这名同学成绩的()A. 众数;B. 中位数;C. 平均数;D. 方差.【答案】B4.如表记录了甲、乙、丙、丁四名学生最近几次数学综合测试成绩的平均数与方差:根据表中数据,要从中选择一名成好且发挥稳定的同学参加竟赛,应该选择()A. 甲;B. 乙;C. 丙;D. 丁.【答案】A5.在“争创美丽校园,争做文明学生”示范校评比活动中,10位评委给某校的评分情况如下表所示:评分(分)80859095评委人数1252则这10位评委评分的平均数是__________ 分【解答】平均数的计算方法是求出所有数据的和,然后除以数据的总个数.这10位评委评分的平均数是:(80+85×2+90×5+95×2)÷10=89(分)【答案】896.教育局为了解我市八年级学生参加社会实践活动情况,随机抽查了某县部分八年级学生第一学期参加社会实践活动的天数,并用得到的数据绘制了两幅统计图,下面给出了两幅不完整的统计图(如图)请根据图中提供的信息,回答下列问题:(1)a=(百分比),并写出该扇形所对圆心角的度数为,请补全条形图;(2)在这次抽样调查中,众数和中位数分别是多少?(3)如果该县共有八年级学生8000人,请你估计“活动时间不少于7天”的学生人数大约有多少人?【解答】(1)解:a=1−(40%+20%+25%+5%)=1−90%=10%,所对的圆心角度数=360°×10%=36°,被抽查的学生人数:240÷40%=600人,8天的人数:600×10%=60人,补全统计图如图所示:(2)解:参加社会实践活动5天的人数最多,∴众数是5天,600人中,按照参加社会实践活动的天数从少到多排列,第300人和301人都是6天,∴中位数是6天;(3)解:8000×(25%+10%+5%)=8000×40%=3200(人).【答案】(1)10%,36°;(2)5,6;(3)3200.7.当今,青少年视力水平下降已引起全社会的关注,为了了解某市30000名学生的视力情况,从中抽取了一部分学生进行了一次抽样调查,利用所得数据绘制的频数分布直方图(长方形的高表示该组人数)如下:解解答下列问题:(1)本次抽样调查共抽测了名学生;(2)参加抽测的学生的视力的众数在范围内;(3)视力为4.9,5.0,5.1及以上为正常,试估计该市学生视力正常的人数约为多少?【解答】(1)解:30+50+40+20+10=150(人);(2)解:根据总数定义,可知视力众数在4.25~4.55范围内;(3)解:∵150人中视力正常所占的百分比为20%,∴某市30000名学生的视力正常的人数为30000×20%=6000人.【答案】(1)150;(2)4.25~4.55;(3)6000.。
数据分析初步讲义及习题

数据分析初步1、平均数平均数:把一组数据的总和除以这组数据的个数所得的商。
平均数反映一组数据的平均水平,平均数分为算术平均数和加权平均数.一般的,有n 个数,,,,321n x x x x •••我们把)(1321n x x x x n +•••+++叫做这n 个数的算术平均数简称平均数,记做-x (读作“x 拔”)(定义法)当所给一组数据中有重复多次出现的数据,常选用加权平均数公式。
且f 1+f 2+……+f k =n (加权法),其中k f f f f •••321,,表示各相同数据的个数,称为权,“权”越大,对平均数的影响就越大,加权平均数的分母恰好为各权的和。
当给出的一组数据,都在某一常数a 上下波动时,一般选用简化平均数公式,其中a 是取接近于这组数据平均数中比较“整”的数;•2、众数与中位数平均数、众数、中位数都是用来描述数据集中趋势的量.平均数的大小与每一个数据都有关,任何一个数的波动都会引起平均数的波动,当一组数据中有个数据太高或太低,用平均数来描述整体趋势则不合适,用中位数或众数则较合适。
中位数与数据排列有关,个别数据的波动对中位数没影响; 当一组数据中不少数据多次重复出现时,可用众数来描述。
众数:在一组数据中,出现次数最多的数(有时不止一个),叫做这组数据的众数 中位数:将一组数据按大小顺序排列,把处在最中间的一个数(或两个数的平均数)叫做这组数据的中位数.3、方差与标准差用“先平均,再求差,然后平方,最后再平均”得到的结果表示一组数据偏离平均值的情况,这个结果叫方差,计算公式是 s 2=[(x 1—)2+(x 2—)2+…+(x n —)2]; 一般的,一组数据的方差的算术平方根S=])x -(x +…+)x -(x +)x -[(x n12_n 2_22_1称为这组数据的标准差。
方差 方差和标准差都是反映一组数据的波动大小的一个量,其值越大,波动越大,也越不稳定或不整齐。
数据分析的初步认识练习题

数据分析的初步认识练习题
数据分析是一种重要的技能,可以帮助我们从大量的数据中提取有价值的信息和洞察力。
下面是一些初步的数据分析练题,帮助你加深对数据分析的理解和应用。
问题1
你有一个销售部门的数据集,包含每位销售员在过去一年内的销售业绩。
每个销售员都有一个销售额的数字,你想了解整个销售团队的总体销售情况。
你应该如何分析这个数据集来得出你需要的信息?
问题2
一家电子商务公司要做市场调研,以了解不同地区的用户购买行为。
他们的数据集包含用户的地理位置信息和购买记录。
你将如何使用这个数据来得出一些洞察?
问题3
某个公司在过去的几个月中进行了一项广告活动,他们想评估广告活动的效果。
公司有广告投放的时间和地点数据,以及销售额的数据。
你会如何分析这个数据集来评估广告活动的效果?
问题4
一家电信公司想了解用户的流失情况,他们的数据集包含用户的个人信息、通话记录和终止合同的时间。
你将如何分析这个数据来预测用户的流失行为?
问题5
以上是一些初步的数据分析练题,通过实践和理解这些问题,你将能够更好地掌握数据分析的基础知识和技能。
继续努力研究和实践,你将在数据分析领域取得更多的成就。
Happy coding!。
人教版八年级下册数学第20章《数据的分析》讲义第26讲数据的分析-复习训练(有答案)

第26讲数据的分析――复习训练第一部分知识梳理1.平均数:把一组数据的总和除以这组数据的所得的商。
平均数反映一组数据的平均水平,平均数分为算术平均数和加权平均数。
2.众数:在一组数据中,出现次数的数(有时不止一个),叫做这组数据的众数3.中位数:将一组数据按大小顺序排列,把处在最中间的(或两个数的)叫做这组数据的中位数.4.极差:是指一组数据中最大数据与最小数据的。
5.方差:各个数据与平均数之差的平方的平均数,记作s2.巧计方法:方差是偏差的平方的平均数公式s2= _________________________________6. 一组数据中的每一个数都增加(或减小)a时,平均数,方差一组数据中的每一个数都扩大相同的倍数k时,平均数 ,方差考点一、算数平均数1、数据-1, 0, 1, 2, 3的平均数是(C )A. -1B. 0C. 1D. 52、样本数据3、6、x、4、2的平均数是5,则这个样本中x的值是(B )A. 5B. 10C. 13D. 153、一组数据3, 5, 7, m, n的平均数是6,则m, n的平均数是(C )A. 6B. 7C. 7.5D. 154、若n个数的平均数为p,从这n个数中去掉一个数q,余下的数的平均数增加了2,则q的值为(A )A.p-2n+2B. 2p-nC. 2p-n+2D. p-n+2思路点拨:n个数的总和为np,去掉q后的总和为(n-1)(p+2),则q=np- (n-1)(p+2) =p-2n+2.故选A.5、已知两组数据X I,X2,…,X n和y1,y2,…,y n的平均数分别为2和-2,则x1+3y1,X2+3y2,…,X n+3y n的平均数为(A )成绩是3分的人数是:40X42.5%=17人), 成绩是2分的人数是:40-3-17-12=8 (人),么这15天通过该路口汽车平均辆数为( C9、某校为了了解学生的课外作业负担情况,随机调查了50名学生,得到他们在某天各自课外作业所用时间的数据,结果用右面的条形图表示,根据图中数据可 得这50名学生这一天平均每人的课外作业时间为( BA. -4B. -2C. 0D. 2考点二、加权平均数6、如表是10支不同型号签字笔的相关信息,则这 10支签字笔的平均价格是( CA. 1.4 元 型号 A B C价格(元/支)1 1.52数量f 支) 3257、对某校八年级随机抽取若干名学生进行体能测试,成绩记为 1分,2分,3分,4分4个等级,将调查结果绘制成如下条形统计图和扇形统计图.根据图中信息,这些学生的平均分数是(A. 2.2D. 3.0 思路点拨: 参加体育测试的人数是: 12+30%=40人),3 1 8 2 17 3 12 4则平均分是: ----------------------- 408、为了调查某一路口某时段的汽车流量,记录= 2.95 (分)15天同一时段通过该路口的汽车 辆数,其中有2天是142辆,2天是145辆,6天是156辆,5天是157辆,那A. 146B. 150C. 153D. 1600D. 1.7元B. 1.5 元C. 1.6 元 C )C . B. 2.52.95成绩频数扇形统计图图21分B.0.9小时C. 1.0小时D. 1.5小时A. 0.6小时10、某学校举行理科(含数学、物理、化学、生物四科)综合能力比赛,四科的满分都为100分.甲、乙、丙三人四科的测试成绩如下表:综合成绩按照数学、物理、化学、生物四科测试成绩的1.2: 1: 1: 0.8的比例计分,则综合成绩的第一名是(A )学科数学物理讹学三物甲9585856080809080丙70908095A.甲B.乙C.内D.不确定11、某班四个学习兴趣小组的学生分布如图①②,现通过对四个小组学生寒假期间所读课外书情况进行调查,并制成各小组读书情况的条形统计图③,根据统计图中的信息:这四个小组平均每人读书的本数是(C )A. 4B. 5C. 6D. 712、某次射击训练中,一小组的成绩如下表所示:环薮78910人数132若该小组的平均成绩为8.7环,则成绩为9环的人数是(A. 1人B. 2人C. 3人D. 4人思路点拨:设成绩为9环的人数为x,则有7+8X 3+9x+10X 2=8.7(X+3+x+2 ,解得x=4.故选D.13、下表中若平均数为2,则x等于(B )A. 0B. 1C. 2D. 3考点三、中位数14、在数据1、3、5、5、7中,中位数是(C )A. 3B. 4 C, 5 D. 715、六个数6、2、3、3、5、10的中位数为(B )A. 3B. 4C. 5D. 616、已知一组数据:-1, x, 1, 2, 0的平均数是1,则这组数据的中位数是(A )A. 1B. 0C. -1D. 2思路点拨:,- -1, x, 1, 2, 0的平均数是1,(-1+x+1+2+0) +5=1解得:x=3,将数据从小到大重新排列:-1, 0, 1, 2, 3最中间的那个数数是:1,「•中位数是:1.17、若四个数2, x, 3, 5的中位数为4,则有(C )A. x=4B. x=6 C, x>5 D, x<5思路点拨:找中位数的时候一定要先排好顺序,然后再根据奇数和偶数个来确定中位数,如果数据有奇数个,则正中间的数字即为所求。
《数据分析初步》考题例析

《数据分析初步》考题例析一、基本考题例1.为了了解学生参加体育活动的情况,学校对学生进行随机抽样调查,其中一个问题是“你平均每天参加体育活动的时间是多少”,共有4个选项:A.小时以上B.1~小时C.—1小时D.小时以下图1、2是根据调查结果绘制的两幅不完整的统计图,请你根据统计图提供的信息,解答以下问题:1本次一共调查了多少名学生2在图1中将选项B的部分补充完整;3若该校有3000名学生,你估计全校可能有多少名学生平均每天参加体育活动的时间在小时以下图1图2分析:本题是通过统计图给出的信息发现有用的信息并提取信息第一个条形统计图体现的是四个选项中的人数,第二个统计图给出的是它们所占的百分比解:1200名;2略;33000×5%=150人二、学科内综合题例2.某校初一年段学生每人都只使用甲、乙、丙三种品牌中的一种计算器,下图是该年段全体学生使用三种不同品牌计算器人数的频数分布直方图1求该校初一年段学生的总人数;2你认为哪种品牌计算器的使用频率最高并求出这个频率.分析:通过右图可以直观的看到每个使用计算器学生的人数,将每组的人数相加即可得到总人数然后根据统计图找到各问的答案即可解:1初一年段学生的总人数=2060120=2002丙种品牌的计算器使用频率最高这个频率=120÷200=三、应用与创新题例4.某校为了了解九年级学生的体能情况,抽调了一部分学生进行一分钟跳绳测试,将测试成绩整理后作出如下统计图.甲同学计算出前两组的频率和是,乙同学计算出跳绳次数不少于100次的同学占96%,丙同学计算出从左至右第二、三、四组的频数比为4:17:15.结合统计图回答下列问题:1这次共抽调了多少人2若跳绳次数不少于130次为优秀,则这次测试成绩的优秀率是多少3如果这次测试成绩的中位数是120次,那么这次测试中,成绩为120次的学生至少有多少人?解:1第一组的频率为=,第二组的频率为,=150人,这次共抽调了150人2第一组人数为150×=6人,第三、四组人数分别为51人,45人这次测试的优秀率为×100%=24%3成绩为120次的学生至少有7人四、开放与研究题例5.我市部分学生参加了2022年全国初中数学竞赛决赛,并取得优异成绩已知竞赛成绩分数都是整数,试题满分为140分,参赛学生的成绩分数分布情况如下:分数段-1920-3940-5960-7980-99100-119120-1401全市共有多少人参加本次数学竞赛决赛最低分和最高分在什么分数范围2经竞赛组委会评定,竞赛成绩在60分以上含60分的考生均可获得不同等级的奖励,求我市参加本次竞赛决赛考生的获奖比例;3决赛成绩分数的中位数落在哪个分数段内4上表还提供了其他信息,例如:“没获奖的人数为105人”等等请你再写出两条此表提供的信息解:1全市共有300名学生参加本次竞赛决赛,最低分在20-39之间,最高分在120-140之间2本次决赛共有195人获奖,获奖率为65%3决赛成绩的中位数落在60—79分数段内4如“120分以上有12人;60至79分数段的人数最多;……”等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据分析初步
1、平均数
平均数:把一组数据的总和除以这组数据的个数所得的商。
平均数反映一
组数据的平均水平,平均数分为算术平均数和加权平均数。
一般的,有n 个数,,,,321n x x x x ∙∙∙我们把叫做这n 个数的算术平均数简称平均数,记做-
x (读作“x 拔”)
(定义法)
当所给一组数据中有重复多次出现的数据,常选用加权平均数公式。
且f 1+f 2+……+f k =n (加权法),其中
k f f f f ∙∙∙321,,表示各相同数据的个数,称为权,“权”越大,对平均数的影响就越大,加权平均数的分母恰好为各权的和。
当给出的一组数据,都在某一常数a 上下波动时,一般选用简化平均数公式
,其中a 是取接近于这组数据平均数中比较“整”的数;•
2、众数与中位数
平均数、众数、中位数都是用来描述数据集中趋势的量。
平均数的大小与每一个数据都有关,任何一个数的波动都会引起平均数的波动,
当一组数据中有个数据太高或太低,用平均数来描述整体趋势则不合适,用中位数或众数则较合适。
中位数与数据排列有关,个别数据的波动对中位数没影响; 当一组数据中不少数据多次重复出现时,可用众数来描述。
众数:在一组数据中,出现次数最多的数(有时不止一个),叫做这组数据
的众数
)
(1
321n x x x x n +∙∙∙+++
中位数:将一组数据按大小顺序排列,把处在最中间的一个数(或两个数
的平均数)叫做这组数据的中位数.
3、方差与标准差
用“先平均,再求差,然后平方,最后再平均”得到的结果表示一组数据偏
离平均值的情况,这个结果叫方差,计算公式是 s 2=[(x 1-)2+(x 2-)2+…
+(x n -)2];
一般的,一组数据的方差的算术平方根
S=])x -(x +…+)x -(x +)x -[(x n
12_
n 2
_22_1称为这组数据的标准差。
方差和标准差都是反映一组数据的波动大小的一个量,其值越大,波动越大,也越不稳定或不整齐。
或者说,离散程度小就越稳定,离散程度大就不稳定。
数据分析练习题 一.选择
1.已知1x ,2x ,3x ,…,15x 的平均数为a ,16x ,17x ,…,40x 的平均数为b ,则1x ,2x ,
3x ,…,15x ,16x ,17x ,…,40x 的平均数为( )
A .
1()2a b + B .1()4a b +
C .1()40a b +
D .1
(35)8a b +
2.已知一组正数1x ,2x ,3x ,
,7x 的方差2
2
22212371(63)
7
S x x x x =
++++-则关于数据13x +,23x +,33x +,,73x +的说法:(1)方差为2
S ;(2)
平均数为3;(3)平均数为6;(4)方差为2
9S ,其中正确的说法是( )
A. (1)与(2)
B. (1)与(3)
C. (2)与(3)
D. (3)与(4) 3..在一化学实验中,因仪器和观察的误差,使得三次实验所得实验数据分别为a 1,a 2,a 3.我们规定该实验的“最佳实验数据”a 是这样一个数值:a 与各数据a 1,a 2,a 3差的平方和M 最小.依此规定,则a =( )
A. 123a a a ++
B.
C.
D. 1
233a a a ++ 4.甲从一个鱼摊上买了三条鱼,平均每条a 元,又从另一个鱼摊上买了两条鱼,平均每条b
A D
C
B 系是()
A .a >b
B .a <b
C .a =b
D .a 和b 的大小无关 5.. 某同学参加了5科考试,平均成绩是77分,他想在下一科考试后使6科考试的平均成绩
为80分,那么他第6科考试要得的分数应为( ) A .88分 B .91分 C .95分 D .98分 6、下列语句中,不是命题的是………………………………………………( )
A.若两角之和为90º,则这两个角互补
B. 相等的角是对顶角
C. 同角的余角相等
D. 作线段的垂直平分线 7、在下列图形中,即是轴对称图形,又是中心对称图形的是( )
8、一组数据共40个,分为6组,第1组到第4组的频数分别为10,5,7,6,第5组的频率为0.1,则第6组的频数为………………………………………( ) A.10 B.8 C.6 D.4
9、如图,在等腰梯形ABCD 中,AD ∥BC ,AD =5,AB =6,BC =8,且AB ∥DE ,则△DEC 周长为( )
A .15
B .12
C .3
D .19
10、如图,四边形ABCD 是由四个边长为1的正六边形所围住, 则四边形ABCD 的面积是( ) A .
2
3 B .
4
3 C .1
D .2
二填空
1.某样本方差的计算公式是2
22
21281(2)(2)(2)8
S x x x ⎡⎤=
-+-++-⎣⎦,则它的样本容量
2. 已知数据1a ,
2a ,…,n a 的平均数为x ,方差为2
S ,则数据123a +,223a +,…,
23n a +的
方差为 .
3. 若1a ,2a ,…,30a ,方差为0.31,那么1a ,2a ,…,30a , x 这31
三解答题
A
B
C
D
第5题图E (第9题)
2.甲、乙两台机床同时加工直径为8mm 的同种规格零件,为了检查两台机床加工零件的稳定性,质检员从两台机床的产品中各抽取5件进行检测,结果如下(单位:mm ):
(1)分别求出这两台机床所加工零件直径的平均数和方差;
(2)根据所学的统计知识,你认为哪一台机床生产零件的稳定性更好一些,说明理由.
3.(6分)如图,在Rt △ABC 中,∠BAC=90º,E 、F 分别是BC 、AC 的中点,延长BA 到点D ,使AB AD 2
1
,连结DE 、DF 。
求证:AF 与DE 互相平分; (1) 若BC=4,求DF 的长。
4.国贸商店服装柜在销售中发现:“宝乐”牌童装平均每天可以售出80件,每件盈利40元。
为了迎接“六·一”儿童节,商场决定采取适当的降价措施,扩大销售量,增加盈利,尽快减少....库存..。
经调查发现:每件童装每降价2元,商场平均每天可多销售6件。
(1)若每件童装降价6元,则商场盈利多少元?
(2)若商场每天要想盈利1200元,请你帮助商场算一算,每件童装应降价多少元? 3.若商场要获得最大盈利应降价多少元?。