统计考点讲解和习题训练

合集下载

统计学习题与答案解析

统计学习题与答案解析

第一章绪论一、填空题1.统计一词从不同角度理解有三种涵义,即统计工作、统计资料和统计学。

2.社会经济统计的研究对象是社会经济现象的数量方面。

3.统计总体具有的特点是大量性、同质性和差异性。

4.标志是说明总体单位特征的,可以分为品质标志和数量标志。

5.统计指标是说明总体特征的,其构成要素有6个,即指标名称、数值、计量单位、计算方法、时间范围、空间范围。

6.职工的文化程度是品质标志,工龄是数量标志。

7.企业的机器台数和职工人数是属于离散变量,而固定资产原值和销售收入是连续变量。

8.要了解我国乳品企业的生产情况,总体是所有乳品企业,总体单位是每一个乳品企业。

9.要了解我国乳品企业的设备状况,总体是所有乳品企业,总体单位是每一个乳品企业。

10.学生的性别、民族属于品质标志,而学生的身高、体重是数量标志。

11.统计指标的概念完整表述为:“说明社会经济现象总体的数量特征的概念和具体数值”。

12.按统计指标的性质不同,统计指标可分为数量指标和质量指标。

二、判断题1.随着研究目的的不同,总体与总体单位之间是可以变换的,指标与标志也是可以变换的。

(T )2.张明同学期末数学成绩85分,这是统计指标。

(F )3.总体单位的特征用指标来说明,总体的特征用标志来说明。

(F )4.标志可以用文字表现,也可以用数字表现。

(T )5.指标可以用文字表现,也可以用数字表现。

(F )6.指标值是由标志值汇总计算而得到。

(T )7.在全国人口普查中,“年龄”是变量。

(T )8.某班学生学习情况调查中,班级名称和学生姓名都是可变标志。

(F )9.张明同学期末数学成绩85分,“成绩”是连续变量,“85分”是变量值。

( F )10.某企业职工的姓名、民族、年龄、工种等都是品质标志。

(F )11.统计的研究对象是社会经济现象总体的数量方面。

( F )三、单项选择题1.社会经济统计学的研究对象是( A )。

A社会经济现象的数量方面B人类生活现象的数量方面C自然科学研究的数量方面D社会经济现象的质量方面2.在确定统计总体时必须注意( A )。

统计基础知识及练习题

统计基础知识及练习题

统计基础知识及练习题第一章总论第一部分本章主要内容一、统计的涵义(一)什么是统计统计的概念:统计,是指对与某一现象有关的数据的搜集、整理、计算和分析等的活动。

在实际应用中,统计的三种涵义:统计工作、统计资料和统计学。

(二)统计工作、统计资料和统计学三者之间的关系第一,统计工作与统计资料是统计活动过程与活动成果的关系。

第二,统计工作与统计学是统计实践与统计理论的关系。

第三,统计工作是先于统计学而发展起来的。

二、统计学中的基本概念(一)总体与总体单位总体是指客观存在的,在同一性质基础上结合起来的许多个别事物的整体,亦称统计总体。

总体单位是指构成统计总体的个别事物。

总体和总体单位的概念不是固定不变的,随着研究目的不同,总体和总体单位也会有所不同。

(二)指标与标志指标是反映总体现象数量特征的概念;指标还可以是反映总体现象数量特征的概念及其具体数值。

标志是说明总体单位特征的名称。

标志按其性质不同,可以分为品质标志与数量标志。

指标与标志既有明显的区别,又有密切的联系。

(三)变异与变量标志在同一总体不同总体单位之间的差别就称为变异。

标志按其总体单位的表现不同,分为不变标志和变异标志。

变异标志有品质变异标志和数量变异标志之分。

总体的基本特征:同质性、大量性、差异性。

习惯上将数量变异标志称为变量。

数量变异标志的表现形式是具体的数值,称为变量值。

按变量值的连续性可把变量分为连续变量与离散变量两种。

三、统计的任务与过程(一)统计的任务对国民经济和社会发展情况进行统计调查、统计分析,提供统计资料和统计咨询意见,实行统计监督。

(二)统计的过程统计的工作过程划分为统计设计、统计调查、统计整理和统计分析四个阶段。

统计的认识过程是:从定性认识到定量认识,再到定量认识与定性认识相结合。

第二章统计调查第一部分本章主要内容一、统计调查的概念与种类(一)统计调查的概念与作用统计调查是按照预定的目的和任务,运用科学的统计调查方法,有计划、有组织地向客观实际搜集统计资料的过程。

高中统计练习题及讲解

高中统计练习题及讲解

高中统计练习题及讲解一、选择题1. 以下哪个选项是描述数据集中趋势的统计量?- A. 方差- B. 标准差- C. 平均数- D. 极差2. 一组数据的中位数是50,众数是60,这组数据的分布可能是怎样的?- A. 正偏态分布- B. 负偏态分布- C. 对称分布- D. 无法确定二、填空题1. 某班级学生数学成绩的平均数为80分,方差为100,如果一个学生的成绩是90分,那么他的标准分是______。

2. 已知一组数据的中位数为40,如果将这组数据的每个数值都增加10,新的中位数为______。

三、解答题1. 某公司员工的月收入数据如下:4000元,5000元,6000元,7000元,8000元。

请计算这组数据的平均数、中位数和众数。

2. 某班学生期末考试成绩如下:70分,80分,90分,100分。

计算这组数据的方差和标准差。

四、数据分析题某市中学生的身高数据如下(单位:厘米):165,170,175,180,185。

请分析这组数据的分布特征,并计算其平均身高、中位数、众数、方差和标准差。

高中统计练习题讲解一、选择题1. C. 平均数是描述数据集中趋势的统计量,它表示数据集中所有数值的算术平均。

2. A. 如果中位数小于众数,通常意味着数据集呈现正偏态分布。

二、填空题1. 标准分是指一个数值与平均数的差除以标准差。

首先计算平均数:(4000 + 5000 + 6000 + 7000 + 8000) / 5 = 6000。

然后计算标准差:√(100) = 10。

最后计算标准分:(90 - 6000) / 10 = -5。

2. 当数据集中的每个数值都增加一个常数时,中位数也会增加相同的常数。

因此,新的中位数为40 + 10 = 50。

三、解答题1. 平均数 = (4000 + 5000 + 6000 + 7000 + 8000) / 5 = 6000元。

中位数 = 6000元(中间的数值)。

众数 = 6000元(出现次数最多的数值)。

人教版七年级数学下册统计调查 典型例题(考点)讲解+练习(含答案)

人教版七年级数学下册统计调查 典型例题(考点)讲解+练习(含答案)

【若缺失公式、图片现象属于系统读取不成功,文档内容齐全完整,请放心下载。

】统计调查知识讲解责编:杜少波【学习目标】1.了解全面调查和抽样调查的优缺点,能选择合适的调查方式,解决有关问题;2.了解总体、样本、样本容量等相关概念;3.会用扇形统计图、条形统计图和折线统计图表示数据,并能从统计图或表中获取信息.【要点梳理】要点一、统计调查1.统计相关概念总体:调查时,调查对象的全体叫做总体.个体:组成总体的每一个调查对象叫做个体.样本:从总体中取出的一部分个体叫做总体的一个样本.样本容量:样本中个体的数量叫做样本容量(不带单位).要点诠释:(1)“调查对象的全体”一般是指调查对象的某种数量指标的全体,如对于一个班级,如果考察的是这个班学生的身高,那么总体是指这个班学生身高的全体,不能错误地理解为学生的全体是总体.(2)样本是总体的一部分,一个总体中可以有许多样本,样本在一定程度上能够反映总体,为了使样本能较好地反映总体情况,在选取样本时要注意使其具有一定的代表性.(3)样本容量是一个数字,不能有单位.一般地,样本容量越大,通过样本对总体的估计越精确,在实际研究中,要根据具体情况确定样本容量的大小.例如:“从5万名考生的数学成绩中抽取2000名考生的数学成绩进行分析”,样本是“2000名考生的数学成绩”,而样本容量是“2000”,不能将其误解为“2000名考生”或“2000名”.2.调查的方法:全面调查和抽样调查(1)全面调查:考察全体对象的调查叫做全面调查.要点诠释:(1)全面调查又叫“普查”,它是指在统计的过程中,为了某种特定的目的而对所有考察的对象一一作出的调查,在记录数据时,通常用划记法进行记录数据.(2)一般来说,全面调查能够得到全体被调查对象的全面、准确的信息,但有时总体中的个体的数目非常大,全面调查的工作量太大;有时受条件的限制,无法进行全面调查;有时调查具有破坏性(例如:测试一批灯泡的使用寿命或炮弹的杀伤半径等),不能进行全面调查.(2)抽样调查:从调查对象中抽取部分对象进行调查,然后根据调查的数据推断全体对象的情况,这种调查方式称为抽样调查.要点诠释:(1)从总体中抽取部分个体进行调查的方式,我们称抽样调查,在抽取的过程中,总体中的每一个个体都有相等的机会被抽到,像这样的抽样方式是一种简单随机抽样.(2)抽样调查方便、快捷,能够减少调查统计的工作量但调查的结果不如“全面调查”得到的结果准确.(3)调查方法的选择:①全面调查是对考查对象的全体调查,它要求对考查范围内所有个体进行一个不漏的逐个准确统计;而抽样调查则只是对总体中的部分个体进行调查,以样本来估计总体的情况.②在调查实际生活中的相关问题时,要灵活处理,既要考虑问题本身的需要,又要考虑实现的可能性和所付出代价的大小.要点二、数据的描述描述数据的方法有两种:统计表和统计图.统计表:利用表格将要统计的数据填入相应的表格内,表格统计法可以很好地整理数据统计图:利用“条形图”、“扇形图”、“折线图”描述数据,这样做的最大优点是将表格中的数据所呈现出来的信息直观化.要点诠释:(1)条形统计图:用线段长度表示数据,根据数据的多少画成长短不同的长方形直条,然后按顺序把这些直条排列起来,条形统计图很容易看出数据的大小,便于比较,但不能清楚地反映各部分占总体的百分比.(2)扇形统计图:用整个圆表示总体,用圆内各个扇形的大小表示各部分数量,从扇形上可清楚地看出各部分量和总数量之间的关系,但不能直接表示出各个项目的具体数据.(3)折线统计图:用一个单位长度表示一定的数量,根据数量的多少描出各点,然后把各点用线段依次连接起来,折线图不但可以表示出数量的多少,而且能够清楚地表示出数量的增减变化情况,但不能清楚地反映数据的分布情况.【典型例题】类型一、统计学及其相关概念1.某次考试有3000名学生参加,为了了解3000名学生的数学成绩,从中抽取了1000名学生的数学成绩进行调查统计分析,在这个问题中,有下述3种说法:①1000名考生是总体的一个样本;②3000名考生是总体;③1000名考生数学平均成绩可估计总体数学平均成绩;④每个考生的数学成绩是个体.其中正确的说法有( ).A.0种 B.1种 C.2种 D.3种【思路点拨】总体是3000名学生的数学成绩,个体是这次考试中每名学生的数学成绩,样本是抽取的1000名学生的数学成绩,样本容量是1000.【答案】C.【解析】解:①、②两个说法指的是考生而不是考生的成绩,故①、②两个说法不对,④指的是考生的成绩,故④对.③用样本的特征估计总体的特征,是抽样调查的核心,故③对.【总结升华】总体、样本的考察对象是相同的,所不同的是范围的大小,在本题中,总体、样本都是指考生的成绩,而不是考生.举一反三:【变式】为了了解某市2万名学生参加中考的情况,教育部门从中抽取了600名考生的成绩进行分析,这个问题中().A.2万考生是总体;B.每名考生是个体;C.个体是每名考生的成绩;D.600名考生是总体的一个样本.【答案】C.类型二、普查和抽样调查2.(2015•重庆)下列调查中,最适合用普查方式的是()A.调查一批电视机的使用寿命情况B.调查某中学九年级一班学生的视力情况C.调查重庆市初中学生每天锻炼所用的时间情况D.调查重庆市初中学生利用网络媒体自主学习的情况【思路点拨】由普查得到的调查结果比较准确,但所费人力、物力和时间较多,而抽样调查得到的调查结果比较近似.【答案】B.【解析】解:A、调查一批电视机的使用寿命情况,调查具有破坏性,适合抽样调查,故A不符合题意;B、调查某中学九年级一班学生的视力情况,适合普查,故B符合题意;C、调查重庆市初中学生每天锻炼所用的时间情况,调查范围广,适合抽样调查,故C不符合题意;D、调查重庆市初中学生利用网络媒体自主学习的情况,适合抽样调查,故D不符合题意;故选:B.【总结升华】本题考查了抽样调查和全面调查的区别,选择普查还是抽样调查要根据所要考查的对象的特征灵活选用,一般来说,对于具有破坏性的调查、无法进行普查、普查的意义或价值不大,应选择抽样调查,对于精确度要求高的调查,事关重大的调查往往选用普查.3.下列调查适合作抽样调查的是( ).A.了解义乌电视台“同年哥讲新闻”栏目的收视率B.了解某甲型H1N1确诊病人同机乘客的健康状况C.了解某班每个学生家庭电脑的数量D.“神七”载人飞船发射前对重要零部件的检查【思路点拨】抽样调查不可能进行全面调查的现象.【答案】A.【解析】解:要了解义乌电视台“同年哥讲新闻”栏目的收视率,显然应采用抽样调查的方式.而对于B、D选项,因为漏掉每一个个体携带H1N1病毒者或者“神七”载人飞船有一个小零件不合格,都会出现意想不到的后果,因此需要采用全面调查的方式.了解某班每个学生家庭电脑的数量,范围小,工作量小,一般也采用全面调查的方式.故选A.【总结升华】①在具体的问题情境中,要根据需要选择用全面调查还是抽样调查的方式进行调查;抽样调查得到的信息的准确度受调查对象(即样本)的数量和特点影响,故抽样时必须注意调查对象是否具有代表性和广泛性.举一反三:【变式】下列调查中,哪些是全面调查的方式,哪些是用抽样调查方式来收集数据的?(1)为了了解你所在的班级的每个同学的身高,向全班同学做调查.(2)为了了解你所在的班级的同学每天的学习时间,选取班级中学号为单号数的所有同学做调查.(3)为了了解某奶牛场中500头奶牛的产奶量,从中抽取出50头进行分析测量.【答案】(1)采用的是全面调查方式收集数据的;(2)、(3)是采用抽样调查方式收集数据的.类型三、数据的描述4.2010年亚运会即将在广州举行,广元小学开展了“你最喜欢收看的五项亚运会球类比赛(只选一项)”抽样调查.根据调查数据,小红计算出喜欢收看排球比赛的人数占抽样人数的6%,小明则绘制成如下不完整的条形统计图(如图所示),请你根据这两位同学提供的信息,解答下面的问题:(1)将统计图补充完整;(2)根据以上调查,试估计该校1800名学生中,最喜欢收看羽毛球的人数.【思路点拨】依据条形图反映出来的数量作答.【答案与解析】解:(1)因为喜欢排球的12人占抽样总人数的6%,故抽样人数为:故喜欢乒乓球的人数为:200-12-38-80-20=50(人).(2)喜欢收看羽毛球人数为:12=200(人),6%20⨯1800=180(人).200【总结升华】把小长方形对应的纵轴数相加即得到抽取的调查报告数,这也是样本数;每组所占样本的百分比乘总数即这组调查报告约有的份数.5.南县农民一直保持着冬种油菜的习惯,利用农闲冬种一季油菜.南县农业部门对2009年的油菜籽生产成本、市场价格、种植面积和产量等进行了调查统计,并绘制了如下统计表与统计图(如图所示):每亩生产成本110元每亩产量130千克油菜籽市场价格3元/千克种植面积500000亩请根据以上信息解答下列问题(1)种植油菜每亩的种子成本是多少元?(2)农民冬种油菜每亩获利多少元?(3)2009年南县全县农民冬种油菜的总获利多少元?(结果用科学记数法表示)【思路点拨】由扇形统计图反映出来的信息知:种子占生产成本的10%,根据这一点不难解答本题.【答案与解析】解:(1)种子占成本的百分数为 1-10%-35%-45%=10%,故种植油菜每亩的种子成本为:110×10%=11(元).(2)由统计表知,每亩油菜销售总价为:130×3=390(元),故农民冬种油菜每亩获利390-110=280(元).(3)因为农民种植油菜.每亩获利280元,则500000亩油菜共获利:280×500000=8140000000=1.4×10(元).【总结升华】在扇形统计图中,各部分所占的百分比之和=1,扇形对应圆心角度数=该扇形所占百分比×360°.6.某住宅小区六月份的1至6日每天的用水量变化情况如图所示,那么这6天的平均用水量是A.30吨 B.31吨 C.32吨 D.33吨【答案】C.【解析】解:从折线统计图,可知1日的用水量为30吨,2日的用水量为34吨,3日的用水量为32吨,4日的用水量为37吨,5日的用水量为28吨,6日的用水量为31吨,由此可计算出这6天的平均用水量为(30+34+32+37+28+31)÷6=32(吨).【总结升华】折线图的特点:易于显示数据的变化趋势.【:统计图例4】举一反三:【变式】近年来国内生产总值增长率变化情况如图,从图上看下列结论不正确的是( ). A.1995~1999年国内生产总值增长率逐年减少B.2000年国内生产总值的年增长率开始回升C.这7年中,每年的国内生产总值不断增长D.这7年中,每年的国内生产总值有增有减【答案】D类型四、综合应用7.(2016•河南模拟)学校准备在各班设立图书角以丰富同学们的课余文化生活,为了更合理的搭配各类书籍,学校团委以“我最喜爱的书籍”为主题,对学生最喜爱的一种书籍类型进行随机抽样调查,收集整理数据后,绘制出以下两幅未完成的统计图,请根据图1和图2提供的信息,解答下列问题:(1)在这次抽样调查中,一共调查了多少名学生?(2)请把折线统计图(图1)补充完整;(3)求出扇形统计图(图2)中,体育部分所对应的圆心角的度数;(4)如果这所中学共有学生1800名,那么请你估计最喜爱科普类书籍的学生人数.【思路点拨】(1)用文学的人数除以所占的百分比计算即可得解;(2)根据所占的百分比求出艺术和其它的人数,然后补全折线图即可;(3)用体育所占的百分比乘以360°,计算即可得解;(4)用总人数乘以科普所占的百分比,计算即可得解.【答案与解析】解:(1)90÷30%=300(名),故一共调查了300名学生;(2)艺术的人数:300×20%=60名,其它的人数:300×10%=30名;补全折线图如图;(3)体育部分所对应的圆心角的度数为:(4)1800×=480(名).×360°=48°;答:1800名学生中估计最喜爱科普类书籍的学生人数为480.【总结升华】本题考查的是折线统计图和扇形统计图的综合运用,折线统计图表示的是事物的变化情况,扇形统计图中每部分占总部分的百分比等于该部分所对应的扇形圆心角的度数与360°的比.【:统计图练习1】举一反三:【变式1】如果想表示我国从20002010年间国民生产总值的变化情况,最合适的是采用( ).A.条形统计图B.扇形统计图 C.折线统计图 D.以上都很合适【答案】C.【变式2】(2015•恩施州)某中学开展“阳光体育一小时”活动,根据学校实际情况,如图决定开设“A:踢毽子,B:篮球,C:跳绳,D:乒乓球”四项运动项目(每位同学必须选择一项),为了解学生最喜欢哪一项运动项目,随机抽取了一部分学生进行调查,丙将调查结果绘制成如图的统计图,则参加调查的学生中最喜欢跳绳运动项目的学生数为()A.240B.120C.80D.40【答案】D.。

《统计》知识梳理及典型例题

《统计》知识梳理及典型例题

成绩高9.5分。这两人的平均成绩是多少分?
分析:这是一道较复杂的平均问题,分析时要抓住平 均就是移多补少的实质,弄清题中的数量关系。
“2人的平均成绩比全班的平均成绩高9.5分”那么在全班 平均时,将这2人高出的部分移补给了其他38名学生。移补的 分数是9.5×2=19(分),其他38名学生的平均成绩将提高 19÷38=0.5(分),则全班平均成绩是89+0.5=89.5 (分)。补考两人的平均成绩是89.5+9.5=99(分)
例题:(1)求1 ,2 ,3 ,4 ,5这组数的中位数? (2)求1 ,2 ,3 ,4 ,5 ,6这组数的中位数?
解答:(1)在1 ,2 ,3 ,4 ,5这组数中,3就是这组数 据的中位数。 (2)在1 ,2 ,3 ,4 ,5这组数中,(3+4)÷2=3.5, 3.5就是这组数据的中位数。
众数:
看上面的统计图,回答下面的问题: (1)中国和韩国分别在哪一届亚运会上获得 的金牌数量最多? (2)哪一届亚运会两国金牌数量相差最少?
解答:(1)中国在第11届亚运会获得的金牌数最多,韩 国在第14届获得的金牌数最多。 (2)第10届亚运会两国金牌数相差最少。
扇形统计图
扇形统计图是用整个圆的面积表示总 数,用圆内各个扇形的大小表示各部分 数量占总数的百分数,通过扇形统计图 可以清楚地表示出各部分数量通总数之 间的关系。
例题:(1)某班分成三组投篮球。第一组投中28个, 第二组投中33个,第三组投中23个,平均每组投中多 少个?
解答:
(28+33+23)÷3 =84÷3 =28(个) 答:平均每组投中28个。
例题:(2)某班有40名学生,期中考试时数学有2名
学生因故缺考,其他学生的平均分是89分。后来缺考
的2名学生补考后,2人的平均成绩比全班40人的平均

统计基础题库及答案详解

统计基础题库及答案详解

统计基础题库及答案详解一、选择题1. 以下哪项不是描述性统计的内容?A. 均值B. 方差C. 标准差D. 相关性分析答案:D2. 在统计学中,总体是指:A. 研究对象的全体B. 研究对象的一部分C. 研究对象的样本D. 研究对象的统计量答案:A3. 下列哪个是离散型随机变量的期望值?A. 0B. 1C. 2D. 3答案:B二、填空题1. 统计学中,________是用来估计总体参数的。

答案:样本2. 标准正态分布的均值为________,标准差为________。

答案:0,13. 相关系数的取值范围在________和________之间。

答案:-1,1三、简答题1. 简述什么是中心极限定理?答案:中心极限定理是统计学中的一个基本定理,它描述了在一定条件下,大量独立同分布的随机变量之和经过标准化后,其分布趋近于正态分布。

2. 什么是抽样误差?为什么会产生抽样误差?答案:抽样误差是指由于样本的随机性导致的样本统计量与总体参数之间的差异。

产生抽样误差的原因主要是因为样本是从总体中随机抽取的,它不能完美代表总体。

四、计算题1. 给定一组数据:2, 4, 6, 8, 10,计算其均值和标准差。

答案:均值:(2+4+6+8+10)/5 = 6标准差:sqrt(((2-6)^2 + (4-6)^2 + (6-6)^2 + (8-6)^2 + (10-6)^2) / 5) = sqrt(20/5) = 22. 如果一个正态分布的总体均值为μ=100,标准差为σ=15,求P(85 < X < 115)。

答案:使用标准正态分布表,查找z值分别为(85-100)/15和(115-100)/15,然后计算两个z值对应的正态分布累积概率,最后相减即可得到所求概率。

五、论述题1. 论述统计推断与描述性统计的区别和联系。

答案:描述性统计主要关注对数据集的总结和描述,如计算均值、中位数、方差等统计量。

而统计推断则是在已知样本信息的基础上,对总体参数进行估计或假设检验。

统计考试题库答案及解析

统计考试题库答案及解析

统计考试题库答案及解析一、选择题1. 在统计学中,描述数据集中趋势的度量是:A. 方差B. 标准差C. 平均数D. 众数答案:C解析:平均数是描述数据集中趋势的一种度量,它表示所有数据值的总和除以数据的个数。

2. 下列哪个选项不是描述数据离散程度的统计量?A. 极差B. 四分位数间距C. 方差D. 标准差答案:B解析:四分位数间距是描述数据分布的统计量,它表示数据的中间50%的范围,而不是离散程度。

二、填空题1. 标准正态分布的均值是______,标准差是______。

答案:0,1解析:标准正态分布是一个均值为0,标准差为1的特殊正态分布。

2. 样本容量为n的样本均值的方差是总体方差的______。

答案:1/n解析:样本均值的方差等于总体方差除以样本容量n,这是根据样本均值的方差公式得出的。

三、简答题1. 什么是标准差?它在数据分析中有什么作用?答案:标准差是衡量数据集中各数据点偏离平均值程度的一个统计量。

它在数据分析中的作用是描述数据的离散程度,即数据的波动大小。

解析:标准差越大,说明数据点偏离平均值的程度越大,数据越不稳定;标准差越小,数据点越集中,数据越稳定。

四、计算题1. 给定一组数据:2, 4, 6, 8, 10,计算这组数据的平均数和标准差。

答案:平均数 = (2 + 4 + 6 + 8 + 10) / 5 = 6标准差 = √[(Σ(xi - x̄)²) / (n - 1)] = √[(2² +2² + 0² + 2² + 2²) / 4] = √2解析:首先计算平均数,然后将每个数据点减去平均数,计算每个差的平方,求和后除以(n-1),最后取平方根得到标准差。

五、论述题1. 论述统计学在商业决策中的应用。

答案:统计学在商业决策中扮演着重要的角色。

它可以帮助企业分析市场趋势、消费者行为、销售数据等,从而制定有效的市场策略。

统计考试复习重点加详细例题

统计考试复习重点加详细例题
32
10.下列四句话有几句正确 ? 同一资料两独立样本均数的比较,两种统 计检验有 t2=F的关系。 做任何比较组的t检验前,都应先做方差齐 性检验。 同一资料两样本均数的比较,t 检验与可 信区间的检验结果一致的。 参数检验的结果比非参数检验结果更可信 A. 1句 b.2句 c.3句 d.4句
33
2)是样本均数的标准差 3)反映总体均数的变异 4)反映平均的抽样误差大小。 5)设x的总体均数为μ,则样本均数的均
数近似μ,样本均数的标准差为 x
20
第三章 总体均数的估计 与假设检验
应掌握概念: 1.何谓统计推断,什么是统计量、参数 2.均数的标准误与标准差区别 3. 总体均数可信区间与参考值范围的区别 4. t 检验(配对或两组设计)的计算及应用时 满足的条件
18
下面说法有几句正确( )。
s ① x 表示样本均数的离散程度
②当两组计量数据单位不同时, 变异大小 的比较可用比较 ③中位数和四分位间距可描述一组偏态 分布数据的平均水平和变异大小 ④同一组数据计算的标准差一定是小于 均数 a. 1句 b.2句 c.3句 d.4句
19
是非题
S X 1)反映是一组数据的随机误差大小
Sd/ n
值(d)的t检验公式
d
t
/
2,
S d
差值均数的可信区间 估计公式
23
第四章 多个样本均数比较的方差分 析
1. 何时采用方差分析 2.何谓完全随机设计资料的方差分析 3. 何谓随机区组设计资料的方差分析 4. 何时用均数的多重比较(SNK-q 检验 、Dunnett - t检验 )
24
方差分析(one-way)与t检验
专用公式 2 n( A2 1)

《统计》知识点总结+典型例题+练习(含答案)

《统计》知识点总结+典型例题+练习(含答案)

统计考纲要求1.理解总体、个体、样本等概念.2.会指出具体问题中的总体、个体、样本、样本容量.3.了解简单随机抽样、系统抽样、分层抽样等三种抽样方法.4.会根据特征选用合适的抽样方法抽取样本.5.理解用样本的频率分布估计总体.6.理解用样本均值、方差和标准差估计总体的均值、方差和标准差.知识点一:总体与样本1.定义:在统计中,所研究对象的全体叫做总体,组成总体的每个对象叫做个体.2.定义:被抽取出来的个体的集合叫做总体的样本,样本所含个体的数目叫做样本容量. 知识点二:抽样1.简单随机抽样定义:我们采用抽签的方法,将总体按照某种顺序编号,写在小纸片上.将小纸片揉成小团,放到一个不透明的袋子中,充分搅拌后,再从中逐个抽出10个小纸团.最后根据编号找到个体.这种抽样叫做简单随机抽样.注意:简单随机抽样必须保证总体的每个个体被抽到的机会是相同的.也就是说,简单随机抽样是等概率抽样.2.系统抽样定义:当总体所含的个体较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分中抽取一定数目的个体.这种抽样叫做系统抽样(或机械抽样).主要步骤:从容量为N的总体中,用系统抽样抽取容量为n的样本,按照下面的步骤进行:(1)编号:将总体的N个个体编号;(2)确定间隔:可以考虑用Nn(取整数)作间隔分段,将总体分成n段;(3)抽样:按照一定的规则抽取样本.如抽每段的第k个顺序号的个体(k为小于Nn的整数),得到容量为n的样本.3.分层抽样当总体是由有明显差异的几个部分组成时,可将总体按差异情况分成互不重叠的几个部分——层,然后按各层个体总数所占的比例来进行抽样,这种抽样叫做分层抽样. 对分层抽样的每一层进行抽样时,可采用简单随机抽样或系统抽样. 知识点三:用样本估计总体 1.用样本的频率分布估计总体频率频率的定义:各组内数据的个数,叫做该组的频数.每组的频数与全体数据的个数之比叫做该组的频率.频率分布直方图:根据频数分布表中各组的频率,得到频率分布表,由频率分布表画出频率分布直方图.用样本的频率分布估计总体的步骤为: (1)选择恰当的抽样方法得到样本数据;(2)计算数据最大值和最小值、确定组距和组数,确定分点并列出频率分布表; (3)绘制频率分布直方图;(4) 观察频率分布表与频率分布直方图,根据样本的频率分布,估计总体中某事件发生的概率.2.用样本均值、标准差估计总体 (1)平均数或均值定义:如果有n 个数1x ,2x ,…,n x ,那么121()n x x x x n=+++叫做这n 个数的平均数或均值,x 读作“x 拔”. 均值反映出这组数据的平均水平. (2)样本方差定义:如果样本由n 个数1x ,2x ,…,n x 组成,那么样本的方差为 2222121()()()1n s x x x x x x n ⎡⎤=-+-++-⎣⎦-. (3)样本标准差由于样本方差的单位是数据的单位的平方,使用起来不方便.因此,人们常使用它的算术平方根来表示个体与样本均值之间偏离程度,叫做样本标准差.即(+-n s x .题型一 总体、个体、样本、样本容量例1 某地区为了掌握7岁儿童身高状况,随机抽取200名儿童测试身高,请指出其中的总体、个体、样本与样本容量.解答:该地区所有7岁儿童的身高是总体,每一个7岁儿童的身高是个体,被抽取的200名7岁儿童的身高是样本,样本容量是200.题型二抽样例2某中职学校为了解2009级新生的身体发育情况,从1000名新生中,利用系统抽样,抽取一个容量为50的样本.请你来完成这个抽样.解答:将这1000名学生编号(也可以利用新生录取号),由于100020 50,所以取每段间隔为20,将编号分成50段,规定各段抽取第16个顺序号的学生,得到容量为50的样本.其学生号码依次为16,36,56,76, (996)题型三用样本均值、标准差估计总体例3 科研人员在研究地里的麦苗长势时,随机抽取20株,测得各株高为(单位:mm): 61675867656459625866645960635860 62606363求样本均值、样本方差、样本标准差.分析:应用公式解答:样本均值61.95,样本方差约为8.68,样本标准差约为2.95.一、选择题1.要能清楚的表示各部分在总体中所占的百分比,应选择().A 扇形统计图B 折线统计图C条形统计图 D 表框统计2.某社区有400个家庭,其中高等收入家庭120户,中等收入家庭180户,低收入家庭100户,为了调查社会购买力的某项指标,要从中抽取一个容量为100的样本记作①;某校高一年级有12名女排球运动员,要从中选出3人调查学习情况记作②.那么,完成上述2项调查应采用的抽样方法是( ).A. ①用随机抽样法,②用系统抽样法B.①用分层抽样法,②用随机抽样法C.①用系统抽样法,②用分层抽样法D.①用分层抽样法,②用系统抽样法3. 以下物征数中能反映一组数据波动大小的是().A极差B平均数C方差D以上都不是4.某同学参加跳远比赛前,若教练想对他10次的训练成绩进行了分析以判断他的成绩是否稳定,则教练需要知道该同学这10次成绩的( ).A平均数 B.方差 C.频数 D.频率5.数据5,7,7,8,10,11的平均值是( ).A.2B. 4C.8D. 16.一组数据:5,7,7,a,10,11,它们的平均值是8,则a的值是( ).A2 B.4 C.8 D.17.扇形统计图中,占圆面积40%的扇形的圆心角的度数是(B )A 162°B 144°C 150°D 120°8.用随机数表法从100名学生(男生25人)中抽选20人进行问卷调查,某男生被抽到的概率是( C ).A.1100B.125C.15D.149. 为了了解1200名学生对课改试验的意见,计划从中抽取一个容量为30的样本,若采用系统抽样的方法,则分段间隔为( ).A.40B.30C.20D.1210. 数据-1,-2,0,1,2的标准差是()A 1B 2 C、0 D二、判断题1.数据1,2,3,2 的众数是2, ( )2.为了了解某校学生早餐就餐情况,四位同学做了不同的调查:小华向初一年级的三个班级的全体同学做了调查;小明向初二年级的三个班级的全体同学做了调查;小华向初三年级的全体同学做了调查;小珍分别向初一(1)班、初二(1)、初三(1)班的全体同学做了调查,则小华同学的抽样调查较科学.()3.要了解一批灯泡的使用寿命,从中抽取60只灯泡进行试验,在这个问题中,样本是抽取的60只灯泡.()4.为了考查某地区初中毕业生的数学毕业会考情况,从中抽查了200名考生的数学成绩,在这个问题中总体是被抽查的200名考生.()5.某校一个年级有12个班,每个班有50名学生,每班的学号都是1~50,为了了解学生的课外兴趣爱好,要求对每班学号为20的学生进行问卷调查,那么这里采用的抽样方法是抽签法.()6.某职业学校高一年级有机电、财经、医护这三个专业,其学生人数之比是5∶3∶2,若用分层抽样的方法抽取容量为100的样本,则应从医护专业中抽取20个个体.()7. 为了知道一锅汤的味道,妈妈从锅里舀了一勺汤尝尝,这种调查方式是抽样调查.()8.若数据1,2,5,3,4的平均数为3.()9.青年歌手大奖赛共有10名选手参赛,并请了7名评委,下表是7名评委给参加最后决赛的两位选手甲评定的成绩,去掉一个最高分和一个最低分后,甲、乙选手剩余数据的平均成绩分别为84.()10. 有四位同学从编号为1-50的总体中抽取8个个体组成一个样本,他们选取的样本中个体编别为:①05,10,15,20,25,30,35,40;②43,44,45,46,47,48,49,50;③1,3,5,7,9,11,13,15,17;④43,25,2,17,35,9,24,19.认为样本④较具有随机性.()三、填空题1.从某工厂生产的某一批零件中,随机抽取10件,测得长度为(单位:cm):79、81、80、78、79、81、79、82、79、78,则总体是_______,个体是_______,样本是_______,样本容量是_______.2.0,-1,1,-2,1 的中位数是为________.3.数据2,4,6,8 的平均数是是________.4.小新家今年6月份头6天用米量如下表:请你运用统计知识,估计小新家6月份(30天)用米量为________千克。

中考数学专题复习《统计》知识点梳理及典型例题讲解课件

中考数学专题复习《统计》知识点梳理及典型例题讲解课件

反映一组数据
优数据的信息
中位数
缺点 易受极端值的影响
优点
众数
在生活实际中应用较多,是人们
反映一组数据
特别关心的一个量
的多数水平
当各个数据的重复次数大致相等
缺点
时,众数的意义不大
2.数据的波动
(1)在一组数据x1,x2,…,xn中,各数据与它们的平均数ҧ
3.(2023·聊城)4月15日是全民国家安全教育日.某校为了摸清该
校1500名师生的国家安全知识掌握情况,从中随机抽取了150
名师生进行问卷调查.这项调查中的样本是( C )
A.1500名师生的国家安全知识掌握情况
B.150
C.从中抽取的150名师生的国家安全知识掌握情况
D.从中抽取的150名师生
稍微减小一点;
④列频数分布表;
⑤用横轴表示各分段数据,纵轴反映各分段数据的频数,小长
方形的高表示频数,绘制频数分布直方图.
(5)组中值是上下限之间的中点数值,以代表各组标志值的
一般水平.
上限+下限
一般情况下,组中值=
.
2
2.各统计图的特点
扇形统
计图
统计图 条形统计图
频数分布直方
折线统计图

图形
特点
第5题图
B.样本中C等级所占百分比是10%
C.D等级所在扇形的圆心角为15°
D.估计全校学生A等级大约有900人

6.如图是某班甲、乙、丙三位同学最近5次数学成绩及其所在班
级相应平均分的折线统计图,则下列判断错误的是( D )
A.甲的数学成绩高于班级平均分,且成绩
比较稳定
B.乙的数学成绩在班级平均分附近波动,

专题1.6统计与概率三大考点与真题训练(解析版)

专题1.6统计与概率三大考点与真题训练(解析版)

2023年中考数学考前30天迅速提分复习方案(上海地区专用)专题1.6统计与概率三大考点与真题训练考点一:数据的收集与整理一、单选题1.(2023·上海·模拟预测)某校有4000名学生,随机抽取了400名学生进行体重调查,下列说法正确的是( )A.总体是该校4000名学生的体重B.个体是每一个学生C.样本是抽取的400名学生D.样本容量是400名学生【答案】A【分析】我们在区分总体、个体、样本、样本容量,这四个概念时,首先找出考查的对象,从而找出总体、个体,再根据被收集数据的这一部分对象找出样本,最后再根据样本确定出样本容量.【详解】解:A.总体是该校4000名学生的体重,说法正确,故A符合题意;B.个体是每一个学生的体重,原来的说法错误,故B不符合题意;C.样本是抽取的400名学生的体重,说法错误,故C不符合题意;D.样本容量是400,说法错误,故D不符合题意.故选:A.【点睛】本题主要考查了总体、个体、样本、样本容量,解题的关键是正确记忆各自的概念.总体是指考查的对象的全体,个体是总体中的每一个考查的对象,样本是总体中所抽取的一部分个体,而样本容量则是指样本中个体的数目.2.(2022·上海徐汇·统考二模)在知识竞赛中,成绩分为A,B,C,D四个等级,相应等级的得分依次记为100分,90分,80分,70分.将九年级二班参赛选手的成绩整理并绘制成如下的统计图,九年级二班参赛选手成绩的众数和中位数分别是()A.100和90B.100和80C.80和90D.80和80.【答案】B【分析】根据中位数和众数的定义求解即可.【详解】解:由统计图可知,A级的占比最多,即得分为100分的人数最多,∴二班参赛选手的成绩的众数为100;∵中位数是一组数据中处在最中间或处在最中间的两个数据的平均数,∴由扇形统计图可知处在最中间的成绩为80分或处在最中间的两个数据分别为80分,80分,∴中位数即为80,故选B.【点睛】本题主要考查了求中位数和众数,熟知二者的定义是解题的关键.3.(2020·上海虹口·统考二模)如图为某队员射击10次的成绩统计图,该队员射击成绩的众数与中位数分别是()A.8,7B.7,6.5C.7,7D.8,7.5【答案】D【分析】先根据折线图将这10个数据从小到大排列,再根据众数和中位数的概念求解可得.【详解】解:由折线图知,这10个数据分别为3、4、6、7、7、8、8、8、9、10,+=7.5,所以这组数据的众数为8,中位数为782故选:D.【点睛】本题主要考查众数和中位数,将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(最中间两个数的平均数),叫做这组数据的中位数;一组数据中出现次数最多的数据叫做众数.4.(2021·上海·上海市实验学校校考二模)为了了解某校九年级300名学生的体重情况,从中抽取50名学生的体重进行分析,在这项调查中,样本是指()A.300名学生B.300名学生的体重C.被抽取的50名学生D.被抽取的50名学生的体重【答案】D【分析】根据总体、个体、样本、样本容量的定义判断即可.【详解】解:为了解某校九年级300名学生的体重情况,从中随机抽取50名学生的体重进行分析,在这项调查中,样本是被抽取的50名学生的体重.故选:D.【点睛】本题考查了总体、个体、样本、样本容量,解题要分清具体问题中的总体、个体与样本,关键是明确考查的对象.总体、个体与样本的考查对象是相同的,所不同的是范围的大小.样本容量是样本中包含的个体的数目,不能带单位.二、填空题5.(2021·上海青浦·统考二模)为了解某区2400名初中教师中接种新冠疫苗的教师人数,随机调查了其中200名教师,结果有150人接种了疫苗,那么估计该区接种新冠疫苗的初中教师人数约有_______人.【详解】解:估计该区接种新冠疫苗的初中教师人数约有2400×150=1800(人),200故答案为:1800.【点睛】本题考查用样本估计总体.理解用样本估计总体的含义和掌握其公式是解答本题的关键.6.(2021·上海金山·二模)为了了解某校初三学生在体育测试中报名球类的情况,随机调查了40名学生的报名情况,得到如下数据.根据此信息,估计该校480名初三学生报名足球的学生人数约为_____人.7.(2021·上海嘉估计某个鱼塘里的鱼的数量,养殖工人网住了50条鱼,在每条鱼的尾巴上做个记号后,又将鱼放回鱼塘.等鱼游散后再随机撒网,网住60条鱼,发现其中有2条鱼的尾巴上有记号.设该鱼塘里有x条鱼,依据题意,可以列出方程:_____.8.(2021·上海静安·统考二模)为了了解学生用于阅读课外书籍的时间的情况,某校在300名九年级学生中随机对40名学生每周阅读课外书籍所用的时间进行统计.根据调查结果画出频率分布直方图,如图所示(每个小组可包括最小值,不包括最大值),由此可以估计该校九年级学生阅读课外书籍用的时间在6小时及以上的人数约为________.【答案】120【分析】根据直方图分析出课外阅读时间在6小时及以上的人数的频率,然后利用频率乘总人数即可求解.【详解】由图中可知,课外阅读时间在6小时及以上的人数的频率为0.25+0.15=0.4,∴所有学生中,课外阅读时间在6小时及以上的人数300×0.4=120人,故答案为:120.【点睛】本题考查频率分布直方图,理解频率分布直方图的意义是解题关键.9.(2021·上海闵行·统考二模)为了解全区104000个小学生家庭是否有校内课后服务需求,随机调查了4000个小学生家庭,结果发现有2800个小学生家庭有校内课后服务需求,那么估计该区约有________个小学生家庭有校内课后服务需求.【答案】72800【分析】先求出样本中学生参加校内课后服务所占的百分比,再用样本估算总体.【详解】280010400072800´=(人).4000故答案为:72800.【点睛】考查了用校本估算总体,解题关键先计算出样本中所占的百分比,再用样本的数据去估算总体情况.10.(2021·上海松江·统考二模)一次数学测试后,某班40名学生按成绩分成5组,第1、2、3、4组的频数分别为6、7、10、13,则第5组的频率为 _____.11.(2022·上海杨浦·统考二模)为了了解全区近4800名初三学生数学学习状况,从中随机抽取500名学生的测试成绩作为样本,将他们的成绩整理后分组情况如下:(每组)数据可含最低值,不含最高值根据上表信息,由此样本请你估计全区此次成绩在70~80分的人数大约是_______.【答案】1920【分析】根据题意和表格中的数据,可以先计算出80~90和90~100的学生人数,然后即可计算出70~80的学生人数,再计算出全区此次成绩在70~80分的人数即可.【详解】解:由题意可得,80~90的学生有:500×0.18=90(人),90~100学生有:500×0.04=20(人),∴样本中70~80的学生有:500-12-18-160-90-20=200(人),=1920,∴估计全区此次成绩在70~80分的人数大约是4800×200500故答案为:1920.【点睛】本题考查频数分布表、用样本估计总体,解答本题的关键是明确题意,求出样本中70~80分的人数.12.(2021·上海·上海市实验学校校考二模)某校200名学生一次数学测试的分数均大于75且小于150,分数段的频数分布情况如下:70~90有15人,90~105有42人,105~12 0有58人,135~150有35人(其中每个分数段可包括最小值,不包括最大值),那么测试分数在120~135分数段的频率是______________.三、解答题13.(2023·上海·模拟预测)小聪、小明参加了100米跑的5期集训,每期集训结束时进行测试.根据他们集训时间、测试成绩绘制成如下两个统计图.根据图中信息,解答下列问题:(1)这5期的集训共有多少天?(2)哪一期小聪的成绩比他上一期的成绩进步最多?进步了多少秒?(3)根据统计数据,结合体育运动的实际,从集训时间和测试成绩这两方面,简要说说你的想法.【答案】(1)55天(2)第3期小聪的成绩比他上一期的成绩进步最多,进步了0.2秒(3)个人测试成绩与很多因素有关,如集训时间不是越长越好,集训时间过长,可能会造成劳累,导致成绩下降;集训的时间为10天或14天时,成绩最好等.(言之有理即可)【分析】(1)根据图中的信息可知这5期的集训各有多少天,求出它们的和即可;(2)由折线统计图可得第3期小聪的成绩比他上一期的成绩进步最多,进步时间可由折线统计图计算;(3)根据图中的信心和题意,说明自己的观点即可,本题答案不唯一,只要合理即可.【详解】(1)∵4710142055++++=(天).∴这5期的集训共有55天.(2)由折线统计图可得第3期小聪的成绩比他上一期的成绩进步最多,进步了11.7211.520.2-=(秒),∴第3期小聪的成绩比他上一期的成绩进步最多,进步了0.2秒.(3)个人测试成绩与很多因素有关,如集训时间不是越长越好,集训时间过长,可能会造成劳累,导致成绩下降;集训的时间为10天或14天时,成绩最好等.(言之有理即可)【点睛】本题考查条形统计图、折线统计图、算术平均数,解答本题的关键是明确题意,利用数形结合的思想解答.14.(2021·上海徐汇·统考二模)问题:某水果批发公司用每千克2元的价格购进1000箱橘子,每箱橘子重10千克.由于购进的橘子有损耗,所以真正可以出售的橘子不到100 00千克.如果该公司希望这批橘子销售能获得5000元利润,应该把销售价格定为多少元?思路:为了解决这个问题,首先要估计这10000千克橘子中除去损耗后剩下多少橘子可以销售,因此需要估计损耗的橘子是多少千克.方案:为此,公司采用抽样调查来估计这批橘子的损耗情况.公司设计如下两种抽样方案:①从仓库中最方便处打开若干箱子逐个检查;②把这批橘子每箱从1~1000编号,用电脑随机选择若干号码,打开相应的箱子进行逐个检查.解决:(1)公司设计的两个抽样方案,从统计意义的角度考虑,你认为哪个方案比较合适?并说明理由;(2)该公司用合理的方式抽取了20箱橘子进行逐个检查,并在表中记录了每个被抽到的箱子里橘子的损耗情况.:被抽到的箱子里橘子的损耗情况表根据如表信息,请你估计这批橘子的损耗率;(3)根据以上信息,请你帮该公司确定这批橘子的销售价格,尽可能达到该公司的盈利目标(精确到0.01元/千克).【答案】(1)从统计意义的角度考虑,方案②比较合适,因为此时每箱橘子都有被抽到的可能,选取的样本具有代表性,属于简单随机抽样,所以方案②比较合适;(2)8.36%;(3)2.73元/千克【分析】(1)根据抽样调查时选取的样本必须具有代表性即可求解;(2)计算出抽取的20箱橘子的平均损耗率即可;(3)设该公司确定这批橘子的销售价格为x元/千克,根据利润=售价﹣进价列出方程即可.【详解】解:(1)从统计意义的角度考虑,方案②比较合适,因为此时每箱橘子都有被抽到的可能,选取的样本具有代表性,属于简单随机抽样,所以方案②比较合适;(2)(8.57+8.15)÷(10×20)×100%=8.36%.即估计这批橘子的损耗率为8.36%;(3)10000×(1﹣8.36%)x﹣2×10000=5000,解得,x≈2.73.答:该公司可确定这批橘子的销售价格约为2.73元/千克,能够尽可能达到该公司的盈利目标.【点睛】本题是一道利用统计知识解答实际问题的重点考题,主要考查利用统计图表处理数据的能力和利用样本估计总体的思想.从统计表中获取有用信息是解题的关键.15.(2022·上海青浦·统考二模)为了解某区3200名学生放学后在校体育运动的情况,调研组选择了有600名学生的W校,抽取40名学生进行调查,调查情况具体如下表:图表1:感兴趣的运动项目(1)此次调查的总体是__________,样本容量是__________.(2)若从9年级某学习加强班进行抽样调查,则这样的调查________(“合适”,“不合适”),原因是样本不是________样本;(3)根据图表1,估计该校对篮球感兴趣的学生的总人数为_____;(4)根据图表2,若从左至右依次是第一、二、三、四、五组,则中位数落在第___组.(5)若要从对篮球感兴趣的同学中选拔出一支篮球队来,现在有以下两名学生的投篮数据,记录的是每10次投篮命中的个数.甲同学:10、5、7、9、4;乙同学:7、8、7、6、7.若想要选择更稳定的同学,你会选择计算这两组数据的________,因为这个量可以代表数据的________.请计算出你所填写的统计量,并且根据计算的结果,选择合适的队员.【答案】(1)某区3200名学生放学后在校体育运动的情况,40(2)不合适;随机抽样(3)240(4)三(5)方差;离散程度;选择乙【分析】(1)根据总体及样本容量的相关概念可直接进行求解;(2)由题意可直接求解;【点睛】本题主要考查平均数、众数、中位数、方差及频数直方图;熟练掌握平均数、众数、中位数、方差及频数直方图是解题的关键.考点二:数据分析一、单选题1.(2022·上海松江·校考三模)小丽连续7次的数学考试成绩分数是:93、85、88、89、90、87、90.关于这组数据,下列说法正确的是( )A.中位数是88B.众数是90C.平均数是89D.方差是87【答案】B【分析】根据方差、众数、平均数、中位数的含义和求法,逐一判断即可.【详解】解:将数据重新排列为85、87、88、89、90、9093,、则这组数的中位数为89,众数为90,平均数为18587888990909388.97´++++++»(),所以说法正确的是B.故选:B.【点睛】本题考查了众数、中位数、平均数以及方差,解题的关键是牢记概念及公式.2.(2022·上海普陀·统考二模)某公司有9个子公司,某年各子公司所创年利润的情况如下表所示.根据表中的信息,下列统计量中,较为适宜表示该年各子公司所创年利润的平均水平的是( )A.方差B.众数C.平均数D.中位数【答案】D【分析】先分别求出平均数和中位数,再进行分析即可得.3.(2022·上海杨浦·统考二模)在一次引体向上的测试中,如果小明等5位同学引体向上的次数分别为:6、8、9、8、9,那么关于这组数据的说法,正确的是()A.平均数是8.5B.中位数是9C.众数是8.5D.方差是1.24.(2022·上海黄浦·统考二模)下列各统计量中,表示一组数据波动程度的量是()A.方差B.众数C.平均数D.频数【答案】A【分析】根据方差、众数、平均数、频数的意义即可求解.【详解】解:方差是表示一组数据波动程度的量,众数、平均数是表示一组数据集中趋势的量,频数是表示数据出现的次数,故选A.【点睛】本题考查了方差、众数、平均数、频数的意义,掌握以上知识是解题的关键.5.(2021·上海青浦·统考二模)某校为了解学生在“慈善募捐”活动中的捐款情况,进行了抽样调查,结果如表所示.那么该样本中学生捐款金额的中位数和众数分别是( )A.20元,50元B.35元,50元C.50元,50元D.20元,20元【答案】A【解析】根据中位数和众数的定义求解即可.【详解】解:∵本组数据从小到大排列共50个,且最中间的两个数据是20和20,∴这组数据的中位数为:2020202+=;∵捐款50元的人数最多,∴这组数据的众数是50.故选:A【点睛】本题考查中位数和众数的知识点,充分利用中位数和众数的定义是解题的关键.6.(2021·上海金山·二模)某人统计九年级一个班35人的身高时,算出平均数与中位数都是158厘米,但后来发现其中一位同学的身高记录错误,将160厘米写成了166厘米,经重新计算后,正确的中位数是a 厘米,那么中位数a 应( )A.大于158B.小于158C.等于158D.无法判断【答案】C【分析】根据中位数的定义得出最中间的数还是158厘米,从而选出正确答案.【详解】解:∵原来的中位数158厘米,将160厘米写成166厘米,最中间的数还是158厘米,∴a =158,故选:C.【点睛】本题考查了中位数,将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(最中间两个数的平均数),叫做这组数据的中位数.7.(2021·上海·统考二模)某校对进校学生进行体温检测,在某一时段测得6名学生的体温分别为36.8℃,36.9℃,36.5℃,36.6℃,36.9℃,36.5℃,那么这6名学生体温的平均数与中位数分别是()A.36.7℃,36.7℃B.36.6℃,36.8℃C.36.8℃,36.7℃D.36.7℃,36.8℃8.(2021·上海普陀·统考二模)已知两组数据:x1、x2、x3、x4、x5和x1+2、x2+2、x3+2、x4+2、x5+2,下列有关这两组数据的说法中,正确的是( )A.平均数相等B.中位数相等C.众数相等D.方差相等【答案】D【分析】根据平均数、中位数、众数和方差的意义求解即可.【详解】解:因为新数据是在原数据的基础上每个加2,∴这两组数据的平均数、中位数和众数都改变,而波动幅度不变,即方差不改变,故选:D.【点睛】本题主要考查方差,解题的关键是掌握方差的意义:方差是反映一组数据的波动大小的一个量.方差越大,则平均值的离散程度越大,稳定性也越小;反之,则它与其平均值的离散程度越小,稳定性越好.9.(2021·上海闵行·统考二模)如果一组数据为,0,1,0,0,那么下列说法不正1-确的是()A.这组数据的方差是0B.这组数据的众数是0C.这组数据的中位数是0D.这组数据的平均数是010.(2022·上海·上海市娄山中学校考二模)某射击选手10次射击成绩统计结果如下表,这10A.8、8B.8、8.5C.8、9D.8、10【点睛】本题考查了众数和中位数的知识,一组数据中出现次数最多的数据叫做众数;将一组数据按照从小到大(或从大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数就是这组数据的中位数;如果这组数据的个数是偶数,则中间两个数据的平均数就是这组数据的中位数.二、填空题11.(2021·上海宝山·统考三模)如果一组数a,2,4,0,5的中位数是4,那么a可以是_______(只需写出一个满足要求的数).【答案】4【分析】由于一共5个数,4一定排在第3个才能是中位数,所以a可以在第4个或第5个,从而确定a的取值即可.【详解】解:∵这组数据有5个数,且中位数是4,∴4必须在5个数从小到大排列的正中间,即这组数据的重新排列是0,2,4,a,5或0,2,4,5,a,∴a≥4或a≥5,故答案是4(答案不唯一).【点睛】本题考查了中位数的意义.中位数是将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(最中间两个数的平均数),叫做这组数据的中位数.12.(2021·上海浦东新·统考模拟预测)某商店4月份销售的鞋子部分情况如表:根据这组数据可知,这个月销售36到41码鞋子尺寸的众数是_____.【答案】39.【分析】根据表格中的数据,正确使用众数的定义即可.【详解】根据表格中数据,可以知道36到41码的鞋子的销售量,其中尺寸为39码的鞋子销售量最大,故众数为39.故答案为:39.【点睛】本题考查统计表的理解和众数的定义,正确理解统计表并掌握众数概念是解题关键.13.(2021·上海普陀·统考二模)为了唤起公众的节水意识,从1993年起,联合国将每年的3月22日定为“世界水日”.某居委会表彰了社区内100户节约用水的家庭,5月份这100户家庭节约用水的情况如表所示,那么5月份这100户家庭节水量的平均数是_____吨.【答案】5.5【分析】根据加权平均数的定义列式计算即可.【详解】解:5月份这100户家庭节水量的平均数是5626287.210100´+´+´=5.5(吨),故答案为:5.5.【点睛】本题主要考查了加权平均数,解题的关键是掌握加权平均数的定义.14.(2023·上海·模拟预测)已知第一组数据:12,14,16,18的方差为21s ;第二组数据:32,34,36,38的方差22s ;第三组数据:2020,2019,2018,2017的方差为23s ,则21s ,22s ,23s 的大小关系是21s _______22s ________23s (填“>”,“=”或“<”)【答案】 = >【分析】根据方差是反映数据波动情况的量进行判断即可.【详解】解:Q 第一组和第二组数据都是间隔为2的偶数,\两组数据波动情况相同,即:2212s s =,Q 第三组数据是相差为1的整数,\方差最小,即:222123s s s =>,故答案为:=,>.【点睛】考查了方差的知识,解题时可以直接根据波动情况判断,也可以利用方差公式计算后确定答案,难度不大.考点三:概率一、填空题1.(2022·上海松江·统考二模)甲乙两人做“石头、剪刀、布”游戏,能在一个回合中分出胜负的概率是____________.【答案】23【分析】直接用列表法求出所有可能的情况,然后根据基本概率公式即可得出答案.【详解】分别用、、A B C 表示石头、剪刀、布,则在一个回合下的所有情况列表如下:一共有9种等可能结果,其中获胜的情况有6种,故获胜的概率6293P ==.【点睛】本题考查了基本概率的求法,解题的关键是熟练掌握求概率的方法,包括列表法和树状图法.2.(2022·上海金山·统考二模)一个布袋中有8个红球和16个黑球,这两种球除了颜色以外没有任何其他区别,从布袋中任取1个球是黑球的概率是______.3.(2022·上海黄浦·统考二模)一副52张的扑克牌(无大王、小王),从中任意抽出一张,抽到红桃K 的概率是________.4.(2022·上海闵行·统考二模)一个布袋中有三个完全相同的小球,把它们分别标号为1、2、3,从布袋中任取一个球记下数字作为点P 的横坐标x ,不放回小球,然后再从布袋中取出一个球记下数字作为点P 的纵坐标y ,那么点(),P x y 落在直线1y x =+上的概率是_________.共有6种等可能的结果,其中,点(),P x y 落在直线1y x =+上的结果有2种,∴点(),P x y 落在直线1y x =+上的概率=2163=.故答案为:13.【点睛】此题考查的是用列表法或树状图法求概率与不等式的性质.注意树状图法与列表法可以不重复不遗漏的列出所有可能的结果,列表法适合于两步完成的事件;树状图法适合两步或两步以上完成的事件;注意概率=所求情况数与总情况数之比,还需要注意实验是不放回实验.5.(2023·上海·模拟预测)一个袋子里装有10个材质均匀,大小相同,颜色不同的球,每个球上面都标有0到9中任意一个数字.现从中任意摸取一个球,摸取到数字是合数的球的概率是___________.【答案】25##0.4数与总情况数之比.6.(2023·上海·模拟预测)从2π这三个数中任选一个数,选出的这个数是有理数的概率为________________.7.(2023·上海·模拟预测)在不透明的盒子中装有5个黑色棋子和15个白色棋子,每个棋子除颜色外都相同,任意摸出一个棋子,摸到黑色棋子的概率是_____.8.(2022·上海虹口·统考二模)如果从1、2、3、4、5、6、7、8、9、10这10个数中任取一个数,那么取到的数恰好是素数的概率是______.9.(2022·上海奉贤·统考二模)有一枚材质均匀的正方体骰子,它的六个面上分别有1点、2点、…6点的标记,掷一次骰子,向上的一面出现的点数是2的倍数的概率是_____ _______.##0.5【答案】1210.(2022·上海·上海市进才中学校考一模)将 1、2、3 三个数字分别作为横坐标和纵坐标,随机生成的点的坐标如下表.如果每个点出现的可能性相等,那么从中任意取一点,则这个点在函数y=x图象上的概率是__________.【真题训练】一、单选题1.(2022·上海·统考中考真题)我们在外卖平台点单时会有点餐用的钱和外卖费6元,我们计算了点单的总额和不计算外卖费的总额的数据,则两种情况计算出的数据一样的是()A.平均数B.中位数C.众数D.方差【答案】D【分析】根据平均数,中位数,众数和方差的特点,这组数据都加上6得到一组新的数据,方差不变,平均数,中位数改变,众数改变,即可得出答案.【详解】解:将这组数据都加上6得到一组新的数据,则新数据的平均数改变,众数改变,中位数改变,但是方差不变;故选:D.【点睛】本题主要考查平均数、中位数、众数、方差的意义.理解求解一组数据的平均数,众数,中位数,方差时的内在规律,掌握“新数据与原数据之间在这四个统计量上的内在规律”是解本题的关键.2.(2021·上海·统考中考真题)商店准备一种包装袋来包装大米,经市场调查以后,做出如下统计图,请问选择什么样的包装最合适()A.2kg/包B.3kg/包C.4kg/包D.5kg/包【答案】A【分析】选择人数最多的包装是最合适的.【详解】由图可知,选择1.5kg/包-2.5kg/包的范围内的人数最多,∴选择在1.5kg/包-2.5kg/包的范围内的包装最合适.故选:A.【点睛】本题较简单,从图中找到选择人数最多的包装的范围,再逐项分析即可.3.(2020·上海·统考中考真题)我们经常将调查、收集得来的数据用各类统计图进行整理与表示.下列统计图中,能凸显由数据所表现出来的部分与整体的关系的是( ) A.条形图B.扇形图C.折线图D.频数分布直方图【答案】B【分析】根据统计图的特点判定即可.【详解】解:统计图中,能凸显由数据所表现出来的部分与整体的关系的是扇形图.故选:B.【点睛】本题考查了统计图的特点,条件统计图能反映各部分的具体数值,扇形统计图能。

专题42 统计【考点精讲】(含答案解析)

专题42  统计【考点精讲】(含答案解析)

专题42统计【考点精讲】-【中考高分导航】备战2022年中考数学考点总复习(全国通用)考点42统计考点1:统计初步知识1.常用的统计调查方式:全面调查、抽样调查.2.所要考察的对象的全体称为总体.组成总体的每一个对象称为个体.3.从总体中抽取的一部分各体叫做总体的一个样本,样本中的个体的数目叫做样本容量.4.在抽取样本的过程中,总体中的每个个体都以相等的机会被抽到,像这样的抽样方法叫做简单随机抽样.【例1】(2021·广东惠州·二模)1.以下调查中,最适合采用全面调查的是()A.检测长征运载火箭的零部件质量情况B.了解全国中小学生课外阅读情况C.调查某批次汽车的抗撞击能力D.检测某城市的空气质量(1)样本是总体中所抽取的一部分个体,而样本容量则是指样本中个体的数目;(2)对于具有破坏性的调查,无法进行普查,普查的意义或价值不大时,应选择抽样调查,而对于精确度要求高的调查或事关重大的调查往往采用普查.2.某校有4000名学生,随机抽取了400名学生进行体重调查,下列说法错误的是()A.总体是该校4000名学生的体重B.个体是每一个学生C.样本是抽取的400名学生的体重D.样本容量是400考点2:平均数、中位数、众数1.平均数:x1,x2,…,xn的平均数1xn=(x1+x2+…+xn).2.加权平均数:如果n个数据中,x1出现f1次,x2出现f2次,…,xR出现fR次(这里f1+f2+…+fR=n),则1xn=(x1f1+x2f2+…+xRfR).3.中位数:将一组数据按大小顺序排列,处在最中间位置上的数据叫做这组数据的中位数;如果数据的个数为偶数,中位数就是处在中间位置上的两个数据的平均数.4.众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.【例2】(2021·湖南张家界市·中考真题)3.如图是张家界市某周每天最高气温的折线统计图,则这7天的最高气温的中位数是______℃.【例3】(2020•无锡)4.已知一组数据:21,23,25,25,26,这组数据的平均数和中位数分别是()A.24,25B.24,24C.25,24D.25,25【例4】(2020•淮安)5.一组数据9、10、10、11、8的众数是()A.10B.9C.11D.8(2021·广东深圳·模拟预测)6.为了了解学生线上学习情况,老师抽查某组10名学生的单元测试成绩如下:78,86,A.95,99B.94,99C.94,90D.95,108(2021·广东香洲·二模)7.在一次献爱心的捐款活动中,八(2)班50名同学捐款金额如图所示,则在这次捐款活动中,该班同学捐款金额的众数和中位数分别是()A.20,10B.10,20C.10,10D.10,15(2021·广东深圳·一模)8.某校为了解学生的课外阅读情况,随机抽取了一个班的学生,对他们一周的课外阅读时间进行了统计,统计数据如下表,则该班学生一周课外阅读时间的中位数和众数分别是()读书时间6小时及以下7小时8小时9小时10小时及以上学生人数611887A.8,7B.8,8C.8.5,8D.8.5,7考点3:方差1.方差:x1,x2,…,xn的方差s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2].2.方差是衡量一组数据波动大小的量,方差越小,数据的波动越小;方差越大,数据的波动越大.【例5】(2020•营口)9.从甲、乙、丙三人中选拔一人参加职业技能大赛,经过几轮初赛选拔,他们的平均成绩都是87.9分,方差分别是s甲2=3.83,s乙2=2.71,s丙2=1.52.若选取成绩稳定的一人参加比赛,你认为适合参加比赛的选手是_____.【例6】(2021·四川乐山市·中考真题)10.如图是根据甲、乙两人5次射击的成绩(环数)制作的折线统计图.你认为谁的成绩较为稳?________(填“甲”或“乙”)方差是衡量一组数据波动大小的量,方差越小,数据的波动越小;方差越大,数据的波动越大(2020•湘西州)11.从甲、乙两种玉米种子中选择一种合适的推荐给某地.考虑到庄稼人对玉米的产量和产量的稳定性十分的关心,选择之前,为了解甲、乙两种玉米种子的情况,某单位各用了10块自然条件相同的试验田进行试验,得到各试验田每公顷产量(单位:t )的数据,这两组数据的平均数分别是x 甲7.5≈,x 乙7.5≈,方差分别是s 2甲0.010,s ≈2乙0.002≈,你认为应该选择的玉米种子是_________.(2020•绥化)12.甲、乙两位同学在近五次数学测试中,平均成绩均为90分,方差分别为22=0.70=0.73s s 甲乙;,甲、乙两位同学成绩较稳定的是________同学.(2020•郴州)13.某5人学习小组在寒假期间进行线上测试,其成绩(分)分别为:86,88,90,92,94,方差为28.0s =.后来老师发现每人都少加了2分,每人补加2分后,这5人新成绩的方差2s =新__________.考点4:频数、频率、用样本估计总体1.频数:在我们研究的对象中,每个对象出现的次数叫做频数.2.频率:每个对象出现的次数与总次数的比值叫做频率.3.绘制频数分布直方图的步骤:①计算最大值与最小值的差;②决定组距与组数;③列频数分布表;④画频数分布直方图.【例7】(2020•徐州)14.在一个不透明的袋子里装有红球、黄球共20个,这些球除颜色外都相同.小明通过多次实验发现,摸出红球的频率稳定在0.25左右,则袋子中红球的个数最有可能是()A.5B.10C.12D.15(1)频率反映了各组频数的大小在总数中所占的分量;(2)样本估计总体的公式:总数×相应的频率.(2021·福建中考真题)15.某校共有1000名学生.为了解学生的中长跑成绩分布情况,随机抽取100名学生的中长跑成绩,画出条形统计图,如图.根据所学的统计知识可估计该校中长跑成绩优秀的学生人数是_________.(2020•南京)16.为了了解某地居民的用电量情况,随机抽取了该地200户居民六月份的用电量(单位:kW h )进行调查,整理样本数据得到下面的频数分布表:组别用电量分组频数x≤<501893x≤<100293178x≤<343178263x≤<114263348x≤<15348433x≤<16433518x≤<27518603x≤<18603688根据抽样调查的结果,回答下列问题:(1)该地这200户居民六月份的用电量的中位数落在第组内.(2)估计该地1万户居民六月份的用电量低于178kW h⋅的大约有多少户.考点5:常见统计图表的综合应用1.常见的统计图有条形统计图、扇形统计图、折线统计图.条线统计图能显示每组中的具体数据;扇形统计图能显示部分在总体中所占百分比;折线统计图能显示数据的变化趋势.2.扇形统计图的制作步骤:①根据有关数据先算出各部分在总体中所占的百分比(即部分数据÷总体数据),再算出各部分圆心角的度数,公式:各部分扇形圆心角的度数=部分占总体的百分比×360;②按比例,取适当半径画一个圆;③按扇形圆心角的度数用量角器在圆内量出各个扇形的圆心角的度数;④在各扇形内写上相应的名称及百分比;⑤写出统计图的名称、制作日期.【例8】(2021·浙江温州市·中考真题)17.如图是某天参观温州数学名人馆的学生人数统计图.若大学生有60人,则初中生有()A.45人B.75人C.120人D.300人常见的统计图有条形统计图、扇形统计图、折线统计图.条线统计图能显示每组中的具体数据;扇形统计图能显示部分在总体中所占百分比;折线统计图能显示数据的变化趋势.(2021·江西中考真题)18.如图是2020年中国新能源汽车购买用户地区分布图,由图可知下列说法错误的是()A.一线城市购买新能源汽车的用户最多B.二线城市购买新能源汽车用户达37%C.三四线城市购买新能源汽车用户达到11万D.四线城市以下购买新能源汽车用户最少(2021·山东聊城市·中考真题)19.为了保护环境加强环保教育,某中学组织学生参加义务收集废旧电池的活动,下面是随机抽取40名学生对收集废旧电池的数量进行的统计:废旧电池数/节45678人数/人9111154请根据学生收集到的废旧电池数,判断下列说法正确的是()A.样本为40名学生B.众数是11节C.中位数是6节D.平均数是5.6节(2021·湖北随州市·中考真题)20.如图是小明某一天测得的7次体温情况的折线统计图,下列信息不正确的是()A.测得的最高体温为37.1℃B.前3次测得的体温在下降C.这组数据的众数是36.8D.这组数据的中位数是36.6参考答案:1.A【分析】根据普查得到的调查结果比较准确,但所费人力、物力和时间较多,而抽样调查得到的调查结果比较近似解答即可.【详解】A.检测长征运载火箭的零部件质量情况,必须全面调查才能得到准确数据;B.了解全国中小学生课外阅读情况,量比较大,用抽样调查;C.调查某批次汽车的抗撞击能力,具有破坏性,用抽样调查;D.检测某城市的空气质量,不可能全面调查,用抽样调查.【点睛】本题考查的是抽样调查和全面调查的区别,选择普查还是抽样调查要根据所要考查的对象的特征灵活选用,一般来说,对于具有破坏性的调查、无法进行普查、普查的意义或价值不大,应选择抽样调查,对于精确度要求高的调查,事关重大的调查往往选用普查.2.B【分析】根据总体、个体、样本、样本容量的知识解答.总体是指所要考查对象的全体;个体是指每一个考查对象;样本是指从总体中抽取的部分考查对象称为样本;样本容量是指样本所含个体的个数(不含单位).【详解】解:A、总体是该校4000名学生的体重,此选项正确,不符合题意;B、个体是每一个学生的体重,此选项错误,符合题意;C、样本是抽取的400名学生的体重,此选项正确,不符合题意;D、样本容量是400,此选项正确,不符合题意;故选:B.【点睛】本题主要考查了总体、个体、样本、样本容量的定义,解题要分清具体问题中的总体、个体与样本,关键是明确考查的对象.总体、个体和样本的考查对象是相同的,所不同的是范围的大小.样本容量是样本中包含的个体的数量,不能带单位.3.26【分析】将7天的最高气温按从小到大排列以后根据中位数的定义求解即可.【详解】解:根据7天的最高气温折线统计图,将这7天的最高气温按从小到大排列为:20,22,24,26,28,28,30,故中位数为26℃.故答案为:26.【点睛】本题主要考查中位数的定义,将一组数据按照从小到大(或从大到小)的顺序排列,如果这组数据的个数是奇数,则处于中间位置的数就是这组数据的中位数;如果这组数据的个数是偶数,则中间两个数据的平均数就是这组数据的中位数.4.A【分析】根据平均数的计算公式和中位数的定义分别进行解答即可.【详解】解:这组数据的平均数是:(21+23+25+25+26)÷5=24;把这组数据从小到大排列为:21,23,25,25,26,最中间的数是25,则中位数是25;故应选:A.【点睛】此题考查了平均数和中位数,掌握平均数的计算公式和中位数的定义是本题的关键.5.A【分析】根据众数的定义进行判断即可.【详解】在这组数据中出现最多的数是10,∴众数为10,故选:A.【点睛】本题考查了众数的定义,掌握知识点是解题关键.6.B【分析】按照平均数和中位数的计算方法进行计算即可.【详解】平均数为:788660108112116+90+120+54+116=9410+++++将数据按照从小到大进行排列为:54,60,78,86,90,108,112,116,116,120中位数为:90+108=99 2故选:B.【点睛】本题考查了平均数,中位数的计算,熟知以上计算方法是解题的关键.7.C【分析】根据众数和中位数的定义可得答案.【详解】解:捐款金额学生数最多的是10元,故众数为10;共50名学生,中位数在第25名、26名学生处,故中位数为10+102=10;故选:C.【点睛】本题考查了众数及中位数的知识,解答本题的关键是熟练掌握众数及中位数的定义.8.A【分析】根据众数与中位数的定义可以直接得到答案.【详解】解:因为全班抽取了61188740++++=人,所以一共有40个数据,且表中数据已是从小到大排列的,最中间两个数据分别为8,8,所以这一组数据的中位数是888 2+=,这一组数据中出现次数最多的是7,所以众数是7.故选A.【点睛】本题考查的是中位数与众数的概念,掌握这两个概念是解题的关键.9.丙【分析】根据方差表示数据的波动大小的量即可解答.【详解】解:∵平均成绩都是87.9分,s甲2=3.83,s乙2=2.71,s丙2=1.52,∴s丙2<s乙2<s甲2,∴选手丙的成绩更稳定,即适合参加比赛的选手是丙.故答案为:丙.【点睛】本题考查了方差的意义,理解方差是表示数据波动大小的量是解答本题的关键.10.甲【分析】先分别求出甲乙的平均数,再求出甲乙的方差,由方差越小成绩越稳定做出判断即可.【详解】解:x甲=(7+6+9+6+7)÷5=7(环),x乙=(5+9+6+7+8)÷5=7(环),2s甲=[(7﹣7)2+(6﹣7)2+(9﹣7)2+(6﹣7)2+(7﹣7)2]÷5=1.2,2s乙=[(5﹣7)2+(9﹣7)2+(6﹣7)2+(7﹣7)2+(8﹣7)2]÷5=2,∵1.2<2,∴甲的成绩较为稳定,故答案为:甲.【点睛】本题考查平均数、方差、折线统计图,会求一组数据的平均数、方差,会根据方差判断一组数据的稳定性是解答的关键.11.乙【分析】通过平均数和方差的性质判断稳定性即可.【详解】∵x 甲7.5≈,x 乙7.5≈,∴x 甲=x 乙,∴甲,乙的每公顷产量相同,∵2s 甲0.010≈,2s 乙0.002≈,∴2s 甲>2s 乙,∴乙的产量比甲的产量稳定,故答案为:乙.【点睛】本题考查了方差和平均数,掌握方差和平均数的意义是解题关键.12.甲【分析】根据方差的定义,方差越小数据越稳定.【详解】解:∵甲的方差是20.70s =甲,乙的方差是20.73s =乙,0.73>0.70,∴甲比乙的成绩稳定.∴甲、乙两位同学成绩较稳定的是甲同学.故答案是:甲.【点睛】本题考查方差的意义.方差是用来衡量一组数据波动大小的量,方差越大,表明这组数据偏离平均数越大,即波动越大,数据越不稳定;反之,方差越小,表明这组数据分布比较集中,各数据偏离平均数越小,即波动越小,数据越稳定.13.8.0【分析】根据一组数据中的每一个数据都加上同一个非零常数,那么这组数据的波动情况不变,即方差不变,即可得出答案.【详解】∵一组数据中的每一个数据都加上(或都减去)同一个常数后,它的平均数都加上(或都减去)这一个常数,方差不变,∴所得到的一组新数据的方差为S 新2=8.0;故答案为:8.0.【点睛】本题考查方差的意义,它反映了一组数据的波动大小,方差越大,波动性越大,反之也成立,关键是掌握一组数据都加上同一个非零常数,方差不变.14.A【分析】设袋子中红球有x 个,根据摸出红球的频率稳定在0.25左右列出关于x 的方程,求出x 的值即可得答案.【详解】解:设袋子中红球有x 个,根据题意,得:0.25,20x =解得5,x =答:袋子中红球有5个.故选:A .【点睛】本题主要考查利用频率估计概率,大量重复实验时,事件发生的频率在某个固定位置左右摆动,并且摆动的幅度越来越小,根据这个频率稳定性定理,可以用频率的集中趋势来估计概率,这个固定的近似值就是这个事件的概率.15.270【分析】利用样本中的优秀率来估计整体中的优秀率,从而得出总体中的中长跑成绩优秀的学生人数.【详解】解:由图知:样本中优秀学生的比例为:2727%100=,∴该校中长跑成绩优秀的学生人数是:100027%270⨯=(人)故答案是:270.【点睛】本题考查了利用样本估计总体的统计思想,解题的关键是:根据图中信息求出样本中优秀率作为总体中的优秀率,即可求出总体中优秀的人数.16.(1)2;(2)7500【分析】(1)将200个数据按大小顺序排列最中间两个数的平均数即为中位数,进而可解决问题;(2)求出用电量低于178kW h ⋅的户数的百分比,根据总户数求出答案..【详解】解:(1)将200个数据按大小顺序排列最中间两个数即第100和101个数,它们的平均数即为中位数,这两个数都落在第2组,故答案为:2;(2)50100100007500200+⨯=(户)因此,估计该地1万户居民六月的用电量低于178kW h ⋅的大约有7500户.【点睛】本题考查频数分布表,利用统计表获取信息的能力,以及利用样本估计总体,利用统计表获取信息时,必须认真观察、分析、研究统计表,才能作出正确的判断和解决问题.17.C【分析】根据大学生的人数与所占的百分比求出总人数为300人,再用初中生所占的百分比乘以总人数即可得到答案.【详解】解:总人数=6020%÷=300(人);30040%⨯=120(人),故选:C .【点睛】本题主要考查了根据扇形统计图求总人数和单项的人数,关键在于公式的灵活运用.18.C【分析】根据扇形统计图分别求出各组人数以及圆心角度数,进而得出答案.【详解】A 、一线城市购买新能源汽车的用户达46%,用户最多,符合题意;B 、二线城市购买新能源汽车用户达37%,说法正确,符合题意;C 、三四线城市购买新能源汽车用户达11%,不能说用户达到11万,不符合题意;D 、四线城市以下购买新能源汽车用户只占6%,最少,说法正确,符合题意;故选:C .【点睛】本题考查了扇形统计图,试题以图表为载体,要求学生能从中提取信息来解题,与实际生活息息相关.19.D【分析】根据样本定义可判定A ,利用众数定义可判定B ,利用中位数定义可判定C ,利用加权平均数计算可判定D 即可.【详解】解:A .随机抽取40名学生对收集废旧电池的数量是样本,故选项A 样本为40名学生不正确;B .根据众数定义重复出现次数最多的数据是5节或6节,故选项B 众数是11节不正确,C .根据中位数定义样本容量为40,中位数位于4020,212=两个位置数据的平均数,第20位、第21位两个数据为5节与6节的平均数65 5.52+=节,故选项C 中位数是6节不正确;D .根据样本平均数()1495116117584 5.640x =⨯+⨯+⨯+⨯+⨯=节故选项D 平均数是5.6节正确.故选择:D .【点睛】本题考查样本,众数,中位数,平均数,熟练掌握样本,众数,中位数,平均数是解题关键.20.D【分析】根据折线图判断最高体温以及上升下降情况,根据众数、中位数的性质判断即可.【详解】解:A、由折线统计图可知,7次最高体温为37.1℃,A选项正确,不符合题意;B、由折线统计图可知,前3次体温在下降,B选项正确,不符合题意;C、由7组数据可知,众数为36.8,C选项正确,不符合题意;D、根据中位数定义可知,中位数为36.8,D选项错误,符合题意;故选:D.【点睛】本题主要考查折线统计图、众数以及中位数的定义,正确读懂统计图,正确理解众数、中位数定义是解题关键,注意必须从大到小或者从小到大排列后再求中位数.。

统计基础习题(含答案解析)

统计基础习题(含答案解析)

第一章总论一、判断题:1、社会经济统计的研究对象是社会经济现象总体的各个方面。

2、在统计调查过程中所采用的大量观察法,是必须对研究对象的所有单位进行调查。

3、在全国工业普查中,全国工业企业数是统计总体,每个工业企业是总体单位。

4、总体单位是标志的承担者,标志是依附于总体单位的。

5、当对品质标志的标志表现所对应的单位进行总计时就形成统计指标。

6、因为统计指标都是用数值表示的,所以数量标志就是统计指标。

7、统计指标及其数值可以作为总体。

8、所有的统计指标和可变的数量标志都是变量。

二、填空题:1、“统计”一词的含义是、和。

它们之间的关系是统计工作的成果,和统计工作是理论和实践的关系。

2、统计学的研究对象是。

3、标志是说明特征的,分标志和品质标志两种,前者的具体表现是,后者的具体表现是。

4、当我们要研究工业企业生产经营状况时,全部工业企业就构成,而每一个工业企业则是。

5、工人的年龄、工资、工龄属于标志,而工人的性别、民族、工种属于标志。

6、设备台数、工人人数属于变量,而身高、年龄、体重属于变量。

7、统计研究的基本方法是、、综合指标法。

8、要了解某一个企业的产品生产情况,总体是,总体单位是。

9、性别是标志,标志表现则具体为。

10、在人口总体中,总体单位是,“文化程度”是总体单位的标志。

三、单项选择题:1、统计总体的基本特征表现为:()A、同质性、广泛性、社会性B、同质性、大量性、变异性C、同质性、综合性、大量性2、研究某市工业企业生产设备使用状况,那么,统计总体为( )A、该市全部工业企业B、该市每一个工业企业C、该市全部工业企业每一台设备D、该市工业企业的全部生产设备3、某组五名学生的考试得分分别为:60、70、80、85、90,这五个数字是:( )A、指标B、标志C、变量值D、变量4、要了解某班40名学生的学习情况,则总体单位是:( )A、40个学生B、每一个学生的成绩C、每一个学生D、40个学生的学习成绩5、数量指标的表现形式为:( )A、相对数B、绝对数C、平均数6、某学生某门课考试成绩为80分,则成绩是:( )A、品质标志B、变量C、变量值D、标志值7、某店有50名职工,把他们的工资加起来除以50,这是:( )A、对50个变量求平均B、对50个变量值求平均C、对50个标志求平均D、对50个指标求平均8、某市全部商店作为总体,每一个商店为总体单位,则该市全部商品零售额是:( )A、品质标志B、质量指标C、数量指标D、变量值9、了解某地区工业企业职工情况,下面哪个是统计指标()A、该地区所有职工的工资水平B、该地区工业企业职工的文化程度C、该地区工业企业职工的工资总额D、该地区职工所从事的工种10、统计工作的过程不包括()A、统计调查B、统计分布C、统计整理D、统计分析四、多项选择题:1、要研究某局所属30个企业职工的工资水平,则:( )A、总体是某局B、总体是某局所属30个企业C、总体是30个企业全部职工D、总体是30个企业全部职工的工资E、总体单位是每一个企业F、总体单位是每一名职工2、下列指标中哪些是质量指标:( )A、工人劳动生产率B、设备利用率C、新产品数量D、单位产品工时消耗量E、废品量F、利润额3、下列变量中哪些是连续变量:( )A、身高B、人数C、体重D、年龄E、设备台数F、企业数4、以某市工业企业为总体则下列各项中哪些是指标:( )A、某市某厂职工人数B、全市工业企业总产值C、全市工业企业职工平均工资D、全市工业企业数5、要了解某地区全部成年人口的就业情况,那么()A、全部成年人是研究的总体B、成年人口总数是统计指标C、成年人口变业率是统计标志D、“职业”是每个人的特征,是数量标志E、某人职业是“教师”,这里的“教师”是标志表现6、国家统计系统的功能或统计的职能是()A、信息职能B、咨询职能C、监督职能D、决策职能E、协调职能7、在工业普查中()A、工业企业总数是统计总体B、每一个工业企业是总体单位C、固定资产总额是统计指标D、机器台数是连续变量E、职工人数是离散变量8、下列各项中属于统计指标的有()A、2009年全国人均总产值B、某台机床使用年限C、某市年供水量D、某地区原煤生产量E、某学员平均成绩第二章统计设计和统计调查一、判断题:1、全面调查和非全面调查是根据调查结果所得的资料是否全面来划分的。

统计专题训练经典练习题(含答案)

统计专题训练经典练习题(含答案)

统计专题训练经典练习题(含答案)统计专题训练经典练题(含答案)以下是一些统计学的经典练题,附带答案供参考。

1. 对于一个班级的学生成绩,已知平均分为75分,标准差为5分。

如果班级总人数为100人,问有多少学生的成绩在65分以上?答案:根据正态分布的性质,我们可以应用标准正态分布表,计算得到 z 值为 (65-75)/5 = -2,查表得到对应的累积概率为 0.0228,因此在65分以上的学生人数约为0.0228 * 100 ≈ 2.28,即约有 2 名学生的成绩在65分以上。

2. 一家工厂生产的产品长度服从正态分布,平均长度为10cm,标准差为0.5cm。

若从该工厂中随机抽取50个产品,问有多少产品的长度在9.5cm至10cm之间?答案:由于从该工厂中抽取的产品长度服从正态分布,我们可以计算出抽样分布的均值和标准差为 10cm 和0.5cm/sqrt(50) ≈0.0707cm。

然后,我们可以将区间 [9.5cm, 10cm] 转化为 z 值计算区间内的概率。

计算得到 z 值为 (10-9.5)/0.0707 ≈ 7.07,查表得到对应的累积概率为 0.9999。

因此,在9.5cm至10cm之间的产品数量约为0.9999 * 50 ≈ 49.995,即约有 50 个产品的长度在9.5cm至10cm之间。

3. 某次调查发现,两种不同品牌的汽车在某一地区的市场占有率的估计值分别为 0.60 和 0.40,并且总样本量为 5000。

现在需要对这一地区汽车市场占有率的差异进行检验。

问如何构建零假设和备择假设?并说明该检验的类型。

答案:对于差异检验,我们可以构建如下的零假设和备择假设:零假设(H0):两个品牌的汽车市场占有率没有差异,即 p1= p2。

备择假设(H1):两个品牌的汽车市场占有率存在差异,即p1 ≠ p2。

该检验属于双侧检验,因为备择假设是双向的,即可能两个品牌的市场占有率存在大于和小于的差异。

统计学和统计法基础知识:统计方法题库考点(强化练习)

统计学和统计法基础知识:统计方法题库考点(强化练习)

统计学和统计法基础知识:统计方法题库考点(强化练习)1、单选相关分析研究的是()。

A.变量问的相互依存关系B.变量问的因果关系C.变量间严格的一一对应关系D.变量间的线性关系正确答案:A参考解析:确定现象之间有无关(江南博哥)系,这是相关分析的起点,只有变量间存在相互依存关系,才有必要进行进一步的分析。

2、单选下列相关系数取值中错误的是()。

A.-0.86B.0.78C.1.25D.0正确答案:C参考解析:相关系数r的取值介于-1与1之间,所以C项的答案肯定是错误的。

3、判断题假设检验是先对总体参数或分布形式提出某种假设,然后利用样本信息和相关统计量的分布特征去检验这个假定,做出是否拒绝原假设的结论。

()正确答案:对4、判断题统计假设检验的结果是绝对正确。

()正确答案:错参考解析:统计假设检验的结果不是绝对正确。

统计结果不能教条地理解,不是以绝对的把握否定什么或肯定什么,只是在概率的意义上成立。

显著性水平就是允许的小概率水平,但小概率并不能说明不会发生,仅仅是发生的概率很小罢了。

统计推断中的假设检验是依据样本的数据信息对关于总体参数的某种假设进行判断,由于样本的信息与总体参数的真实情况不完全一致,无论做出拒绝或不拒绝原假设的结论,都有可能犯错误。

所以统计假设检验的结果并不是绝对准确。

5、多选A于定性数据,反映其集中趋势的数字特征有()。

A.比例B.百分比C.平均数D.众数E.中位数正确答案:A, B, D, E参考解析:由于定性数据主要是计数,比较简单,对定性数据的集中趋势常用的方法就是计算比例、百分比、中位数和众数。

定性数据由于不能进行数学运算,因此计算平均数无意义。

6、判断题只有当相关系数接近+1时,才能说明两变量之间存在着高度相关关系。

()正确答案:错参考解析:只要相关系数绝对值接近1,就能说明两变量之间存在着高度相关关系,当相关系数接近+1时,说明两变量之间高度正相关;当相关系数接近-1时,说明两变量之间高度正负相关。

高中数学必修二第九章统计必考考点训练(带答案)

高中数学必修二第九章统计必考考点训练(带答案)

高中数学必修二第九章统计必考考点训练单选题1、已知甲、乙两组数据(已按从小到大的顺序排列):甲组:27、28、39、40、m 、50;乙组:24、n 、34、43、48、52.若这两组数据的30百分位数、80百分位数分别相等,则m n 等于( ) A .127B .107C .43D .74答案:A分析:根据百分位数的定义,求出30%×6=1.8,故选取第2个数据为30百分位数,同理选取第5个数据作为80百分位数,求出m =48,n =28,进而求出结果.因为30%×6=1.8,大于1.8的比邻整数为2,所以30百分位数为n =28,80%×6=4.8,大于4.8的比邻整数为5,所以80百分位数为m =48,所以m n =4828=127.故选:A2、要完成下列两项调查:(1)某社区有100户高收入家庭,210户中等收入家庭,90户低收入家庭,从中抽取100户调查有关消费购买力的某项指标;(2)从某中学高一年级的10名体育特长生中抽取3人调查学习情况;应采用的抽样方法分别是( )A .(1)用简单随机抽样,(2)用分层随机抽样B .(1)(2)都用简单随机抽样C .(1)用分层随机抽样,(2)用简单随机抽样D .(1)(2)都用分层随机抽样答案:C分析:根据简单随机抽样、分层抽样的适用条件进行分析判断.因为有关消费购买力的某项指标受家庭收入的影响,而社区家庭收入差距明显,所以①用分层抽样; 从10名体育特长生中抽取3人调查学习情况,个体之间差别不大,且总体和样本容量较小,所以②用简单随机抽样.故选:C3、数据x 1,x 2,x 3,…,x m 的平均数为x ,数据y 1,y 2,y 3,…,y n 的平均数为y ,则数据x 1,x 2,x 3,…,x m ,y 1,y 2,y 3,…,y n 的平均数为( )A .x n +y mB .x m +y nC .nx+my m+nD .mx+ny m+n答案:D分析:利用平均数的计算公式计算.由题意得:x 1+x 2+x 3+⋯+x m =mx ,y 1+y 2+y 3+⋯+y n =ny ,所以x 1+x 2+x 3+⋯+x m +y 1+y 2+y 3+⋯+y n m+n =mx+ny m+n故选:D4、已知某6个数据的平均数为4,方差为8,现加入数据2和6,此时8个数据的方差为( )A .8B .7C .6D .5答案:B分析:由平均数和方差的计算公式求出平均数和方差即可得出答案.设原数据为a 1,a 2,a 3,a 4,a 5,a 6,则∑a i 6i=1=6×4=24,16∑(a i −4)26i=1=8, 加入数据2和6,后,所得8个数据的平均数x̅=∑a i 6i=1+2+68=4, 方差s 2=∑(a i −4)26i=1+(2−4)2+(6−4)28=48+4+48=7.故选:B .5、10名工人某天生产同一零件,生产的件数分别是15,17,14,10,15,17,17,16,14,12.设其平均数为a ,中位数为b ,众数为c ,则有( )A .a >b >cB .b >c >aC .c >a >bD .c >b >a答案:D分析:将数据从小到大重新排列(也可以是从大到小),计算出a,b,c 的值即可比较大小.解:重新排列得:10,12,14,14,15,15,16,17,17,17.则有:a =110×(15+17+14+10+15+17+17+16+14+12)=14.7,b =12×(15+15)=15,c =17. 所以c >b >a故选:D.6、下列调查方式合适的是()A.为了了解一批炮弹的杀伤半径,采用普查的方式B.为了了解一批玉米种子的发芽率,采用普查的方式C.为了了解一条河流的水质,采用抽样调查的方式D.为了了解一个寝室的学生(共6个人)每周体育锻炼的时间,采用抽样调查的方式答案:C分析:根据普查和抽样调查的特征,即可求解.个体数少且易于完成的可以采用普查的方式;个体数量多,工作量大,或破坏性大,不易完成的可以采用抽样调查的方式.故选:C.7、为调查参加考试的高二级1200名学生的成绩情况,从中抽查了100名学生的成绩,就这个问题来说,下列说法正确的是()A.1200名学生是总体B.每个学生是个体C.样本容量是100D.抽取的100名学生是样本答案:C分析:根据总体、个体、样本容量、样本的定义,结合题意,即可判断和选择.根据题意,总体是1200名学生的成绩;个体是每个学生的成绩;样本容量是100,样本是抽取的100名学生的成绩;故正确的是C.故选:C.8、如图1为某省2019年1~4月份快递业务量统计图,图2为该省2019年1~4月份快递业务收入统计图,对统计图理解不正确的是()A.2019年1~4月份快递业务量3月份最高,2月份最低,差值接近2000万件B.从1~4月份来看,业务量与业务收入有波动,但整体保持高速增长C.从两图中看,增量与增长速度并不完全一致,但业务量与业务收入变化高度一致D.2019年1~4月份快递业务量同比增长率均超过50%,在3月份最高,和春节后网购迎来喷涨有关答案:B分析:结合两图中柱状图和曲线图及同比的意义可得正确的选项.从图(1)的柱形图可得2019年1~4月份快递业务量3月份最高,2月份最低,3月份比2月份高4397-2411=1986,差值接近2000万件,故A正确.从1~4月份来看,业务量与业务收入有波动,结合图(1)(2)中的柱形图可得业务量与业务收入在2月份和4月份均下降,故B错误.从两图中柱状图可得业务量与业务收入变化高度一致,但业务量2月份同比增长53%,而业务收入2月份同比增长30%,因此增量与增长速度并不完全一致,故C正确.从图(1)中可得2019年1~4月份快递业务量同比增长率均超过50%,在3月份最高,这的确和春节后网购迎来喷涨有关,故D正确.故选:B.多选题9、下列抽样方法是简单随机抽样的是()A.某工厂从老年、中年、青年职工中按2∶5∶3的比例选取职工代表B.用抽签的方法产生随机数C.福利彩票用摇奖机摇奖D.规定凡买到明信片最后四位号码是“6637”的人获三等奖答案:BC分析:由题意,根据简单随机抽样的定义,可得答案.对于A,此为分层抽样;对于B,此为随机数表法;对于C,此为简单随机抽样;对于D,此为系统抽样.故选:BC.10、一组数据按从小到大排列为2,3,3,x,7,10,若这组数据的平均数是中位数的54倍,则下列说法正确的是()A.x=4B.众数为3C.中位数为4D.方差为233答案:BCD分析:由一组数据的平均数是中位数的54倍,列方程求出x=5,由此求出众数、中位数、方差,从而能求出结果.解:一组数据按从小到大排列为2,3,3,x,7,10,∵这组数据的平均数是中位数的54倍,∴16(2+3+3+x+7+10)=54×3+x2,解得x=5,故A错误;众数为3,故B正确;中位数为3+52=4,故C正确;平均数为:16(2+3+3+5+7+10)=5,方差为:16[(2−5)2+(3−5)2+(3−5)2+(5−5)2+(7−5)2+(10−5)2]=233,故D正确.故选:BCD.11、已知一组样本数据x1,x2,...,x15,其中x i=2i(i=1,2,⋯,15),由这组数据得到另一组新的样本数据y1,y2,…,y15,其中y i=x i−20,则().A.两组样本数据的样本平均数相同B.两组样本数据的样本方差相同C.y1,y2,…,y15样本数据的第30百分位数为−10D.将两组数据合成一个样本容量为30的新的样本数据,该样本数据的平均数为5答案:BC分析:根据平均数、方差和百分位数的概念与性质分析运算.由题意可得:x̅=x8=16∵y i=x i−20,则y̅=x̅−20=−4,s y2=s x2,故A错误,B正确.第30百分位数:15×0.3=4.5,故为第5个数.y i的排列为:−18,−16,−14,−12,−10,……因此,第30百分位数为−10,C正确;=6,D错误.新样本的平均数为15x̅+15y̅30故选:BC.填空题12、福利彩票“双色球”中红色球由编号为01,02,…,33的33个个体组成,某彩民利用下面的随机数表(下表是随机数表的第一行和第二行)选取6个红色球,选取方法是从随机数表中第1行的第6列和第7列数字开始,由左到右依次选取两个数字,则选出来的第3个红色球的编号为______.分析:根据给定的随机数表的读取规则,从第一行第6、7列开始,两个数字一组,从左向右读取,重复的或超出编号范围的跳过,即可.根据随机数表,排除超过33及重复的编号,第一个编号为21,第二个编号为32,第三个编号05,故选出来的第3个红色球的编号为05.小提示:本题主要考查了简单随机抽样中的随机数表法,属于容易题.13、以下数据为某校参加数学竞赛的20名同学的成绩:82,80,84,89,90,76,88,82 ,96,95,95,96,90,89,95,92,98,83,90,91.则这20人成绩的第75百分位数可以是______.答案:95分析:利用百分位数的求法直接求解即可.解:将所给数据按照从小到大的顺序排列:76,80,82,82,83,84,88,89,89,90 ,90,90,91,92,95,95,95,96,96,98.数据量n=20,∵c=n×75%=20×75%=15是整数,∴P75=x15+x162=95+952=95所以答案是:95.14、已知某样本数据分别为1,4,3,a,6,且样本均值x=3,则样本方差S2=_________.答案:185##3.6分析:先求得a的值,然后求得样本方差.依题意1+4+3+a+65=3,a=1,所以S2=15[(1−3)2×2+(4−3)2+(3−3)2+(6−3)2]=185.所以答案是:185解答题15、一个农技站为了考查某种大麦穗生长的分布情况,在一块试验田里抽取了100株麦穗,量得长度如下(单位:cm):6 .5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.65 .8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.86 .2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.56 .8 6.0 6.3 5.5 5.0 6.3 5.2 6.0 7.0 6.46 .4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.7 7.46 .0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.65 .3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.05 .6 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.75 .8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.06 .3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3根据上面的数据列出频率分布表,绘制出频率分布直方图,并估计在这块试验田里长度在5.75~6.35 cm之间的麦穗所占的百分比.答案:分布表见解析,直方图见解析,41%分析:首先计算出极差,从而确定组距,再决定分点,最后统计频数,列出频率分布表,画出频率分布直方图,由频率分布表可得试验田里长度在5.75~6.35 cm之间的麦穗所占的百分比.解:(1)计算极差:7.4-4.0=3.4.(2)决定组距与组数:若取组距为0.3,因为3.4≈11.3,需分为12组,组数合适,所以取组距为0.3,组数为12.0.3(3)决定分点:使分点比数据多一位小数,并且把第1小组的起点稍微减小一点,那么所分的12个小组可以是3.95~4.25,4.25~4.55,4.55~4.85,…,7.25~7.55.(4)列频率分布表:.从表中看到,样本数据落在5.75~6.35之间的频率是0.28+0.13=0.41,于是可以估计,在这块试验田里长度在5.75~6.35 cm之间的麦穗约占41%.小提示:本题考查绘制频率分布表及频率分布直方图及其应用,属于基础题.。

第九章 统计(知识点梳理及例题解析)

第九章   统计(知识点梳理及例题解析)

第九章统计9.1 随机抽样1. 全面调查与抽样调查( 1 )对每一个调查对象都进行调查的方法,称为全面调查,又称普查W .( 2 )在一个调查中,我们把调查对象的全体称为总体,组成总体的每一个调查对象称为个体W .( 3 )根据一定的目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查W .( 4 )把从总体中抽取的那部分个体称为样本W .( 5 )样本中包含的个体数称为样本量W .( 6 )调查样本获得的变量值称为样本的观测数据,简称样本数据 .2. 简单随机抽样( 1 )有放回简单随机抽样一般地,设一个总体含有 N ( N 为正整数)个个体,从中逐个抽取 n (1 ≤ n < N )个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样 .( 2 )不放回简单随机抽样如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样 .( 3 )简单随机抽样放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样 .( 4 )简单随机样本通过简单随机抽样获得的样本称为简单随机样本 .( 5 )简单随机抽样的常用方法实现简单随机抽样的方法很多,抽签法和随机数法是比较常用的两种方法 .■名师点拨( 1 )从总体中,逐个不放回地随机抽取 n 个个体作为样本,一次性批量随机抽取 n 个个体作为样本,两种方法是等价的 .( 2 )简单随机抽样中各个个体被抽到的机会都相等,从而保证了抽样的公平性 .3. 总体平均数与样本平均数( 1 )总体平均数① 一般地,总体中有 N 个个体,它们的变量值分别为 Y 1 , Y 2 ,… , Y N ,则称== Y i 为总体均值,又称总体平均数 .② 如果总体的 N 个变量值中,不同的值共有 k (k ≤ N )个,不妨记为 Y 1 , Y2 ,… , Y k ,其中 Y i 出现的频数 f i ( i = 1 , 2 ,… , k ),则总体均值还可以写成加权平均数的形式= f i Y i W .( 2 )样本平均数如果从总体中抽取一个容量为 n 的样本,它们的变量值分别为 y 1 , y 2 ,… , yn ,则称== y i 为样本均值,又称样本平均数 . 在简单随机抽样中,我们常用样本平均数去估计总体平均数 .4. 分层随机抽样( 1 )分层随机抽样一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层W .( 2 )比例分配在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配 .5. 分层随机抽样中的总体平均数与样本平均数( 1 )在分层随机抽样中,如果层数分为 2 层,第 1 层和第 2 层包含的个体数分别为 M 和 N ,抽取的样本量分别为 m 和 n . 我们用 X 1 , X 2 ,… , X M 表示第 1 层各个个体的变量值,用 x 1 , x 2 ,… , x m 表示第 1 层样本的各个个体的变量值;用 Y 1 , Y 2 ,… , Y N 表示第 2 层各个个体的变量值,用 y 1 , y 2 ,… ,y n 表示第 2 层样本的各个个体的变量值,则:① 第 1 层的总体平均数和样本平均数分别为== X i ,== x i .② 第 2 层的总体平均数和样本平均数分别为==Y i ,== y i .③ 总体平均数和样本平均数分别为=,=W .( 2 )由于用第 1 层的样本平均数可以估计第 1 层的总体平均数,用第 2 层的样本平均数可以估计第 2 层的总体平均数 . 因此我们可以用=+估计总体平均数 .( 3 )在比例分配的分层随机抽样中,==,可得+=+= . 因此,在比例分配的分层随机抽样中,我们可以直接用样本平均数估计总体平均数 .6. 获取数据的途径获取数据的基本途径有:( 1 )通过调查获取数据;( 2 )通过试验获取数据;( 3 )通过观察获取数据;( 4 )通过查询获取数据典型应用 1总体、样本等概念辨析题为了调查参加运动会的 1 000 名运动员的平均年龄,从中抽取了 100 名运动员进行调查,下面说法正确的是()A.1 000 名运动员是总体B. 每个运动员是个体C. 抽取的 100 名运动员是样本D. 样本量是 100【解析】根据调查的目的可知,总体是这 1 000 名运动员的年龄,个体是每个运动员的年龄,样本是抽取的 100 名运动员的年龄,样本量为 100. 故答案为D.【答案】 D此类题目要正确理解总体与个体的概念,要弄明白概念的实质,并注意样本与样本容量的不同,其中样本量为数目,无单位 .典型应用 2简单随机抽样的概念下面的抽样方法是简单随机抽样吗?为什么?( 1 )从无数个个体中抽取 50 个个体作为样本;( 2 )仓库中有 1 万支奥运火炬,从中一次抽取 100 支火炬进行质量检查;( 3 )某连队从 200 名党员官兵中,挑选出 50 名最优秀的官兵赶赴灾区开展救灾工作 .【解】( 1 )不是简单随机抽样 . 因为简单随机抽样要求被抽取的样本总体的个数是有限的 . ( 2 )不是简单随机抽样 . 虽然“ 一次性抽取” 和“ 逐个抽取” 不影响个体被抽到的可能性,但简单随机抽样要求的是“ 逐个抽取” . ( 3 )不是简单随机抽样 . 因为这 50 名官兵是从中挑选出来的,是最优秀的,每个个体被抽到的可能性不同,不符合简单随机抽样中“ 等可能抽样” 的要求 .要判断所给的抽样方法是否为简单随机抽样,关键是看它们是否符合简单随机抽样的定义,即简单随机抽样的四个特点 .典型应用 3抽签法及随机数法的应用某班有 50 名学生,要从中随机地抽出 6 人参加一项活动,请分别写出利用抽签法和随机数法抽取该样本的过程 .【解】( 1 )利用抽签法步骤如下:第一步:将这 50 名学生编号,编号为 01 , 02 , 03 ,… , 50.第二步:将 50 个号码分别写在纸条上,并揉成团,制成号签 .第三步:将得到的号签放在一个不透明的容器中,搅拌均匀 .第四步:从容器中逐一抽取 6 个号签,并记录上面的号码 .对应上面 6 个号码的学生就是参加该项活动的学生 .( 2 )利用随机数法步骤如下:第一步:将这 50 名学生编号,编号为 1 , 2 , 3 ,… , 50.第二步:用随机数工具产生 1 ~ 50 范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的学生进入样本 .第三步:重复第二步的过程,直到抽足样本所需人数 .对应上面 6 个号码的学生就是参加该项活动的学生 .( 1 )利用抽签法抽取样本时应注意以下问题:① 编号时,如果已有编号(如学号、标号等)可不必重新编号 . (例如该题中 50 名同学,可以直接利用学号)② 号签要求大小、形状完全相同 .③ 号签要搅拌均匀 .④ 抽取号签时要逐一、不放回抽取 .( 2 )利用随机数法抽取样本时应注意的问题:如果生成的随机数有重复,即同一编号被多次抽到,应剔除重复的编号并重新产生随机数,直到产生的不同编号个数等于样本所需的人数 .典型应用 4分层随机抽样中的有关计算( 1 )某单位共有老、中、青年职工 430 人,其中有青年职工 160 人,中年职工人数是老年职工人数的 2 倍,为了解职工身体状况,现采用分层随机抽样方法进行调查,在抽取的样本中有青年职工 32 人,则该样本中的老年职工的人数为W .( 2 )某高中学校为了促进学生个体的全面发展,针对学生发展要求,开设了富有地方特色的“ 泥塑” 与“ 剪纸” 两个社团,已知报名参加这两个社团的学生共有800 人,按照要求每人只能参加一个社团,各年级参加社团的人数情况如下表:高一年级高二年级高三年级泥塑 a b c剪纸x y z其中 x ∶ y ∶ z = 5 ∶ 3 ∶ 2 ,且“ 泥塑” 社团的人数占两个社团总人数的,为了了解学生对两个社团活动的满意程度,从中抽取一个 50 人的样本进行调查,则从高二年级“ 剪纸” 社团的学生中应抽取人 .【解析】( 1 )设该单位老年职工人数为 x ,由题意得 3 x = 430 - 160 ,解得 x = 90. 则样本中的老年职工人数为 90 × = 18.( 2 )法一:因为“ 泥塑” 社团的人数占总人数的,故“ 剪纸” 社团的人数占总人数的,所以“ 剪纸” 社团的人数为 800 × = 320 ;因为“ 剪纸” 社团中高二年级人数比例为==,所以“ 剪纸” 社团中高二年级人数为 320 × = 96.由题意知,抽样比为=,所以从高二年级“ 剪纸” 社团中抽取的人数为 96 × = 6.法二:因为“ 泥塑” 社团的人数占总人数的,故“ 剪纸” 社团的人数占总人数的,所以抽取的 50 人的样本中,“ 剪纸” 社团中的人数为 50 × = 20.又“ 剪纸” 社团中高二年级人数比例为==,所以从高二年级“ 剪纸” 社团中抽取的人数为 20 × = 6.【答案】( 1 ) 18 ( 2 ) 6分层随机抽样中有关计算的方法( 1 )抽样比== .( 2 )总体中某两层的个体数之比=样本中这两层抽取的个体数之比 .对于分层抽样中求某层个体数,或某层要抽取的样本个体数,都可以通过上面两个等量关系求解 .典型应用 5样本平均数的求法( 1 )甲在本次飞镖游戏中的成绩为 8 , 6 , 7 , 7 , 8 , 10 , 9 , 8 ,7 , 8. 求甲在本次游戏中的平均成绩 .( 2 )在了解全校学生每年平均阅读多少本文学经典名著时,甲同学抽取了一个容量为 10 的样本,并算得样本的平均数为 5 ;乙同学抽取了一个容量为 8 的样本,并算得样本的平均数为 6. 已知甲、乙两同学抽取的样本合在一起组成一个容量为 18 的样本,求合在一起后的样本均值 .【解】( 1 )甲在本次游戏中的平均成绩为= 7.8. ( 2 )合在一起后的样本均值为== .在分层随机抽样中,如果第一层的样本量为 m ,平均值为 x ;第二层的样本量为n ,平均值为 y ,则样本的平均值为 .9 . 2 用样本估计总体1 .频率分布表、频率分布直方图的制作步骤及意义2 .百分位数(1) 定义:一般地,一组数据的第 p 百分位数是这样一个值,它使得这组数据中至少有 p % 的数据小于或等于这个值,且至少有 ( 100 - p ) % 的数据大于或等于这个值.(2) 计算步骤:计算一组 n 个数据的第 p 百分位数的步骤:第 1 步,按从小到大排列原始数据.第 2 步,计算 i = n × p % .第 3 步,若 i 不是整数,而大于 i 的比邻整数为 j ,则第 p 百分位数为第 j 项数据;若 i 是整数,则第 p 百分位数为第 i 项与第 ( i + 1) 项数据的平均数.典型应用 1频率分布表、频率分布直方图、频率分布折线图的绘制角度一频率分布表、频率分布直方图的绘制为考查某校高二男生的体重,随机抽取 44 名高二男生,实测体重数据( 单位: kg ) 如下:57 , 61 , 57 , 57 , 58 , 57 , 61 , 54 , 68 , 51 , 49 , 64 , 50 , 48 ,65 , 52 , 56 , 46 , 54 , 49 , 51 , 47 , 55 , 55 , 54 , 42 , 51 , 56 ,55 , 51 , 54 , 51 , 60 , 62 , 43 , 55 , 56 , 61 , 52 , 69 , 64 , 46 ,54 , 48将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.【解】以 4 为组距,列表如下:分组频率累计频数频率[41.5 , 45.5 ) 2 0.045 5[45.5 , 49.5 ) 7 0.159 1[49.5 , 53.5 ) 8 0.18 1 8[53.5 , 57.5 ) 16 0.363 6[57.5 , 61.5 ) 5 0.113 6[61.5 , 65.5 ) 4 0.090 9[65.5 , 69.5 ) 2 0.045 5频率分布直方图和频率分布折线图如图所示.(1) 在列频率分布表时,极差、组距、组数有如下关系:① 若为整数,则=组数;② 若不为整数,则的整数部分+ 1 =组数.(2) 组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,纵使数据的分布规律能较清楚地呈现出来,组数太多或太少,都会影响我们了解数据的分布情况,若样本容量不超过 100 ,按照数据的多少常分为 5 ~ 12 组,一般样本量越大,所分组数越多.角度二频率分布直方图的应用为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图 ( 如图所示 ) ,图中从左到右各小长方形面积之比为 2 ∶ 4 ∶ 17 ∶ 15 ∶ 9 ∶ 3 ,第二小组的频数为 12.(1) 第二小组的频率是多少?样本量是多少?(2) 若次数在 110 以上 ( 含 110 次 ) 为达标,则该校全体高一年级学生的达标率是多少?(3) 样本中不达标的学生人数是多少?(4) 第三组的频数是多少?【解】 (1) 频率分布直方图以面积的形式反映数据落在各小组内的频率大小,因此第二小组的频率为= 0.08.又因为第二小组的频率=,所以样本容量=== 150.(2) 由直方图可估计该校高一年级学生的达标率为 × 100% = 88 %.(3) 由 (1)(2) 知达标率为 88 % ,样本量为 150 ,不达标的学生频率为 1 - 0.88= 0.12.所以样本中不达标的学生人数为 150 × 0.12 = 18( 人 ) .(4) 第三小组的频率为= 0.34.又因为样本量为 150 ,所以第三组的频数为 150 × 0.34 = 51.频率分布直方图的应用中的计算问题(1) 小长方形的面积=组距 × =频率;(2) 各小长方形的面积之和等于 1 ;(3) =频率,此关系式的变形为=样本量,样本量 × 频率=频数.典型应用 2条形统计图为了丰富校园文化生活,某校计划在午间校园广播台播放“ 百家讲坛” 的部分内容.为了了解学生的喜好,抽取若干名学生进行问卷调查 ( 每人只选一项内容 ) ,整理调查结果,绘制统计图如图所示.请根据统计图提供的信息回答以下问题:(1) 求抽取的学生数;(2) 若该校有 3 000 名学生,估计喜欢收听易中天《品三国》的学生人数;(3) 估计该校喜欢收听刘心武评《红楼梦》的女学生人数约占全校学生人数的百分比.【解】 (1) 从统计图上可以看出,喜欢收听于丹析《庄子》的男生有 20 人,女生有 10 人;喜欢收听《故宫博物院》的男生有 30 人,女生有 15 人;喜欢收听于丹析《论语》的男生有 30 人,女生有 38 人;喜欢收听易中天《品三国》的男生有 64 人,女生有 42 人;喜欢收听刘心武评《红楼梦》的男生有 6 人,女生有 45 人.所以抽取的学生数为 20 + 10 + 30 + 15 + 30 + 38 + 64 + 42 + 6 + 45 =300( 人 ) .(2) 喜欢收听易中天《品三国》的男生有 64 人,女生有 42 人,共有 106 人,占所抽取总人数的比例为,由于该校有 3 000 名学生,因此可以估计喜欢收听易中天《品三国》的学生有× 3 000 = 1 060( 人 ) .(3) 该校喜欢收听刘心武评《红楼梦》的女学生人数约占全校学生人数的比例为× 100% = 15 %.(1) 绘制条形统计图时,第一步确定坐标系中横轴和纵轴上坐标的意义,第二步确定横轴上各部分的间距及位置,第三步根据统计结果绘制条形图.实际问题中,我们需根据需要进行分组,横轴上的分组越细,对数据的刻画(描述)就越精确.(2) 在条形统计图中,各个矩形图的宽度没有严格要求,但高度必须以数据为准,它直观反映了各部分在总体中所占比重的大小.典型应用 3折线统计图小明同学因发热而住院,下图是根据护士为他测量的体温所绘制的体温折线图.根据图中的信息,回答以下问题:(1) 护士每隔几小时给小明测量一次体温?( 2) 近三天来,小明的最高体温、最低体温分别是多少?(3) 从体温看,小明的病情是在恶化还是在好转?(4) 如果连续 36 小时体温不超过 37.2 摄氏度的话,可认为基本康复,那么小明最快什么出院?【解】 (1) 根据横轴表示的意义,可知护士每隔 6 小时给小明测量一次体温.(2) 从折线统计图中的最高点和最低点对应的纵轴意义,可知最高体温是 39.5 摄氏度,最低体温是 36.8 摄氏度.(3) 从图中可知小明的体温已经下降,并趋于稳定,因此病情在好转.(4)9 月 8 日 18 时小明的体温是 37 摄氏度.其后的体温未超过 37.2 摄氏度,自 9 月 8 日 18 时起计算,连续 36 小时后对应的时间为 9 月 10 日凌晨 6 时.因此小明最快可以在 9 月 10 凌晨 6 时出院.(1) 绘制折线统计图时,第一步,确定直角坐标系中横、纵坐标表示的意义;第二步,确定一个单位长度表示一定的数量,根据数量的多少描出各点;第三步,用直线段顺次连接即可.(2) 在折线统计图中,从折线的上升、下降可分析统计数量的增减变化情况,从陡峭程度上,可分析数据间相对增长、下降的幅度.典型应用 4扇形统计图下图是 A , B 两所学校艺术节期间收到的各类艺术作品的情况的统计图:(1) 从图中能否看出哪所学校收到的水粉画作品数量多?为什么?(2) 已知 A 学校收到的剪纸作品比 B 学校的多 20 件,收到的书法作品比 B 学校的少 100 件,请问这两所学校收到艺术作品的总数分别是多少件?【解】 (1) 不能.因为两所学校收到艺术作品的总数不知道.(2) 设 A 学校收到艺术作品的总数为 x 件, B 学校收到艺术作品的总数为 y 件,则解得即 A 学校收到艺术作品的总数为 500 件,B 学校收到艺术作品的总数为 600 件.(1) 绘制扇形统计图时,第一步计算各部分所占百分比以及对应圆心角的度数;第二步在圆中按照上述圆心角画出各个扇形并恰当标注.(2) 扇形统计图表示总体的各部分之间的百分比关系,但不同总量下的扇形统计图,其不同的百分比不可以作为比较的依据.典型应用 5百分位数的计算现有甲、乙两组数据如下表所示.序号1 2 3 4 5 6 7 8 9 11112131415161718192甲组1 2 2 2 2 3 3 3 5 5 6 6 8 8 9 11121313乙组0 0 0 0 1 1 2 3 4 5 6 6 7 7 11414141415试求甲、乙两组数的 25 % 分位数与 75 % 分位数.【解】因为数据个数为 20 ,而且 20 × 25 % = 5 , 20 × 75% = 15.因此,甲组数的 25 % 分位数为== 2.5 ;甲组数的 75 % 分位数为== 9.5.乙组数的 25 % 分位数为== 1 ,乙组的 75 % 分位数为== 12.求百分位数时,一定要将数据按照从小到大的顺序排列.9 . 3 统计案例公司员工的肥胖情况调查分析1 .平均数和中位数的特点(1) 样本平均数与每一个样本数据有关,样本中的任何一个数据的改变都会引起平均数的改变.(2) 中位数只利用了样本数据中间位置的一个或两个值,并未利用其他数据,所以不是任何一个样本数据的改变都会引起中位数的改变.(3) 与中位数相比较,平均数反映出样本数据中的更多信息,对样本中的极端值更加敏感.2 .中位数、平均数与频率分布直方图的关系一般来说,对一个单峰的频率分布直方图来说,如果直方图的形状是对称的 ( 图(1)) ,那么平均数和中位数应该大体上差不多;如果直方图在右边“ 拖尾” ( 图(2)) ,那么平均数大于中位数;如果直方图在左边“ 拖尾” ( 图 (3)) ,那么平均数小于中位数.也就是说,和中位数相比,平均数总是在“ 长尾巴” 那边.3 .众数的特点众数只利用了出现次数最多的那个值的信息.众数只能告诉我们它比其他值出现的次数多,但并未告诉我们它比别的数值多的程度.因此,众数只能传递数据中的信息的很少一部分,对极端值也不敏感.■名师点拨一般地,对数值型数据 ( 如用水量、身高、收入、产量等 ) 集中趋势的描述,可以用平均数、中位数;而对分类型数据 ( 如校服规格、性别、产品质量等级等 ) 集中趋势的描述,可以用众数.4 .总体方差与总体标准差如果总体中所有个体的变量值分别为 Y 1 , Y 2 ,… , Y N ,总体平均数为,则称 S 2 = __ ( Y i - ) 2 为总体方差, S =为总体标准差.与总体均值类似,总体方差也可以写成加权的形式.如果总体的 N 个变量值中,不同的值共有k ( k ≤ N ) 个,不妨记为 Y 1 , Y 2 ,… , Y k ,其中 Y i 出现的频数为 f i ( i = 1 , 2 ,… , k ) ,则总体方差为 S 2 = f i ( Y i - ) 2 .5 .样本方差与样本标准差如果一个样本中个体的变量值分别为 y 1 , y 2 ,… y n ,样本平均数为,则称 s 2 = ( y i - ) 2 为样本方差, s =为样本标准差.■名师点拨(1) 若 x 1 , x 2 , x 3 ,… , x n 的平均数为,方差为 s 2 那么 ax 1 + b ,ax 2 + b , ax 3 + b ,… , ax n + b 的平均数为′ = a + b ;方差s ′ 2 =a 2 s 2 .(2) 标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.显然,在刻画数据的分散程度上,方差和标准差是一样的.但在解决实际问题中,一般多采用标准差.典型应用 1众数、中位数、平均数的计算及应用某工厂人员及月工资构成如下:人员经理管理人员高级技工工人学徒合计月工资 ( 元 )22 000 2 500 2 200 2 000 1 000 29 700人数 1 6 5 10 1 23合计22 000 15 000 11 000 20 000 1 000 69 000(1) 指出这个表格中的众数、中位数、平均数;(2) 这个表格中,平均数能客观地反映该工厂的月工资水平吗?为什么?【解】 (1) 由表格可知,众数为 2 000 元.把 23 个数据按从小到大 ( 或从大到小 ) 的顺序排列,排在中间的数应是第 12 个数,其值为 2 200 ,故中位数为 2 200 元.平均数为 (22 000 + 15 000 + 11 000 + 20 000 + 1 000)÷23 = 69 000÷23 = 3 000( 元 ) .(2) 虽然平均数为 3 000 元 / 月,但由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平.(1) 如果样本平均数大于样本中位数,说明数据中存在较大的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中的极端数据信息,帮助我们作出决策.(2) 众数、中位数、平均数三者比较,平均数更能体现每个数据的特征,它是各个数据的重心.典型应用 2利用频率分布直方图求众数、中位数、平均数从高三抽出 50 名学生参加数学竞赛,由成绩得到如下的频率分布直方图.由于一些数据丢失,试利用频率分布直方图求:(1) 这 50 名学生成绩的众数与中位数;(2) 这 50 名学生的平均成绩.【解】 (1) 由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小长方形的底边中点的横坐标即为所求,所以众数应为 75.由于中位数是所有数据中的中间值,故在频率分布直方图中体现的是中位数的左右两边频数应相等,即频率也相等,从而就是小矩形的面积和相等.因此在频率分布直方图中将所有小矩形的面积一分为二的垂直于横轴的直线与横轴交点的横坐标所对应的成绩即为所求.因为 0.004 × 10 + 0.006 × 10 + 0.02 × 10= 0.04 + 0.06 + 0.2 = 0.3 ,所以前三个小矩形面积的和为 0.3. 而第四个小矩形面积为 0.03 × 10 = 0.3 , 0.3 +0.3 > 0.5 ,所以中位数应位于第四个小矩形内.设其底边为 x ,高为 0.03 ,所以令 0.03 x = 0.2 ,得x ≈ 6.7 ,故中位数应约为 70 + 6.7 = 76.7.(2) 样本平均值应是频率分布直方图的“ 重心” ,即所有数据的平均值,即每个小矩形底边的中点的横坐标乘以每个小矩形的面积求和即可.所以平均成绩为 45 × (0.004 × 10) + 55 × (0.006 × 10) + 65 × (0.02 × 10) + 75 × (0.03 × 10) + 85 × (0.024 × 10) + 95 × (0.016 × 10) = 76.2.频率分布直方图的数字特征(1) 众数:众数一般用频率分布表中频率最高的一组的组中值来显示,即在样本数据的频率分布直方图中,最高矩形的底边中点的横坐标;(2) 中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等;(3) 平均数:平均数在频率分布表中等于组中值与对应频率之积的和.典型应用 3标准差、方差的计算及应用甲、乙两机床同时加工直径为 100 cm 的零件,为检验质量,从中抽取 6件测量数据为:甲: 99 100 98 100 100 103乙: 99 100 102 99 100 100(1) 分别计算两组数据的平均数及方差;(2) 根据计算说明哪台机床加工零件的质量更稳定.【解】 (1) 甲= × (99 + 100 + 98 + 100 + 100 + 103) = 100 ,乙= × (99 + 100 + 102 + 99 + 100 + 100) = 100 ,s = × [(99 - 100) 2 + (100 - 100) 2 + (98 - 100) 2 + (100 - 100) 2 +(100 - 100) 2 + (103 - 100) 2 ] =,s = × [(99 - 100) 2 + (100 - 100) 2 + (102 - 100) 2 + (99 - 100) 2 +(100 - 100) 2 + (100 - 100) 2 ] = 1.(2) 由 (1) 知甲=乙,比较它们的方差,因为 s > s ,故乙机床加工零件的质量更稳定.用样本的标准差、方差估计总体的方法(1) 用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,当所得数据的平均数不相等时,需先分析平均水平,再计算标准差 ( 方差 ) 分析稳定情况.(2) 标准差、方差的取值范围是 [0 ,+∞ ) .(3) 因为标准差与原始数据的单位相同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的离散程度上是一样的,但在解决实际问题时,一般多采用标准差.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

普通高中课程标准实验教科书—数学[人教版]高三新数学第一轮复习教案(讲座40)—统计一.课标要求:1.统计案例通过典型案例,学习下列一些常见的统计方法,并能初步应用这些方法解决一些实际问题。

(1)通过对典型案例(如"肺癌与吸烟有关吗"等)的探究,了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用;(2)通过对典型案例(如"质量控制"、"新药是否有效"等)的探究,了解实际推断原理和假设检验的基本思想、方法及初步应用;(3)通过对典型案例(如"昆虫分类"等)的探究,了解聚类分析的基本思想、方法及初步应用;(4)通过对典型案例(如"人的体重与身高的关系"等)的探究,进一步了解回归的基本思想、方法及初步应用。

2.随机变量的分布列(1)在对具体问题的分析中,理解取有限值的离散型随机变量及其分布列的概念,认识分布列对于刻画随机现象的重要性;(2)通过实例(如彩票抽奖),理解超几何分布及其导出过程,并能进行简单的应用;(3)在具体情境中,了解条件概率和两个事件相互独立的概念,理解n次独立重复试验的模型及二项分布,并能解决一些简单的实际问题;(4)通过实例,理解取有限值的离散型随机变量均值、方差的概念,能计算简单离散型随机变量的均值、方差,并能解决一些实际问题;(5)通过实际问题,借助直观(如实际问题的直方图),认识正态分布曲线的特点及曲线所表示的意义。

二.命题走向统计案例本部分内容主要包括回归分析的基本思想及其初步应用和独立性检验的基本思想和初步应用,是教材新增内容,估计高考中比重不会过大。

预测07年的高考主要有以下几种情况:(1)知识点将会考察回归分析的基本思想方法,用独立性检验判断A与B间的关系,及2×2列联表;(2)考查的形式主要以选择、填空题为主,但不会涉及很多;随机变量的分布列本部分内容主要包括随机变量的概念及其分布列,离散性随机变量的均值和方差,正态分布,从近几年的高考观察,这部分内容有加强命题的趋势。

预测07年的高考对本部分内容的考查有以下情况:(1)考查的重点将以随机变量及其分布列的概念和基本计算为主,题型以选择、填空为主,有时也以解答题形式出现;(2)预计07年高考还是实际情景为主,建立合适的分布列,通过均值和方差解释实际问题;三.要点精讲统计案例 1.相关系数相关系数是因果统计学家皮尔逊提出的,对于变量y 与x 的一组观测值,把=叫做变量y 与x 之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度。

相关系数的性质:||r ≤1,且||r 越接近1,相关程度越大;且||r 越接近0,相关程度越小。

显著性水平:显著性水平是统计假设检验中的一个概念,它是公认的小概率事件的概率值。

它必须在每一次统计检验之前确定。

显著性检验:(相关系数检验的步骤)由显著性水平和自由度查表得出临界值,显著性水平一般取0.01和0.05,自由度为n-2,其中n是数据的个数 在“相关系数检验的临界值表”查出与显著性水平0.05或0.01及自由度n-2(n 为观测值组数)相应的相关数临界值r 0 05或r0 01;例如n=7时,r0.05=0.754,r0.01=0.874 求得的相关系数r和临界值r0.05比较,若r>r0.05,上面y与x是线性相关的,当≤r 0.05或r 0.01,认为线性关系不显著。

结论:讨论若干变量是否线性相关,必须先进行相关性检验,在确认线性相关后,再求回归直线;通过两个变量是否线性相关的估计,实际上就是把非确定性问题转化成确定性问题来研究; 我们研究的对象是两个变量的线性相关关系,还可以研究多个变量的相关问题,这在今后的学习中会进一步学到。

2.卡方检验统计中有一个有用的(读做“卡方”)统计量,它的表达式是: ))()()(()(2d b c a d c b a bc ad n K++++-=,经过对统计量分布的研究,已经得到了两个临界值:3.841与6.635。

当根据具体的数据算出的k>3.841时,有95%的把握说事件A 与B 有关;当k>6.635时,有99%的把握说事件A 与B 有关;当k ≤3.841时,认为事件A 与B 是无关的。

随机变量1.随机变量的概念如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量。

随机变量常用希腊字母ξ、η等表示。

对于随机变量可能取的值,我们可以按一定次序一一列出,这样的随机变量叫做离散型随机变量。

注:随机变量ξ是关于试验结果的函数,即每一个试验结果对应着一个实数;随机变量ξ的线性组合η=aξ+b(a 、b 是常数)也是随机变量。

2.离散性随机变量的分布列 一般地,设离散型随机变量ε可能取得值为: X1,X2,…,X3,…,ε取每一个值Xi (I=1,2,…)的概率为P (P xi ==)ε,则称表两条基本性质:①,2,1(0=≥i p i ...);②P 1+P 2+ (1)3.独立相互独立事件:事件A (或B )是否发生对事件B (或A )发生的概率没有影响.这样的两个事件叫做相互独立事件。

独立重复试验:若n 次重复试验中,每次试验结果的概率都不依赖于其他各次试验的结果,则称这n 次试验是独立的。

公式(1)两个相互独立事件同时发生的概率,等于每个事件发生的概率的积,即P (A·B )=P (A )·P (B );推广:若事件A 1,A 2,…,A n 相互独立,则P(A 1·A 2…A n )=P(A 1)·P(A 2)·…·P(n )。

(2)如果在一次试验中某事件发生的概率为P ,那么在n 次独立重复试验中这个事件恰好发生k 次的概率:P n (k)=C kn P k (1-P)n-k 。

4.随机变量的均值和方差 (1)随机变量的均值++=2211p x p x E ε…;反映随机变量取值的平均水平。

(2)离散型随机变量的方差:+-+-=222121)()(p E x p E x D εεε…+-+n n p E x 2)(ε…;反映随机变量取值的稳定与波动,集中与离散的程度。

基本性质:b aE b a E +=+εε)(;εεD a b a D 2)(=+。

5.几种特殊的分布列(1)两点分步两点分布:对于一个随机试验,如果它的结果只有两种情况,则我们可用随机变量⎩⎨⎧=.0, 1乙结果发生甲结果发生η,来描述这个随机试验的结果。

如果甲结果发生的概率为P ,则乙结果发生的概率必定为1-P ,所以两点分布的分布列为:(2)超几何分布重复进行独立试验,每次试验只有成功、失败两种可能,如果每次试验成功的概率为p ,重复试验直到出现一次成功为止,则需要的试验次数是一个随机变量,用ξ表示,因此事件{ξ=n}表示“第n 次试验成功且前n -1次试验均失败”。

所以()()1n p 1p n P --⨯==ξ,其分布列为:(3)二项分布如果我们设在每次试验中成功的概率都为P ,则在n 次重复试验中,试验成功的次数是一个随机变量,用ξ来表示,则ξ服从二项分布.则在n 次试验中恰好成功k 次的概率为:()().p 1p C k P kn kk n--==ξ二项分布的分布列为:,2,1,0,1()(=-==-k p q qp C k P kn kkn n …),n 。

期望E ε=np ,方差D ε=npq 。

6.正态分布正态分布密度函数:222)(21)(σμπσ--=x e x f ,均值为E ε=μ,方差为2σε=D 。

正态曲线具有以下性质:(1)曲线在x 轴的上方,与x 轴不相交。

(2)曲线关于直线x =μ对称。

(3)曲线在x =μ时位于最高点。

(4)当x <μ时,曲线上升;当x >μ时,曲线下降。

并且当曲线向左、右两边无限延伸时,以x 轴为渐近线,向它无限靠近。

(5)当μ一定时,曲线的形状由σ确定。

σ越大,曲线越“矮胖”,表示总体越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中。

从理论上讲,服从正态分布的随机变量ξ的取值范围是R ,但实际上ξ取区间(μ-3σ,μ+3σ)外的数值的可能性微乎其微,在实际问题中常常认为它是不会发生的。

因此,往往认为它的取值是个有限区间,即区间(μ-3σ,μ+3σ),这即实用中的三倍标准差规则,也叫3σ规则。

在企业管理中,经常应用这个规则进行产品质量检查和工艺生产过程控制。

四.典例解析题型1:线性相关性检验例1.一个工厂在某年里每月产品的总成本y(万元)与该月产量x(万件)之间由如下一组数据:的回归直线方程.解析:=,==2.8475,=29.808,=99.2081,=54.2432)r==在“相关系数检验的临界值表”查出与显著性水平0.05及自由度12-2=10相应的相关数临界值r0.05=0.576<0.997891, 这说明每月产品的总成本y(万元)与该月产量x(万件)之间存在线性相关关系。

3)设回归直线方程,利用,计算a,b,得b≈1.215, a=≈0.974,∴回归直线方程为:例2.在7块并排、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得数据如下(单位:kg)r的显著性水平;3)求月总成本y与月产量x之间的回归直线方程。

解析:1)画出散点图如下:2)检验相关系数r的显著性水平:=30,=399.3,=7000,=1132725,=87175r==≈0.9733,在“相关系数检验的临界值表”查出与显著性水平0.05及自由度7-2=5相应的相关数临界值r0.05=0.754<0.9733,这说明水稻产量与施化肥量之间存在线性相关关系。

3)设回归直线方程,利用计算a,b,得b=a=399.3-4.75×30≈257,则回归直线方程题型2:独立性检验例3.为了探究患慢性气管炎是否与吸烟有关,调查了339名50岁以上的人,调查结果如下表所示:试问:50岁以上的人患慢性气管炎与吸烟习惯有关吗? 解析:由公式469.728356134205)1316212143(3392=⨯⨯⨯⨯-⨯⨯=K,因为7.469>6.635,所以我们有99%的把握说:50岁以上的人患慢性气管炎与吸烟习惯有关。

例4.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:试根据上述数据比较这两种手术对病人又发作心脏病的影响有没有差别。

解析:由公式78.132468196196)2915716739(3922=⨯⨯⨯⨯-⨯⨯=K,因为1.78>3.841,所以我们没有理由说“心脏搭桥手术”与“又发作过心脏病”有关,可以认为病人又发作与否与其做过任何手术无关。

相关文档
最新文档