“统计与概率”中考知识梳理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
原文地址:“统计与概率”中考知识梳理作者:sxzq
(本文发表于2010年第3期《数学金刊》)
“统计与概率”是初中数学的四个学习领域之一,这部分知识在人们的生活实践有着广泛的应用,在近年来各地中考中所占比例约为15%.初中阶段对该部分知识的学习分散在各册数学书中,我们一起来将它们梳理一下吧!
一、知识结构
二、重点知识
1. “两查”即普查、抽样调查
普查(又叫全面调查)的范围是所有考察的对象,抽样调查的范围是部分考察的对象.现实生活中经常会进行一些调查,采取普查还是抽样调查既要考虑问题本身的需要,又要考虑实现的可能性和所付出的代价的大小.例如,为让市民吃上放心月饼,某市质检部门对市场上销售的月饼进行质量调查,面对种类、数量繁多的月饼,如果采用普查方式,虽然得到的结果准确,但费时耗力不说、经过调查的月饼都被破坏无法继续销售,所以只能采取抽样调查.又如,为防控H1N1甲型流感,学校要记录师生每天的体温,因为要防治严重传染病,所以人数再多这样的调查也应该是普查.
当然抽样调查时,所选择的样本必须要具有代表性.例:要检测某地区空气的质量,如果只抽取市中心的空气质量作为样本,这样选择就不具有代表性,就不能真实反映总体情况.
在区分总体、个体、样本、样本容量这四个概念时,首先找出考察的对象,从而找出总体、个体,再根据被收集数据的这一部分对象找出样本,最后再根据样本确定出样本容量.
例:为了了解七年级2000名学生的数学成绩,从中抽取了1000名学生的期末数学成绩进行统计分析.这个问题中,我们考察的对象是学生的数学成绩,因此,总体是所有2000名学生的数学成绩,个体就是每一个学生的数学成绩,再根据被收集数据的这一部分考察对象即1000名学生的数学成绩,确定出样本即1000名学生的数学成绩,最后再根据样本的数目,即收集的数据的数目,确定样本容量1000(注意没有单位).
2.“双频”,即频数和频率
在一组数据中,我们称每个数据出现的次数为频数,而每个数据出现的次数与总次数的比值为频率.如,“(2009年宜宾)已知数据: .其中无理数出现的频率为()”.题中共5个数,无理数出现的频数是3(分别是),所以频率为 = 60%.
3. “三数”即平均数、中位数、众数
一般地,我们会用平均数(算术平均数或加权平均数)、中位数、众数来描述一组数据的平均水平.
怎样计算一个同学某次考试的平均分呢?大家都知道,只要将各科成绩相加再除以科数就可以了.一般地,对于n个数x1,x2,x3,……,x n,x=(x1+x2+x3+…+x n)叫做这n个数的平均数,又称算术平均数.
某电台在招播音员时,要进行笔试和面试,并将上两项成绩按3:2的比例计算总成绩,甲的两项成绩各为90分、80分,其总成绩的计算就不能90和80相加再除以2、而要用加权平均数来算.如果一组数据里的各个数据的“重要程度”未必相同,在计算这组数据的平均数时,往往给每个数据一个“权”,那么这组数据的平均数就成为加权平均数,公式是….上述问题中甲的总成绩就是90×+80×=86(分).
将一组数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数),叫做这组数据的中位数.如,要求一组数据4,5,6,7,7,8的中位数,它们已经按大小排列好了,最中间的是两个数6、7,中位数就是(6+7)÷2=3.5;又如,“(2009柳州)某学习小组7个男同学的身高(单位:米)为:1.66、1.65、1.72、1.58、1.64、1.66、1.70,那么这组数据的众数为()”,将原数据从小到大排列为1.58、1.64、1.65、1.66、1.66、1.70、1.72,最中间一个位置上的数1.66就是中位数.
有时我们更关心一组数据里哪个数出现的次数最多,比如书店的老板,要根据书的不同销量来确定怎样进货,这时就要用到众数了.我们把一组数据中出现次数最多的那个数据叫做这组数据的众数.例如,在5、3、2、6、9、6、7这组数中,6出现了2次,出现的次数最多,所以众数是6;如果在这组数中再加上一个5,因为其中5和6都出现了2次、都是最多的,所以这8个数的众数就是5、6两个数.
注意:①平均数的计算要用到所有数据,它能够充分利用数据提供的信息,故在生活中较为常用,但它受极端值的影响较大;②中位数只是一个位置代表值,只需很少的计算,不受极端值的影响,但不能充分利用所有数据的信息;③当一组数据中某些数据多次重复出现时,众数是人们关心的一个量,它不需要计算,并且不受极端值的影响,但当各个数据重复的资料大致相等时,众数往往没有特别意义.
4. “三差”即极差、方差、标准差
我们用极差、方差、标准差来描述一组数据的波动程度(或离散程度),它们越大,说明数据的波动越大;反之,越小.
极差是指一组数据中最大数据与最小数据的差.它能反映数据的变化范围,是一种简单的度量数据波动情况的量,但它受极端值的影响较大.如,“(2009年嘉兴市)已知数据:2,,3,5,6,5,则这组数据的众数和极差分别是()”,其中5出现了2次、出现次数最多,故众数是5;极差是最大数6与最小数-1的差7.
方差是各个数据与平均数之差的平方的平均数,即:
S2= [(x1- )2+(x2- )2+(x3- )2+…+(x n- )2〕,其中,是x1,x2,x3,…x n的平均数,S2是方差,而标准差S就是方差的算术平方根.如,“(2009年鄂州)有一组数据如下:3、a、4、6、7,它们的平均数是5,那么这组数据的方差是()”.先根据平均数的公式求出a=5,所以方差S2= [(3-5)2+(5-5)2+(4-5)2+(6-5)2+(7-5)2〕=2,标准差是 .
在实际问题的解决过程中,仅有“平均水平”还难以准确到刻画一组数据,比如,当两个运动员的几次训练的平均成绩相同时,怎样评价他们的水平呢?这时我们还要考虑数据的“波动情况”,总的说来,一般用平均数(算术平均数或加权平均数)、中位数、众位数来描述一组数据的平均水平,表示数据的集中程度;而用极差和方差来表示数据的离散程度和波动情况,在分析数据时,往往会根据要求来取数据的平均数,当数据的平均水平一致时,为了更好地根据统计结果做出合理的判断和预测,我们往往会根据极差和方差来判断数据的稳定性,从而做出正确的决策.
5. “五图” :即条形统计图、折线统计图、扇形统计图、频数分布直方图、频数分布折线图
统计图是表示统计数据的图形,是数据及其之间关系的直观表现和反映.
解决问题时选择哪种统计图,要根据统计图的特点和问题需要而定.当我们要清楚地表示出每个项目的具体数目时用条形统计图或频数分布直方图,当要清楚地反映数据的变化情况时用折线统计图或频数分布折线图,当要表示出各部分在总体中所占的百分比时就用扇形统计图.
在扇形统计图中所有部分的百分比之和等于1,扇形圆心角的度数=表示部分占总体的比例×360°;在频数分布直方图中,各小组的频数之和等于数据总数,各小组的频率之和等于1.
6.“三事件”,即必然事件、不可能事件和不确定事件
生活中,有的事件肯定会发生,像太阳每天都从东方升起,这样的事件叫必然事件;有的事件是不会发生的,像半夜里出太阳,这样的事件叫不可能事件;还有的事件可能发生、也可能不发生,像买彩票中奖,这样的事件叫不确定事件(或随机事件).必然事件和不可能事件统称为确定事件.
7.“两率”,即频率和概率
频率在前面已经提过,概率是某事件发生的可能性大小,常用字母P表示.显然,必然事件发生的概率为1,即p(必然事件)=1;不可能事件发生的概率为0,即P(不可能事件)=0;不确定事件A发生的概率在0和1之间,即 0<P(A)<1.
8.“一计算”,即概率的计算