2010年高考数学复习必备精品:用样本估计总体及线性相关关系
高中数学用样本估计总体
总体中所有个体值与总体平均数之差的平方的平均数,是衡量数据分散程度的量 。总体方差是参数,而样本方差是统计量。
样本比例和总体比例
样本比例
样本中某事件发生的次数与样本容量 的比值,用于估计总体比例。计算公 式为 $frac{a}{n}$,其中 $a$ 是事 件发生的次数,$n$ 是样本容量。
高中数学用样本估计总体
汇报人: 202X-01-02
contents
目录
• 样本和总体 • 用样本估计总体 • 样本估计总体的误差 • 用样本估计总体的应用 • 案例分析
01
样本和总体
样本和总体的定义
总体
研究对象的全体集合,表示为N。
样本
从总体中随机抽取的一部分个体,表示为n。
样本和总体的关系
05
案例分析
案例一:某品牌电视的市场占有率
总结词
通过调查某地区一定数量的家庭或零售商,了解他们购买电视的品牌偏好,从而估算该品牌电视在该 地区的整体市场占有率。
详细描述
选取一定数量的家庭或零售商作为样本,通过问卷调查或访谈的方式了解他们购买电视的品牌偏好。 然后,根据样本数据计算该品牌电视的市场占有率,并使用合适的统计方法对结果进行估计和误差分 析。
总体比例
总体中某事件发生的次数与总体容量 的比值。在统计学中,总体比例通常 作为参数来估计。
03
样本估计总体的误差
抽样误差和非抽样误差
抽样误差
由于从总体中随机抽取样本而产 生的误差,这种误差可以通过增 加样本量和提高样本代表性来减 小。
非抽样误差
由于调查过程中的非随机因素, 如测量误差、记录误差等而产生 的误差,这种误差难以控制和消 除。
案例二:某班级的数学成绩分布
高考数学第一轮知识点总复习 第二节 用样本估计总体
平.因为公司中少数人的月工资额与大多数人的月工资额差别较大,
这样导致了平均数与中位数的偏差较大,所以平均数不能客观真实
地反映这个公司员工的工资水平.
题型四 综合问题
【例4】(12分)某种瓶装溶液,因为装瓶机的不稳定性,所以很可能每 瓶装的容量都不是标准的容量.我们随机抽出了20瓶,测得它们的容量 (单位:百毫升)如下: 12.1 11.9 12.2 12.2 12.0 12.1 12.9 12.1 12.3 12.5 11.7 12.4 12.3 11.8 11.3 12.1 11.4 11.6 11.2 12.2
1
(2)频率分布直方图如图:
(3)电子元件寿命在100 h~400 h以内的频数为130,则频率 为 13=00.65. 200
(4)寿命在400 h以上的电子元件的频数为70,则频率 为 =700.35. 200
学后反思利用样本的频率分布可近似地估计总体的分布.从本例可 以看出,要比较准确地反映出总体70 分布的情况,必须准确地作出
[140,15 0)
人数
4
8
x
5
3
生产能 力分组 人数
表2:
[110, 120)
6
[120,130) [130,14 0)
y
36
[140,15 0)
18
(1)先确定x、y,再完成下列频率分布直方图,就生产能力而言, A类工人中个体间的差异程度与B类工人中个体间的差异程度哪 个更小?(不用计算,可通过观察直方图直接回答结论)
比;所有组距的频率之和为1;每一组距的频率是频率分布直方图中该
组距所对应的矩形的面积.
解
(1)M=0.102
=50,m=50-(1+4+20+15+8)=2n,N =m1,
高考数学一轮复习 第19讲 用样本估计总体及线性相关关系精品学案
2013年普通高考数学科一轮复习精品学案 第19讲 用样本估计总体及线性相关关系一.课标要求:1.用样本估计总体①通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图、茎叶图,体会他们各自的特点;②通过实例理解样本数据标准差的意义和作用,学会计算数据标准差; ③能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;④在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布和数字特征的随机性;⑤会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题;能通过对数据的分析为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异;⑥形成对数据处理过程进行初步评价的意识。
2.变量的相关性①通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系;②经历用不同估算方法描述两个变量线性相关的过程。
知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。
二.命题走向“统计”是在初中“统计初步”基础上的深化和扩展,本讲主要会用样本的频率分布估计总体的分布,并会用样本的特征来估计总体的分布。
预测2013年高考对本讲的考察是:1.以基本题目(中、低档题)为主,多以选择题、填空题的形式出现,以实际问题为背景,综合考察学生学习基础知识、应用基础知识、解决实际问题的能力;2.热点问题是频率分布直方图和用样本的数字特征估计总体的数字特征。
三.要点精讲1.用样本的数字特征估计总体的数字特征 (1)众数、中位数在一组数据中出现次数最多的数据叫做这组数据的众数;将一组数据按照从大到小(或从小到大)排列,处在中间位置上的一个数据(或中间两位数据的平均数)叫做这组数据的中位数;(2)平均数与方差如果这n 个数据是n x x x ,,.........,21,那么∑==ni i x n x 11叫做这n 个数据平均数;如果这n 个数据是n x x x ,,.........,21,那么)(112∑=-=ni i x x n S 叫做这n 个数据方差;同时=s )(11∑=-ni i x x n 叫做这n 个数据的标准差。
高考数学一轮复习 热点难点精讲精析 10.2用样本估计总体与变量间的相关关系
高考一轮复习热点难点精讲精析:10.2用样本估计总体与变量间的相关关系一、用样本估计总体(一)频率分布直方图在总体估计中的应用※相关链接※频率分布直方图反映样本的频率分布(1)频率分布直方图中横坐标表示组距,纵坐标表示频率组距,频率=组距×频率组距.(2)频率分布直方图中各小长方形的面积之和为1,因此在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.(4)众数为最高矩形中点的横坐标.(5)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标.※例题解析※〖例〗为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图,图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学生全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.思路解析:利用面积求得每组的频率→求样本容量→求频率和→求达标率→分析中位数.解答:(1)由已知可设每组的频率为2x,4x,17x,15x,9x,3x.则2x+4x+17x+15x+9x+3x=1,解得x=0.02.则第二小组的频率为0.02×4=0.08,样本容量为12÷0.08=150.(2)次数在110次以上(含110次)的频率和为17×0.02+15×0.02+9×0.02+3×0.02=0.88,则高一学生的达标率为0.88×100%=88%.(3)在这次测试中,学生跳绳次数的中位数落在第四组.因为中位数为平分频率分布直方图的面积且垂直于横轴的直线与横轴交点的横坐标.注:利用样本的频率分布可近似地估计总体的分布,要比较准确地反映出总体分布的情况,必须准确地作出频率分布表和频率分布直方图,充分利用所给的数据正确地作出估计.(二)用样本的分布估计总体※相关链接※茎叶图刻画数据的优点(1)所有的数据信息都可以从茎叶图中得到.(2)茎叶图便于记录和表示,且能够展示数据的分布情况.注:当数据是两位有效数字时,用茎叶图显得容易、方便.而当样本数据较大和较多时,用茎叶图表示,就显得不太方便.※例题解析※〖例〗在某电脑杂志的一篇目文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17.在某报纸的一篇文章中,每个句子中所含的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,得到什么结论?思路解析:(1)将十位数字作为茎,个位数字作为叶,逐一统计;(2)根据茎叶图分析两组数据,得到结论.解答:(1)如图:(2)电脑杂志上每个句子的字数集中在10~30之间,中位数为22.5;而报纸上每个句子的字数集中在10~40之间,中位数为27.5.可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为读物须通俗易懂、简明.(三)用样本的数字特征估计总体的数字特征〖例〗甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价.思路解析:(1)先通过图象统计出甲、乙二人的成绩;(2)利用公式求出平均数、方差,再分析两人的成绩,作出评价.解答:(1)由图象可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分.2222222222221013121416==1351314121214==1351=[(1013)(1313)(1213)(1413)(1613)]451[(1313)(1413)(1213)(1213)(1413)]0.85x x s s ++++++++-+-+-+-+-==-+-+-+-+-=甲乙甲乙,(2)由2s 甲>2s 乙可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.注:(1)运用方差解决问题时,注意到方差越大,波动越大,越不稳定;方差越小,波动越小,越稳定.(2)平均数与方差都是重要的数字特征,是对总体的一种简单的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(3)平均数、方差的公式推广①若数据123,,,,n x x x x 的平均数为x ,那么12,,,n mx a mx a mx a +++的平均数是mx a +. ②数据123,,,,n x x x x 的方差为2s . a.22222111[()];n s x x x nx n=+++- b.数据12,,,n x a x a x a +++的方差也为2s ; c.数据12,,,n ax ax ax 的方差为22a s .二、变量间的相关关系(一)利用散点图判断两个变量的相关关系※相关链接※1.散点图在散点图中,如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.注:函数关系是一种理想的关系模型,而相关关系是一种更为一般的情况.2.正相关、负相关从散点图可知,即一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.如年龄的值由小变大时,体内脂肪含量也在由小变大.反之,如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.※例题解析※〖例〗在某地区的12~30岁居民中随机抽取了10个人的身高和体重的统计资料如表:根据上述数据,画出散点图并判断居民的身高和体重之间是否有相关关系。
高三数学第一轮复习单元讲座第19讲用样本估计总体及线性相关关系
高三新数学第一轮复习第十九讲—用样本估计总体及线性相关关系一.知识整合:1.用样本的数字特征估计总体的数字特征 (1)众数、中位数在一组数据中出现次数最多的数据叫做这组数据的众数;将一组数据按照从大到小(或从小到大)排列,处在中间位置上的一个数据(或中间两位数据的平均数)叫做这组数据的中位数;(2)平均数与方差如果这n 个数据是n x x x ,,.........,21,那么∑==ni i x n x 11叫做这n 个数据平均数;如果这n 个数据是n x x x ,,.........,21,那么)(112∑=-=ni i x x n S 叫做这n 个数据方差;同时=s)(11∑=-ni i x x n 叫做这n 个数据的标准差。
2.频率分布直方图、折线图与茎叶图样本中所有数据(或数据组)的频率和样本容量的比,就是该数据的频率。
所有数据(或数据组)的频率的分布变化规律叫做频率分布,可以用频率分布直方图、折线图、茎叶图来表示。
频率分布直方图: 具体做法如下:(1)求极差(即一组数据中最大值与最小值的差); (2)决定组距与组数; (3)将数据分组; (4)列频率分布表; (5)画频率分布直方图。
注:频率分布直方图中小正方形的面积=组距×组距频率=频率。
折线图:连接频率分布直方图中小长方形上端中点,就得到频率分布折线图。
总体密度曲线:当样本容量足够大,分组越多,折线越接近于一条光滑的曲线,此光滑曲线为总体密度曲线。
3.线性回归回归分析:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫相关关系或回归关系。
回归直线方程:设x 与y 是具有相关关系的两个变量,且相应于n 个观测值的n 个点大致分布在某一条直线的附近,就可以认为y 对x 的回归函数的类型为直线型:bx a y+=ˆ。
其中2121121)())((xn x yx n yx x x y y x xb n i i ni ii ni i ni i i--=---=∑∑∑∑====,x b y a -=。
高考数学讲义2用样本估计总体
平均数 x =87+89+90+91+92+93+94+96=91.5. 8
4.如图是 100 位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有
______人.
答案 25 解析 0.5×0.5×100=25.
题组三 易错自纠 5.若数据 x1,x2,x3,…,xn 的平均数 x =5,方差 s2=2,则数据 3x1+1,3x2+1,3x3+1,…, 3xn+1 的平均数和方差分别为( ) A.5,2 B.16,2 C.16,18 D.16,9 答案 C 解析 ∵x1,x2,x3,…,xn 的平均数为 5, ∴x1+x2+x3+…+xn=5,
n ∴3x1+3x2+3x3+…+3xn+1=3×5+1=16,
n ∵x1,x2,x3,…,xn 的方差为 2, ∴3x1+1,3x2+1,3x3+1,…,3xn+1 的方差是 32×2=18. 6.为了普及环保知识,增强环保意识,某大学随机抽取 30 名学生参加环保知识测试,得分(十 分制)如图所示,假设得分的中位数为 m,众数为 n,平均数为 x ,则 m,n, x 的大小关系 为________.(用“<”连接)
命题点 1 扇形图 例 1 (2018·全国Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为
4.会用样本的频率分布估计总体分布,会用样本的基本数字特 解答题时经常与概率相结
征估计总体的基本数字特征,理解用样本估计总体的思想. 5.会用随机抽样的基本方法和样本估计总体的思想解决一些 简单的实际问题.
合,难度为中低档.
1.作频率分布直方图的步骤 (1)计算极差(即一组数据中最大值与最小值的差). (2)决定组数与组距. (3)决定分点. (4)列频率分布表. (5)绘制频率分布直方图. 2.频率分布折线图和总体密度曲线 (1)频率分布折线图:把频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率 分布折线图. (2)总体密度曲线:设想如果样本容量不断增大,分组的组距不断缩小,则频率分布直方图实 际上越来越接近于总体的分布,它可以用一条光滑曲线 y=f(x)来描绘,这条光滑曲线就叫做 总体密度曲线. 3.茎叶图 统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶就是从茎的旁边 生长出来的数.
高考数学科学复习创新方案:用样本估计总体
用样本估计总体[课程标准]1.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性.2.能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义.3.能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义.会计算样本均值和样本方差,结合具体实例,掌握分层随机抽样的样本均值和样本方差.4.能用样本估计总体的取值规律.5.能用样本估计百分位数,理解百分位数的统计含义.1.频率分布表、频率分布直方图的制作步骤及意义2.频率分布折线图用线段连接频率分布直方图中各个矩形上面一边的06中点,就得到频率分布折线图.3.不同统计图的特点及适用类型(1)不同的统计图在表示数据上的特点扇形图主要用于直观描述各类数据占总数的07比例,条形图和直方图主要用于直观描述不同类别或分组数据的08频数和09频率,折线图主要用于描述数据随10时间的变化趋势.(2)不同的统计图适用的数据类型条形图适用于描述11离散型的数据,直方图适用于描述12连续型的数据.4.百分位数(1)定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据13小于或等于这个值,且至少有(100-p)%的数据14大于或等于这个值.(2)计算步骤:计算一组n个数据的第p百分位数的步骤:第1步,按15从小到大排列原始数据.第2步,计算i=16n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第17j 项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的18平均数.5.总体集中趋势的估计(1)平均数、中位数和众数等都是刻画“19中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.(2)一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用20平均数、21中位数;而对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用22众数.6.频率分布直方图中平均数、中位数、众数的求法(1)样本平均数:可以用每个小矩形底边中点的23横坐标与小矩形面积的乘积之和近似代替.(2)在频率分布直方图中,中位数左边和右边的直方图的面积应该24相等.(3)将最高小矩形所在的区间25中点的横坐标作为众数的估计值.7.方差、标准差(1)假设一组数据为x 1,x 2,…,x n ,则①平均数x -=x 1+x 2+…+x n n,②方差s 2=261n ∑n i =1__(x i -x -)2,③标准差s =271n ∑n i =1(x i -x -)2.(2)如果总体中所有个体的变量值分别为Y 1,Y 2,…,Y N ,总体平均数为Y -,则称S 2=1N ∑N i =1(Y i -Y -)2为总体方差,S =S 2为总体标准差.如果总体的N 个变量值中,不同的值共有k (k ≤N )个,不妨记为Y 1,Y 2,…,Y k ,其中Y i 出现的频数为f i (i =1,2,…,k ),则总体方差为S 2=1N ∑k i =1f i (Y i -Y -)2.(3)如果一个样本中个体的变量值分别为y 1,y 2,…,y n ,样本平均数为y -,则称s 2=1n ∑n i =1(y i -y -)2为样本方差,s =s 2为样本标准差.(4)标准差刻画了数据的离散程度或波动幅度,标准差28越大,数据的离散程度越大;标准差29越小,数据的离散程度越小.(5)分层随机抽样的均值与方差分层随机抽样中,如果样本量是按比例分配,记总的样本平均数为w -,样本方差为s 2.以分两层抽样的情况为例,假设第一层有m 个数,分别为x 1,x 2,…,x m ,平均数为x -,方差为s 21;第二层有n 个数,分别为y 1,y 2,…,y n ,平均数为y -,方差为s 22.则x -=1m ∑m i =1x i ,s 21=1m ∑m i =1(x i -x -)2,y -=1n ∑n i =1y i ,s 22=1n∑n i =1(y i -y -)2.则①w -=30m m +n x -+n m +n y -,②s 2=311m +n {m [s 21+(x --w -)2]+n [s 22+(y --w -)2]}=321m +n (ms 21+ns 22)+mn m +n (x --y -)2.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x -+a .(2)若数据x 1,x 2,…,x n 的方差为s 2,则:①数据x 1+a ,x2+a ,…,x n +a 的方差也为s 2;②数据ax 1,ax 2,…,ax n 的方差为a 2s 2.1.(多选)(2021·新高考Ⅱ卷)下列统计量中,能度量样本x 1,x 2,…,x n 的离散程度的是()A .样本x 1,x 2,…,x n 的标准差B .样本x 1,x 2,…,x n 的中位数C .样本x 1,x 2,…,x n 的极差D .样本x 1,x 2,…,x n 的平均数答案AC 解析由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义可知,中位数考查的是数据的集中趋势;由极差的定义可知,极差考查的是数据的离散程度;由平均数的定义可知,平均数考查的是数据的集中趋势.故选AC.2.(多选)给出一组数据:1,3,3,5,5,5,下列说法正确的是()A .这组数据的极差为4B.这组数据的平均数为3 C.这组数据的中位数为4 D.这组数据的众数为3和5答案AC解析这组数据的极差为5-1=4,A正确;平均数为1+3×2+5×36=113,B错误;中位数为3+52=4,C正确;众数为5,D错误.3.设一组样本数据x1,x2,…,x n的方差为0.01,则数据10x1,10x2,…,10x n的方差为()A.0.01B.0.1C.1D.10答案C解析因为数据ax i+b(i=1,2,…,n)的方差是数据x i(i=1,2,…,n)的方差的a2倍,所以所求数据的方差为102×0.01=1.故选C.4.从某网络平台推荐的影视作品中抽取400部,统计其评分数据,将所得400个评分数据分为8组:[66,70),[70,74),…,[94,98],并整理得到如下的频率分布直方图,则评分在区间[82,86)内的影视作品数量是()A.20B.40C.64D.80答案D解析由频率分布直方图可知,评分在区间[82,86)内的影视作品数量为400×0.050×4=80.故选D.5.(人教B必修第二册5.1.2练习A T2改编)90,92,92,93,93,94,95,96,99,100的75%分位数为________,80%分位数为________.答案9697.5解析10×75%=7.5,10×80%=8,所以75%分位数为x8=96,80%分位数为x8+x9 2=96+992=97.5.多角度探究突破角度扇形图例1(多选)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案BCD解析设新农村建设前的收入为M,则新农村建设后的收入为2M,新农村建设前种植收入为0.6M,新农村建设后的种植收入为0.74M,所以种植收入增加了,所以A不正确;新农村建设前其他收入为0.04M,新农村建设后其他收入为0.1M,故增加了一倍以上,所以B正确;新农村建设前,养殖收入为0.3M,新农村建设后为0.6M,增加了一倍,所以C正确;新农村建设后,养殖收入与第三产业收入的总和占经济收入的30%+28%=58%>50%,所以超过了经济收入的一半,所以D正确.故选BCD.角度折线图例2(2023·乌鲁木齐二模)如图为2012~2022年我国电子信息制造业企业和工业企业利润总额增速情况折线图,根据该图,下列结论正确的是()A.2012~2022年电子信息制造业企业利润总额逐年递增B.2017~2022年工业企业利润总额逐年递增C.2012~2017年电子信息制造业企业利润总额均较上一年实现增长,且其增速均快于当年工业企业利润总额增速D.2019~2022年工业企业利润总额增速的均值大于电子信息制造业企业利润总额增速的均值答案C解析对于A,由折线图可知,2018年电子信息制造业企业利润总额增速为负值,利润总额较上一年下降,A错误;对于B,由折线图可知,2019年工业企业利润总额增速为负值,利润总额较上一年下降,B错误;对于C,2012~2017年电子信息制造业企业利润总额增速为正,利润总额较上一年增长,且其增速大于当年工业企业利润总额增速,C正确;对于D,2019~2022年中,工业企业利润总额增速都小于电子信息制造业企业利润总额增速,则这几年中工业企业利润总额增速的均值小于电子信息制造业企业利润总额增速的均值,D错误.故选C.角度频率分布直方图例3(1)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.8B.12C.16D.18答案B=50,所以第三组的人数为解析志愿者的总人数为20(0.24+0.16)×150×0.36=18,有疗效的人数为18-6=12.故选B.(2)(多选)(2024·菏泽东明县开学考试)某小区为了让居民了解更多垃圾分类的知识,对500名小区居民进行了培训,并进行了培训结果测试,从中随机抽取50名居民的成绩(单位:分),按照[50,60),[60,70),…,[90,100]分成5组,并制成了如图所示的频率分布直方图,则下列结论正确的是()A.所抽取的50名居民成绩的平均数约为74B.所抽取的50名居民成绩的中位数约为75C.50名居民成绩的众数约为85D.参加培训的居民中约有100人的成绩不低于85分答案AD解析因为频率和为1,可得0.1+0.3+0.3+10x+0.1=1,所以m=0.02,所抽取的50名居民成绩的平均数约为55×0.1+65×0.3+75×0.3+85×0.2+95×0.1=74,故A正确;设中位数为x,因为0.1+0.3<0.5,0.1+0.3+0.3>0.5,所以x∈(70,80),所以0.1+0.3+0.03(x-70)=0.5,所以x=70+103≠75,故B错误;50名居民成绩的众数无法由频率分布直方图判断出来,故C错误;成绩不低于85分的频率为0.2×0.5+0.1=0.2,参加培训的居民中成绩不低于85分的约有0.2×500=100人,故D正确.故选AD.常见统计图的特点(1)通过扇形统计图可以很清楚地表示出各部分数量同总数之间的关系.(2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.(3)准确理解频率分布直方图的数据特点①频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆;②频率分布直方图中各小长方形的面积之和为1,这是解题的关键,常利用频率分布直方图估计总体分布.1.(多选)(2023·太原模拟)十项全能是田径运动中全能项目的一种,是由跑、跳、投等10个田径项目组成的综合性男子比赛项目,比赛成绩是按照国际田径联合会制定的专门田径运动会全能评分表将各个单项成绩所得的评分加起来计算的,总分多者为优胜者.如图是某次十项全能比赛中甲、乙两名运动员的各个单项得分的雷达图,则下列说法正确的是()A.在400米跑项目中,甲的得分比乙的得分低B.在跳高和标枪项目中,甲、乙水平相当C.甲的各项得分比乙的各项得分更均衡D.甲的各项得分的极差比乙的各项得分的极差大答案BD解析对于A,由雷达图可知,400米跑项目中,甲的得分比乙的得分高,A 错误;对于B,由雷达图可知,在跳高和标枪项目中,甲、乙水平相当,B正确;对于C,甲的各项得分的波动较大,乙的各项得分均在(600,800]内,波动较小,C错误;对于D,甲的各项得分的极差约为1000-470=530,乙的各项得分的极差小于200,D正确.故选BD.2.(多选)(2023·济南三模)某学校组建了辩论、英文剧场、民族舞、无人机和数学建模五个社团,高一学生全员参加,且每位学生只能参加一个社团.学校根据学生参加情况绘制如下统计图,已知无人机社团和数学建模社团的人数相等,则下列说法正确的是()A.高一年级学生人数为120B.无人机社团的人数为17C.若按比例分层随机抽样从各社团选派20人,则无人机社团选派的人数为3D.若甲、乙、丙三人报名参加社团,则共有60种不同的报名方法答案AC解析由题中所给的数据可知,民族舞社团的人数为12,占高一年级学生人数的比例为10%,所以高一年级学生人数为12÷10%=120,英文剧场社团的人数为120×35%=42,辩论社团的人数为30,无人机社团的人数=数学建模社团的人数=(120-42-30-12)÷2=18,占高一年级学生人数的比例是18×100%=15%,120A正确,B错误;按比例分层随机抽样20人,无人机社团应派出20×15%=3人,C正确;甲、乙、丙三人报名参加社团,每人有5种选法,共有53=125种不同的报名方法,D错误.故选AC.多角度探究突破角度总体百分位数的估计例4(1)一组数据为6,47,49,15,42,41,7,39,43,40,36,则这组数据的一个四分位数是()A.15B.25C.50D.75答案A解析将该组数据由小到大排列的结果为6,7,15,36,39,40,41,42,43,47,49,一共11个数,由11×25%=2.75,11×50%=5.5,11×75%=8.25,故第25百分位数是15,第50百分位数是40,第75百分位数是43.故选A.(2)如图是将高三某班80名学生参加某次数学模拟考试所得的成绩(成绩均为整数)整理后画出的频率分布直方图,则此班的模拟考试成绩的80%分位数是________(结果保留两位小数).答案124.44解析由频率分布直方图可知,分数在120分以下的学生所占的比例为(0.01+0.015+0.015+0.03)×10×100%=70%,分数在130分以下的学生所占的比例为70%+0.0225×10×100%=92.5%,因此,80%分位数一定位于[120,130)内.由120+0.80-0.70≈124.44,故此班的模拟考试成绩的80%分位数约为124.44.0.0225角度比例分配的分层随机抽样的均值与方差例5(多选)(2023·大连二十四中模拟)大连市教育局为了解二十四中学、第八中学、育明中学三所学校的学生文学经典名著的年阅读量,采用比例分配的分层随机抽样方法抽取了一个容量为120的样本.其中,从二十四中学抽取容量为35的样本,平均数为4,方差为9;从第八中学抽取容量为40的样本,平均数为7,方差为15;从育明中学抽取容量为45的样本,平均数为8,方差为21.据此估计,三所学校的学生文学经典名著的年阅读量的()A.均值为6.3B.均值为6.5C.方差为17.52D.方差为18.25答案BD解析设二十四中学、第八中学、育明中学三组数据中每个人的数据分别为x i(i=1,2,3,…,35),y i(i=1,2,3,…,40),z i(i=1,2,3,…,45),均值===6.5,方差=+=++==1×[(9+2.52)×35+(15+0.52)×40+(21+1201.52)×45]=18.25.故选BD.角度均值方差的应用例6(2023·全国乙卷)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为x i,y i(i=1,2,…,10).试验结果如下:试验序号i12345678910伸缩率x i545533551522575544541568596548伸缩率y i536527543530560533522550576536记z i=x i-y i(i=1,2,…,10),z1,z2,…,z10的样本平均数为z-,样本方差为s2.(1)求z-,s2;(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果z-≥2s210,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高).解(1)x-=110×(545+533+551+522+575+544+541+568+596+548)=552.3,y-=110×(536+527+543+530+560+533+522+550+576+536)=541.3,z-=x--y-=552.3-541.3=11,z i=x i-y i的值分别为9,6,8,-8,15,11,19,18,20,12,故s2=110×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+(11-11)2+(19-11)2+(18-11)2+(20-11)2+(12-11)2]=61.(2)由(1)知,z-=11,2s210=26.1=24.4,故有z-≥2s210,所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.1.频率分布直方图中第p百分位数的计算(1)确定百分位数所在的区间[a,b].(2)确定小于a和小于b的数据所占的百分比分别为f a%,f b%,则第p百分位数为a+p%-f a%f b%-f a%×(b-a).2.众数、中位数、平均数、方差的意义及常用结论(1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述数据的集中趋势,方差和标准差描述数据的波动大小.(2)方差的简化计算公式:s2=1n [(x21+x22+…+x2n)-n x-2],或写成s2=1n(x21+x22+…+x2n)-x-2,即方差等于原始数据平方的平均数减去平均数的平方.1.(2023·合肥模拟)若一组样本数据x1,x2,…,x n的平均数为10,另一组样本数据2x1+4,2x2+4,…,2x n+4的方差为8,则两组样本数据合并为一组样本数据后的平均数和方差分别为()A.17,54B.17,48C.15,54D.15,48答案A解析由题意可知,数据x1,x2,…,x n的平均数为10,则=10,则=10n,所以数据2x1+4,2x2+4,…,2x n+4的平均数为=1n错误!(2x i+4)=2n错误!i +4=2×10+4=24,方差为s′2=1n错误!(2x i+4)-(2x-+4)]2=4n错误!(x i-10)2=4n错误!2i-4n×n×102=-400=8,所以=102n,将两组数据合并后,新数据x1,x2,…,x n,2x1+4,2x2+4,…,2x n+4的平均数为==12错误!=1×(3×10+4)=17,方差为s″2==21(5×102n-860n+458n)=54.故选A.2n2.有13位同学参加学校组织的才艺表演比赛,已知他们所得的分数互不相同,共设7个获奖名额,某同学知道自己的比赛分数后,要判断自己能否获奖,在这13名同学成绩的统计量中只需知道一个量,它是________(填“众数”“中位数”或“平均数”).答案中位数解析因为7位获奖者的分数肯定是13名参赛选手中较高的,所以把13个不同的分数按从小到大排序,只要知道自己的分数和中位数就可以知道是否获奖了.3.(2024·西安开学考试)某校开展了航天知识竞赛活动,竞赛分为初赛和复赛两个阶段.全校共有1000名学生参加,将他们的初赛成绩(成绩都在[50,100]内)分为[50,60),[60,70),[70,80),[80,90),[90,100]5组,得到如图所示的频率分布直方图.(1)求a的值,并估计全校学生初赛成绩的平均数(同一组中的数据以这组数据的中间值作为代表);(2)若规定初赛成绩前20%的学生进入复赛,试估计进入复赛的分数线n.解(1)由(0.010+0.020+a+0.030+0.005)×10=1,解得a=0.035,所以全校学生初赛成绩的平均数估计为55×0.1+65×0.2+75×0.35+85×0.3+95×0.05=75.(2)由频率分布直方图可知,成绩在[80,100]内的频率为0.35>0.2,成绩在[90,100]内的频率为0.05<0.2,则分数线n 位于区间[80,90)内,故n =90-0.2-0.050.3×10=85.课时作业一、单项选择题1.(2024·吕梁开学考试)一组数据按从小到大的顺序排列为1,3,5,6,m ,10,12,13,若该组数据的中位数是极差的58,则该组数据的第60百分位数是()A .7.5B .8C .9D .9.5答案C解析这组数据一共8个数,中位数是6+m 2,极差为13-1=12,所以6+m2=12×58,解得m =9,又8×60%=4.8,则该组数据的第60百分位数是第5个数据9.故选C.2.已知数据x 1,x 2,x 3,x 4,x 5,x 6的平均数是5,方差是9,则x 21+x 22+x 23+x 24+x 25+x 26=()A .159B .204C .231D .636答案B解析根据题意,数据x 1,x 2,x 3,x 4,x 5,x 6的平均数x -=5,方差s 2=9,则s 2=16(x 21+x 22+x 23+x 24+x 25+x 26)-x -2=9,变形可得x 21+x 22+x 23+x 24+x 25+x 26=204.故选B.3.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数B.平均数C.方差D.极差答案A解析中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均可能受影响.故选A.4.(2023·滨州二模)某组样本数据的频率分布直方图如图所示,设该组样本数据的众数、平均数、第一四分位数分别为x1,x2,x3,则x1,x2,x3的大小关系是(注:同一组中的数据用该组区间中点值近似代替)()A.x3<x1<x2B.x2<x1<x3C.x1<x3<x2D.x1<x2<x3答案A=2.5,即x1=2.5,平均数x2=解析由频率分布直方图可知,众数为2+320.2×1.5+0.24×2.5+0.2×3.5+0.16×4.5+0.12×5.5+0.04×6.5+0.04×7.5=3.54,显然第一四分位数位于[2,3)之间,则0.2+(x3-2)×0.24=0.25,解得x3≈2.208,所以x3<x1<x2.故选A.5.(2023·商洛模拟)如图为国家统计局于2023年1月20日发布的2016~2022年全国R&D经费总量与R&D经费与GDP之比的数据图表,则()A.R&D经费总量的平均数超过23000亿元B.R&D经费总量的中位数为19678亿元C.R&D经费与GDP之比的极差为0.45%D.R&D经费与GDP之比增幅最大的是2021年到2022年答案C解析对于A,R&D经费总量的平均数为1×(15677+17606+19678+221447+24393+27956+30870)≈22617.7,所以A错误;对于B,R&D经费总量的中位数为22144亿元,所以B错误;对于C,R&D经费与GDP之比的极差为2.55%-2.10%=0.45%,所以C正确;对于D,R&D经费与GDP之比增幅最大的是2019年到2020年,所以D错误.故选C.6.(2022·全国甲卷)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:A.讲座前问卷答题的正确率的中位数小于70%B.讲座后问卷答题的正确率的平均数大于85%C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差答案B=72.5%>70%,故A 解析讲座前问卷答题的正确率的中位数为70%+75%2错误;讲座后问卷答题的正确率只有一个是80%,4个是85%,剩下的全部大于等于90%,所以讲座后问卷答题的正确率的平均数大于85%,故B正确;讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,故C错误;讲座后问卷答题的正确率的极差为100%-80%=20%,讲座前问卷答题的正确率的极差为95%-60%=35%>20%,故D错误.故选B.7.某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15℃,B 点表示四月的平均最低气温约为5℃.下列叙述不正确的是()A.各月的平均最低气温都在0℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20℃的月份有5个答案D解析由图形可得各月的平均最低气温都在0℃以上,A正确;七月的平均温差约为10℃,而一月的平均温差约为5℃,故B正确;三月和十一月的平均最高气温都在10℃左右,基本相同,C正确;平均最高气温高于20℃的月份为六月、七月、八月,只有3个,D错误.8.(2024·重庆南岸模拟)已知某人收集了一个样本量为50的一组数据,并求得其平均数为70,方差为75,现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90,在对错误的数据进行更正后,重新求得样本的平均数为X-,方差为s2,则()A.X-<70,s2>75B.X->70,s2<75C.X-=70,s2>75D.X-=70,s2<75答案D解析因为80+70=60+90,因此平均数不变,即X-=70,设其他48个数据依次为a1,a2,…,a48,因此(a1-70)2+(a2-70)2+…+(a48-70)2+(60-70)2+(90-70)2=50×75,(a1-70)2+(a2-70)2+…+(a48-70)2+(80-70)2+(70-70)2=50×s2,所以50(s2-75)=100-400-100=-400<0,所以s2<75.故选D.二、多项选择题9.(2023·新课标Ⅰ卷)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则()A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差答案BD解析对于A,设x2,x3,x4,x5的平均数为m,x1,x2,…,x6的平均数为n,则n-m=x1+x2+x3+x4+x5+x66-x2+x3+x4+x54=2(x1+x6)-(x2+x3+x4+x5)12,因为没有确定2(x1+x6),x2+x3+x4+x5的大小关系,所以无法判断m,n的大小,例如1,2,3,4,5,6,可得m=n=3.5,又如1,1,1,1,1,7,可得m=1,n=2,再如1,2,2,2,2,2,可得m=2,n=116,故A错误;对于B,不妨设x1≤x2≤x3≤x4≤x5≤x6,可知x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数,均为x3+x42,故B正确;对于C,因为x1是最小值,x6是最大值,则x2,x3,x4,x5的波动性不大于x1,x2,…,x6的波动性,即x2,x3,x4,x5的标准差不大于x1,x2,…,x6的标准差,例如2,4,6,8,10,12,则平均数n=16×(2+4+6+8+10+12)=7,标准差s1=16×[(2-7)2+(4-7)2+(6-7)2+(8-7)2+(10-7)2+(12-7)2]=1053,而4,6,8,10的平均数m=14×(4+6+8+10)=7,标准差s2=14×[(4-7)2+(6-7)2+(8-7)2+(10-7)2]=5,显然1053>5,即s1>s2,故C错误;对于D,不妨设x1≤x2≤x3≤x4≤x5≤x6,则x6-x1≥x5-x2,当且仅当x1=x2,x5=x6时,等号成立,故D正确.故选BD.10.某中学举行安全知识竞赛,对全校参赛的1000名学生的得分情况进行了统计,把得分数据按照[50,60),[60,70),[70,80),[80,90),[90,100]分成了5组,绘制了如图所示的频率分布直方图,根据图中信息,下列说法正确的是()A.这组数据的极差为50B.这组数据的众数约为76C.这组数据的中位数约为5407D.这组数据的第75百分位数约为85答案CD解析由频率分布直方图无法得到这组数据的最大值和最小值,故这组数据的极差无法准确判断,故A错误;这组数据的众数约为12×(70+80)=75,故B错误;因为(0.005+0.02)×10=0.25<0.5,0.25+0.035×10=0.6>0.5,所以中位数位于[70,80)之间,设中位数为x,则0.25+(x-70)×0.035=0.5,解得x=540,即7,故C正确;0.6+0.03×10=0.9>0.75,故第75百分位这组数据的中位数约为5407=85,故D正确.故选CD.数约为80+0.75-0.60.0311.在发生某公共卫生事件期间,我国有关机构规定:“该事件在一段时间没有发生规模群体感染的标志为连续10天,每天新增加疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,不一定符合该标志的是() A.甲地总体均值为3,中位数为4B.乙地总体均值为2,总体方差大于0C.丙地中位数为3,众数为3D.丁地总体均值为2,总体方差为3答案ABC解析平均数和中位数不能确定某一天的病例不超过7人,A不一定符合该标志;当总体方差大于0时,不知道总体方差的具体数值,因此不能确定数据的波动大小,B不一定符合该标志;中位数和众数也不能确定某一天的病例不超过7人,C不一定符合该标志;当总体均值为2时,若有一个数据超过7,则方差就超过3,D一定符合该标志.故选ABC.三、填空题12.从甲、乙、丙三个厂家生产的同一种产品中各抽取8件产品,对其使用寿命(单位:年)跟踪调查结果如下:甲:3,4,5,6,8,8,8,10;乙:4,6,6,6,8,9,12,13;丙:3,3,4,7,9,10,11,12.三个厂家在广告中都称该产品的使用寿命是8年,请根据结果判断厂家在广告中分别运用了平均数、众数、中位数中的哪一种集中趋势的特征数?甲:________,乙:________,丙:________.答案众数平均数中位数解析甲、乙、丙三个厂家从不同角度描述了一组数据的特征,甲:该组数=8;据8出现的次数最多;乙:该组数据的平均数x-=4+6×3+8+9+12+138=8.丙:该组数据的中位数是7+9213.某校组织学生参与航天知识竞答活动,某班8位同学的成绩如下:7,6,8,9,8,7,10,m.若去掉m,该组数据的第25百分位数保持不变,则整数m(1≤m≤10)的值可以是________(写出一个满足条件的m值即可).答案7或8或9或10(填上述四个数中任意一个均可)解析7,6,8,9,8,7,10,m,若去掉m,该组数据从小到大排列为6,7,7,8,8,9,10,则7×0.25=1.75,故第25百分位数为第二个数即7,所以7,6,8,9,8,7,10,m这组数据的第25百分位数为7,而8×0.25=2,所以7为从小到大排列后第二个数与第三个数的平均数,所以m(1≤m≤10)的值可以是7或8或9或10.14.(2024·邯郸一中期末)土壤修复是使遭受污染的土壤恢复正常功能的技术受到不同程度的污染,但随着新发展理念的深入贯彻落措施.中国现有耕地有近15实,国家对环境保护工作越来越重视.2021年我国正式启动(含已招标项目,不含未招标、流标项目)的土壤修复工程项目共510个,合同总金额为121.56亿元,覆盖全国除西藏、港、澳、台的30个省(区、市).如图为2021年30个省(区、市)土壤修复工程类项目数量的前十名,则这30个省(区、市)土壤修复工程类项目数据的第80百分位数是________,若图中未列出的其他20个省(区、市)土壤修复工程类项目数量的方差为44.7,则这30个省(区、市)土壤修复工程类项目数据的总体方差为________.。
2010年高考数学一轮复习讲义:用样本估计总体及线性相关关系
用样本估计总体及线性相关关系一.【课标要求】1.用样本估计总体①通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图、茎叶图,体会他们各自的特点;②通过实例理解样本数据标准差的意义和作用,学会计算数据标准差;③能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;④在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布和数字特征的随机性;⑤会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题;能通过对数据的分析为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异;⑥形成对数据处理过程进行初步评价的意识 2.变量的相关性①通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系;②经历用不同估算方法描述两个变量线性相关的过程。
知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程二.【命题走向】“统计”是在初中“统计初步”基础上的深化和扩展,本讲主要会用样本的频率分布估计总体的分布,并会用样本的特征来估计总体的分布预测2010年高考对本讲的考察是:1.以基本题目(中、低档题)为主,多以选择题、填空题的形式出现,以实际问题为背景,综合考察学生学习基础知识、应用基础知识、解决实际问题的能力;2.热点问题是频率分布直方图和用样本的数字特征估计总体的数字特征。
三.【要点精讲】1.用样本的数字特征估计总体的数字特征 (1)众数、中位数在一组数据中出现次数最多的数据叫做这组数据的众数;将一组数据按照从大到小(或从小到大)排列,处在中间位置上的一个数据(或中间两位数据的平均数)叫做这组数据的中位数;(2)平均数与方差如果这n 个数据是n x x x ,,.........,21,那么∑==ni ix n x 11叫做这n 个数据平均数;如果这n 个数据是n x x x ,,.........,21,那么)(112∑=-=ni i x x n S 叫做这n 个数据方差;同时=s)(11∑=-ni i x x n 叫做这n 个数据的标准差。
(人教A版)高考数学一轮复习精品学案:用样本估计总体及线性相关关系
2019年高考数学一轮复习精品学案(人教版A 版)用样本估计总体及线性相关关系一.【课标要求】1.用样本估计总体①通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图、茎叶图,体会他们各自的特点;②通过实例理解样本数据标准差的意义和作用,学会计算数据标准差; ③能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;④在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布和数字特征的随机性;⑤会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题;能通过对数据的分析为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异;⑥形成对数据处理过程进行初步评价的意识. 2.变量的相关性①通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系;②经历用不同估算方法描述两个变量线性相关的过程。
知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 二.【命题走向】“统计”是在初中“统计初步”基础上的深化和扩展,本讲主要会用样本的频率分布估计总体的分布,并会用样本的特征来估计总体的分布.预测2019年高考对本讲的考察是:1.以基本题目(中、低档题)为主,多以选择题、填空题的形式出现,以实际问题为背景,综合考察学生学习基础知识、应用基础知识、解决实际问题的能力;2.热点问题是频率分布直方图和用样本的数字特征估计总体的数字特征。
三.【要点精讲】1.用样本的数字特征估计总体的数字特征 (1)众数、中位数在一组数据中出现次数最多的数据叫做这组数据的众数;将一组数据按照从大到小(或从小到大)排列,处在中间位置上的一个数据(或中间两位数据的平均数)叫做这组数据的中位数;(2)平均数与方差如果这n 个数据是n x x x ,,.........,21,那么∑==ni i x n x 11叫做这n 个数据平均数;如果这n 个数据是n x x x ,,.........,21,那么)(112∑=-=n i i x x n S 叫做这n 个数据方差;同时=s )(11∑=-ni i x x n 叫做这n 个数据的标准差。
课标高考复习课教学设计——用样本估计总体及线性相关关系
2 热 点 问题 是 频 率 分 布 直 方 图 、 叶 图 和 用 样 本 . 茎 的 数 字特 征估 计 总 体 的数 字 特 征 . 三 、 点 精 讲 要 1用 样 本 的 数 字 特 征 估 计 总体 的 数字 特 征 . ( )众数 、 位 数 1 中
本估计总体 的思想 , 会用样本 的频率 分布估计 总体分 征; 初步体会样本频率分布和数字特征的随机性 ;
准 差.
关 的 过 程. 道 最 小 二 乘 法 的 思 想 , 根 据 给 出 的 线 知 能 性 回归 方程 系数 公 式 建 立 线 性 回归 方 程. 二、 题走 向 命 “ 计 ”是 在初 中 “ 汁 仞 步 ”基 础上 的深 化和 扩 统 统 展 , 讲主要会用样 本的频 率分 布估 汁总 体的 分布 , 本
出散 点 图 , 并利 用 散 点 图 直 观认 识 变 量 间 的 相 关
大 尔 ;
~‘… 的 做 数 。 n 据 这个…方
羞
; 时 : . 同
r f
( 一 :叫 做这 个 数据 的 标 )
( ) 历 用 不 同 估 算 方 法 描 述 两 个 变 量 线 性 桐 2 经
i中 I小学越学砷学 版
高 研 考 究
高 中
课标 高考 复 习课 教 学设 计
用样 本估计 总体 及
安 徽 省 五 河 县 刘集 中学 (3 3 3 刘 瑞 美 233 )
关系
一
、
课标要求 :
考 查 基 础 知 识 为主 线 .
预 测 2 1 年 新 课 标 高考 对 本部 分 的考 察 是 : 0 1
( )通 过 实 例 理 解 样 本 数 据 标 准 差 的 意 义和 作 2 用 , 会计算数据标准差 ; 学 ( )能 根据 实 际 问题 的需 求 合理 地 选 取 样 本 , 3 从 样 本 数 据 中 提 取 基 本 的 数 字 特 征 ( 平 均 数 、 ; 。 如 标隹 差 ) 并 作 出合 理 的 解 释 ; , ( ) 解 决 统 计 问题 的过 程 中 , 一 步 体 会 用 样 4 在 进 f
高考数学一轮复习考点知识专题讲解63---用样本估计总体
线. (4)茎叶图的画法步骤: 第一步:将每个数据分为茎(高位)和叶(低位)两部分;
第二步:将最小茎与最大茎之间的数按大小次序排成一列;
第三步:将各个数据的叶依次写在其茎的右(左)侧.
2.样本的数字特征
(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.
(2)中位数:把 n 个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两
布表.
y 的分组 [-0.20,0) [0,0.20) [0.20,0.40) [0.40,0.60) [0.60,0.80)
企业数
2
24
53
14
7
(1)分别估计这类企业中产值增长率不低于 40%的企业比例、产值负增长的企业比
例; (2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区
组距 的频率.各小矩形的面积和为 1.
(3)频率分布折线图和总体密度曲线
- 1 - / 13
①频率分布折线图:将频率分布直方图中各相邻的矩形的上底边的中点顺次连接
起来,就得到频率分布折线图.
②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相
应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲
间的中点值为代表).(精确到 0.01) 附: 74≈8.602. [解] (1)根据产值增长率频数分布表得,所调查的 100 个企业中产值增长率不低 14+7
于 40%的企业频率为 100 =0.21. 2
产值负增长的企业频率为100=0.02. 用样本频率分布估计总体分布得这类企业中产值增长率不低于 40%的企业比例为 21%,产值负增长的企业比例为 2%. (2)-y =1100(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,s2=1010
新课程人高中数学必修件用样本估计总体
常见离散型概率分布
二项分布、泊松分布等,它们在实际 问题中有着广泛的应用。
概率分布列
描述离散型随机变量取各个可能值的 概率,通常用表格或公式表示。
连续型随机变量及其概率密度函数
连续型随机变量的定义
01
取值充满一个区间的随机变量,如测量某物体的长度。
概率密度函数
02
描述连续型随机变量在某个区间内取值的概率,通常用曲线表
04
预测与风险控制
利用样本数据对总体进行预测 ,并评估预测结果的风险和不 确定性,为风险控制提供依据 。
挑战性问题探讨和解决方案
模型选择与优化问题
样本偏差问题
针对样本选择过程中可能出现 的偏差问题,采用随机抽样、 分层抽样等方法提高样本的代 表性。
数据异常值处理
对于数据中的异常值,采用剔 除、替换或进行稳健性处理等 方法,以减少其对分析结果的 影响。
频率分布折线图绘制技巧
01
02
03
确定点
在频率分布直方图中,以 各组的组中值为横坐标, 对应的频率为纵坐标,确 定各点。
连接各点
用平滑的曲线将各点连接 起来,形成频率分布折线 图。
注意细节
在连接各点时,要注意曲 线的平滑度,不要出现明 显的折角。
两者关系及优缺点比较
1
关系
频率分布直方图和折线图都是用来表示 数据分布情况的图形,折线图是在直方 图的基础上绘制而成的,可以更加直观 地反映数据的分布情况。
05
置信区间与假设检验
置信区间概念及求解方法
置信区间定义
置信区间是指由样本统计 量所构造的总体参数的估 计区间,用于表示参数估 计的可靠程度。
求解方法
通常使用样本均值和标准 差来构造置信区间,具体 方法包括标准误差法、t分 布法、正态分布法等。
考点3 统计图表及数据的数字特征,用样本估计总体
温馨提示:高考题库为Word 版,请按住Ctrl ,滑动鼠标滚轴,调节合适的观看比例,点击右上角的关闭按钮可返回目录。
考点3 统计图表及数据的数字特征,用样本估计总体2010年考题1.(2010·陕西高考文科·T4)如图,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为A B x x 和,样本标准差分别为s A 和s B ,则( )(A) A x >B x ,s A >s B (B) A x <B x ,s A >s B (C) A x >B x ,s A <s B (D) A x <B x ,s A <s B【解析】选B 由图易得A x <B x ,又A 波动性大,B 波动性小,所以s A >s B2.(2010·山东高考理科·T6)样本中共有五个个体,其值分别为a,0,1,2,3,,若该样本的平均值为1,则样本方差为( )65【解析】选D,由题意知1a+0+1+2+3)=15(,解得a=-1,所以样本方差为2222221S =[(-1-1)+(0-1)+(1-1)+(2-1)+(3-1)]5=2,故选D.3. (2010·山东高考文科·T6)在某项体育比赛中,七位裁判为一选手打出的分数如下: 90 89 90 95 93 94 93去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( )(A )92 , 2 (B) 92 , 2.8 (C) 93 , 2 (D) 93 , 2.8 【解析】选了B ,去掉一个最高分95一个最低分89,剩下5个数的平均值为1(9090939493)925++++=,方差为222221[(9092)(9092)(9392)(9492)(9392)] 2.85-+-+-+-+-= 4. (2010·福建高考文科·T9)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A.91.5和91.5B.91.5和92C.91和91.5D.92和92【解析】选A ,数据从小到大排列后可得其中位数为919291.52+=,平均数为878990919293949691.58+++++++=。
121用样本估计总体与相关性
(2)根据(1)的计算结果,说明哪一台机床加工的这种零件更符合要求
巩固练习:教师用书【388】即时巩固:4,5
课后作业:对应课后提升:填空题
教后
反思
备课组长签字:年月日
中心发言人
难点
能根据给出的线性回归方程系数公式建立线性回归方程
教法
讨论与讲授法相结合
学法
课前预习、课堂合作探究
个人主页
教具
教材、练习册
课型
常规课课时安排1课时 Nhomakorabea教
学
过
程
主要知识:
在考虑两个变量的关系时,将变量所对应的点描出来,这些点组成了变量之间的一个图,通常称这种图为变量之间的散点图.
若两个变量x和y的散点图中,所有点看上去都在一条直线附近波动,则称变量间是线性相关.若所有点看上去都在某条曲线附近波动,则称此相关为非线性相关
例题分析:
例1:某棉纺厂为了解一批棉花的质量,从中随机抽测了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标).所得数据均在区间[5,40]中,其频率分布直方图如图所示,则在抽测的100根中,有根棉花纤维的长度小于20 mm.
例2:甲、乙两台机床同时加工直径为10mm的零件,为了检验产品的质量,从产品中各随机抽取6件进行测量,测得数据如下(单位:mm)甲:99,100,98,100,100,103乙:99,100,102,99,100,100
富县高级中学集体备课教案
年级:高三科目:数学授课人:
课题
用样本估计总体与相关性
第121课时
教学
目标
(1)会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系.
学案用样本估计总体与变量间的相关关系
【解析】 (1)样本频率分布表如下:
分组 [100.200) [200.300) [300,400) [400,500) [500,600)
合计
频数 20 30 80 40 30 20
频率 0.01 0.15 0.40 0.20 0.15 1.00
(2)频率分布直方图如图
(3)由频率分布表能够看出,寿命在[100,400)内旳电子 元件出现旳频率为0.65,所以我们估计电子元件寿命在 [100,400)内旳概率为0.65.
(4)由频率分布表可知,寿命在400 h以上旳电子元件出现 旳频率为0.20+0.15=0.35,故我们估计电子元件寿命在 400 h以上旳概率为0.35.
考点2 频率分布直方图旳应用
为了解学生身高情况,某校以10%旳百分比对全校700 名学生按性别进行分层抽样调查,测得身高情况旳统计 图如图:
(1)估计该校男生旳人数; (2)估计该校学生身高在170~185 cm之间旳概率; (3)从样本中身高在180~190 cm之间旳男生中任选2人, 求至少有1人身高在185~190 cm之间旳概率.
1
月旳天135数;旳处于15优;或良有旳26天天数处为于2良8旳,占水当平月,占天当数月旳天14数5 .阐明 该市空气质量基本良好. ②轻微污染有2天,占当月天数旳 1 ;污染指数在80以上
15
旳接近轻微污染旳天数15,加上处于轻微污染旳天数17, 占当月天数旳 17 ,超出50%;阐明该市空气质量有待进
1n n i=1
xi
1n
,y= n i=1 yi
.
经过求Q= (y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2 旳最小值而得出回归直线旳措施,即求回归直线,使得样 本 数 据旳点到它旳距离旳平方和最小,这一措施叫做最小 二乘法.
用样本估计总体及线性相关关系
普通高中课程标准实验教科书—数学 [人教版]高三新数学第一轮复习教案(讲座19)—用样本估计总体及线性相关关系一.课标要求:1.用样本估计总体①通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图、茎叶图,体会他们各自的特点;②通过实例理解样本数据标准差的意义和作用,学会计算数据标准差; ③能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;④在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布和数字特征的随机性;⑤会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题;能通过对数据的分析为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异;⑥形成对数据处理过程进行初步评价的意识。
2.变量的相关性①通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系;②经历用不同估算方法描述两个变量线性相关的过程。
知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。
二.命题走向“统计”是在初中“统计初步”基础上的深化和扩展,本讲主要会用样本的频率分布估计总体的分布,并会用样本的特征来估计总体的分布。
预测2007年高考对本讲的考察是:1.以基本题目(中、低档题)为主,多以选择题、填空题的形式出现,以实际问题为背景,综合考察学生学习基础知识、应用基础知识、解决实际问题的能力;2.热点问题是频率分布直方图和用样本的数字特征估计总体的数字特征。
三.要点精讲1.用样本的数字特征估计总体的数字特征 (1)众数、中位数在一组数据中出现次数最多的数据叫做这组数据的众数;将一组数据按照从大到小(或从小到大)排列,处在中间位置上的一个数据(或中间两位数据的平均数)叫做这组数据的中位数;(2)平均数与方差如果这n 个数据是n x x x ,,.........,21,那么∑==ni i x n x 11叫做这n 个数据平均数;如果这n 个数据是n x x x ,,.........,21,那么)(112∑=-=ni i x x n S 叫做这n 个数据方差;同时=s)(11∑=-ni i x x n 叫做这n 个数据的标准差。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
用样本估计总体及线性相关关系一.【课标要求】1.用样本估计总体①通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图、茎叶图,体会他们各自的特点;②通过实例理解样本数据标准差的意义和作用,学会计算数据标准差;③能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;④在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布和数字特征的随机性;⑤会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题;能通过对数据的分析为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异;⑥形成对数据处理过程进行初步评价的意识 2.变量的相关性①通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系;②经历用不同估算方法描述两个变量线性相关的过程。
知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程二.【命题走向】“统计”是在初中“统计初步”基础上的深化和扩展,本讲主要会用样本的频率分布估计总体的分布,并会用样本的特征来估计总体的分布预测2010年高考对本讲的考察是:1.以基本题目(中、低档题)为主,多以选择题、填空题的形式出现,以实际问题为背景,综合考察学生学习基础知识、应用基础知识、解决实际问题的能力;2.热点问题是频率分布直方图和用样本的数字特征估计总体的数字特征。
三.【要点精讲】1.用样本的数字特征估计总体的数字特征(1)众数、中位数在一组数据中出现次数最多的数据叫做这组数据的众数;将一组数据按照从大到小(或从小到大)排列,处在中间位置上的一个数据(或中间两位数据的平均数)叫做这组数据的中位数;(2)平均数与方差如果这n 个数据是n x x x ,,.........,21,那么∑==ni i x n x 11叫做这n 个数据平均数;如果这n 个数据是n x x x ,,.........,21,那么)(112∑=-=ni i x x n S 叫做这n 个数据方差;同时=s)(11∑=-ni i x x n 叫做这n 个数据的标准差。
2.频率分布直方图、折线图与茎叶图样本中所有数据(或数据组)的频率和样本容量的比,就是该数据的频率。
所有数据(或数据组)的频率的分布变化规律叫做频率分布,可以用频率分布直方图、折线图、茎叶图来表示。
频率分布直方图: 具体做法如下:(1)求极差(即一组数据中最大值与最小值的差); (2)决定组距与组数; (3)将数据分组; (4)列频率分布表; (5)画频率分布直方图注:频率分布直方图中小正方形的面积=组距×组距频率=频率。
折线图:连接频率分布直方图中小长方形上端中点,就得到频率分布折线图总体密度曲线:当样本容量足够大,分组越多,折线越接近于一条光滑的曲线,此滑曲线为总体密度曲线。
3.线性回归回归分析:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫相关关系或回归关系。
回归直线方程:设x 与y 是具有相关关系的两个变量,且相应于n 个观测值的n 个点大致分布在某一条直线的附近,就可以认为y 对x 的回归函数的类型为直线型:bx a y+=ˆ。
其中2121121)())((xn xy x n yx x xy y x xb ni ini ii ni ini i i--=---=∑∑∑∑====,x b y a -=。
我们称这个方程为y 对x 的回归直线方程。
四.【典例解析】题型1:数字特征例1.为了检查一批手榴弹的杀伤半径,抽取了其中20颗做试验,得到这20颗手榴弹的杀伤半径,并列表如下:(1)在这个问题中,总体、个体、样本和样本容量各是什么?(2)求出这20颗手榴弹的杀伤半径的众数、中位数和平均数,并估计这批手榴弹的平均杀伤半径.解析: (1)总体是要检查的这批手榴弹的杀伤半径的全体;个体是每一颗手榴弹的杀伤半径;样本是所抽取的20颗手榴弹的杀伤半径;样本容量是20。
(2)在20个数据中,10出现了6次,次数最多,所以众数是10(米)20个数据从小到大排列,第10个和第11个数据是最中间的两个数,分别为9(米)和10(米),所以中位数是21(9+10)=9.5(米)。
样本平均数4.9)112311610495817(201=⨯+⨯+⨯+⨯+⨯+⨯=x (米) 所以,估计这批手榴弹的平均杀伤半径约为9.4米。
点评:(1)根据总体、个体、样本、样本容量的概念答题.要注意:总体、个体和样本所说的考察对象是一种数量指标,不能说成考察的对象是手榴弹,而应说是手榴弹的杀伤半径。
(2009山东卷理)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品 净重的范围是[96,106],样本数据分组为[96,98),[98,100), [100,102),[102,104),[104,106],已知样本中产品净重小于 100克的个数是36,则样本中净重大于或等于98克并且 小于104克的产品的个数是 ( ). A.90 B.75 C. 60 D.45 答案 A解析 产品净重小于100克的概率为(0.050+0.100)×2=0.300, 已知样本中产品净重小于100克的个数是36,设样本容量为n , 则300.036=n,所以120=n ,净重大于或等于98克并且小于 104克的产品的概率为(0.100+0.150+0.125)×2=0.75,所以样本 中净重大于或等于98克并且小于104克的产品的个数是 120×0.75=90.故选A.【命题立意】:本题考查了统计与概率的知识,读懂频率分布直方图,会计算概率以及样本中有关的数据.(2)读懂表格的意义,利用概念求众数、中位数,用样本平均数估计这批手榴弹的平均杀伤半径.另外在这里要会简便计算有多个重复数据的样本的平均数。
例2.为估计一次性木质筷子的用量,1999年从某县共600家高、中、低档饭店抽取10家作样本,这些饭店每天消耗的一次性筷子盒数分别为:0.6 3.7 2.2 1.5 2.8 1.7 1.2 2.1 3.2 1.0(1)通过对样本的计算,估计该县1999年消耗了多少盒一次性筷子(每年按350个营业日计算);(2)2001年又对该县一次性木质筷子的用量以同样的方式作了抽样调查,调查的结果是10个样本饭店,每个饭店平均每天使用一次性筷子2.42盒.求该县2000年、2001年这两年一次性木质筷子用量平均每年增长的百分率(2001年该县饭店数、全年营业天数均与1999年相同);(3)在(2)的条件下,若生产一套学生桌椅需木材0.07m 3,求该县2001年使用一次性筷子的木材可以生产多少套学生桌椅。
计算中需用的有关数据为:每盒筷子100双,每双筷子的质量为5g ,所用木材的密度为0.5×103kg/m 3;(4)假如让你统计你所在省一年使用一次性筷子所消耗的木材量,如何利用统计知识去做,简要地用文字表述出来。
第8题图解析:(1)0.2)0.12.31.22.17.18.25.12.27.36.0(101=+++++++++=x 所以,该县1999年消耗一次性筷子为2×600×350=420000(盒)。
(2)设平均每年增长的百分率为X ,则2(1+X )2=2.42, 解得X 1=0.1=10%,X 2=-2.1(不合题意,舍去)。
所以,平均每年增长的百分率为10%; (3)可以生产学生桌椅套数为726007.0105.035060010042.2005.03=⨯⨯⨯⨯⨯⨯(套)。
(2009四川卷文)设矩形的长为a ,宽为b ,其比满足b ∶a =618.0215≈-,这种矩形给人以美感,称为黄金矩形。
黄金矩形常应用于工艺品设计中。
下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本: 甲批次:0.598 0.625 0.628 0.595 0.639 乙批次:0.618 0.613 0.592 0.622 0.620根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是 A.甲批次的总体平均数与标准值更接近 B.乙批次的总体平均数与标准值更接近 C.两个批次总体平均数与标准值接近程度相同 D.两个批次总体平均数与标准值接近程度不能确定 答案 A解析 甲批次的平均数为0.617,乙批次的平均数为0.613(4)先抽取若干个县(或市、州)作样本,再分别从这些县(或市、州)中抽取若干家饭店作样本,统计一次性筷子的用量.点评:本题是一道统计综合题,涉及的知识点很多,需要灵活运用各种知识分析解决问题.对于第(1)小题,可先求得样本平均数,再利用样本估计总体的思想来求得问题的解.对于第(2)小题,实际是一个增长率问题的应用题,可通过设未知数列方程的方法来解.对于第(3)小题,用到了物理公式m =ρv , 体现了各学科知识之间的联系,让学生触类旁通,在解决实际问题时能综合运用多种知识灵活地解决问题.第(4)小题只要能够运用随机抽样方法,能体会到用样本估计总体的统计思想就可解决,在文字表述上要注意简洁、明了、正确。
题型2:数字特征的应用例3.甲、乙两种冬小麦试验品种连续5年的平均单位面积产量如下(单位:t / hm 2)其中产量比较稳定的小麦品种是 甲 。
解析:x ¯甲 = 1 ( 9.8 + 9.9 + 10.1 + 10 + 10.2) = 10.0,x ¯乙 = 1( 9.4 + 10.3 + 10.8 + 9.7 + 9.8) =10.0;s 2甲 = 1 5( 9.82 + … + 10.22) – 102 = 0.02,s 2甲 = 1 5( 9.42 + … + 9.82) – 102 = 0.244 > 0.02 。
点评:方差与平均数在反映样本的特征上一定要区分开例4.在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4 8.4 9.4 9.9 9.6 9.4 9.7 去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为(A )9.4, 0.484 (B )9.4, 0.016 (C )9.5, 0.04 (D )9.5, 0.016 答案:D ; 解析:7个数据中去掉一个最高分和一个最低分后,余下的5个数为:9.4, 9.4, 9.6, 9.4, 9.5。
则平均数为:5.946.955.94.96.94.94.9≈=++++=x ,即5.9=x 。