人教A版数学必修第二册第九章《9.2 用样本估计总体》同步讲义
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
人教A 版数学必修第二册第九章《统计》同步讲义
9.2 用样本估计总体
一.总体取值规律的估计(一)作频率分布直方图的步骤
1.求极差:
2.决定组距与组数
将数据分组时,一般取等长组距,并且组距应力求“取整”,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.3.将数据分组
4.列频率分布表:各小组的频率=
5.画频率分布直方图纵轴表示
频率组距,频率
组距
实际上就是频率分布直方图中各小长方形的高度,小长方形的面积= =频率.(二)频率分布直方图的性质
1.因为小矩形的面积= = ,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.
2.在频率分布直方图中,各小矩形的面积之和等于1.
3.
频数
相应的频率
=样本容量.
二.常见统计图表的特点与区别
1.扇形图:用于直观描述各类数据占总数的比例,易于显示每组数据相对于总数的大小
2.条形图:主要用于直观描述不同类别或分组数据的频数和频率,适用于描述离散型数据。
3.直方图主要用于直观描述不同类别或分组数据的频数和频率,直方图适用于描述连续型数据.
4.折线图主要用于描述数据随时间的变化趋势.三.总体百分位数的估计
1.百分位数定义:一般地,一组数据的第p 百分位数是这样一个值,它使得这组数据中至少有p %的数据小于或等于这个值,且至少有(100-p )%的数据大于或等于这个值.
2.常用的百分位数
(1)四分位数:第25百分位数,第50百分位数,第75百分位数.
(2)其它常用的百分位数:第1百分位数,第5百分位数,第95百分位数,第99百分位数.3.计算一组n 个数据的第p
百分位数的一般步骤如下:
第1步,按从小到大排列原始数据;第2步,计算i =n ×p %;
第3步,若i 不是整数,而大于i 的比邻整数为j ,则第p 百分位数为第j 项数据;
若i 是整数,则第p 百分位数为第i 项与第(i +1)项数据的平均数.
四.总体集中趋势的估计(一)众数、中位数、平均数
1.众数:一组数据中出现次数最多的数.
2.中位数:
如果一组数有奇数个数,且按照从小到大排列后为x 1,x 2,…,x 2n +1,则称x n +1为这组数的中位数;如果一组数有偶数个数,且按照从小到大排列后为x 1,x 2,…,x 2n ,则称x n +x n +1
2为这组数的中位数.
3.平均数:如果n 个数x 1,x 2,…,x n ,那么x =1
n
(x 1+x 2+…+x n )叫做这n 个数的平均数.
(二)频率分布直方图中平均数、中位数、众数的求法(1)众数:取最高小长方形底边中点的横坐标作为众数.
(2)中位数:在频率分布直方图中,把频率分布直方图划分为左右两个面积相等的部分的分界线与x 轴交点的横坐标称为中位数.
(3)平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. 五.总体离散程度的估计
1.假设一组数据为x 1,x 2,…x n ,则这组数据的平均数= ,
方差为
标准差2.如果总体中所有个体的变量值分别为Y 1,Y 2,…,Y N ,总体平均数为,则称为总体方差,S =S 2为总体标准差.
3.标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.
4.分层随机抽样的方差
设样本中不同层的平均数分别为x 1,x 2,…,x n ,方差分别为s 21,
s 2
,…,s 2n ,相应的权重分别为w 1,w 2,…,w n
,则这个样本的方差为x s =Y n
2
2i i 1
1S (Y Y)N ==-∑n
2
2
2i
i i i 1
S w [S
(x x)]
==
+-∑
题型一 总体取值规律的估计
【例1-1】(2023·全国·高一专题练习)在2022年某地销售的汽车中随机选取1000台,对销售价格与销售数量进行统计,这1000台车辆的销售价格都不小于5万元,小于30万元,将销售价格分为五组:
(单位:万元).统计后制成的频率分布直方图如图所示.在选取的1000台汽
车中,销售价格在内的车辆台数为( )
A .800
B .600
C .700
D .750
【例1-2】(2023天津)从某小区抽取100户居民用户进行月用电调查,发现他们的用电量都在之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示.在被调查的用户中,用电量落在区间内的户数为( )
A .45
B .46
C .54
D .70
【例1-3】(2023·江苏)党的二十大报告指出:“全面提高人才自主培养质量,着力造就拔尖创新人才,聚天下英才而用之.”某区域教育部门为提高学生的创新能力,组织了200名学生参与研究性学习,每人仅参加1个课题组,参加各课题组的人数占比的扇形统计图如图所示,则参加数学类的人数比参加理化类的人数多(
)
[)[)[)[)[)5,1010,1515,2020,2525,30,,,,[)10,2050350kW h ⋅:[100,200)
A .16
B .30
C .32
D .62
【例1-4】(2023云南)下图是国家统计局发布的我国最近10年的人口出生率(单位:‰),根据下图,则( )
A .这10年的人口出生率逐年下降
B .这10年的人口出生率超过12‰的年数所占比例等于45%
C .这10年的人口出生率的80%分位数为13.57‰
D .这10年的人口出生率的平均数小于12‰
题型二 总体百位分数的估计
【例2-1】(2023·辽宁)某地有9个快递收件点,在某天接收到的快递个数分别为360,284,290,300,402,188,240,260,288,则这组数据的第72百分位数为( )A .290
B .295
C .300
D .330
【例2-2】(2023·全国·高一专题练习)《中国居民膳食指南(2022)》数据显示,6岁至17岁儿童青少年超重肥胖率高达19.0%.为了解某地中学生的体重情况,某机构从该地中学生中随机抽取100名学生,测量他们的体重(单位:千克),根据测量数据,按分成六组,得到的频率分布直方图如图所示.根据调查的数据,估计该地中学生体重的第75百分位数是(
)
[40,45),[45,50),[50,55),[55,60),[60,65),[65,70]
A .55
B .57.25
C .58.75
D .60
题型三 总体集中趋势的估计
【例3-1】(2023上海徐汇)军训时,甲、乙两名同学进行射击比赛,共比赛10场,每场比赛各射击四次,且用每场击中环数之和作为该场比赛的成绩.数学老师将甲、乙两名同学的10场比赛成绩绘成如图所示的茎叶图(成绩的十位数为“茎”,个位数为“叶”),并给出下列三个结论:
①甲的成绩的极差是29;②乙的成绩的中位数是18;③乙的成绩的众数是22.则三个结论中,正确结论个数为( ).A .3
B .2
C .1
D .0
【例3-2】(2023秋·内蒙古包头·高三统考期末)某公司为了解用户对其产品的满意度,从使用该产品的用户中随机调查了100个用户,根据用户对产品的满意度评分,得到如图所示的用户满意度评分的频率分布直方图.若用户满意度评分的中位数、众数、平均数分别为a ,b ,c ,则( )
A .
B .
C .
D .【例3-3】(2023春·浙江温州)(多选)
《国家学生体质健康标准》是国家学校教育工作的基础性指导文件和教育质
a b c <<b a c <<a c b <<b<c<a
量基本标准,它适用于全日制普通小学、初中、普通高中、中等职业学校、普通高等学校的学生.某高校组织名大一新生进行体质健康测试,现抽查200名大一新生的体测成绩,得到如图所示的频率分布直方图,其中分组区间为,,,,,.则下列说法正确的是( )
A .估计该样本的众数是
B .估计该样本的均值是
C .估计该样本的中位数是
D .若测试成绩达到分方可参加评奖,则有资格参加评奖的大一新生约为人
题型四 总体离散程度的估计
【例4-1】(2023·高一课时练习)两名运动员在某次测试的6次成绩如图所示,则两人平均数与方差的关系是( )
A .甲的平均数大,方差小
B .平均数相等,甲方差大
C .平均数相等,甲方差小
D .平均数和方差都相等
【例4-2】(2023 浙江湖州 )(多选)为响应自己城市倡导的低碳出行,小李上班可以选择公交车、自行车两种交通工具,他分别记录了100次坐公交车和骑车所用时间(单位:分钟),得到下列两个频率分布直方图:基于以上统计信息,则(
)
4000[70,75)[75,80)[80,85)[85,90)[90,95)[95,100)87.58086
852200
A .骑车时间的中位数的估计值是22分钟
B .坐公交车时间的40%分位数的估计值是19分钟
C .坐公交车时间的平均数的估计值小于骑车时间的平均数的估计值
D .坐公交车时间的方差的估计值小于骑车时间的方差的估计值
【例4-3】(2023内蒙古赤峰·)甲、乙两名同学12次考试中数学成绩的茎叶图如图所示,则下列说法正确的是( )
A .甲同学比乙同学发挥稳定,且平均成绩也比乙同学高
B .甲同学比乙同学发挥稳定,但平均成绩比乙同学低
C .乙同学比甲同学发挥稳定,且平均成绩也比甲同学高
D .乙同学比甲同学发挥稳定,但平均成绩比甲同学低
【例4-4】(2023 北京·高一校考期末)经过简单随机抽样获得的样本数据为,且数据的平
均数为,方差为,则下列说法正确的是( )
A .若数据,方差,则所有的数据都为0
B .若数据,的平均数为,则的平均数为6
C .若数据,的方差为,则的方差为12
D .若数据,的分位数为90,则可以估计总体中有至少有的数据不大于90
12,,,n x x x 12,,,n x x x x 2s 12,,,n x x x 20s =()1,2,,i x i n = 12,,,n x x x 3x =()211,2,,i i y x i n =+= 12,,,n x x x 23s =()211,2,,i i y x i n =+= 12,,,n x x x 25%75%
答案解析
一.总体取值规律的估计(一)作频率分布直方图的步骤
1.求极差:极差为一组数据中最大值与最小值的差.
2.决定组距与组数
将数据分组时,一般取等长组距,并且组距应力求“取整”,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.3.将数据分组
4.列频率分布表:各小组的频率=小组频数
样本容量
.
5.画频率分布直方图纵轴表示
频率组距,频率
组距
实际上就是频率分布直方图中各小长方形的高度,小长方形的面积=组距×
频率
组距
=频率.(二)频率分布直方图的性质1.因为小矩形的面积=组距×
频率
组距
=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.2.在频率分布直方图中,各小矩形的面积之和等于1.3.
频数
相应的频率
=样本容量.
二.常见统计图表的特点与区别
1.扇形图:用于直观描述各类数据占总数的比例,易于显示每组数据相对于总数的大小
2.条形图:主要用于直观描述不同类别或分组数据的频数和频率,适用于描述离散型数据。
3.直方图主要用于直观描述不同类别或分组数据的频数和频率,直方图适用于描述连续型数据.
4.折线图主要用于描述数据随时间的变化趋势.三.总体百分位数的估计
1.百分位数定义:一般地,一组数据的第p 百分位数是这样一个值,它使得这组数据中至少有p %的数据小于或等于这个值,且至少有(100-p )%的数据大于或等于这个值.
2.常用的百分位数
(1)四分位数:第25百分位数,第50百分位数,第75百分位数.
(2)其它常用的百分位数:第1百分位数,第5百分位数,第95百分位数,第
99百分位数.
3.计算一组n 个数据的第p 百分位数的一般步骤如下:第1步,按从小到大排列原始数据;
第2步,计算i =n ×p %;
第3步,若i 不是整数,而大于i 的比邻整数为j ,则第p 百分位数为第j 项数据;
若i 是整数,则第p 百分位数为第i 项与第(i +1)项数据的平均数.
四.总体集中趋势的估计(一)众数、中位数、平均数
1.众数:一组数据中出现次数最多的数.
2.中位数:
如果一组数有奇数个数,且按照从小到大排列后为x 1,x 2,…,x 2n +1,则称x n +1为这组数的中位数;如果一组数有偶数个数,且按照从小到大排列后为x 1,x 2,…,x 2n ,则称x n +x n +1
2为这组数的中位数.
3.平均数:如果n 个数x 1,x 2,…,x n ,那么x =1
n
(x 1+x 2+…+x n )叫做这n 个数的平均数.
(二)频率分布直方图中平均数、中位数、众数的求法(1)众数:取最高小长方形底边中点的横坐标作为众数.
(2)中位数:在频率分布直方图中,把频率分布直方图划分为左右两个面积相等的部分的分界线与x 轴交
点的横坐标称为中位数.
(3)平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形
底边中点的横坐标之和.
五.总体离散程度的估计
1.假设一组数据为x 1,x 2,…x n ,则这组数据的平均数=x 1+x 2+…+x n
n ,方差为标准差2.如果总体中所有个体的变量值分别为Y 1,Y 2,…,Y N ,总体平均数为,则称为总体方差,S =S 2为总体标准差.
3.标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.
4.分层随机抽样的方差
设样本中不同层的平均数分别为x 1,x 2,…,x n ,方差分别为s 21,
s 2
,…,s 2n ,相应的权重分别为w 1,w 2,…,w n
,则这个样本的方差为题型一 总体取值规律的估计
x n
22
i
i 1
1S (x
x)n
==
-∑s =Y n
2
2i i 1
1S (Y Y)N ==-∑n
2
2
2i
i i i 1
S w [S
(x x)]
==
+-∑
【例1-1】(2023·全国·高一专题练习)在2022年某地销售的汽车中随机选取1000台,对销售价格与销售数量进行统计,这1000台车辆的销售价格都不小于5万元,小于30万元,将销售价格分为五组:
(单位:万元).统计后制成的频率分布直方图如图所示.在选取的1000台汽车中,销售价格在内的车辆台数为( )
A .800
B .600
C .700
D .750
【答案】C 【解析】由频率分布直方图知,销售价格在内的频率是,
所以1000台汽车中,销售价格在内的车辆台数为.故选:C
【例1-2】(2023天津)从某小区抽取100户居民用户进行月用电调查,发现他们的用电量都在之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示.在被调查的用户中,用电量落在区间内的户数为( )
A .45
B .46
C .54
D .70
【答案】B 【解析】由题知,这些用户中,
用电量落在区间内的频率为,
则用电量落在区间内的户数为
.
[)[)[)[)[)5,1010,1515,2020,2525,30,,,,[)10,20[)10,201(0.0150.0250.02)50.7-++⨯=[)10,200.71000700⨯=50350kW h ⋅:[100,200)[100,200)()0.0065010.00120.00240.00480.00240.006500.46⨯+-++++⨯=[100,200)1000.4646⨯=
故选:B
【例1-3】(2023·江苏)党的二十大报告指出:“全面提高人才自主培养质量,着力造就拔尖创新人才,聚天下英才而用之.”某区域教育部门为提高学生的创新能力,组织了200名学生参与研究性学习,每人仅参加1个课题组,参加各课题组的人数占比的扇形统计图如图所示,则参加数学类的人数比参加理化类的人数多( )
A .16
B .30
C .32
D .62
【答案】C
【解析】由扇形统计图可知参加数学类的人数为,
参加理化类的人数为,
故参加数学类的人数比参加理化类的人数多,
故选:C
【例1-4】(2023云南)下图是国家统计局发布的我国最近10年的人口出生率(单位:‰),根据下图,则( )
A .这10年的人口出生率逐年下降
B .这10年的人口出生率超过12‰的年数所占比例等于45%
C .这10年的人口出生率的80%分位数为13.57‰
D .这10年的人口出生率的平均数小于12‰
【答案】D
【解析】对于A :这10年的人口出生率有升有降,故A
错误;
20031%62⨯=20015%30⨯=623032-=
对于B :这10年的人口出生率超过12‰的年数所占比例等于50%,故B 错误;
对于C :由于,则这10年的人口出生率的80%分位数为从小到大第8个和第9个数的平均数
,故C 错误;对于D :这10年的人口出生率的平均数为
小于12‰,故D 正确;故选:D.
题型二 总体百位分数的估计
【例2-1】(2023·辽宁)某地有9个快递收件点,在某天接收到的快递个数分别为360,284,290,300,402,188,240,260,288,则这组数据的第72百分位数为( )
A .290
B .295
C .300
D .330
【答案】C
【解析】将这组数据按照从小到大的顺序排列得188,240,260,284,288,290,300,360,402,
因为,所以这组数据的第72百分位数为300.故选:C
【例2-2】(2023·全国·高一专题练习)《中国居民膳食指南(2022)》数据显示,6岁至17岁儿童青少年超重肥胖率高达19.0%.为了解某地中学生的体重情况,某机构从该地中学生中随机抽取100名学生,测量他们的体重(单位:千克),根据测量数据,按分成六组,得到的频率分布直方图如图所示.根据调查的数据,估计该地中学生体重的第75百分位数是( )A .55
B .57.25
C .58.75
D .60
【答案】C 【解析】因为,
所以该地中学生体重的第75百分位数在内,
设第75百分位数为m ,则,解得.故选:C
题型三 总体集中趋势的估计
【例3-1】(2023上海徐汇)军训时,甲、乙两名同学进行射击比赛,共比赛10
场,每场比赛各射击四次,且用每
100.88⨯=13.5713.8313.702
+=()114.5713.0313.8311.9913.5712.6410.8610.418.527.5211.69410
+++++++++=90.72 6.48⨯=[40,45),[45,50),[50,55),[55,60),[60,65),[65,70](0.010.030.08)50.60.75,0.60.0450.80.75++⨯=<+⨯=>[55,60)(55)0.040.60.75m -⨯+=58.75m =
场击中环数之和作为该场比赛的成绩.数学老师将甲、乙两名同学的10场比赛成绩绘成如图所示的茎叶图(成绩的十位数为“茎”,个位数为“叶”),并给出下列三个结论:
①甲的成绩的极差是29;②乙的成绩的中位数是18;③乙的成绩的众数是22.
则三个结论中,正确结论个数为( ).
A .3
B .2
C .1
D .0
【答案】B
【解析】由茎叶图可知甲的成绩的极差是,故①正确;
乙的成绩按从小到大的顺序为,
所以乙的成绩的中位数是,众数是,故②错误,③正确.所以正确的个数为2个.故选:B.【例3-2】(2023秋·内蒙古包头·高三统考期末)某公司为了解用户对其产品的满意度,从使用该产品的用户中随机调查了100个用户,根据用户对产品的满意度评分,得到如图所示的用户满意度评分的频率分布直方图.若用户满意度评分的中位数、众数、平均数分别为a ,b ,c ,则( )
A .
B .
C .
D .【答案】B 【解析】由频率分布直方图可知众数为65,即,由表可知,组距为10,
所以平均数为:,故,记中位数为,
则有:,解得:,即,所以.故选:B.
【例3-3】(2023春·浙江温州)(多选)《国家学生体质健康标准》是国家学校教育工作的基础性指导文件和教育质量基本标准,它适用于全日制普通小学、初中、普通高中、中等职业学校、普通高等学校的学生.某高校组织名大一新生进行体质健康测试,现抽查200名大一新生的体测成绩,得到如图所示的频率分布直方图,其中分组区间为,,,,,.则下列说法正确的是( )
36729-=9,11,13,14,18,19,20,22,22,23181918.52+=22a b c
<<b a c <<a c b <<b<c<a
65b =450.15550.2650.25750.2850.1950.167⨯+⨯+⨯+⨯+⨯+⨯=67c =x ()100.015100.02600.0250.5x ⨯+⨯+-⨯=66x =66a =b a c <<4000[70,75)[75,80)[80,85)[85,90)[90,95)[95,100)
A .估计该样本的众数是
B .估计该样本的均值是
C .估计该样本的中位数是
D .若测试成绩达到分方可参加评奖,则有资格参加评奖的大一新生约为人
【答案】ACD
【解析】对于A 项,由频率分布直方图可得,最高小矩形为
,所以可估计该样本的众数是
,故A 项正确;对于B 项,由频率分布直方图,可估计该样本的均值是,故B 项错误;对于C 项,由频率分布直方图可得,成绩在之间的频率为,在
之间的频率为,
所以可估计该样本的中位数在内.设中位数为,则由可得,,故C 项正确;对于D 项,由频率分布直方图可得,测试成绩达到分的频率为,所以可估计有资格参加评奖的大一新生约为人,故D 项正确.故选:ACD.
题型四 总体离散程度的估计
【例4-1】(2023·高一课时练习)两名运动员在某次测试的6次成绩如图所示,则两人平均数与方差的关系是( )
A .甲的平均数大,方差小
B .平均数相等,甲方差大
C .平均数相等,甲方差小
D .平均数和方差都相等【答案】C 【解析】由茎叶图可看出甲的平均数是,87.580
86
852200[85,90)859087.52
+=0.020572.50.030577.50.040582.5⨯⨯+⨯⨯+⨯⨯0.050587.50.035592.50.025597.585.625+⨯⨯+⨯⨯+⨯⨯=[70,85)50.02050.030500.045.04⨯+⨯+⨯=[70,90)70.02050.03050.04050.05050.⨯+⨯+⨯+⨯=[85,90)x 850.450.250.59085
x -+⨯=-86x =850.05050.03550.02550.55⨯+⨯+⨯=40000.552200⨯=91415151621156
x +++++==1
乙的平均数是,两组数据的平均数相等.甲的方差是,乙的方差是,甲的方差小于乙的方差.故选:C.
【例4-2】(2023 浙江湖州 )(多选)为响应自己城市倡导的低碳出行,小李上班可以选择公交车、自行车两种交通工具,他分别记录了100次坐公交车和骑车所用时间(单位:分钟),得到下列两个频率分布直方图:基于以上统计信息,则( )A .骑车时间的中位数的估计值是22分钟
B .坐公交车时间的40%分位数的估计值是19分钟
C .坐公交车时间的平均数的估计值小于骑车时间的平均数的估计值
D .坐公交车时间的方差的估计值小于骑车时间的方差的估计值
【答案】BC
【解析】对A :设骑车时间的中位数为,则,解得,
故骑车时间的中位数的估计值是分钟,A 错误;
对B :设坐公交车时间的40%分位数为,则,解得,故坐公交车时间的40%分位数的估计值是19分钟,B 正确;
对C :坐公交车时间的平均数
,骑车时间的平均数,
281315151722156
x +++++=
=()211373610013663
S =+++++=()221534940044963S =+++++=a ()0.1020.20200.50a ⨯+-=21.5a =21.5b ()0.02520.05020.07520.100180.4b ⨯+⨯+⨯+⨯-=19b =130.0252150.0502170.0752190.1002210.1002230.0752250.0502270.025220x =⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=190.102210.202230.152250.05221.6y =⨯⨯+⨯⨯+⨯⨯+⨯⨯=
∵,故坐公交车时间的平均数的估计值小于骑车时间的平均数的估计值,C 正确;
对D :
坐公交车时间的方差骑车时间的方差
,∵,故坐公交车时间的方差的估计值大于骑车时间的方差的估计值,D 错误.
故选:BC.
【例4-3】(2023内蒙古赤峰·)甲、乙两名同学12次考试中数学成绩的茎叶图如图所示,则下列说法正确的是( )
A .甲同学比乙同学发挥稳定,且平均成绩也比乙同学高
B .甲同学比乙同学发挥稳定,但平均成绩比乙同学低
C .乙同学比甲同学发挥稳定,且平均成绩也比甲同学高
D .乙同学比甲同学发挥稳定,但平均成绩比甲同学低
【答案】C
【解析】由茎叶图中的数据,得甲同学次考试成绩的平均数是
.乙同学次考试成绩的平均数是,甲同学数学成绩比较分散,乙同学数学成绩相对集中,
所以乙同学比甲同学发挥稳定,且平均成绩比甲同学高.
故选:C
【例4-4】(2023 北京·高一校考期末)经过简单随机抽样获得的样本数据为,且数据的平均数为,方差为,则下列说法正确的是( )
A .若数据,方差,则所有的数据都为0
x y <()()()()2222
2113200.025215200.050217200.075219200.1002s =-⨯⨯+-⨯⨯+-⨯⨯+-⨯⨯()()()()2222
21200.100223200.075225200.050227200.025213
+-⨯⨯+-⨯⨯+-⨯⨯+-⨯⨯=()()()()2222221921.60.1022121.60.2022321.60.1522521.60.052 3.24s =-⨯⨯+-⨯⨯+-⨯⨯+-⨯⨯=2212s s >128288919495104105107111115118120102.512
x +++++++++++==甲1299102107108114115115117118119122128113.712x +++++++++++=
≈乙12,,,n x x x 12,,,n x x x x 2s 12,,,n x x x 20s =()1,2,,i x i n =
B .若数据,的平均数为,则的平均数为6
C .若数据,的方差为,则的方差为12
D .若数据,的分位数为90,则可以估计总体中有至少有的数据不大于90
【答案】C
【解析】对于,数据的方差时,说明所有的数据都相等,但不一定为,故选项错误;
对于,数据,的平均数为,数据的平均数为,故选项错误;
对于,数据的方差为,数据的方差为,故选项正确;对于,数据,的分位数为90,则可以估计总体中有至少有的数据大于90,故选项错误,
故选:.
12,,,n x x x 3x =()211,2,,i i y x i n =+= 12,,,n x x x 23s =()211,2,,i i y x i n =+= 12,,,n x x x 25%75%A 12,,,n x x x 20s =12,,,n x x x 0A B 12,,,n x x x 3x =()211,2,,i i y x i n =+= 2317⨯+=B C 12,,,n x x x 23s =()211,2,,i i y x i n =+= 22312⨯=C D 12,,,n x x x 25%75%D C。