统计与统计案例 PPT
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2)为了调查上网时间对学习的影响程度,学校决定在平均 每周上网时间少于 4 小时的学生中利用分层抽样法抽取 4 名学 生,然后再随机抽取 2 名学生进行学习效率等方面的调查,求 平均每周上网时间在 2~4 小时内的学生有 2 名被抽到的概率.
[解析] (1)设频率分布直方图中从左到右前 3 个小矩形的 面积分别为 P,3P,5P.
统计与统计案例
知识方法整合 1.抽样方法 三种抽样方法的比较
2.统计图表 (1)在频率分布直方图中: ①各小矩形的面积表示相应各组的频率,各小矩形的高= 频率 组距;②各小矩形面积之和等于 1;③中位数左右两侧的直方 图面积相等,因此可以估计其近似值.
3.样本的数字特征 (1)众数 在样本数据中,频率分布最大值所对应的样本数据(或出 现次数最多的那个数据). (2)中位数 样本数据中,将数据按大小排列,位于最中间的数据.如 果数据的个数为偶数,就取当中两个数据的平均数作为中位 数.
其中上网时间在 2~4 小时内的学生有 2 名被抽到所包括 的基本事件有(B1,B2),(B2,B3),(B1,B3),共 3 种结果,
故所求概率 P=36=12.
(2013·福建理,4)某校从高一年级学生中随机抽取部分学 生,将他们的模块测试成绩分成 6 组:[40,50),[50,60),[60,70), [70,80),[80,90),[90,100]加以统计,得到如图所示的频率分 布直方图,已知高一年级共有学生 600 名,据此估计,该模块 测试成绩不少于 60 分的学生人数为( )
(2)平均数反映了数据取值的平均水平,标准差、方差描述 了一组数据围绕平均数波动的大小.标准差、方差越大,数据 的离散程度越大,越不稳定.
疑难误区警示 1.当总体数 N 不能被样本容量整除,用系统抽样法剔除 多余个体时,必须随机抽样. 2.注意中位数与平均数的区别,中位数可能不在样本数 据中.
抽样方法
用样本估计总体
用样本估计总体
(文)某学校为了调查学生平均每周的上网时间(单 位:h)对学习产生的影响,从高三年级随机抽取了 100 名学生, 将所得数据整理后,画出频率分布直方图(如图),其中频率分 布直方图从左到右前 3 个小矩形的面积之比为 1:3:5,试估 计:
(1)该学校学生平均每周上网时间少于 4 小时的学生人数 是多少?
由频率分布直方图可知,最后 2 个小矩形的面积之和为 (0.015+0.035)×2=0.1.
因为频率分布直方图中各个小矩形的面积之和为 1,所以 P+3P+5P=0.9,即 P=0.1.
所以平均每周上网时间少于 4 小时的学生所占比例为 P+ 3P=0.4ቤተ መጻሕፍቲ ባይዱ即人数为 0.4×100=40.
(2)由题意可知,利用分层抽样的方法抽取上网时间在 0~ 2 小时内的学生 1 名(记为 A),抽取上网时间在 2~4 小时内的 学生 3 名(分别记为 B1,B2,B3),从这 4 名学生中随机抽取 2 名学生有(A,B1),(A,B2),(A,B3),(B1,B2),(B2,B3),(B1, B3),共 6 种结果,
(3)平均数 样本数据的平均数-x =1n(x1+x2+…+xn). (4)方差与标准差 方差 s2=1n[(x1--x )2+(x2--x )2+…+(xn--x )2]. 标准差 s= 1n[x1--x 2+x2--x 2+…+xn--x 2].
注意:(1)现实中总体所包含的个体数往往较多,总体的平 均数与标准差、方差是不知道(或不可求)的,所以我们通常用 样本的平均数与标准差、方差来估计总体的平均数与标准差、 方差.
4.方差越大,数据的波动程度越大,越不稳定. 5.准确理解给出图表及已知条件中数据的含义是解决统 计问题的关键.
A.588 C.450
[答案] B
B.480 D.420
[解析] 成绩不少于 60 分的学生人数为 600×(0.030+ 0.025+0.015+0.01)×10=480.
1.求中位数、平均数、方差主要依据公式进行计算. 2.在频率分布直方图中,平均数的估计值等于每个小矩 形的面积乘以小矩形底边中点横坐标之和;在中位数的估计值 两侧直方图的面积相等;最高小矩形中点对应数据为这组数据 的众数. 3.方差越大,数据的波动程度越大,越不稳定. 4.准确理解给出图表及已知条件中数据的含义是解决统 计问题的关键.
[答案] 20
[解析] 属简单题,关键是清楚每一层的抽取比例都一样 是Nn .
由于所有超市共计 200+400+1400=2000 家,需抽取 100 家,则抽取比例为2100000,
所以中型超市抽取 400×2100000=20 家.
[方法规律总结] 解决抽样问题首先要深刻理解各种抽样方法的特点和适 用范围,如分层抽样,适用于数目较多且各部分之间具有明显 差异的总体.其次要抓住无论哪种抽样方法,每一个个体被抽 到的概率都等于样本容量与总体容量的比值.
D.系统抽样
[答案] C
[解析] 由于三个学段学生的视力差别较大,由分层抽样 的定义知,合理的抽样方法是分层抽样,要按学段分层,故选 C.
某市有大型超市 200 家、中型超市 400 家、小型超市 1400 家.为掌握各类超市的营业情况,现按分层抽样方法抽取一个 容量为 100 的样本,应抽取中型超市________家.
(理)(2013·新课标Ⅰ理,3)为了解某地区的中小学生视力情
况,拟从该地区的中小学生中抽取部分学生进行调查,事先已
了解到该地区小学、初中、高中三个学段学生的视力情况有较
大差异,而男女生视力情况差异不大,在下面的抽样方法中,
最合理的抽样方法是( )
A.简单随机抽样
B.按性别分层抽样
C.按学段分层抽样
(文)(2013·湖南文,3)某工厂甲、乙、丙三个车
间生产了同一种产品,数量分别为 120 件,80 件,60 件,为
了解它们的产品质量是否存在显著差异,用分层抽样方法抽
取了一个容量为 n 的样本进行调查,其中从丙车间的产品中
抽取了 3 件,则 n=( )
A.9
B.10
C.12
D.13
[答案] D
[解析] ∵120+n80+60=630,∴n=13.故选 D.
[解析] (1)设频率分布直方图中从左到右前 3 个小矩形的 面积分别为 P,3P,5P.
统计与统计案例
知识方法整合 1.抽样方法 三种抽样方法的比较
2.统计图表 (1)在频率分布直方图中: ①各小矩形的面积表示相应各组的频率,各小矩形的高= 频率 组距;②各小矩形面积之和等于 1;③中位数左右两侧的直方 图面积相等,因此可以估计其近似值.
3.样本的数字特征 (1)众数 在样本数据中,频率分布最大值所对应的样本数据(或出 现次数最多的那个数据). (2)中位数 样本数据中,将数据按大小排列,位于最中间的数据.如 果数据的个数为偶数,就取当中两个数据的平均数作为中位 数.
其中上网时间在 2~4 小时内的学生有 2 名被抽到所包括 的基本事件有(B1,B2),(B2,B3),(B1,B3),共 3 种结果,
故所求概率 P=36=12.
(2013·福建理,4)某校从高一年级学生中随机抽取部分学 生,将他们的模块测试成绩分成 6 组:[40,50),[50,60),[60,70), [70,80),[80,90),[90,100]加以统计,得到如图所示的频率分 布直方图,已知高一年级共有学生 600 名,据此估计,该模块 测试成绩不少于 60 分的学生人数为( )
(2)平均数反映了数据取值的平均水平,标准差、方差描述 了一组数据围绕平均数波动的大小.标准差、方差越大,数据 的离散程度越大,越不稳定.
疑难误区警示 1.当总体数 N 不能被样本容量整除,用系统抽样法剔除 多余个体时,必须随机抽样. 2.注意中位数与平均数的区别,中位数可能不在样本数 据中.
抽样方法
用样本估计总体
用样本估计总体
(文)某学校为了调查学生平均每周的上网时间(单 位:h)对学习产生的影响,从高三年级随机抽取了 100 名学生, 将所得数据整理后,画出频率分布直方图(如图),其中频率分 布直方图从左到右前 3 个小矩形的面积之比为 1:3:5,试估 计:
(1)该学校学生平均每周上网时间少于 4 小时的学生人数 是多少?
由频率分布直方图可知,最后 2 个小矩形的面积之和为 (0.015+0.035)×2=0.1.
因为频率分布直方图中各个小矩形的面积之和为 1,所以 P+3P+5P=0.9,即 P=0.1.
所以平均每周上网时间少于 4 小时的学生所占比例为 P+ 3P=0.4ቤተ መጻሕፍቲ ባይዱ即人数为 0.4×100=40.
(2)由题意可知,利用分层抽样的方法抽取上网时间在 0~ 2 小时内的学生 1 名(记为 A),抽取上网时间在 2~4 小时内的 学生 3 名(分别记为 B1,B2,B3),从这 4 名学生中随机抽取 2 名学生有(A,B1),(A,B2),(A,B3),(B1,B2),(B2,B3),(B1, B3),共 6 种结果,
(3)平均数 样本数据的平均数-x =1n(x1+x2+…+xn). (4)方差与标准差 方差 s2=1n[(x1--x )2+(x2--x )2+…+(xn--x )2]. 标准差 s= 1n[x1--x 2+x2--x 2+…+xn--x 2].
注意:(1)现实中总体所包含的个体数往往较多,总体的平 均数与标准差、方差是不知道(或不可求)的,所以我们通常用 样本的平均数与标准差、方差来估计总体的平均数与标准差、 方差.
4.方差越大,数据的波动程度越大,越不稳定. 5.准确理解给出图表及已知条件中数据的含义是解决统 计问题的关键.
A.588 C.450
[答案] B
B.480 D.420
[解析] 成绩不少于 60 分的学生人数为 600×(0.030+ 0.025+0.015+0.01)×10=480.
1.求中位数、平均数、方差主要依据公式进行计算. 2.在频率分布直方图中,平均数的估计值等于每个小矩 形的面积乘以小矩形底边中点横坐标之和;在中位数的估计值 两侧直方图的面积相等;最高小矩形中点对应数据为这组数据 的众数. 3.方差越大,数据的波动程度越大,越不稳定. 4.准确理解给出图表及已知条件中数据的含义是解决统 计问题的关键.
[答案] 20
[解析] 属简单题,关键是清楚每一层的抽取比例都一样 是Nn .
由于所有超市共计 200+400+1400=2000 家,需抽取 100 家,则抽取比例为2100000,
所以中型超市抽取 400×2100000=20 家.
[方法规律总结] 解决抽样问题首先要深刻理解各种抽样方法的特点和适 用范围,如分层抽样,适用于数目较多且各部分之间具有明显 差异的总体.其次要抓住无论哪种抽样方法,每一个个体被抽 到的概率都等于样本容量与总体容量的比值.
D.系统抽样
[答案] C
[解析] 由于三个学段学生的视力差别较大,由分层抽样 的定义知,合理的抽样方法是分层抽样,要按学段分层,故选 C.
某市有大型超市 200 家、中型超市 400 家、小型超市 1400 家.为掌握各类超市的营业情况,现按分层抽样方法抽取一个 容量为 100 的样本,应抽取中型超市________家.
(理)(2013·新课标Ⅰ理,3)为了解某地区的中小学生视力情
况,拟从该地区的中小学生中抽取部分学生进行调查,事先已
了解到该地区小学、初中、高中三个学段学生的视力情况有较
大差异,而男女生视力情况差异不大,在下面的抽样方法中,
最合理的抽样方法是( )
A.简单随机抽样
B.按性别分层抽样
C.按学段分层抽样
(文)(2013·湖南文,3)某工厂甲、乙、丙三个车
间生产了同一种产品,数量分别为 120 件,80 件,60 件,为
了解它们的产品质量是否存在显著差异,用分层抽样方法抽
取了一个容量为 n 的样本进行调查,其中从丙车间的产品中
抽取了 3 件,则 n=( )
A.9
B.10
C.12
D.13
[答案] D
[解析] ∵120+n80+60=630,∴n=13.故选 D.