考研高数总复习专题六第3讲(讲义)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
主干知识梳理
1.随机抽样
(1)简单随机抽样特点为从总体中逐个抽取,适用范围:
本 讲
总体中的个体较少.
栏 目
(2)系统抽样特点是将总体均分成几部分,按事先确定的
开 关
规则在各部分中抽取,适用范围:总体中的个体数较多.
(3)分层抽样特点是将总体分成几层,分层进行抽取,适
用范围:总体由差异明显的几部分组成.
开
关
(2)最小二乘法:对于给定的一组样本数据(x1,y1),(x2,
n
y2),…,(xn,yn),通过求Q= (yi-a-bxi)2最小时,得
i=1
到线性回归方程y^=b^x+a^的方法叫做最小二乘法.
主干知识梳理
5.独立性检验
对于取值分别是{x1,x2}和{y1,y2}的分类变量X和Y,其样 本频数列联表是:
关
3204 9234 4935 8200 3623 4869 6938 7481
A.08
B.07
C.02
D.01
热点分类突破
(2)某单位 200 名职工的年龄分布情况如图所示,现要从中抽
取 40 名职工作样本.用系统抽样法,将全体职工随机按 1~
200 编号,并按编号顺序平均分为 40 组(1~5 号,6~10 号,…,
=30,抽取的号码依次为9,39,69,…,
939.
本
讲 落入区间[451,750]的有459,489,…,729,这些数构成首项为
栏
目 459,公差为30的等差数列,
开
关 设有n项,显然有729=459+(n-1)×30,解得n=10.
所以做问卷B的有10人.
答案 C
热点分类突破
在系统抽样的过程中,要注意分段间隔,需要抽取
几个个体,样本就需要分成几个组,则分段间隔即为
N n
(N为
本 讲
样本容量),首先确定在第一组中抽取的个体的号码数,再从
栏 后面的每组中按规则抽取每个个体.解决此类题目的关键是
目
开 深刻理解各种抽样方法的特点和适用范围.但无论哪种抽样
关
方法,每一个个体被抽到的概率都是相等的,都等于样本容
量和总体容量的比值.
(单位:环),结果如下:
运动员 第1次 第2次 第3次 第4次 第5次
本
甲
87 91 90 89 93
讲 栏
乙
89 90 91 88 92
目 开
则成绩较为稳定(方差较小)的那位运动员成绩的方差为
关 ________.
解析 (1)由于频率分布直方图的组距为5,去掉C、D,又 [0,5),[5,10)两组各一人,去掉B,应选A.
本
y1
y2 总计
讲 栏
x1
a
b a+b
目 开
x2
c
d c+d
关
总计 a+c b+d n
则K2=
nad-bc2 a+bc+da+cb+d
(其中n=a+b+c+d为样
本容量).
热点分类突破
考点一 抽样方法
例1 (2012·山东)采用系统抽样方法从960人中抽取32人做问
本 讲
卷调查,为此将他们随机编号为1,2,…,960,分组后在
栏 目
第一组采用简单随机抽样的方法抽到的号码为9.抽到的32
开 关
人中,编号落入区间[1,450]的人做问卷A,编号落入区间
[451,750]的人做问卷B,其余的人做问卷C.则抽到的人中,
做问卷B的人数为
()
A.7
B.9
C.10
D.15
热点分类突破
解析 由系统抽样的特点知:
抽取号码的间隔为
960 32
例2 (1)(2013·四川)某学校随机抽取20个班,调查各班中有网
上购物经历的人数,所得数据的茎叶图如图所示,以组距
为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所
本 作的频率分布直方图是
讲 栏 目 开 关
()
热点分类突破
本 讲 栏 目 开 关
热点分类突破
(2)(2013·江苏)抽样统计甲、乙两位射击运动员的5次训练成绩
(2)由分组可知,抽号的间隔为5,又因为第5组抽出的号码为
本 讲
22,即第n组抽取的号码为5n-3,
栏 目
所以第8组抽出的号码为37;40岁以下年龄段的职工数为
开 关
200×0.5=100,
则应抽取的人数为24000×100=20人.
答案 (1)D
(2)37 20
热点分类突破
考点二 用样本估计总体
196~200 号).若第 5 组抽出的号码为 22,则第 8 组抽出的号
本 讲
码应是________.若用分层抽样方法,则 40 岁以下年龄段应
栏 目
抽取________人.
开
关
热点分类突破
解析 (1)从第1行第5列、第6列组成的数65开始由左到右依
次选出的数为:08,02,14,07,01,所以第5个个体编号为01.
主干知Hale Waihona Puke Baidu梳理
2.常用的统计图表
(1)频率分布直方图
频率
本
①小长方形的面积=组距×组距=频率;
讲 栏
②各小长方形的面积之和等于1;
目 开 关
③小长方形的高=频组率距,所有小长方形的高的和为组1距.
(2)茎叶图
在样本数据较少时,用茎叶图表示数据的效果较好.
主干知识梳理
3.用样本的数字特征估计总体的数字特征
(1)众数、中位数、平均数
数字特征
样本数据
频率分布直方图
取最高的小长方形底
众数 出现次数最多的数据
本
边中点的横坐标
讲 栏
将数据按大小依次排 把频率分布直方图划
目 开 关
列,处在最中间位置 分左右两个面积相等 中位数
的一个数据(或最中间 的分界线与x轴交点的
两个数据的平均数) 横坐标
平均数
样本数据的算术平均 数
每个小矩形的面积乘 以小矩形底边中点的 横坐标之和
主干知识梳理
(2)方差:s2=n1[(x1- x )2+(x2- x )2+…+(xn- x )2].
标准差:
本
s= n1[x1- x 2+x2- x 2+…+xn- x 2].
讲 4.变量的相关性与最小二乘法
栏
目
(1)相关关系的概念、正相关和负相关、相关系数.
热点分类突破
(1)(2013·江西)总体由编号为01,02,…,19,20的
20个个体组成,利用下面的随机数表选取5个个体,选取方法
本 是从随机数表第1行的第5列和第6列数字开始由左到右依次选
讲 栏
取两个数字,则选出来的第5个个体的编号为
()
目 开
7816 6572 0802 6314 0702 4369 9728 0198
(2) x 甲=15(87+91+90+89+93)=90,
热点分类突破
x 乙=15(89+90+91+88+92)=90,
s2甲=15[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]
1.随机抽样
(1)简单随机抽样特点为从总体中逐个抽取,适用范围:
本 讲
总体中的个体较少.
栏 目
(2)系统抽样特点是将总体均分成几部分,按事先确定的
开 关
规则在各部分中抽取,适用范围:总体中的个体数较多.
(3)分层抽样特点是将总体分成几层,分层进行抽取,适
用范围:总体由差异明显的几部分组成.
开
关
(2)最小二乘法:对于给定的一组样本数据(x1,y1),(x2,
n
y2),…,(xn,yn),通过求Q= (yi-a-bxi)2最小时,得
i=1
到线性回归方程y^=b^x+a^的方法叫做最小二乘法.
主干知识梳理
5.独立性检验
对于取值分别是{x1,x2}和{y1,y2}的分类变量X和Y,其样 本频数列联表是:
关
3204 9234 4935 8200 3623 4869 6938 7481
A.08
B.07
C.02
D.01
热点分类突破
(2)某单位 200 名职工的年龄分布情况如图所示,现要从中抽
取 40 名职工作样本.用系统抽样法,将全体职工随机按 1~
200 编号,并按编号顺序平均分为 40 组(1~5 号,6~10 号,…,
=30,抽取的号码依次为9,39,69,…,
939.
本
讲 落入区间[451,750]的有459,489,…,729,这些数构成首项为
栏
目 459,公差为30的等差数列,
开
关 设有n项,显然有729=459+(n-1)×30,解得n=10.
所以做问卷B的有10人.
答案 C
热点分类突破
在系统抽样的过程中,要注意分段间隔,需要抽取
几个个体,样本就需要分成几个组,则分段间隔即为
N n
(N为
本 讲
样本容量),首先确定在第一组中抽取的个体的号码数,再从
栏 后面的每组中按规则抽取每个个体.解决此类题目的关键是
目
开 深刻理解各种抽样方法的特点和适用范围.但无论哪种抽样
关
方法,每一个个体被抽到的概率都是相等的,都等于样本容
量和总体容量的比值.
(单位:环),结果如下:
运动员 第1次 第2次 第3次 第4次 第5次
本
甲
87 91 90 89 93
讲 栏
乙
89 90 91 88 92
目 开
则成绩较为稳定(方差较小)的那位运动员成绩的方差为
关 ________.
解析 (1)由于频率分布直方图的组距为5,去掉C、D,又 [0,5),[5,10)两组各一人,去掉B,应选A.
本
y1
y2 总计
讲 栏
x1
a
b a+b
目 开
x2
c
d c+d
关
总计 a+c b+d n
则K2=
nad-bc2 a+bc+da+cb+d
(其中n=a+b+c+d为样
本容量).
热点分类突破
考点一 抽样方法
例1 (2012·山东)采用系统抽样方法从960人中抽取32人做问
本 讲
卷调查,为此将他们随机编号为1,2,…,960,分组后在
栏 目
第一组采用简单随机抽样的方法抽到的号码为9.抽到的32
开 关
人中,编号落入区间[1,450]的人做问卷A,编号落入区间
[451,750]的人做问卷B,其余的人做问卷C.则抽到的人中,
做问卷B的人数为
()
A.7
B.9
C.10
D.15
热点分类突破
解析 由系统抽样的特点知:
抽取号码的间隔为
960 32
例2 (1)(2013·四川)某学校随机抽取20个班,调查各班中有网
上购物经历的人数,所得数据的茎叶图如图所示,以组距
为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所
本 作的频率分布直方图是
讲 栏 目 开 关
()
热点分类突破
本 讲 栏 目 开 关
热点分类突破
(2)(2013·江苏)抽样统计甲、乙两位射击运动员的5次训练成绩
(2)由分组可知,抽号的间隔为5,又因为第5组抽出的号码为
本 讲
22,即第n组抽取的号码为5n-3,
栏 目
所以第8组抽出的号码为37;40岁以下年龄段的职工数为
开 关
200×0.5=100,
则应抽取的人数为24000×100=20人.
答案 (1)D
(2)37 20
热点分类突破
考点二 用样本估计总体
196~200 号).若第 5 组抽出的号码为 22,则第 8 组抽出的号
本 讲
码应是________.若用分层抽样方法,则 40 岁以下年龄段应
栏 目
抽取________人.
开
关
热点分类突破
解析 (1)从第1行第5列、第6列组成的数65开始由左到右依
次选出的数为:08,02,14,07,01,所以第5个个体编号为01.
主干知Hale Waihona Puke Baidu梳理
2.常用的统计图表
(1)频率分布直方图
频率
本
①小长方形的面积=组距×组距=频率;
讲 栏
②各小长方形的面积之和等于1;
目 开 关
③小长方形的高=频组率距,所有小长方形的高的和为组1距.
(2)茎叶图
在样本数据较少时,用茎叶图表示数据的效果较好.
主干知识梳理
3.用样本的数字特征估计总体的数字特征
(1)众数、中位数、平均数
数字特征
样本数据
频率分布直方图
取最高的小长方形底
众数 出现次数最多的数据
本
边中点的横坐标
讲 栏
将数据按大小依次排 把频率分布直方图划
目 开 关
列,处在最中间位置 分左右两个面积相等 中位数
的一个数据(或最中间 的分界线与x轴交点的
两个数据的平均数) 横坐标
平均数
样本数据的算术平均 数
每个小矩形的面积乘 以小矩形底边中点的 横坐标之和
主干知识梳理
(2)方差:s2=n1[(x1- x )2+(x2- x )2+…+(xn- x )2].
标准差:
本
s= n1[x1- x 2+x2- x 2+…+xn- x 2].
讲 4.变量的相关性与最小二乘法
栏
目
(1)相关关系的概念、正相关和负相关、相关系数.
热点分类突破
(1)(2013·江西)总体由编号为01,02,…,19,20的
20个个体组成,利用下面的随机数表选取5个个体,选取方法
本 是从随机数表第1行的第5列和第6列数字开始由左到右依次选
讲 栏
取两个数字,则选出来的第5个个体的编号为
()
目 开
7816 6572 0802 6314 0702 4369 9728 0198
(2) x 甲=15(87+91+90+89+93)=90,
热点分类突破
x 乙=15(89+90+91+88+92)=90,
s2甲=15[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]