统计学重点总结
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 条形图使用条形的长度表示各类别频数的多少,宽度是固定 ○ 的;直方图是用面积表示各类别频数的多少,矩形的高表示每 一组的频数或频率,宽度则表示各组的组距,因此其高度和宽 度都有意义 2 分组数据具有连续性,直方图的各举行通常是连续排列,条 ○ 形图是分开排列, 3 条形图用于展示数据,直方图用于展示数学值型数据 ○
也称随机抽样,是指遵循随机原则进行的抽样,总体中的每个 单位都有一定的机会被选入样本 10、 抽样误差 抽样误差是由于抽样的随机性引起的样本结果与总体真值之间 的误差。 11、 抽样框 抽样框是有关总体单位的名录 12、 控制回答误差 搞好问卷设计,调查过程的质量控制(ps:未能找到正确的方 法,希望大家自己找寻) 13、 数据的预处理 1 数据审核 ○ 2 数据筛选 ○ 3 数据排序 ○ 4 数据透视表 ○ 14、 频数 频数是落在某一特定类别或组里的数据个数 15、 比例 比例是一个样本(或总体)中各个部分的数据与全部数据之比 16、 比率 比率是样本(或总体)各不同类别数值之间的比值 17、 条形图与直方图的区别:
xe xe x! x! x n x C C 27.超几何分布 p ( x ) r n N r , 0 x r CN
25.泊松分布 p ( x ) 28.正态概率密度函数 f ( x ) 29.标准正态分布变换 Z
1 e 2
x 2
41.独 立 样 本 时 , 两 个 总 体 均 值 之 差 的 点 估 计 量 : X 1 X 2 X 1 X 2的 期 望 值 与 标 准 差 : E ( X 1 X 2 ) 1 2 ,
X
1
X2
12 22 n1 n2
42.两个总体均值之差的区间估计 :
X
2
n
X
i 1
i
2
n
i 1
2
,
L
X Y
i 1 n
n
X
i
X
Y
2
i
Y
i 2
n
X
n
i 1
i
Y
i 2
n
X
i 1
i
n
n
Y
i 1
i
,
L
Y Y
Y
i 1
准 本 尔
分 协 逊
数 方 相
( Z 分 差 关
数
)
Z
i
X
i
S
X Y X Y
X
, 或
Z
i
i
X X ,
Y Y
i
C o v ( X ,Y ) 系 数 rX
Y
S S
L L X n
i
X
X Y
Y
i
Y
n 1 L
S
X
S
Y
X X
L
X X
i 1
n
X
i
38.小 样 本 总 体 均 值 的 检 验 统 计 量 : t 39.总 体 比 率 检 验 统 计 量 : Z
p p0 p 0 (1 p 0 ) n
40.总 体 均 值 的 单 侧 检 验 中 所 需 样 本 容 量 :
Z n
Z
2
2
2
0 1
, 用 Z 2代 替 Z即 为 双 侧 检 验 的 公 式
n S n
, ,
n 31.比例P的数学期望和标准差 : E ( p ) p,
有限总体时 P
(3)总体正态, 小样本, 方差已知X Z 2
n
,
N n N 1 p(1 p) n
p(1 p) S (4)总体正态, 小样本, 方差未知X t 2 n n
45.两 个 总 体 比 率 之 差 的 区 间 估 计 : 大 样 本 n1 p1 , n1 (1 p1 ), n 2 p 2 , n 2 (1 p 2 ) 5时 , p1 p 2 Z S p 1 p2
2
46.两 个 总 体 比 率 之 差 的 检 验 统 计 量 : p1 p 2 p1 p 2 Z n1 p1 n 2 p 2 总体比率合并估计 : p n1 n 2
i
Y
n
Y
i
n
Y
Y n
i 1
i
,
i 1
X
n
X n
i 1
i
,Y
i 1
n
1 0 .加 权 平 均 数
X
W X W
i i
i
1 1 .分 组 数 据 样 本 平 均 数
X
F X F
i i
i
1 2 .分 组 数 据 样 本 方 差 1 3 .排 列 组 合 公 式 n ! n n 1 m ! n ! 1 2 n , P nm C C
异众比率是指非众数组的频数占总频数的比例 24、 离散系数 离散系数是一组数据的标准差与平均数之比 25、 抽样分布 (定义)在总体 X 的分布类型已知时,若对任意自然数 n,都 能导出统计量 T=T(X1,X2,…Xn)的分布的数学表达式, 这种分布 称为精确地抽样分布 26、 总体分布 总体中各元素的观测值所形成的相对频数分布是总体分布 27、 样本分布 从总体中抽取一个容量为 n 的样本,由这 n 个观测值形成的相 对频数分布,称为样本分布 28、 抽样分布 在重复选取样本量为 n 的样本时,由该样本统计量的所有可能 取值形成的相对频数分布,称为抽样分布 29、 相关关系 变量之间存在的不确定的数量关系,称为相关关系 30、 相关系数 相关系数是根据样本数据计算的度量两个变量之间线性关系强 度的统计量。若为总体的,称为总体相关系数;若为样本的, 则称为样本相关系数,记为
X
n
S2 100%
X
i
i
2
(2 ) 样 本 方 差 :S 2
X
N
标准差 总 体 : CV 100% 平均数 S 样 本 : CV 100% X
n 1
7 .标 8 .样 9 .皮
无限总体时
P
34.估计时所需的样本容量 : n
2 2 Z 2
2
p (1 p ) 2 n 2 Z 2 p (1 p ) 36. p的 区 间 估 计 时 所 需 的 样 本 容 量 n 2 37.大 样 本 总 体 均 值 的 检 验 统 计 量 : 35.总 体 比 率 P的 区 间 估 计 p Z 方差已知 : Z 方差未知 : Z X , / n X S/ n X , df n 1 S/ n
m n m n
S
2
F
i
X
i
X
2
n 1 n m 1
n 2
,
P nm m !
n m n
m !
n ! n m
!
,
C
14.事 件 补 的 概 率 P ( A ) 1 P ( A ) 15.加 法 公 式 P(A B) P(A) P(B)-P(A B) P(A B) P(A B) 16.条 件 概 率 P(A|B) , P(B|A) P(B) P ( A) 17.乘 法 公 式 P(A B) P ( B ) P(A|B) P ( A ) P(B|A) 18.独 立 事 件 P(A B) P ( A ) P ( B ) 19.全 概 率 公 式 P(B)
X
1
1
X 2 1 2
(2 )小 样 本 t
X
12 22 n1 n2
X 2 1 2 1 2 1 Sp n1 n 2 d d Sd n
,
,
(3) 相 关 样 本 t
4 4 .两 个 比 率 之 差 的 点 估 计 量 : p1 p 2 p1 p 2的 期 望 值 与 标 准 差 E p1 p 2 p1 p 2 p1 (1 p1 ) p 2 (1 p 2 ) p1 (1 p1 ) p 2 (1 p 2 ) p 1 p2 n1 n2 n1 n2 p1 (1 p1 ) p 2 (1 p 2 ) 的点估计量 : S p 1 p2 p1 p 2 n1 n2
的点估计量 : S p1 p 2时 p p1 p 2 1 p2 p p
X
(1)大样本( n1 , n2 30), 1 , 2已知
1
X 2 Z 2
X1 X 2
1 2
X X 的点估计量为 : S X X
1 2
(2)大样本, 1 , 2未知
2 1 2 2
X
1
X 2 Z 2 S
2 S12 S 2 n1 n2
另附重要公式:
统计学重要公式
1. 样 本 平 均 数 : X 2 . 总 体 平 均 数 : 4 .方 差 : (1) 总 体 方 差 :
2
X
5.标 准 差 : (1) 总 体 标 准 差 : 2 (2) 样 本 标 准 差 :S 6.变 异 系 数
2
N 3 . 四 分 位 差 :Q D IQ R Q U Q L
2 2
x
30. X的数学期望和标准差 : E( X ) , 有限总体时 X 无限总体时 X N n N 1 n
32.估计时的抽样误差 : X 33.总体均值的区间估计 (1)大样本且方差已知 : X Z 2 (2)大样本且方差未知 : X Z 2
P ( A ) P(B|A
i 1 i
n
i
)
n
Байду номын сангаас
20.贝 叶 斯 公 式 P(A i |B)
P ( Ai ) P(B|A i ) P(B)
P ( Ai ) P(B|A i )
j
P( A
j 1 2
) P(B|A j )
21.离散型随机变量的数学期望 E ( X ) xp ( x ) 22.离散型随机变量的方差 Var ( X ) 2 x p ( x ) 23.二项分布的概率函数 p ( x ) C nx p x q n x , x 0,1, 2,..., n , q 1 p 24.二项分布的数学期望和方差 E ( X ) np , Var ( X ) 2 np (1 p )
统计学知识总结
1、 统计学 统计学是收集、处理、分析、解释数据并从数据中得出结论的 科学。 2、 统计数据 分类数据、顺序数据、数值型数据 3、 总体 总体是包含所研究的全部个体(数据)的集合。 4、 样本 样本是从总体中抽取的一部分元素的集合 5、 样本量 样本量构成样本的元素的数目 6、 参数 参数是用来描述总体特征的概括性数字度量 7、 统计量 统计量是用来描述样本特征的概括性数字特征 8、 变量 说明现象某种特征的概念 1 分类变量:说明事物类别的一个名称 ○ 2 顺序变量:说明事物有序类别的一个名称 ○ 3 数值型变量:说明事物数字特征的一个名称 ○ 9、 概率抽样
最小值 下四分位数 中位数 上四分位数 最大值
18、 箱线图
19、 众数 众数是一组数据中出现次数最多的变量值,用 M0 表示
20、 中位数 中位数是一组数据排序后处于中间位置上的变量值 21、 四分位数 四分位数是数据排序后处于 25%和 75%位置上的数 22、平均数 平均数是一组数据相加后除以数据个数得到的结果 1 简单平均数 ○ 2 加权平均数 ○ 3 几何平均数:G= ○ 23、 异众比率
X1 X 2
时, X 1 X 2 的标准差 X X
1
2
2 12 2 1 1 2( ) n1 n2 n1 n2
X
(3)小样本, 正态
1
X 2 t 2 S
X1 X 2
4 3 .两 个 总 体 均 值 之 差 的 假 设 检 验 统 计 量 (1) 大 样 本 Z