中级质量工程师理论与实务:统计整理
质量工程师《质量专业基础理论与实务(中级)》名师讲义(概率统计基础知识 下)【圣才出品】
确定分组后,统计每组的频数,即落在组中的数据个数 ni 以及频率 fi=ni/n,列出每 组的频数、频率表。
(5)作频数频率直方图。 在分组不完全等距的情形,在作频率直方图时,应当用每个组的频率与组距的比值 fi/hi 为高作为矩形,此时以每个矩形的面积表示频率。
2.直方图的观察与分析
3.数据变换可改变直方图的形状
三、统计量
1.统计量的概念
为了把样本中包含的零散的信息集中起来反映总体的特征,需要对样本进行加工,一种
有效的方法就是构造样本的函数,不含未知参数的样本函数就称为统计量。
2.描述样本集中位置的统计量
(1)样本均值
样本均值又称样本平均数,记为 x ,它是样本数据 x1,x2,…,xn 的算术平均数:
(2)根据数据个数,即样本量 n,决定分组数 k 和组距 h;
一批数据究竟分多少组,通常根据 n 的多少而定,不过这也不是绝对的,表 1-4 是可
以参考的分组数。
表 1-4 直方图分组组数选用表
样本量 n
推荐组数 k
50~100
6~10
101~250
7~12
250 以上
10~20
选择 k 的原则是要能显示出数据中所隐藏的规律,级数不能过多,但也不能太少。
二、频数(频率)直方图 1.直方图的作法 为研究一批产品的质量情况,需要研究它的某个质量特性 X 的变化规律。为此,从这 批产品(总体)中抽取一个样本(设样本量为 n),对每个样本产品进行该特性的测量(观 测)后得到一组样本观测值,记为 x1,x2,…,xn,这便是通常说的数据。 为了研究数据的变化规律,需要对数据进行一定的加工整理。直方图是为研究数据变化
每一组的区间长度,称为组距。组距可以相同也可以不同,而区间长度相同的情况用得
理论与实务(质量工程师中级)主要公式汇总
理论与实务(中级)主要公式汇总第一章 第二章 第三章 第四章 第五章 第六章第一章(返回首页)1、样本均值x :x =n1∑=ni 1x i2、样本中位数Me :x (21+n ),当n 为奇数Me=21[x (2n )+x (2n +1)],当n 为偶数 3、样本众数Mod :样本中出现频率最高的值。
4、样本极差R :R=X (max )-X (min ) 5、样本方差S 2:S 2=11-n ∑=ni 1(x i -x )2=11-n [∑=ni 1x 2i -n x 2 ]= 11-n [∑=ni 1x 2i -nXi n i 21⎪⎭⎫⎝⎛∑=]6、样本变异系数cv :cv=xs7、排列:P r n =n(n-1)…(n-r+1)8、组合:( n r )= P rn /r!=n!/r!(n-r)!9、不放回抽样P (Am ):共有N 个,不合格品M 个,抽n 个,恰有m 个不合格品的概率Am 。
(M n )(N-Mn-m )P (A m )= ,m=0,1,…,r(N n )10、放回抽样P (B m ):P (B m )=(nm )(N M )m (1-NM)n-m ,m=0,1,…,n 11、概率性质:11.1非负性:0≤P (A )≤1 11.2 :P (A )+ P (A )=1 11.3若A>B :P(A-B)= P (A )-P (B ) 11.4 P(A ∪B)= P (A )+P (B )-P (AB );若A 与B 互不相容,P (AB )=0 11.5对于多个互不相容事件:P(A 1∪A 2∪A 3)=P(A 1)+P(A 2)+P(A 3) 12、条件概率:P (A|B )P (A|B )=()()B P AB P ,(P (B )>0)13、随机变量分布的均值E (X )、方差Var (X )与标准差σ(X )∑ix i p i ,X 是离散分布13.1 E (X )=()⎰badx x xp ,X 是连续分布∑i[x i -E (X )]2p i ,X 是离散分布13.2 Var (X )=()()⎰-badx x p X E x 2][,X 是连续分布13.3σ=σ(X )=()X Var 14、常用分布 14.1二项分布:P (X=x )=(n x )P x (1-P )n-x,x=0,1,…,nE (X )=np ;Var (X )=np(1-p) 14.2泊松分布:P (X=x )=!x xλe λ-,x=0,1,2,…E (X )=λ;Var (X )=λ 14.3超几何分布:(M x )(N-Mn-x )P (X=x )= ,x=0,1,…,r(N n )E (X )=N nM ;Var (X )=()1--N n N n N M (1-NM)14.4正态分布: P (x )=σ∏21e()222_σμ-x ,-∞<x<∞ 常记为N (μ,σ2)14.5标准正态分布: P (x )=∏21e2_2x ,-∞<x<∞ 常记为N (0,1)另:P (u>a )=1-Φ(a);Φ(-a)=1-Φ(a);P(a ≤u ≤b)=Φ(b)-Φ(a)X ~N(μ,σ2),则U=σμ-X ~N(0,1)14.6均匀分布:ab -1,a<x<b p(x)=0,其他E (X )=(a+b )/2;Var (X )=()122a b -14.7对数正态分布: μx =E (X )=exp{μy +σ2y /2} σ2x =Var (X )=μ2x {exp(σ2y )-1} 14.8指数分布:λe x λ-, x ≥0 p(x)=0,x <0E (X )=1/λ;Var (X )=1/λ2 15、样本均值的分布:E (x )=μ,Var (x )=σ2/n16、方差未知时,正态均值的x 的分布—t 分布: 当σ已知时,nx /σμ-~N(0,1) 当σ未知时,ns x /μ-=()()∑---211X X n x n i μ,记为t(n-1)17、正态样本方差的s 2的分布—2χ的分布()221σs n -=()∑--ni iXX122σ~2χ(n-1)18、两个独立的正态样本方差之比的分布—F 分布2221s s =()()∑∑------m i i ni iY Y m XX n 12121111~F (n-1,m-1)19、一个正态总体均值、方差、标准差的1-α置信区间20、比例p 的置信区间x ±u 1-α/2()n x x /1-21、单个正态总体均值μ,方差σ2的检验22、有关比例p 的假设检验 u=()np p p x /1--近似服从N (0,1)第二章(返回首页)1、方差分析中的S T 、S A 、S e 、f T 、f A 、f e 、V A 、V e : S T =()211∑∑==-r i mj ij y y =∑∑==r i mj ijy 112n T 2-自由度:f T =n-1=rm-1S A=()∑=-ri i y y m 12=∑=-ri i n T m T 122 自由度:f A =r-1S e =S T -S A自由度:f e =f T -f A =r(m-1)V A =S A /f A ,V e =S e /f e ,F= V A /V e2、相关系数:r=yyxx xy L L L()()∑∑-=--=n T T y x y y x x L y x i i i i xy / ()∑∑-=-=n T x x x L x i xx /222()∑∑-=-=n Ty y y L yiyy/222其中T x =∑i x ,T y =∑i y 拒绝域为:W={|r|>()22/1--n r α} 3、一元线性回归方程:i i bx a y+=ˆ b=xx xy L L /,a=x b y -4、回归方程的显著性检验(方差分析):总离差平方和S T 、回归平方和S R 、残差平方和S E 及其自由度 S T =L yy ,S R =bL xy ,S E =S T -S R f T =n-1,f R =1,f E =f T -f R =n-2,F=EE RR f S f S // 5、利用回归方程进行预测:00ˆbx a y+=可以给出1-α的y 的预测区间(δ-0ˆy ,δ+0ˆy ) ()()xx L x x n n t //112ˆ202/1-++-⨯=-αδδ6、一般的正交表为L n (q p )n=q k ,k=2,3,4,…,p=(n-1)/(q-1)1、接收概率1.1超几何分布计算法:此公式用于有限总体计件抽检时。
质量工程师《质量专业基础理论与实务(中级)》名师讲义(概率统计基础知识 上)【圣才出品】
显然,对任一事件 A,有 A 。
(二)随机事件 随机现象的某些样本点组成的集合称为随机事件,简称事件,常用大写字母 A、B、C 等表示。 1.随机事件的特征 (1)任一事件 A 是相应样本空间Ω中的一个子集。常用维恩(Venn)图表示样本空间 与事件的关系,如图 1-l 所示。(长方形代表样本空间Ω,长方形中的一个圆(或其他几何 图形)代表事件 A)
图 1-2 B A
(2)互不相容 概念:在一个随机现象中有两个事件 A 与 B,若事件 A 与 B 没有相同的样本点,则称 事件 A 与 B 互不相容。这时事件 A 与 B 不可能同时发生,如图 1-3 所示。
4 / 39
圣才电子书 十万种考研考证电子书、题库视频学习平台
(3)相等 概念:在一个随机现象中有两个事件 A 与 B,若事件 A 与 B 含有相同的样本点,则称 事件 A 与 B 相等,记为 A=B。(两个相等事件用点的集合表述时应完全相同,但如用语言 表述则可能有不同的表述方式)
注意:如果两个事件相等,它们必互相包含,即若 A=B,则有 A B,B A;反之若
图 1-3 A 与 B 互不相容 两个事件间的互不相容性可能推广到三个或更多个事件间的互不相容。
【例题 1.1.3】设事件 A 与 B 互不相容,则下列说法中,正确的有( )。[2010 年 真题]
A.A 与 B 没有相同的样本点 B.A∪B=Ω C.AB=ø D.A 与 B 相互独立 E.A 与 B 不能同时发生 【答案】AE 【解析】在一个随机现象中有两个事件 A 与 B,若事件 A 与 B 没有相同的样本点,则 称事件 A 与 B 互不相容。则 A 与 B 的交集为空集,A 与 B 不能同时发生。
质量工程师中级-理论与实务-主要公式汇总
理论与实务(中级)主要公式汇总第一章 第二章 第三章 第四章 第五章 第六章第一章(返回首页)1、样本均值x :x =n1∑=ni 1x i2、样本中位数Me :x (21+n ),当n 为奇数Me=21[x (2n )+x (2n +1)],当n 为偶数3、样本众数Mod :样本中出现频率最高的值。
4、样本极差R :R=X (max )-X (min )5、样本方差S 2:S 2=11-n ∑=ni 1(x i -x )2=11-n [∑=ni 1x 2i -n x 2 ]= 11-n [∑=ni 1x 2i -nXi n i 21⎪⎭⎫⎝⎛∑=]6、样本变异系数cv :cv=xs7、排列:P r n =n(n-1)…(n-r+1)8、组合:( n r )= P rn /r!=n!/r!(n-r)!9、不放回抽样P (Am ):共有N 个,不合格品M 个,抽n 个,恰有m 个不合格品的概率Am 。
(M n )(N-Mn-m )P (A m )= ,m=0,1,…,r(N n )10、放回抽样P (B m ):P (B m )=(nm )(N M )m (1-NM)n-m ,m=0,1,…,n 11、概率性质:11.1非负性:0≤P (A )≤1 11.2 :P (A )+ P (A )=1 11.3若A>B :P(A-B)= P (A )-P (B ) 11.4 P(A ∪B)= P (A )+P (B )-P (AB );若A 与B 互不相容,P (AB )=0 11.5对于多个互不相容事件:P(A 1∪A 2∪A 3)=P(A 1)+P(A 2)+P(A 3) 12、条件概率:P (A|B )P (A|B )=()()B P AB P ,(P (B )>0)13、随机变量分布的均值E (X )、方差Var (X )与标准差σ(X )∑i x i p i ,X 是离散分布13.1 E (X )=()⎰b adx x xp ,X 是连续分布∑i [x i -E (X )]2p i ,X 是离散分布 13.2 Var (X )=()()⎰-badx x p X E x 2][,X 是连续分布13.3σ=σ(X )=()X Var 14、常用分布 14.1二项分布:P (X=x )=(n x )P x (1-P )n-x,x=0,1,…,nE (X )=np ;Var (X )=np(1-p) 14.2泊松分布:P (X=x )=!x x λe λ-,x=0,1,2,…E (X )=λ;Var (X )=λ 14.3超几何分布:(M x )(N-Mn-x )P (X=x )= ,x=0,1,…,r(N n )E (X )=N nM ;Var (X )=()1--N n N n N M (1-NM)14.4正态分布: P (x )=σ∏21e()222_σμ-x ,-∞<x<∞ 常记为N (μ,σ2)14.5标准正态分布: P (x )=∏21e2_2x ,-∞<x<∞ 常记为N (0,1)另:P (u>a )=1-Φ(a);Φ(-a)=1-Φ(a);P(a ≤u ≤b)=Φ(b)-Φ(a)X ~N(μ,σ2),则U=σμ-X ~N(0,1)14.6均匀分布:ab -1,a<x<b p(x)=0,其他E (X )=(a+b )/2;Var (X )=()122a b -14.7对数正态分布: μx =E (X )=exp{μy +σ2y /2} σ2x =Var (X )=μ2x {exp(σ2y )-1} 14.8指数分布:λe x λ-, x ≥0 p(x)=0,x <0E (X )=1/λ;Var (X )=1/λ2 15、样本均值的分布:E (x )=μ,Var (x )=σ2/n16、方差未知时,正态均值的x 的分布—t 分布: 当σ已知时,nx /σμ-~N(0,1) 当σ未知时,ns x /μ-=()()∑---211X X n x n i μ,记为t(n-1)17、正态样本方差的s 2的分布—2χ的分布()221σs n -=()∑--ni i X X 122σ~2χ(n-1)18、两个独立的正态样本方差之比的分布—F 分布2221s s =()()∑∑------m i i ni i Y Y m XX n 12121111~F (n-1,m-1) 19、一个正态总体均值、方差、标准差的1-α置信区间20、比例p 的置信区间±u 1-α/2()n x x /1-21、单个正态总体均值μ,方差σ2的检验22、有关比例p 的假设检验 u=()np p p x /1--近似服从N (0,1)第二章(返回首页)1、方差分析中的S T 、S A 、S e 、f T 、f A 、f e 、V A 、V e : S T =()211∑∑==-r i mj ij y y =∑∑==r i mj ijy 112n T 2-自由度:f T =n-1=rm-1S A=()∑=-ri i y y m 12=∑=-ri i n T mT 122 自由度:f A =r-1S e =S T -S A自由度:f e =f T -f A =r(m-1)V A =S A /f A ,V e =S e /f e ,F= V A /V e2、相关系数:r=yyxx xy L L L()()∑∑-=--=n T T y x y y x x L y x i i i i xy /()∑∑-=-=n T x x x L x ixx /222()∑∑-=-=n T yy y L y iyy/222其中T x =∑i x ,T y =∑i y 拒绝域为:W={|r|>()22/1--n r α} 3、一元线性回归方程:i i bx a y+=ˆ b=xx xy L L /,a=x b y -4、回归方程的显著性检验(方差分析):总离差平方和S T 、回归平方和S R 、残差平方和S E 及其自由度 S T =L yy ,S R =bL xy ,S E =S T -S R f T =n-1,f R =1,f E =f T -f R =n-2,F=EE RR f S f S // 5、利用回归方程进行预测:00ˆbx a y+=可以给出1-α的y 的预测区间(δ-0ˆy ,δ+0ˆy ) ()()xx L xx n n t //112ˆ202/1-++-⨯=-αδδ 6、一般的正交表为L n (q p )n=q k ,k=2,3,4,…,p=(n-1)/(q-1)1、接收概率1.1超几何分布计算法:此公式用于有限总体计件抽检时。
2023年质量工程师(中级)-质量专业理论与实务(中级)考试备考题库附带答案9
2023年质量工程师(中级)-质量专业理论与实务(中级)考试备考题库附带答案第1卷一.全考点押密题库(共50题)1.(单项选择题)(每题 1.00 分) 树图可用于()。
A. 提出详细的质量改进计划B. 明确管理职能C. 在质量改进活动实施过程中,随时对实施方案进行调整D. 认识新事物正确答案:B,2.(单项选择题)(每题 1.00 分) 选择抽样方案时,比较和分析方案的平均样本量ASN可以判断()。
A. 哪个方案的判别能力更强B. 哪个方案对企业来说更经济C. 企业的质量要求是否合理D. 平均出厂质量如何正确答案:B,3.(单项选择题)(每题 1.00 分) 为应付意外事件的发生提出的一种有助于使事态向理想方向发展的解决问题的方法称为( )。
A. 网络图法B. 亲和图法C. PDPC法D. 树图法正确答案:C,4.(多项选择题)(每题 2.00 分) 关于抽样检验中检验水平的说法,正确的有()。
A. 特殊水平抽样风险大B. -般水平Ⅲ所需的样本量大C. 检验水平的选择并不影响质量保证能力D. 一般水平Ⅲ的检验成本低E. 所有检验水平的判断能力相同正确答案:A,B,5.(单项选择题)(每题 1.00 分) 若检验是破坏性的,为减少平均样本量,更适宜选择()抽样方案。
A. 一次B. 二次C. 五次D. 序贯正确答案:D,6.(单项选择题)(每题 1.00 分) 在单因子方差分析中,因子A有3个水平,每个水平下各做4次重复试验,已算得因子A的平方和SA=42,总平方和ST = 69,则误差平方和Se = ( )。
A. 3B. 9C. 27D. 18正确答案:C,7.(不定项选择题)(每题 2.00 分) 某电子产品由4个部件组成,其中某个部件故障就会导致该产品故障,若假定故障的发生时间服从指数分布,并已知每个部件的故障率分别为:λ1 =0. 000 7/h,λ2 = 0.000 4/h, λs=0. 000 3/h, λ4 =0. 0001/h。
中级质量工程师理论与实务:统计指标
中级质量工程师理论与实务:统计指标一、总量指标1、总量指标的概念总量指标又称统计绝对数,它是反映社会经济现象发展的总规模、总水平的综合指标。
2、总量指标的种类(1)按其反映总体内容的不同,分为总体单位总量和总体标志总量,前者是总体内所有单位的总数,后者是总体中各单位标志值的总和。
总体单位是标志的直接承担者,标志总量不会独立于单位总量而存在。
在一个特定的总体内,只存在一个单位总量,而同时并存多个标志总量,构成一个总量指标体系。
同一总量指标在不同情况下可有不同的性质。
例如对各企业工人总数指标来说,当研究企业平均规模时,以企业为总体单位,企业总数为单位总量,各企业工人总数为标志总量;当研究企业劳动效益时,以工人为总体单位,各企业工人总数为单位总量,这时企业的总产量成为标志总量。
所以说总体单位总量和总体标志总量并不是固定不变的,二者随研究目的不同而变化。
(2)按其反映时间状况的不同,分为时期指标和时点指标。
时期指标是反映某种社会经济现象在一段时间发展变化结果的总量指标;时点指标是反映社会经济现象在某一时间(瞬间)状况上的总量指标。
(3)按其所采用计量单位的不同分为实物指标、价值指标和劳动量指标。
实物指标是以实物单位计量的统计指标;价值指标是以货币单位计量的统计指标;按实物单位计算的指标最大的特点是它直接反映产品的使用价值或现象的具体内容,能具体表明事物的规模和水平,但指标的综合性能较差,无法进行汇总。
按价值单位计量的最大优点是它具有最广泛的综合性和概括能力,可以表示现象的总规模和总水平,但它脱离了物质内容。
二者要结合应用。
劳动量指标是以劳动单位即工日、工时等劳动时间计量的统计指标。
3、总量指标的作用(1)总量指标是对社会经济现象总体认识的起点。
(2)总量指标是编制计划,实行经营管理的主要依据。
(3)总量指标是计算相对指标和平均指标的基础。
二、相对指标1、相对指标的概念和表现形式相对指标又称统计相对数。
它是两个有联系的现象数值的比率,用以反映现象的发展程度、结构、强度、普遍程度或比例关系。
质量工程师中级理论与实务笔记原创
第一章概率统计基础知识第一节概率基础知识全集:Ω、空集:Ф、交:∩、并:∪、差:-、相等:=、对立: 、包含:交换律:A∪B=B∪A A∩B=B∩A结合律:A∪(B∪C)=(A∪B)∪C A∩(B∩C)=(A∩B)∩C对偶律:A∪B=A∩B A∩B=A∪B分配律:A∪(B∩C)=(A∪B)∩(A∪C)A∩(B∪C)=(A∩B)∪(A∩C)古典定义:P(A)=K/n=A中含样本点的个数/Ω中样本点的总数排列、重复排列、组合统计定义:f n(A)=K n/n=事件A发生的次数/重复实验次数P(A︱B)=P(AB)/P(B)残骛楼諍锩瀨濟溆塹籟。
第二节随机变量及其分布第三节统计基础知识总体个体样本随机样本有序样本频数(频率)直方图第四节参数估计(一)点估计用样本估计总体无偏性:E(θ)=0;有效性:Var(θ)越小,越有效。
矩法估计:用样本矩去估计相应总体矩;用样本矩的函数去估计相应总体矩的函数。
(二)区间估计随机区间[θL,θU]是θ的置信水平1-α的置信区间。
第五节假设检验♣掌握假设检验的基本步骤:①建立假设-----原假设(H0)、备择假设:(H1)②选择检验统计量,给出拒绝域的形式-----检验统计量(u检验、t检验、X2检验)、拒绝域(W)③给出显著性水平α-----两类错误(α好的判坏、β坏的判好)、检验水平α、显著性④确定临界性C,给出拒绝域W⑤判断(二)总体参数的假设检验第二章常用统计技术第一节方差分析第二节回归分析第三节实验设计每列中每个数字重复次数相同;将任意两列的同行数字看成一个数对,一切可能数对重复次数相同正交表L n(q P),正交表的行数:n=q K,列数:P=(n-1)/(q-1),水平数:q正交表进行实验设计的步骤:①实验设计;②进行实验和记录实验结果;③数据分析;④验证实验直观分析法:寻找最好的的实验条件;各因子的对指标影响程度大小的分析;作因子的影响图。
方差分析法:①平方和分解;②F比;③计算;④最佳条件选择交互作用:不考虑单个因子,要分析交互的两因子,在不同搭配下的均值,选取最佳组合。
质量工程师《质量专业基础理论与实务(中级)》名师讲义(常用统计技术)【圣才出品】
A.在水平 Ai 下,指标服从正态分布 B.在不同水平下,方差σ2 不相等 C.在不同水平下,方差σ2 相等 D.数据 yij 相互不独立 E.数据 yij 相互独立 【答案】ACE 【解析】方差分析的基本假定包括:①在水平 Ai 下,指标服从正态分布;②在不同水 平下,方差σ2 相等;③数据 yij 相互独立。
使试验结果不同,可以用组间平方和表示,又称因子平方和:
r
SA m( yi y)2 i1
②由于存在随机误差,即使在同一水平下获得的数据间也有差异,这是除了因子 A 的
水平外的其他所有原因引起的,将它们归结为随机误差,可以用组内平方和表示,又称误差
平方和:
rm
Se
( yij yi )2
i1 j1
3.均方与 F 比 因子或误差平方和与相应的自由度之比,也即按自由度平均的平方和称为均方,并分别 记为:
MSA=SA/fA,MSe=Se/fe 当 MSA 与 MSe 相差不大时,认为因子 A 不显著;而当 MSA 相对于 MSe 大得多时,认 为 A 是显著的。这一比较可以用两者的比表示,称为 F 比,记为:
据的总平均,那么这 n 个数据的差异可以用总离差平方和 ST 表示:
rm
ST
( yij y)2
i1 j1
3 / 36
圣才电子书 十万种考研考证电子书、题库视频学习平台
(1)引起数据差异的原因
①由于因子 A 的水平不同,当假设 H0 不真时,各个水平下指标的均值不同,这必然会
水平 A1 A2 …
表 2-1 单因子试验数据表
理论与实务(中级)公式大全(质量工程师中级考试)
理论与实务(中级)主要公式汇总第一章1、样本均值x :x n1=∑=ni ix12、样本中位数Me :x (21+n ),当n 为奇数Me=21[x (2n )+x (2n +1)],当n 为偶数 3、样本众数Mod :样本中出现频率最高的值。
4、样本极差R :R=X (max )-X (min ) 5、样本方差S 2:S 2=11-n ∑=ni 1(x i -x )2=11-n [∑=ni 1x 2i -n x 2 ]= 11-n [∑=ni 1x 2i -nXi n i 21⎪⎭⎫⎝⎛∑=]6、样本变异系数cv :cv=xs7、排列:P r n =n(n-1)…(n-r+1)8、组合:( n r)= P rn /r!=n!/r!(n-r)! 9、不放回抽样P (Am ):共有N 个,不合格品M 个,抽n 个,恰有m 个不合格品的概率Am 。
(M n )(N-M n-m )P (A m )= ,m=0,1,…,r(N n )10、放回抽样P (B m ):P (B m )=(nm )(N M )m (1-NM)n-m ,m=0,1,…,n 11、概率性质:11.1非负性:0≤P (A )≤1 11.2 :P (A )+ P (A )=1 11.3若A>B :P(A-B)= P (A )-P (B ) 11.4 P(A ∪B)= P (A )+P (B )-P (AB );若A 与B 互不相容,P (AB )=0 11.5对于多个互不相容事件:P(A 1∪A 2∪A 3)=P(A 1)+P(A 2)+P(A 3) 12、条件概率:P (A|B )P (A|B )=()()B P AB P ,(P (B )>0)13、随机变量分布的均值E (X )、方差Var (X )与标准差σ(X )∑ix i p i ,X 是离散分布13.1 E (X )=()⎰badx x xp ,X 是连续分布∑i[x i -E (X )]2p i ,X 是离散分布13.2 Var (X )=()()⎰-badx x p X E x 2][,X 是连续分布13.3σ=σ(X )=()X Var 14、常用分布 14.1二项分布:P (X=x )=(n x )P x (1-P )n-x,x=0,1,…,nE (X )=np ;Var (X )=np(1-p) 14.2泊松分布:P (X=x )=!x xλe λ-,x=0,1,2,…E (X )=λ;Var (X )=λ 14.3超几何分布:(M x )(N-Mn-x )P (X=x )= ,x=0,1,…,r(N n )E (X )=N nM ;Var (X )=()1--N n N n N M (1-NM)14.4正态分布: P (x )=σ∏21e()222_σμ-x ,-∞<x<∞ 常记为N (μ,σ2)14.5标准正态分布: P (x )=∏21e2_2x ,-∞<x<∞ 常记为N (0,1)另:P (u>a )=1-Φ(a);Φ(-a)=1-Φ(a);P(a ≤u ≤b)=Φ(b)-Φ(a)X ~N(μ,σ2),则U=σμ-X ~N(0,1)14.6均匀分布:ab -1,a<x<b p(x)=0,其他 E (X )=(a+b )/2;Var (X )=()122a b -14.7对数正态分布: μx =E (X )=exp{μy +σ2y /2} σ2x =Var (X )=μ2x {exp(σ2y )-1} 14.8指数分布:λe x λ-, x ≥0 p(x)=0,x <0E (X )=1/λ;Var (X )=1/λ2 15、样本均值的分布: E (x )=μ,Var (x )=σ2/n16、方差未知时,正态均值的x 的分布—t 分布: 当σ已知时,nx /σμ-~N(0,1) 当σ未知时,ns x /μ-=()()∑---211X X n x n i μ,记为t(n-1)17、正态样本方差的s 2的分布—2χ的分布()221σs n -=()∑--ni iXX122σ~2χ(n-1)18、两个独立的正态样本方差之比的分布—F 分布2221s s =()()∑∑------m i i ni iY Y m XX n 12121111~F (n-1,m-1)19、一个正态总体均值、方差、标准差的1-α置信区间20、比例p 的置信区间±u 1-α/2()n x x /1-21、单个正态总体均值μ,方差σ2的检验22、有关比例p 的假设检验 u=()np p p x /1--近似服从N (0,1)第二章(返回首页)1、方差分析中的S T 、S A 、S e 、f T 、f A 、f e 、V A 、V e : S T =()211∑∑==-r i mj ij y y =∑∑==r i mj ijy 112n T 2-自由度:f T =n-1=rm-1S A=()∑=-ri i y y m 12=∑=-ri i n T m T 122 自由度:f A =r-1S e =S T -S A自由度:f e =f T -f A =r(m-1)V A =S A /f A ,V e =S e /f e ,F= V A /V e 2、相关系数:r=yyxx xy L L L()()∑∑-=--=n T T y x y y x x L y x i i i i xy / ()∑∑-=-=n Tx x x L x i xx /222()∑∑-=-=n Ty y y L yiyy/222其中T x =∑i x ,T y =∑i y 拒绝域为:W={|r|>()22/1--n r α} 3、一元线性回归方程:i i bx a y+=ˆ b=xx xy L L /,a=x b y -4、回归方程的显著性检验(方差分析):总离差平方和S T 、回归平方和S R 、残差平方和S E 及其自由度 S T =L yy ,S R =bL xy ,S E =S T -S R f T =n-1,f R =1,f E =f T -f R =n-2,F=EE RR f S f S // 5、利用回归方程进行预测:00ˆbx a y+=可以给出1-α的y 的预测区间(δ-0ˆy ,δ+0ˆy ) ()()xx L x x n n t //112ˆ202/1-++-⨯=-αδδ6、一般的正交表为L n (q p )n=q k ,k=2,3,4,…,p=(n-1)/(q-1)1、接收概率1.1超几何分布计算法:此公式用于有限总体计件抽检时。
中级质量工程师《理论与实务》考试大纲
中级质量工程师《理论与实务》考试大纲2015年中级质量工程师《理论与实务》考试大纲2015年注册质量工程师考试大纲暂未公布,考生可参考2014年注册质量工程师考试大纲。
以下为你提供2014年注册质量工程师考试大纲:2014年中级质量工程师《理论与实务》考试大纲第一章概率统计基础知识一、概率基础知识1.掌握随机现象与事件的概念2.熟悉事件的运算(对立事件、并、交及差)3.掌握概率是事件发生可能性大小的度量的概念4.熟悉概率的古典定义及其简单计算5.掌握概率的统计定义6.掌握概率的基本性质7.掌握事件的互不相容性和概率的加法法则8.掌握事件的独立性、条件概率和概率的乘法法则二、随机变量及其分布(一)随机变量及随机变量分布的概念1.熟悉随机变量的概念2.掌握随机变量的取值及随机变量分布的概念(二)离散随机变量的分布1.熟悉离散随机变量的概率函数(分布列)2.熟悉离散随机变量均值、方差和标准差的定义3.掌握二项分布、泊松分布及其均值、方差和标准差以及相关概率的计算4.了解超几何分布(三)连续随机变量的分布1.熟悉连续随机变量的分布密度函数2.熟悉连续随机变量均值、方差、标准差的定义3.掌握连续随机变量在某个区间内取值概率的计算方法4.掌握正态分布的定义及其均值、方差、标准差,标准正态分布的分位数5.熟悉标准正态分布表的用法6.了解均匀分布及其均值、方差与标准差7.熟悉指数分布及其均值、方差和标准差8.了解对数正态分布及其均值、方差和标准差9.熟悉中心极限定理,样本均值的(近似)分布三、统计基础知识1.掌握总体与样本的概念和表示方法2.熟悉频数(频率)直方图3.掌握统计量的概念4.掌握样本均值和样本中位数概念及其计算方法5.掌握样本极差、样本方差、样本标准差和样本变异系数概念及计算方法6.熟悉抽样分布概念7.熟悉t分布、分布和F分布的由来四、参数估计(一)点估计1.熟悉点估计的概念2.掌握矩法估计方法3.熟悉点估计优良性的标准4.熟悉二项分布、泊松分布、指数分布、正态分布参数的点估计(二)区间估计1.熟悉区间估计(包括置信水平、置信区间)的概念2.熟悉正态总体均值、方差和标准差的置信区间的求法3.了解比率p的置信区间(大样本场合)的求法五、假设检验(一)基本概念1.掌握原假设、备择假设、检验统计量、拒绝域、两类错误、检验水平及显著性的基本概念2.掌握假设检验的基本步骤(二)总体参数的假设检验1.掌握对正态总体均值的检验(总体方差已知或未知的情况)2.掌握对正态总体方差的检验3.熟悉比率p的检验(大样本场合)第二章常用统计技术一、方差分析(一)方差分析基本概念1.掌握因子、水平和方差分析的三项基本假定2.熟悉方差分析是在同方差假定下检验多个正态均值是否相等的统计方法(二)方差分析方法1.掌握单因子的方差分析方法(平方和分解、总平方和、因子平方和、误差平方和,自由由度、F比、显著性)2.了解重复数不等情况下的方差分析方法。
全国质量工程师考试实务考试大纲(中级)
第一章概率统计基础知识一、概率基础知识1.掌握随机现象与事件的概念2.熟悉事件的运算(对立事件、并、交及差)3.掌握概率是事件发生可能性大小的度量的概念4.熟悉概率的古典定义及其简单计算5.掌握概率的统计定义6.掌握概率的基本性质7.掌握事件的互不相容性和概率的加法法则8.掌握事件的独立性、条件概率和概率的乘法法则二、随机变量及其分布(一)随机变量及随机变量分布的概念1.熟悉随机变量的概念2.掌握随机变量的取值及随机变量分布的概念(二)离散随机变量的分布1.熟悉离散随机变量的概率函数(分布列)2.熟悉离散随机变量均值、方差和标准差的定义3.掌握二项分布、泊松分布及其均值、方差和标准差以及相关概率的计算4.了解超几何分布(三)连续随机变量的分布1.熟悉连续随机变量的分布密度函数2.熟悉连续随机变量均值、方差、标准差的定义3.掌握连续随机变量在某个区间内取值概率的计算方法4.掌握正态分布的定义及其均值、方差、标准差,标准正态分布的分位数5.熟悉标准正态分布表的用法6.了解均匀分布及其均值、方差与标准差7.熟悉指数分布及其均值、方差和标准差8.了解对数正态分布及其均值、方差和标准差9.熟悉中心极限定理,样本均值的(近似)分布三、统计基础知识1.掌握总体与样本的概念和表示方法2.熟悉频数(频率)直方图3.掌握统计量的概念4.掌握样本均值和样本中位数概念及其计算方法5.掌握样本极差、样本方差、样本标准差和样本变异系数概念及计算方法6.熟悉抽样分布概念7.熟悉t分布、分布和F分布的由来四、参数估计(一)点估计1.熟悉点估计的概念2.掌握矩法估计方法3.熟悉点估计优良性的标准4.熟悉二项分布、泊松分布、指数分布、正态分布参数的点估计(二)区间估计1.熟悉区间估计(包括置信水平、置信区间)的概念2.熟悉正态总体均值、方差和标准差的置信区间的求法3.了解比率p的置信区间(大样本场合)的求法五、假设检验(一)基本概念1.掌握原假设、备择假设、检验统计量、拒绝域、两类错误、检验水平及显著性的基本概念2.掌握假设检验的基本步骤(二)总体参数的假设检验1.掌握对正态总体均值的检验(总体方差已知或未知的情况)2.掌握对正态总体方差的检验3.熟悉比率p的检验(大样本场合)[NextPage]第二章常用统计技术一、方差分析(一)方差分析基本概念1.掌握因子、水平和方差分析的三项基本假定2.熟悉方差分析是在同方差假定下检验多个正态均值是否相等的统计方法(二)方差分析方法1.掌握单因子的方差分析方法(平方和分解、总平方和、因子平方和、误差平方和,自由由度、F比、显著性)2.了解重复数不等情况下的方差分析方法。
质量工程师《质量专业基础理论与实务(中级)》名师讲义(统计过程控制 上)【圣才出品】
质量工程师《质量专业基础理论与实务(中级)》名师讲义第四章统计过程控制上第一节统计过程控制概述一、过程控制的基本概念1.概念过程控制是指为实现产品生产过程质量而进行的有组织、有系统的过程管理活动。
其目的在于为生产合格产品创造有利的生产条件和环境,从根本上预防和减少不合格品的产生。
2.过程控制的主要内容(1)过程分析和控制标准;(2)过程监控和评价;(3)过程维护和改进。
二、统计过程控制1931年休哈特出版了他的代表作:《加工产品质量的经济控制(Economical Control of Quality of Manufactured Products)》,标志着统计过程控制时代的开始。
1.概念统计过程控制(Statistical Process Control,简称SPC)是应用统计技术对过程中的各个阶段进行评估和监控,建立并保持过程处于可接受的并且稳定的水平,从而保证产品与服务符合规定的要求的一种质量管理技术。
SPC是过程控制的一部分,其内容主要包括:(1)利用控制图分析过程的稳定性,对过程存在的异常因素进行预警;(2)计算过程能力指数分析稳定的过程能力满足技术要求的程度,对过程质量进行评价。
【例题4.1.1】统计过程控制主要包括()两个方面的内容。
[2008年真题]A.应用分析用控制图和控制用控制图B.利用控制图分析过程的稳定性和评价过程质量C.评价过程性能和评价过程能力D.判断过程是否处于技术控制状态和评价过程性能【答案】B【例题4.1.2】从SPC的角度看,一个合格的过程应当具备的条件是()。
[2006年真题]A.过程处于统计控制状态B.具有足够的生产能力C.过程处于统计控制状态并具有足够的过程能力D.过程处于统计控制状态但过程能力不足【答案】C2.发展近年来,随着科学技术的发展,无论是产品质量还是控制技术都有了很大突破,从产品质量上,产品的不合格率迅速降低;在控制技术上,生产控制方式由过去的3σ控制方式演进为6σ控制方式。
(中级)质量工程师考试理论与实务主要公式汇总
理论与实务(中级质量考试)主要公式汇总第一章1、样本均值x :x n1=∑=ni ix12、样本中位数Me :x (21+n ),当n 为奇数 Me=21[x (2n )+x (2n+1)],当n 为偶数 3、样本众数Mod :样本中出现频率最高的值。
4、样本极差R :R=X (max )-X (min )5、样本方差S2:S 2=11-n ∑=ni 1(x i -x )2=11-n [∑=n i 1x 2i -n x 2]= 11-n [∑=ni 1x 2i -nXi n i 21⎪⎭⎫⎝⎛∑=] 6、样本变异系数cv :cv=xs7、排列:P rn =n(n-1)…(n-r+1) 8、组合:( n r )= P rn /r!=n!/r!(n-r)!9、不放回抽样P (Am ):共有N 个,不合格品M 个,抽n 个,恰有m 个不合格品的概率Am 。
(M n )(N-Mn-m )P (A m )= ,m=0,1,…,r(Nn )10、放回抽样P (B m ):P (B m )=(nm )(NM )m (1-NM )n-m ,m=0,1,…,n11、概率性质:11.1非负性:0≤P (A )≤1 11.2 :P (A )+ P (A )=111.3若A>B :P(A-B)= P (A )-P (B ) 11.4 P(A ∪B)= P (A )+P (B )-P (AB );若A 与B 互不相容,P (AB )=0 11.5对于多个互不相容事件:P(A 1∪A 2∪A 3)=P(A 1)+P(A 2)+P(A 3) 12、条件概率:P (A|B )P (A|B )=()()B P AB P ,(P (B )>0) 13、随机变量分布的均值E (X )、方差Var (X )与标准差σ(X )∑ix i p i ,X 是离散分布13.1 E (X )=()⎰badx x xp ,X 是连续分布∑i[x i -E (X )]2p i ,X 是离散分布13.2 Var (X )=()()⎰-badx x p X E x 2][,X 是连续分布13.3σ=σ(X )=()X Var 14、常用分布 14.1二项分布:P (X=x )=(n x )P x (1-P )n-x,x=0,1,…,n E (X )=np ;Var (X )=np(1-p) 14.2泊松分布:P (X=x )=!x xλeλ-,x=0,1,2,…E (X )=λ;Var (X )=λ 14.3超几何分布:(M x )(N-Mn-x )P (X=x )= ,x=0,1,…,r(Nn )E (X )=N nM ;Var (X )=()1--N n N n NM (1-N M)14.4正态分布: P (x )=σ∏21e()222_σμ-x ,-∞<x<∞ 常记为N (μ,σ2)14.5标准正态分布: P (x )=∏21e2_2x ,-∞<x<∞ 常记为N (0,1)另:P (u>a )=1-Φ(a);Φ(-a)=1-Φ(a);P(a ≤u ≤b)=Φ(b)-Φ(a)X ~N(μ,σ2),则U=σμ-X ~N(0,1)14.6均匀分布:ab -1,a<x<b p(x)=0,其他E (X )=(a+b )/2;Var (X )=()122a b -14.7对数正态分布:μx =E (X )=exp{μy +σ2y /2} σ2x =Var (X )=μ2x {exp(σ2y )-1} 14.8指数分布:λexλ-, x ≥0p(x)=0,x<0E (X )=1/λ;Var (X )=1/λ215、样本均值的分布: E (x )=μ,Var (x )=σ2/n16、方差未知时,正态均值的x 的分布—t 分布: 当σ已知时,nx /σμ-~N(0,1)当σ未知时,ns x /μ-=()()∑---211X X n x n i μ,记为t(n-1)17、正态样本方差的s 2的分布—2χ的分布()221σsn -=()∑--ni iX X122σ~2χ(n-1)18、两个独立的正态样本方差之比的分布—F 分布2221s s =()()∑∑------mi i ni iY Y m X X n 12121111~F (n-1,m-1) 19、一个正态总体均值、方差、标准差的1-α置信区间 参数 条件 1-α置信区间μσ已知x ±u 1-α/2nσμσ未知x ±t 1-α/2(n-1)nsσ2μ未知[()()1122/12---n s n αχ,()()1122/2--n s n αχ] σ μ未知[()1122/1---n n s αχ,()1122/--n n s αχ]20、比例p 的置信区间x ±u 1-α/2()n x x /1-21、单个正态总体均值μ,方差σ2的检验 检验法 条件 H 0 H 1 检验统计量 拒绝域 u 检验σ已知μ≤μ0 μ≥μ0 μ=μ0μ>μ0 μ<μ0 μ≠μ0u=nx /σμ-{u>u 1-α} {u<u α} {|u|> u 1-α/2}t 检验 σ未知 μ≤μ0 μ≥μ0 μ=μ0μ>μ0 μ<μ0 μ≠μ0t=ns x /μ-{t>t 1-α(n-1)} {t<t α(n-1)} {|t|>t 1-α/2(n-1)}2χ检验 u 未知2σ≤20σ2σ≥20σ2σ=20σ2σ>20σ 2σ<20σ2σ≠20σ2χ=()2021σs n -{2χ>21αχ-(n-1)} {2χ<2αχ(n-1)}{2χ<22/αχ(n-1)}或 {2χ>22/1αχ-(n-1)}22、有关比例p 的假设检验 u=()np p p x /1--近似服从N (0,1)第二章1、方差分析中的S T 、S A 、S e 、f T 、f A 、f e 、V A 、V e : S T =()211∑∑==-r i mj ij y y =∑∑==r i mj ijy 112n T 2- 自由度:f T =n-1=rm-1S A=()∑=-ri i y y m 12=∑=-ri i n T m T 122自由度:f A =r-1S e =S T -S A自由度:f e =f T -f A =r(m-1)V A =S A /f A ,V e =S e /f e ,F= V A /V e 2、相关系数:r=yyxx xy L L L()()∑∑-=--=n T T y x y y x x L y x i i i i xy / ()∑∑-=-=n T x x x L x i xx /222()∑∑-=-=n Ty y y L yiyy/222其中T x =∑ix ,T y=∑iy拒绝域为:W={|r|>()22/1--n r α} 3、一元线性回归方程:i i bx a y+=ˆ b=xx xy L L /,a=x b y -4、回归方程的显著性检验(方差分析):总离差平方和S T 、回归平方和S R 、残差平方和S E 及其自由度 S T =L yy ,S R =bL xy ,S E =S T -S Rf T =n-1,f R =1,f E =f T -f R =n-2,F=EE RR f S f S //5、利用回归方程进行预测:00ˆbx a y+=可以给出1-α的y 的预测区间(δ-0ˆy ,δ+0ˆy ) ()()xx L x x n n t //112ˆ202/1-++-⨯=-αδδ6、一般的正交表为L n (q p)n=q k,k=2,3,4,…,p=(n-1)/(q-1) 第三章1、接收概率1.1超几何分布计算法:此公式用于有限总体计件抽检时。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中级质量工程师理论与实务:统计整理一、统计整理的概念和内容1、统计整理根据统计研究的任务与要求,对统计调查所搜集到的原始资料进行分组、汇总,使其条理化、系统化的工作过程称统计整理。
统计整理包括对原始资料和次级资料的整理。
统计整理是统计调查的继续,是统计分析的前提和基础,在整个统计工作中发挥着承上启下的作用。
2、统计整理的意义通过统计调查所取得的总体各单位的资料是零星的,分散的,只能说明总体单位的情况,而不能反映总体特征。
统计整理对调查资料进行科学加工,使之系统化,成为说明总体特征的综合资料,实现了由反映总体单位特征的标志向反映总体综合数量特征的统计指标的转化,是从对社会经济现象个体量的观察到对社会经济现象总体量的认识的连接点,是人们对社会经济现象从感性认识到理性认识的过渡阶段。
统计整理在整个统计工作中发挥着承上启下的作用。
3、统计整理的方法统计整理的方法是分组、汇总和编表。
分组是根据研究任务的要求,对调查所得的原始资料,确定哪些分组或分类。
统计分组是统计整理的关键。
汇总是在统计分组的基础上,把总体单位各种标志的标志值汇总起来,汇总主要有手工汇总和电子计算机汇总。
编表是把汇总的资料按一定的规则在表格上表现出来。
4、统计整理的内容和步骤①确定应整理的指标和确定应分的组;②对各项指标进行汇总,确定各组和总体的单位数和标志总量;③用统计表现分组、汇总的结果。
二、统计分组1、统计分组的意义根据统计研究任务的要求和研究现象总体的内在特点,把现象总体按某一标志划分为若干性质不同但又有联系的几个部分称统计分组。
总体的变异性是统计分组的客观依据。
统计分组是总体内进行的一种定性分类,它把总体划分为一个个性质不同的范围更小的总体。
2、统计分组的种类①统计分组按其任务和作用不同,分为类型分组、结构分组和分析分组。
类型分组的目的是划分经济类型,结构分类的目的是研究同质总体的构成,分析分组的目的是研究现象总体内部诸标志间的依从和制约关系。
②统计分组按分组标志的多少分为简单分组和复合分组。
简单分组是将总体按一个标志进行分组,复合分组是将总体按两个或两个以上的标志重叠起来进行分组。
③统计分组按分组标志的性质分为品质分组和变量分组。
品质分组是将总体按品质标志进行分组,如企业按经济成份、地理位置分组,职工按性别、文化程度分组等;变量分组是将总体按数量标志进行分组,如企业按职工人数、劳动生产率分组,职工按工龄、工资分组等。
3、分组体系与分组标志的选择①分组体系统计分组后所形成的一系列互相联系、互相补充的组的整体称分组体系。
分组体系有平行分组体系和复合分组体系两种。
平行分组体系是选择两个或两个以上的标志对总体进行一次次简单分组后所形成的体系;复合分组体系就是复合分组后形成的体系。
②分组标志的选择分组标志的选择是统计分组的关键。
分组标志,即将同质总体区分为不同组的标准或依据。
分组标志一旦选定,就必然突出了总体在该标志下的性质差别,其他的差别看不见了。
分组标志选择不当,不但无法显示现象的根本特征,甚至会混淆事物的性质,歪曲社会经济的真实情况。
正确选择分组标志,必须根据统计研究的任务目的,抓住反映现象本质区别和内在联系的标志作为分组标志。
4、统计分组的方法品质标志分组方法品质标志分组一般较简单,分组标志一旦确定,组数、组名、组与组之间的界限也就确定。
有些复杂的品质标志分组可根据统一规定的划分标准和分类目录进行。
数量标志分组方法按数量标志分组的目的并不是单纯确定各组在数量上的差别,而是要通过数量上的变化来区分各组的不同类型和性质。
数量标志分组方法从以下几个方面来说明:①单项式分组和组距式分组对离散变量,如果变量值的变动幅度小,就可以一个变量值对应一组,称单项式分组。
如居民家庭按儿童数或人口数分组,均可采用单项式分组。
离散变量如果变量值的变动幅度很大,变量值的个数很多,则把整个变量值依次划分为几个区间,各个变量值则按其大小确定所归并的区间,区间的距离称为组距,这样的分组称为组距式分组。
也就是说,离散变量根据情况既可用单项式分组,也可用组距式分组。
在组距式分组中,相邻组既可以有确定的上下限,也可将相邻组的组限重叠。
连续变量由于不能一一列举其变量值,只能采用组距式的分组方式,且相邻的组限必须重叠。
如以总产值、商品销售额、劳动生产率、工资等为标志进行分组,就只能是相邻组限重叠的组距式分组。
在相邻组组限重叠的组距式分组中,若某单位的标志值正好等于相邻两组的上下限的数值时,一般把此值归并到作为下限的那一组(适用于连续变量和离散变量)。
组距式分组使资料的真实性受到一定程度的损害。
组距式分组的假定条件是:变量在各组内的分布都是均匀的(即各组标志值呈线性变化)。
通过组距式分组以后,把各组内部各单位的次要差异抽象去了,而把各组之间的主要差异突出出来,这样,各组分配的规律性可以更容易显示出来。
根据这个道理,如组距太小,分组过细,容易将属于同类的单位划分到不同的组,因而显示不出现象类型的特点;但如果组距太大,组数太少,会把不同性质的单位归并到同一组中,失去区分事物的界限,达不到正确反映客观事实的目的。
因此,组距的大小、组数的确定应根据研究对象的经济内容和标志值的分散程度等因素,不可强求一致。
②等距分组和不等距分组等距分组是各组保持相等的组距,也就是说各组标志值的变动都限于相同的范围。
不等距分组即各组组距不相等的分组。
统计分组时采用等距分组还是不等距分组,取决于研究对象的性质特点。
在标志值变动比较均匀的情况下宜采用等距分组。
等距分组便于各组单位数和标志值直接比较,也便于计算各项综合指标。
在标志值变动很不均匀的情况下宜采用不等距分组。
不等距分组有时更能说明现象的本质特征。
③组限和组中值组距两端的数值称组限。
其中,每组的起点数值称为下限,每组的终点数值称为上限。
上限和下限的差称组距,表示各组标志值变动的范围。
组中值是上下限之间的中点数值,以代表各组标志值的一般水平。
组中值并不是各组标志值的平均数,各组标志数的平均数在统计分组后很难计算出来,就常以组中值近似代替。
组中值仅存在于组距式分组数列中,单项式分组中不存在组中值。
组中值的计算是有假定条件的,即假定各组标志值的变化是均匀的(与组距式分组的假定条件相同)。
一般情况下,组中值=(上限+下限)÷2对于第一组是“多少以下”,最后一组是“多少以上”的开口组,组中值的计算可参照邻组的组距来决定。
即:缺下限开口组组中值=上限-1/2邻组组距,缺上限开口组组中值=下限+1/2邻组组距。
三、统计分布(分配数列)1、分配数列的概念、构成要素在统计分组的基础上,列出各组对应的单位数,形成总体单位数在各个组的分布,称统计分布,又称分配数列或次数分布。
分配数列包括两个要素:总体按某标志所分的组和各组对应的单位数(频数)2、分配数列的类型分配数列包括品质分配数列和变量分配数列,分别由品质标志分组和数量标志分组形成。
变量数列又有单项式数列和组距式数列,分别由单项式分组和组距式分组形成。
3、频数和频率统计分组后各组对应的单位数称频数,也叫次数;各组单位数占总体单位总数的比重称频率。
各组的频率大于0,所有组的频率总和等于1。
在变量分配数列中,频数(频率)表明对应组标志值的作用程度。
频数(频率)数值越大表明该组标志值对于总体水平所起的作用也越大,反之,频数(频率)数值越小,表明该组标志值对于总体水平所起的作用越小。
组距数列中,影响各组次数分布的要素是组数、组距、组限和组中值。
有时为了更简便地概括总体各单位的分布特征,还需要编制累计频数数列和累计频率数列。
累计有向上累计和向下累计的方法。
向上累计是指将各组频数和频率由变量值低的组向变量值高的组累计,表明在这些数值以下所有数值所占的比重;向下累计是指将各组频数和频率由变量值高的组向变量值低的组累计,表明在这些数值以上所有数值所占的比重。
4、次数分布特征现象总体的性质不同,其次数分布也不同。
归纳起来主要有四种类型:①钟型分布。
特征是“两头大,中间小”,即靠近中间的变量值分布的次数多,靠近两边的变量分布次数少,形若古钟。
②U型分布。
其特征与钟型分布正相反,靠近中间的变量值分布的次数少,靠近两端的变量值分布次数多,形成“两头大,中间小”的U字型分布。
如人口死亡现象按年龄分布便是如此。
③J型分布。
在社会经济现象中,一些统计总体分布曲线呈J型。
④洛伦兹分布。
洛伦兹曲线专门用以检定社会收入分配的平等程度。
洛伦兹曲线拓展可运用于其他社会经济现象,研究总体各单位标志分布集中状况或平均性。
洛伦兹曲线又称集中曲线,其运作的条件是:现象总体各组频率与相应的各组标志总量的比重。
5、变量分配数列编制的步骤①将原始资料按其数值大小重新排列只有把得到的原始资料按其数值大小重新排列顺序,才能看出变量分布的集中趋势和特点,为确定全距、组距和组数作准备。
②确定全距全距是变量值中最大值和最小值的差数。
确定全距,主要是确定变量值的变动范围和变动幅度。
如果是变动幅度不大的离散变量,即可编制单项式变量数列,如果是变量幅度较大的离散变量或者是连续变量,就要编制组距式变量数列。
③确定组距和组数前面已经介绍过组距数列有等距和不等距之分,应视研究对象的特点和研究目的而定。
组距的大小和组数的多少,是互为条件和互相制约的。
当全距一定时,组距大,组数就少;组距小,组数就多。
在实际应用中,组距应是整数,最好是5或10的整倍数。
在确定组距时,必须考虑原始资料的分布状况和集中程度,注意组距的同质性,尤其是对带有根本性的质量界限,绝不能混淆,否则就失去分组的意义。
在等距分组条件下,存在以下关系:组数=全距/组距④确定组限组限要根据变量的性质来确定。
如果变量值相对集中,无特大或特小的极端数值时,则采用闭口式,使最小组和最大组也都有下限和上限;反之,如果变量值相对比较分散,则采用开口式,使最小组只有上限(用“××以下”表示),最大组只有下限(用“××以上”表示)。
如果是离散型变量,可根据具体情况采用不重叠组限或重叠组限的表示方法,而连续型变量则只能用重叠组限来表示。
在采用闭口式时,应做到最小组的下限低于最小变量值,最大组的上限高于最大变量值,但不要过于悬殊。
⑤编制变量数列经过统计分组,明确了全距、组距、组数和组限及组限表示方法以后,就可以把变量值归类排列,最后把各组单位数经综合后填入相应的各组次数栏中。
四、统计表1、统计表的概念、构成统计表是纵横交叉的线条所绘制表现统计资料的一种表格形式。
广义统计表包括统计工作各阶段所使用的一切表格。
从形式上看,统计表是由总标题,横行标题、纵栏标题和指标数值四部分组成;从内容上看,统计表是由主词和宾词两部分构成。
主词是统计表要说明的总体或总体分成的多个组,宾词是说明主词的统计指标。