分位数(quantile)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分位数(quantile)
------------------------------------------------------------------------------------------------------
四分位数(Quartile),即统计学中,把所有数值由⼩到⼤排列并分成四等份,处于三个分割点位置的得分就是四分位数。
第⼀四分位数 (Q1),⼜称“较⼩四分位数”,等于该样本中所有数值由⼩到⼤排列后第25%的数字。
第⼆四分位数 (Q2),⼜称“中位数”,等于该样本中所有数值由⼩到⼤排列后第50%的数字。
第三四分位数 (Q3),⼜称“较⼤四分位数”,等于该样本中所有数值由⼩到⼤排列后第75%的数字。
第三四分位数与第⼀四分位数的差距⼜称四分位距(InterQuartile Range,IQR)。
⾸先确定四分位数的位置:
Q1的位置= (n+1) × 0.25
Q2的位置= (n+1) × 0.5
Q3的位置= (n+1) × 0.75
n表⽰项数
对于四分位数的确定,有不同的⽅法,另外⼀种⽅法基于N-1 基础。
即
Q1的位置=(n-1)x 0.25
Q2的位置=(n-1)x 0.5
Q3的位置=(n-1)x 0.75
Excel 中有两个四分位数的函数。
QUARTILE.EXC 和QUARTILE.INC
QUATILE.EXC 基于 N+1 的⽅法,QUARTILE.INC基于N-1的⽅法。
实例1
数据总量: 6, 47, 49, 15, 42, 41, 7, 39, 43, 40, 36
由⼩到⼤排列的结果: 6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49
⼀共11项
Q1 的位置=(11+1) × 0.25=3, Q2 的位置=(11+1)× 0.5=6, Q3的位置=(11+1) × 0.75=9
Q1 = 15,
Q2 = 40,
Q3 = 43
实例2
数据总量: 7, 15, 36, 39, 40, 41
⼀共6项
Q1 的位置=(6+1)× 0.25=1.75, Q2 的位置=(6+1) × 0.5=3.5, Q3的位置=(6+1) × 0.75=5.25
Q1 = 7+(15-7)×(1.75-1)= 13,
Q2 = 36+(39-36)×(3.5-3)= 37.5,
Q3 = 40+(41-40)×(5.25-5)= 40.25
1、将数据从⼩到⼤排序,计为数组a(1 to n),n代表数据的长度
2、确定四分位数的位置:b= 1+(n-1) × 0.25= 2.25,b的整数部分计为c b的⼩数部分计为d
计算Q1:Q1=a(c)+[a(c+1)-a(c)]*d=a(1)+[a(2)-a(1)] *0.25 =15+(36-15)×(2.25-2)=20.25
3、计算如上 Q2与Q3的求法类似,四分位差=Q3-Q1
R语⾔举例
> x=c(6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49) > quantile(x,.25)。