常用统计方法:T检验、F检验、卡方检验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
常用统计方法:T检验、F检验、卡方检验
介绍常用的几种统计分析方法:T检验、F检验、卡方检验
一、T检验
(一)什么是T检验
T检验是一种适合小样本的统计分析方法,通过比较不同数据的均值,研究两组数据是否存在差异。主要用于样本含量较小(例如n < 30),总体标准差σ未知的正态分布。
(二)T检验有什么用
1.单样本T检验用于比较一组数据与一个特定数值之间的差异情况。
样例:难产儿出生数n = 35,体重均值 = 3.42,S = 0.40,一般婴儿出生体重μ0= 3.30(大规模调查获得),问相同否?
求解代码:from scipy import statsstats.ttest_1samp(data,sample)
检验一列数据的均值与sample的差异是否显著。(双侧检验)
若为单侧检验,则将p值除以2
2.配对样本的T检验(ABtest)用于检验有一定对应关系的样本之间的差异情况,需要两组样本数相等。常见的使用场景有:
①同一对象处理前后的对比(同一组人员采用同一种减肥方法前后的效果对比);
②同一对象采用两种方法检验的结果的对比(同一组人员分别服用两种减肥药后的效果对比);
③配对的两个对象分别接受两种处理后的结果对比(两组人员,按照体重进行配对,服用不同的减肥药,对比服药后的两组人员的体重)。
AB测试时互联网运营为了提升用户体验从而获得用户增长而采用的精细化运营手段,简单的说就是分为A版本和B版本哪个更能吸引用户使用。
目的:检验两个独立样本的平均值之差是否等于目标值样例:比较键盘A版本和B版本哪个更好用,衡量标准:谁在规定时间内打错字少,或者两者差异不大
求解代码:ttest_rel(data1,data2) (得出的p值是双侧检验的p值)
3.独立样本的T检验(要求总体方差齐性)
独立样本与配对样本的不同之处在于独立样本T检验两
组数据的样本个数可以不等。
样例:比较男生与女生的专业和职业任职得分的均值是否存在显著差异,可采用独立样本T检验进行分析。
求解代码:
from scipy.stats import ttest_ind, levenelevene(data1,data2)#方差齐性检验(pvalue>0.05可以认为方差是相等的)
stats.ttest_ind(data1,data2)(得出的p值是双侧检验的p值)
独立样本和配对样本两种检验的区别在于,配对检验是基于对同一样本中相同个体的多次测量数据的检验;独立检验是对于不同样本的个体的测量数据。
(三)T检验怎么用
1.首先要明确检验的目的,是单样本T检验、配对样本的T检验还是独立样本的T检验。
2.进行正态性检验,独立样本需要进行方差齐性检验(观察是否来自于同一个整体)
3.选择合适的检验方法进行检验
(四)T检验注意事项
1.无论哪种T检验、都要数据服从正态或者近似正态分布。正态性的检验方法有:正态图、正态性检验、P-P图/Q-Q 图等。
2.独立样本的T检验,除了要满足正态性,还需要满足方差齐性的前提条件。在方差齐性的情况下才可以使用T检验,如果方差不齐性,则应采用校正T检验。
二、F检验
(一)什么是F检验
方差分析就是对试验数据进行分析,检验方差相等的多个正态总体均值是否相等,进而判断各因素对试验指标的影响是否显著。其原理认为不同处理组的均数间的差别基本来源有两个:实验条件和随机误差。其思想为通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。
(二)F检验有什么用1.单因素方差分析适用于问卷数据和实验数据,实验中只有一个因素改变的样本。判断该因素对样本的影响因素是否显著。2.双因素方差分析适用于实验数据,实验中有两个因素改变的样本。3.多因素方差分析适用于实验数据,实验中有多个因素改变的样本。
(三)F检验怎么用(方差齐性检验)1.判断数据类型定性数据用卡方检验, t检验一般用来比较两个总体的均值是否相同,而单因素方差分析可用于比较多个总体的均值是否相同。2.确定方差分析的类型确定实验过程中有几种因素发生了改变,如只有一组,则选择单因素方差分析;如有两
组,则选择双因素方差分析;如有多组,则选择多因素方差分析。3.正态性检验4.方差齐性检验5.选择合适的方法进行检验6.事后多重比较单因素方差分析如果呈现出显著性,说明不同组别之间确实存在显著的差异,事后多重比较可以得出出两组间显著差异的大小。
(四)F检验注意事项1.方差分析用来分析定量数据的变化情况,可以比较2组或多组数据的差异。2.方差分析要求样本满足正态分布3.方差分析的前提是方差齐性
三、卡方检验
(一)什么是卡方检验卡方检验是一种用途广泛的分析定性数据差异性的方法。是一种通过频数进行检验的方法。
(二)卡方检验有什么用1.卡方优度检验对一列数据进行统计检验,分析单个分类变量实际观测的比例与期望的比例是否一致。2.交叉表卡方研究两组分类变量的关系:如性别与看不看直播是否有关系。
样例:
从某中学随机抽取两个班,调查他们对待文理分科的态度,结果,甲班37人赞成,27人反对;乙班39人赞成,21人反对,这两个班对待文理分科的态度是否有显著差异(α= .05)?
求解代码:
from scipy.stats import chi2_contingency
kf_data = np.array([[37,27], [39,21]])
kf = chi2_contingency(kf_datad)print('chisq-statistic=%. 4f, p-value=%.4f, df=%i expected_frep=%s'%kf) # chisq-statistic=0.4054, p-value=0.5243, df=1 expected_frep=[[39.22580645 24.77419355][36.77419355 23.22580645]]
3.配对卡方研究实验过程中,用不同方法检测同一批人,看两个方法的效果是否有显著差异。
(三)卡方检验怎么用
1.确定卡方检验的类型
2.选用合适的方法进行卡方检验
(四)卡方检验注意事项
1.需要随机样本数据
2.理论频数不能太小