置信度和置信区间
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
首先我们要弄清楚两个概念,置信度和置信区间
置信度:以测量值为中心,在一定范围内,真值出现在该范围内的几率。
一般设定在2σ,也就是95%,95%是通常情况下置信度(置信水平)的设定值。
置信区间:在某一置信度下,以测量值为中心,真值出现的范围。
我们在论文里经常看到CI,CI是置信区间,一定概率下真值得取值范围(可靠范围)称为置信区间。
其概率称为置信概率或置信度(置信水平)
真实数据往往是实际上不能获知的,我们只能进行估计,估计的结果是给出一对数据,比如从1到1.5,真实的值落在1到1.5之间的可能性是95%(也有5%的可能性在这区间之外的)。
区间是由抽样的数据根据大样定律结合查表得来的。
区间越小精度越高,区间越大置信度越高。
打个比方,我们猜张燕燕的年龄,你给出区间是25-35,这个区间很小置信度很低但精度就很高,你说在8岁到80岁之间,那是百分百的置信度了不过精度太低毫无意义。
的确99%准确度高于95%,但是它的精度(精密度)就低于95%。
95%的置信度是一般通用的。
P值指的是比较的两者的差别是由机遇所致的可能性大小。
P值越小,越有理由认为对比事物间存在差异。
例如,P<0.05,就是说结果显示的差别是由机遇所致的可能性不足5%,或者说,别人在同样的条件下重复同样的研究,得出相反结论的可能性不足5%。
P>0.05称“不显著”;P<=0.05称“显著”,P<=0.01称“非常显著”。
由于常用“显著”来表示P值大小,所以P值最常见的误用是把统计学上的显著与临床或实际中的显著差异相混淆,即混淆“差异具有显著性”和“具有显著差异”二者的意思。
其实,前者指的是p<=0.05,即说明有充分的理由认为比较的二者来自同一总体的可能性不足5%,因而认为二者确实有差异,下这个结论出错的可能性<=5%。
而后者的意思是二者的差别确实很大。
举例来说,4和40的差别很大,因而可以说是“有显著差异”,而4和4.2差别不大,但如果计算得到的P值<=0.05,则认为二者“差别有显著性”,但是不能说“有显著差异”。