统计学基础1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学的几个重要概念
①总体:是根据研究目的确定的所有同质观察单位的全体
②样本:是从总体中抽取部分具有代表性的观察单位
③同质(homogeneity):根据研究目的给研究单位确定的相同性质。(同类个体具有共性)
④变异(variation):同质研究单位中变量值间的差异。(同类个体间的差异)
⑤参数(parameter):统计学中总体的指标称为参数,一般用希腊字母表示如总体均数、
总体标准差、总体率。
⑥统计量(statistic):样本的指标称为统计量,一般用拉丁字母表示如样本均数、样本标
准差、样本率。
⑦误差:是指观测值与真实值、样本统计量与总体参数之间的差别
➢系统误差
➢随机测量误差
➢抽样误差
⑧概率P:是度量某事件发生可能性大小的数值,具有预测性。取值(0 ≤ P ≤ 1 )
➢必然事件的概率P= 1,
➢随机事件:0
➢不可能事件的概率P=0
⑨小概率事件:概率P≤0.05 或P≤0.01的随机事件,表明事件发生的可能性很小在一次
抽样中,可认为小概率事件不会发生。小概率事件原理是统计推断的基础
⑩变量:研究对象的某个或某些特征
⑪资料:变量的观察值
资料的类型
➢定量资料离散型连续型
➢定性资料无序分类(二项分类,多项分类)有序分类
定量→有序分类→无序分类(单向)✳血压数值→几级血压→血压正常与否
⑫频率:某现象发生的频度(频繁程度)或强度,具有回顾性(已发生)
⑬统计工作的基本步骤:
➢设计(关键一步)
➢收集资料
➢整理资料
➢分析资料统计推断,统计描述
统计描述:是用统计图(表)、统计指标来描述资料的分布规律及其数量特征。
统计推断:在总体中随机抽取的部分观察单位(样本) ,然后用样本信息推断总体特征,即统计推断。
⑭统计推断
➢参数估计:指用样本指标推断总体相应的指标
➢假设检验:指由样本之间的差异推断总体之间是否可能存在差异
几个重要的统计指标 集中趋势
离散趋势 应用场合 算术均数
方差、标准差 适用于对称分布,特别是正态分布 几何均数
几何标准差 等比资料或对数正态分布资料 中位数 四分位数间距 适用于任何分布资料,特别是偏态分布、分布不
明、分布末端无确定值
变异系数
适用于均数相差太大或度量衡单位不同的资料 ① 算术均数x ̅
➢ 直接法:x ̅=∑x
n i=1n
➢ 频数表法:x ̅=Σfx 0
n
x 0为各组段组中值 f 为各组段的频数 离均差:Σ(x −x ̅)=0 各变量值与均数的 各变量值与均数的离均差之和等于零: ② 几何均数
➢ 直接法:G =l g−1Σlgx n
➢ 频数表法:G =lg −1(Σf lg x
n ) x 为单个对数值或组中值
③ 中位数M
➢ 直接法:n 为奇数:M =X (n+12) ;n 为偶数:M =(X (n 2)+X (n 2+1))∕2
➢ 频数表法:M =L m +ⅈ
f m (n ×50%−Σf L )
Lm 为刚好大于50%的组的下限,Σf L 为中位数组以前的累积频数 i 为组距 fm 为中位数组频数
④ 极差R :R =X max −X mⅈn
⑤ 四分位间距Q :Q =Q u −Q L =Q 75−Q 25
⑥ 方差:σ2=Σ(x−u )2
N (总体) s 2=Σ(x−x ̅)z
n−1(样本)
⑦ 标准差:s =√s 2
⑧ 变异系数CV: s x ̅
×100%