统计学基础1

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

统计学的几个重要概念

①总体:是根据研究目的确定的所有同质观察单位的全体

②样本:是从总体中抽取部分具有代表性的观察单位

③同质(homogeneity):根据研究目的给研究单位确定的相同性质。(同类个体具有共性)

④变异(variation):同质研究单位中变量值间的差异。(同类个体间的差异)

⑤参数(parameter):统计学中总体的指标称为参数,一般用希腊字母表示如总体均数、

总体标准差、总体率。

⑥统计量(statistic):样本的指标称为统计量,一般用拉丁字母表示如样本均数、样本标

准差、样本率。

⑦误差:是指观测值与真实值、样本统计量与总体参数之间的差别

➢系统误差

➢随机测量误差

➢抽样误差

⑧概率P:是度量某事件发生可能性大小的数值,具有预测性。取值(0 ≤ P ≤ 1 )

➢必然事件的概率P= 1,

➢随机事件:0

➢不可能事件的概率P=0

⑨小概率事件:概率P≤0.05 或P≤0.01的随机事件,表明事件发生的可能性很小在一次

抽样中,可认为小概率事件不会发生。小概率事件原理是统计推断的基础

⑩变量:研究对象的某个或某些特征

⑪资料:变量的观察值

资料的类型

➢定量资料离散型连续型

➢定性资料无序分类(二项分类,多项分类)有序分类

定量→有序分类→无序分类(单向)✳血压数值→几级血压→血压正常与否

⑫频率:某现象发生的频度(频繁程度)或强度,具有回顾性(已发生)

⑬统计工作的基本步骤:

➢设计(关键一步)

➢收集资料

➢整理资料

➢分析资料统计推断,统计描述

统计描述:是用统计图(表)、统计指标来描述资料的分布规律及其数量特征。

统计推断:在总体中随机抽取的部分观察单位(样本) ,然后用样本信息推断总体特征,即统计推断。

⑭统计推断

➢参数估计:指用样本指标推断总体相应的指标

➢假设检验:指由样本之间的差异推断总体之间是否可能存在差异

几个重要的统计指标 集中趋势

离散趋势 应用场合 算术均数

方差、标准差 适用于对称分布,特别是正态分布 几何均数

几何标准差 等比资料或对数正态分布资料 中位数 四分位数间距 适用于任何分布资料,特别是偏态分布、分布不

明、分布末端无确定值

变异系数

适用于均数相差太大或度量衡单位不同的资料 ① 算术均数x ̅

➢ 直接法:x ̅=∑x

n i=1n

➢ 频数表法:x ̅=Σfx 0

n

x 0为各组段组中值 f 为各组段的频数 离均差:Σ(x −x ̅)=0 各变量值与均数的 各变量值与均数的离均差之和等于零: ② 几何均数

➢ 直接法:G =l g−1Σlgx n

➢ 频数表法:G =lg −1(Σf lg x

n ) x 为单个对数值或组中值

③ 中位数M

➢ 直接法:n 为奇数:M =X (n+12) ;n 为偶数:M =(X (n 2)+X (n 2+1))∕2

➢ 频数表法:M =L m +ⅈ

f m (n ×50%−Σf L )

Lm 为刚好大于50%的组的下限,Σf L 为中位数组以前的累积频数 i 为组距 fm 为中位数组频数

④ 极差R :R =X max −X mⅈn

⑤ 四分位间距Q :Q =Q u −Q L =Q 75−Q 25

⑥ 方差:σ2=Σ(x−u )2

N (总体) s 2=Σ(x−x ̅)z

n−1(样本)

⑦ 标准差:s =√s 2

⑧ 变异系数CV: s x ̅

×100%

相关文档
最新文档