研究生统计学讲义第1讲第一章绪论
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
7.统计描述与统计推断
统计描述是对原始资料的一种概括,即把分散而不 好理解的原始数据,通过统计指标、统计图、统计表 等方法,来描述资料的特征及其分布规律。统计描述 不考虑抽样误差问题。
统计推断通过样本所提供的信息来推断总体特征 ,并标明可能发生的误差。统计推断包括置信区间 (confidence interval)与假设检验(hypothesis testing ) 。是对整理出的统计量作进一步的分析,统计推断 的结果为研究者下专业结论时提供科学的依据,所 下的推断结论将影响后来的决策。例如,某新药A 与某常规药B对某病疗效的差异有统计意义,A药效 应较好,这种推断结论所导致的决策就是把A药引 入市场,推广应用于临床。
概率的统计定义实际上给出了一个近似计算随机事 件的概率的方法,即当试验次数 n 够大时,可用频率 作为概率的近似值。
注意: 频率具有偶然性;而概率刻划的则是总体中随 机事件(随机变量)出现的可能性大小,一个随机变量 的概率是一个常数,具有必然性,是一种客观存在。
0≤P(A)≤1。必然事件概率为1,不可能事件的概率 为0,概率越接近1,表明其事件发生的可能性越大, 概率越接近0,其事件发生的可能性越小,P<0.05表 示事件发生的可能性小于0.05,P<0.01表示事件发生 的可能性小于0.01
从总体中随机抽取部分个体的过程称为抽样 (sampling),从总体中随机抽取的代表总体的部分个 体的观察值集合称为样本(sample)。样本中所包含的 个体数目,即样本例数,称为样本含量(sample size) 。总体中有很多个体,究竟哪些个体在抽样中被抽 到,要依机会而定。因此,样本是随机变量;
6.参数与统计量 出现在总体分布中的统计指标称为 参数(parameter),参数一般用小写的希腊字母表示, 如用μ表示总体均数,用σ表示总体标准差。
通过对样本数据进行统计分析所产生的统计指标 称为统计量(statistical variable)。
统计量也是随机变量,统计量的分布称为抽样分布。 常用的有2分布、t分布、F分布。在统计推断中,抽 样分布充分发挥作用。统计学研究的基本方法是通过 样本构造统计量,再通过抽样分布的研究,对样本所 来自的总体进行分析和推断。
数理统计方法就是应用概率论的结果,通过样 本来了解和判断总体的统计特征的科学方法。
3.概率与频率 概率(probability)和频率(frequency) 都是反映某一随机事件发生可能性大小的度量。
若随机事件A在n次独立重复试验中发生了m次,则称 m为频数(counts)。称比值m/ n为事件A在n次试验中出 现的频率或相对频数(relative frequency) ,0≤m/ n≤1, 即事件A发生的频率为m/ n。
试验者 De Morgan
掷币数n 正面数m
2048
1061
正频率fn 0.5181
Buffon
4040
2048
0.5069
Pearson
12000
6019
0.5016
Pearson
24Biblioteka Baidu00 12019
0.5005
统计上常用符号 P 表示概率,概率的统计定义是: 如果事件 A 在大量重复试验中出现的频率稳定在某一 常数p,则称事件 A 的概率为p,记作P(A)=p,
5.概率分布 对一个随机变量,不但要了解它可能取 得的数值,还要了解它以多大的概率取得这些数值, 只有这样,才算是掌握了这个随机变量所刻划的随机 现象。事实上,随机变量的取值有一定的概率意义, 所以必须用随机变量的取值及其相应的概率才能完整 地刻划随机现象的规律。一个随机变量各可能的取值 与其对应的概率共同构造出它的概率分布(probability distribution),简称分布。
样本的概率分布称为抽样分布,统计上描述一个样 本的性质,就等价于给出它的概率分布。由样本的分 布可以推断出总体的分布,这是随机抽样的特征,可 以把它取作“随机抽样”的定义。从总体中随机抽取 一定个体数目的样本进行研究,通过样本指标推断总 体指标的方法,称为抽样研究方法。
样本的“质”通过适当的抽样方法来保证,必须使样 本中的每一个体确属同质总体,必须遵循随机化抽样 和分配的原则,使样本足以代表总体,能充分反映总 体的实际情况,保证样本的可靠性
研究生统计学讲义第1讲第一章
观察单位(称为个体)的研究特征(或指标)称为变 量 (variable) 。 变 量 的 观 察 结 果 即 观 察 值 (observed value),称为变量值(value of variable)。变量值是变量 的具体表现。随机变量(random variable)是专指具有 一个分布或一个概率或概率分布的变量,特性:(1) 在一次试验中,取值具有不确定性。随机事件在一次 试验中可能发生,也可能不发生,所以随机变量的取 值是随机的,取决于随机试验结果。(2) 在大量重复 试验中,随机变量的各种可能取值发生的可能性大小 具有一定的统计规律,也就是说,具有一定的“概率 ”意义。可见,随机变量既具有变量的意义,又具有 概率意义,这种双重意义正是随机变量与普通变量的 区别。在不致混淆的情况下,通常将随机变量简称变 量。
2.总体、个体与样本 研究对象的全体称为总体 (population)。构成总体的每个成员称为个体,亦称 样品或观察单位。总体是根据研究目的所确定的性 质相同的所有个体的研究指标值的集合。
个体(individual)即观察单位(study unit)。总 体的性质特征由其各个个体的性质而定,要研究总 体的性质或特征,须对它的个体进行观测。
抽样的目的是用样本信息推断总体特征,所以样本 要有足够的含量及代表性。
样本要具有:①随机性:即要使总体中的每一个体 都有同等的机会被抽到和分配,不受研究者的主观意 愿或客观偏性影响,样本可能取值与总体是完全一样 的,并且取各个值的概率也是完全一样的,这就是说 ,样本与总体是同分布的随机变量。②独立性:即各 个样品的取得互不影响,即任何一次抽样都未改变总 体成份,因而下一次抽样是在同样条件下进行的。例 如,有放回的抽样就能保证这一点;无放回的抽样在 总体很大时,也近似满足这一点。