统计学提纲第五章总结

合集下载

数理统计第五章总结

数理统计第五章总结

x1 ,, xn .
(2).主要类型

(1).性质:二重性

随机性 确定性
完全样本 分组样本
第五章 知识点总结
x1 ,, xn ~ F ( x ), (3).简单随机样本:
(4).样本的联合分布函数: F ( x1 ,, xn )
0, k (5). 经验分布函数: Fn ( x ) , n 1, x x( 1 )
n 2 n ![ F ( z ) F ( y )] p( y ) p( z ) p1n ( y, z ) . (n 2)!
( y z)
第五章 知识点总结
(3). 次序统计量的函数及其分布
①. 样本中位数:
n 2k 1, x( n21 ), x n x n (2) ( 2 1) , n 2k . 2
i 1 j i 1 n j n ![ F ( y )] [ F ( z ) F ( y )] [ 1 F ( z )] p( y ) p( z ) pij ( y, z ) . (i 1)!( j i 1)!(n j )!
( y z)

次序统计量 ( x(1) , x(n) ) 的联合密度函数为
若 X ~ 2 (n), 则 E ( X ) n, Var( X ) 2n. 若 X ~ 2 (m ), Y ~ 2 (n), 且 X 与 Y 独立, 则
X Y ~ 2 (m n).
2 2. 分布的分位数: P( 2 1 (n)) 1 .
第五章 知识点总结
第20页
6. 对来自总体N(2,4) 的样本 y1 , y2 ,, y25 , S 2 是样本方差, 若 2 b s 2 ~ 2 (24), 则b = ( ).

统计学第五章(变异指标)

统计学第五章(变异指标)

峰态及其度量
峰态定义
峰态是指数据分布的尖峭程度或扁平程度。在统计学中,峰态通常通过峰态系数 来度量。
峰态系数
峰态系数是描述数据分布峰态程度的一个统计量,通常表示为K。当K=3时,分 布呈正态分布,峰度适中;当K>3时,分布呈尖峰分布,即比正态分布更尖峭; 当K<3时,分布呈平峰分布,即比正态分布更扁平。
方差
要点一
定义
方差是在概率论和统计方差衡量随机 变量或一组数据时离散程度的度量, 用来度量随机变量和其数学期望(即 均值)之间的偏离程度。
要点二
计算公式
方差s^2=[(x1-x)^2+(x2x)^2+......(xn-x)^2]/n(x为平均数)。
要点三
性质
方差越大,说明随机变量取值越离散; 方差刻画了随机变量的取值对于其数学 期望的离散程度;若X的取值比较集 中,则方差D(X)较小,若X的取值比较 分散,则方差D(X)较大;因此,D (X)是刻画X取值分散程度的一个 量,它是衡量取值分散程度的一个尺 度。
变异系数的计算
01
注意事项
02
当数据集包含极端值时,变异系数可能会受到影响。
03
对于非正态分布的数据,变异系数的解释需谨慎。
变异系数的应用
比较不同数据集的离散程度
通过比较不同数据集的变异系数,可以评估它们 的相对波动程度。
在质量控制中的应用
通过计算产品质量的变异系数,计学第五章变异指

CONTENCT

• 变异指标概述 • 变异系数 • 极差、四分位差与平均差 • 标准差与方差 • 偏态与峰态的度量 • 变异指标在统计分析中的应用
01
变异指标概述

统计学各章节期末复习知识点归纳(原创整理精华,考试复习必备!)

统计学各章节期末复习知识点归纳(原创整理精华,考试复习必备!)

统计学原理与实务各章节复习知识点归纳(考试复习资料精华版-根据历年考试重点以及老师画的重点原创整理)第一章总论重点在“第三节:统计学中的基本概念”考点一:掌握以下四组概念(含义及举例)——肯定考一个名词解释!①总体、总体单位(统计)总体:是由客观存在的,具有某种共同性质的许多个别事物构成的整体。

总体单位:构成总体的个别事物。

②标志、标志值及分类标志:说明总体单位特征的名称。

分类:Ⅰ按性质不同a.品质标志:说明总体单位的品质特征,一般用文字表现。

(有些品质标志虽然以数量表现,但实质表现产品质量差异。

例如产品质量的具体表现未“一等、二等、三等”。

)b.数量标志:说明总体单位的数量特征。

只能用数值来表现。

Ⅱ按变异情况可变标志:当一个标志在各个总体单位表现不尽相同时称为可变标志不变标志:……都相同……不变标志。

标志值:标志的具体表现。

③变量、变量值变量:指数量标志。

变量值:指数量标志值,具有客观存在性。

④指标的含义及分类(统计)指标:是综合反映统计总体某一数量特征的概念和数值,简称指标。

a.按其反映总体现象内容不同:数量指标(绝对数,绝对指标,总量指标),质量指标(相对数或平均数,相对指标和平均指标)。

b.按其作用不同:总量指标,相对指标和平均指标。

c.按反映的时间特点不同:试点指标和时期指标d.计量单位的特点:实物指标、价值指标和劳动指标。

★指标和标志的区别与联系:区别:①标志是说明总体单位特征的名称;指标是说明总体的数量特征;②标志既有反映总体单位数量特征的,也有反映总体单位品质特征;而指标只反映总体的数量特征;③凡是统计指标都具有综合的性质,而标志一般不具有。

联系:①许多指标由数量标志值汇总而得;②指标与数量标志可随统计研究目的而改变;课后习题:社会经济统计学研究对象的特点是:数量性、总体性、变异性。

统计研究运用的方法主要包括:大量观察法、统计分组法、综合指标法、统计模型法标志值就是标志表现。

第二章统计调查考点一:统计报表的分类①填报内容和实施范围:国家、部门和地方统计报表②调查范围:全面、非全面③报送周期长短:日报、旬报、月报、季报、半年报和年报④填报单位:基层、综合报表考点二:“普查”的含义普查:是普遍调查的简称。

统计学原理第五章

统计学原理第五章

第五章综合指标学习要点:了解各种指标的概念及作用,掌握相对指标、平均指标的特点及计算方法,变异指标的计算方法。

§1、总量指标§2、相对指标§3、平均指标§4、变异指标学习知识点:前言:1、总量指标是反映社会经济现象发展的总规模、总水平的综合指标。

将总体单位数相加或总体单位标志值相加,就可以得到说明在一定时间、空间条件下某种现象总体的总规模、总水平的指标,即总量指标。

如:2010年年年末为1339724852亿,反映是我国人口的总规模。

总量指标的作用:第一、总量指标可以用来反映一个国家的基本国情国力,反映一个地区、一个部门或一个单位的人力、物力和财力,是人们对客观事物认识的起点。

第二、总量指标可以用来作为制定政策、制定计划和实行科学管理的基本依据,也是检查政策、计划执行情况,反映社会经济活动绝对效果的重要指标。

第三、总量指标可以用来研究客观现象的数量表现及其发展的变化趋势。

第四、总量指标是计算相对指标和平均指标的基础。

一、总量指标的种类:1、按其反映现象总体内容的不同:• 总体单位总量(简称单位总量):指总体内所有单位的总数,表示总体本身规模的大小。

对于一个确定的统计总体,其总体单位总量是唯一确定的。

• 总体标志总量(简称标志总量):指总体中各单位标志值总和。

对于确定的统计总体,标志总量不是唯一的,而是随着标志的不同可计算不同的标志。

• 例:我们研究某市三级医院的基本情况,则全市三级医院的总数量是总体单位总量,而全部三级医院职工总人数、全部三级医院职工工资总额等就是总体指标总量。

2、按反映时间状况的不同,可分为时期指标和时点指标。

• 时期指标指反映某社会经济现象在一段时间活动结果的总量指标,它反映的是一段时间连续发生变化过程。

如产品总量、货物运输量、商品销售量、国内生产总量等。

• 时点指标是反映社会经济现象在某一时间(瞬间)状况上的总量指标。

如人口数、职工数、设备台数等。

统计学 第五章

统计学      第五章

第五章 抽样推断抽样推断定义:是一种非全面调查,是按随机原则,从总体中抽取一部分单位进行调查,并以其结果对总体某一数量特征作出估计和推断的一种统计方法。

(一) 总体和样本在抽样推断中面临两个不同的总体,即全及总体和样本总体,全及总体也叫母体,简称总体。

全及总体的单位数用N 表示全及总体⎪⎩⎪⎨⎧⎩⎨⎧属性总体有限总体无限总体变量总体样本总体又叫抽样总体、子样,简称样本,样本总体的单位数称样本容量,用n 表示。

(二) 参数和统计量参数亦称全及指标,由于全及总体是唯一确定的,故根据全及总体计算的参数也是个定值 对于属性总体,可以有如下参数,全及总体成数p ,全及总体标准差)(2p p σσ方差 属性总体标准差:()p p p-=1σ统计量即样本指标设样本总体有n 个变量:n x x x x ,...,,,321 则:样本平均数 nx x ∑=(三) 样本容量与样本个数样本容量是指一个样本所包含的单位数,用n 来表示,一般地,样本单位数达到或超过30个的样本称为大样本,而在30个以下称为小样本。

社会经济统计的抽样推断多属于大样本,而科学实验的抽样观察则多取小样本。

样本个数又称样本可能数目,是指从全及总体中可能抽取的样本的个数。

一个总体可能抽取多少样本,与样本容量大小有关,也与抽样的方法有关。

在样本容量确定之后,样本的可能数目便完全取决于抽样方法。

抽样误差是抽样调查自身所固有的,不可避免的误差,虽然不能消除这种误差,但有办法进行计算,并能对其加以控制。

抽样平均误差越大,表示样本的代表性越低;抽样平均误差越小,表示样本的代表性越高。

在重复简单随机抽样时,样本平均数的抽样分布有数学期望值E(a)=a(a代表全及总体平均数,即X)X⇔。

样本平均数的平均数=总体平均数抽样平均误差=抽样标准误差=样本平均数的标准差(它反映抽样平均数与总体平均数的平均误差程度)例题:某班组4个工人的月工资(N=4)分别是:1400元,1500元,1600元,1700元,现用重复简单随机抽样的方法从全及总体中抽选出容量大小为2的样本(n=2),求抽样平均误差?解:全及总体平均工资)(15501700160015001400元=+++=X全及总体标准差()4500002=-=∑NX Xσ抽样平均误差x μ=nnσσ=2=)(0569.792*450000元=例题:某班组4个工人的月工资(N=4)分别是:1400元,1500元,1600元,1700元,现用不重复简单随机抽样的方法从全部总体中抽选容量大小为2的样本(n=2),求抽样平均误差?解:全及总体平均工资)(155041700160015001400元=+++==∑NXX全及总体标准差()4500002=-=∑NX Xσx μ=⎪⎭⎫ ⎝⎛--∙12N n N n σ=)(55.6414244*250000元=--∙例题:某电子元件厂,生产某型号晶体管,按正常生产试验,产品中属于一级品的占70%,现在从10000件晶体管中,抽取100件进行抽查检验,求一级品率的抽样平均误差? 解:已知:P=0.7 , P(1-P)=0.21在重复抽样的情况下,抽样平均误差为:()np p p -=1μ=%58.410021.0=在不重复抽样的情况下,抽样平均误差为:()⎪⎭⎫⎝⎛-∙-=N n n p p p 11μ=%56.410000*********.0=⎪⎭⎫ ⎝⎛-∙参数估计()()⎪⎪⎩⎪⎪⎨⎧→-==+≤≤是概率度是置信度,极限误差)样本指标总体指标极限误差—(样本指标区间估计:求不高的情况准确程度与可靠程度要点估计:适用于推断的t t F t F P α1例题:已知某车间某产品的合格率在某个置信度下的估计区间是(85%,95%),还已知样本容量为100,求置信度?解:显然p p ∆-=85%,p p ∆+=95%,即p=90%,p ∆=5%p ∆=μ⋅t μpt ∆=⇒=()()67.1100%901%90%51=-∙=-∆np p p ()t F =0.9052即置信度为90.51% ★求置信度,只需要求出t影响抽样数目的因素⎪⎪⎪⎪⎩⎪⎪⎪⎪⎨⎧∆样本单位不重置抽样可以少抽些单位,抽样需要多抽一些样本、在同等条件下,重置单位,则反之值越大,则多抽些样本、概率度则反之单位,的值大可以少抽些样本)、允许误差(极限误差越多,则反之值越大,必要抽样数目、总体标准差4321t x σ例题:某城市组织职工家庭生活抽样调查,职工家庭平均每户每月收入的标准差为11.50元,要求把握程度为95.45%,允许误差为1元,问需抽选多少户? 解:()t F =0.95452=⇒t , 元元,150.11=∆=x σxt n 222∆=σ=()户529150.1142=∙。

统计学原理第5章:时间序列分析

统计学原理第5章:时间序列分析

a a

n 118729 129034 132616 132410 124000 5
127357.8
②时点序列
若是连续时点序列: 计算方法与时期序列一样; 若是间断时点序列: 则必须先假设两个条件,分别是 假设上期期末水平等于本期期初水平; 假设现象在间隔期内数量变化是均匀的。 间隔期相等的时点序列 采用一般首尾折半法计算。 例如:数列 a i , i 0,1,2, n 有 n 1 个数据,计算 期内的平均水平 a n a n 1 a 0 a1 a1 a 2
(3)联系
环比发展速度的乘积等于相应的定基发展速度,
n n i 0 i 1 i 1
相邻两期的定基发展速度之商等于后期的环比发展速度
i i 1 i 0 0 i 1
(二)增减速度
1、定义:增长量与基期水平之比 2、反映内容:现象的增长程度 3、公式:增长速度
0.55
二、时间序列的速度分析指标
(一)发展速度 (二)增长速度 (三)平均发展水平
(四)平均增长速度
(一)发展速度
1、定义:现象两个不同发展水平的比值 2、反映内容:反映社会经济现象发展变化快慢相对程度 3、公式:v 报告期水平 100%
基期水平
(1)定基发展速度
是时间数列中报告期期发展水平与固定基期发展水平对比所 得到的相对数,说明某种社会经济现象在较长时期内总的发 展方向和速度,故亦称为总速度。 (2)环比发展速度 是时间数列中报告期发展水平与前期发展水平之比,说明某 种社会经济现象的逐期发展方向和速度。
c

a
b
均为时期或时点数列,一个时期数列一个时点数列,注意平均的时间长度 ,比如计算季度的月平均数,时点数据需要四个月的数据,而时期数据则 只需要三个月的数据。

统计学基础第五章时间数列

统计学基础第五章时间数列

statistics
统计学——第五章时间数列
解:根据上面计算资料再计算第三季度的月平均库存额为:
an-1 an a1 a2 a2 a3 … 2 2 a 2 n 1 an a1 a2 an-1 2 2 n 1
700 900 900 1000 2 2 4 1
均衡的期末登记排列。通常将前者称为间隔相等的间断 时点数列,后者称为间断不等的间断时点数列。
statistics
统计学——第五章时间数列
间隔相等的间断时点数列的平均发展水平的计算公式:
an1 an a1 a2 a2 a3 2 2 a 2 n 1 an a1 a2 an-1 2 2 n 1
statistics
统计学——第五章时间数列
(3)分子、分母由一个时期数列和一个时点数列对比组成 相对数时间数列。
a a 1 a 2 a n 1 a n c b0 bn b1 b n 1 b 2 2
(分子为时期数列,分母为时点数列) a0 an a 1 a 2 a n 1 a 2 或 2 c b1 b n 1 b n
可见,该商场2006年的第三、第四季度的月平均销售 额大于第一、第三季度的月平均销售额。 statistics
统计学——第五章时间数列
2.依据时点数列计算序时平均数
连续时点数列 时点数列 间断时点数列 间隔不等的间断时点数列 间隔相等的间断时点数列
statistics
统计学——第五章时间数列
(1)连续时点数列的序时平均数。
5-4所示,试求第一季度的平均完成率。 表5-4 某厂某年第一季度各月商品销售额 计划完成情况统计表 目 1月 200 210 105 2月 240 260 105 3月 250 280 112 statistics

《统计学》第5章 假设检验

《统计学》第5章 假设检验
假设。原假设通常用H0 表示,也称为“零假设”;备择假设指的是当原
假设不成立时,即拒绝原假设时备以选择的假设,通常用H1 表示。备择
假设和原假设互斥,如在例5.1中,原假设是“2022 年全国城市平均
PM2.5 浓度与2018 年相比没有显著差异”,那么备择假设就是“2022
年全国城市平均PM2.5 浓度与2018 年相比存在显著差异”。相应的统计
小越好。但是,在一定的样本容量下,减少犯第I类错误的概率,就会
使犯第II类错误的概率增大;减少犯第II类错误的概率,会使犯第I类
错误的概率增大。增加样本容量可以使犯第I类错误的概率和犯第II类
错误的概率同时减小,然而现实中资源总是有限的,样本量不可能没有
限制。因此,在给定的样本容量下,必须考虑两类可能的错误之间的权
易被否定,若检验结果否定了原假设,则说明否定的理由是充分的。
第四章 参数估计
《统计学》
16
5.1 假设检验的基本原理
(四) P值法
假设检验的另一种常用方法是利用P值(P-value) 来确定检验决策。P值
指在原假设0 为真时,得到等于样本观测结果或更极端结果的检验统计
量的概率,也被称为实测显著性水平。P值法的决策规则为:如果P值大
1.96) 中。这里−1.96和1.96 称为临界值,区间(−1.96, 1.96) 两侧的
区域则被称为拒绝域。基于样本信息,可以计算得到相应的z检验统计量
值,已知ҧ = 46,0 = 53, = 14 , n = 100 = −5
14/10
第四章 参数估计
《统计学》
14
5.1 假设检验的基本原理
犯第I 类(弃真) 错误的概率 也称为显著性水平(Significance level),

统计学第五章

统计学第五章

2-分布
(性质和特点)
• 1. 期望为:E(2)=n,

方差为:D(2)=2n(n为自由度)
• 2. 可加性:

若U和V为两个独立的2分布随机变量,
U~2(n1),V~2(n2),则U+V这一随机变量服从 自由度为n1+n2的2分布
• 3. 当 n 时, 2分布的极限分布是正态
分布
不同自由度的2-分布
(central limit theorem)
从均值为,方差为 2的一个任意总体中抽取容量
为n的样本,当n充分大时,样本均值的抽样分布近 似服从均值为μ、方差为σ2/n的正态分布
一个任意分 布的总体
x
n
当样本容量足够 大时(n 30) , 样本均值的抽样 分布逐渐趋于正 态分布
x
x
中心极限定理
(2)系统抽样的评价 ——操作上简便易行 ——如果总体是按有关标志进行排列的话,可以提 高样本的代表性,改进抽样精度 ——对估计量方差的估计比较困难
4、整群抽样(cluster random sampling) (1)整群抽样的概念
整群抽样是指将总体分成群,从中随机抽取 若干群,群中的所有单位构成样本
E(x)
2 x
2
n
样本比例的分布
(proportion)
1. 总体(或样本)中具有某种属性的单位与全部单位 总数之比
– 不同性别的人与全部人数之比
– 合格品(或不合格品) 与全部产品总数之比
2. 总体比例可表示为
N0 或 1 N1
N
N
3. 样本比例可表示为
4.
p n0 或 1 p n1
2. 一种理论概率分布

医学统计学第七版教材第五章总结

医学统计学第七版教材第五章总结

医学统计学第七版教材第五章总结假设检验1.试述假设检验中α与P的联系与区别。

区别:(1)α值是事先确定的一个小的概率值。

为一次检验中,甘愿冒的风险。

(2)P值是在H,成立的条件下,出现当前检验统计量以及更极端状况的概率。

为一次检验中,实际冒的风险。

联系:以t检验为例,P、α都可以用t分布尾部面积大小表示。

Kα时,拒绝H。

假设,差异有统计学意义。

2.试述假设检验与置信区间的联系与区别。

联系:区间估计与假设检验是由样本数据对总体参数做出统计学推断的两种主要方法。

区别:置信区间用于说明量的大小,即推断总体参数的置信范围;假设检验用于推断质的不同,即判断两总体参数是否不等。

3.怎样正确运用单侧检验和双侧检验?需要根据数据的特征及专业知识进行确定。

若比较甲、乙两种方法有无差异,则应选用双侧检验。

若需要区分何者为优,,则应选用单侧检验。

在没有特殊专业知识说明的情况下,一般采用双侧检验即可。

4.试述两类错误的意义及其关系。

(1)Ⅰ类错误:如果检验假设H。

实际是正确的,由样本数据计算获得的检验统计量得出拒绝H。

的结论,此时就犯了错误,统计学上将这种拒绝了正确的零假设H。

(弃真)的错误称为Ⅰ类错误。

I类错误的概率用α表示。

(2)Ⅱ类错误:若检验假设H。

原本不正确(H正确),由样本数据计算获得的检验统计量得出不拒绝H。

(纳伪)的结论,此时就犯了Ⅱ类错误。

Ⅱ类错误的概率用β表示。

5.简述假设检验的基本思想。

假设检验是在局成立的前提下,从样本数据中寻找证据来拒绝H。

、接受H,的一种“反证”方法。

如果从样本数据中得到的证据不足,则只能不拒绝H,暂且认为H,成立,即样本与总体间的差异仅仅是由于抽样误差所引起。

拒绝H。

是根据某个界值,即根据小概率事件确定的。

所谓小概率事件是指如果比检验统计量更极端(即绝对值更大)的概率较小,比如小于等于0.05,则认为零假设的事件在某一次抽样研究中不会发生,此时有充分理由拒绝H。

,即有足够证据推断差异具有统计学意义。

统计学第5章抽样推断

统计学第5章抽样推断
就 是 由 样 本 指 标 直 接 代 替 全 及 指 标 , 不 考 虑
任 何 抽 样 误 差 因 素 。 即 用 x直 接 代 表 X , 用 p 直 接 代 表 P。
例 在 全 部 产 品 中 , 抽 取 100件 进 行 仔 细 检 查 , 得 到 平 均 重 量 x1002克 , 合 格 率 p98% , 我 们 直 接 推 断 全 部 产 品 的 平 均 重 量 X 1002克 , 合 格 率 P 98% 。
(1)
2
n
(1 )
12 2 (1
100
) 1.19 (千克 )
x
n
N
100 10000
(2) 若以概率 95.45%(t 2)保证,该农场 10000 亩小麦的平均
亩产量的可能范围为:
X : x 400 2 1.19 x
X (: 397 .62 ,402.38 ) (3) 若以概率 99.73%(t 3)保证,该农场 10000 亩小麦的平均
在重复抽样情况下:
p (1 p )
p
n
在不重复抽样情况下:
p (1 p ) n
(1 )
p
n
N

某玻璃器皿厂某日生产15000只印花玻璃 杯,现按重复抽样方式从中抽取150只进行 质量检验,结果有147只合格,其余3只为不 合格品,试求这批印花玻璃杯合格率(成数) 的抽样平均误差。
N15000n150
二、区间估计
根据样本指标和抽样误差去推断全及 指标的可能范围,它能说清楚估计的准 确程度和把握程度。
总体平均数和总体成数的估计
X :(x x, x x)
1的概率保证下:x tx
P:(pp, pp)
1的概率保证下: p tp

统计学--第五章两均数差别的统计意义

统计学--第五章两均数差别的统计意义

四、可信区间与假设检验的区别和联系
可信区间用于说明量的大小 即是否不同。
1、可信区间亦可回答假设检验的问题:算
得的可信区若包含了H0 ,则按α 水准不拒绝H0; 若不包含H0,则按α 水准,拒绝H0接受H1。
2、可信区间比假设检验可提供更多的信息:
也是对自由度进行校正重点介绍第一种方法见书p48例56第六节两种检验与两类错误一单侧检验与双侧检验1若检验目的在于检验两总体均数是否相等两者谁大谁小都有可能只的绝对值大于005界值即认为均数差别有统计学意义称双侧检验twotailedtest或双尾检验2若已知一个均数不可能低于另一个均数检验时只需考虑一侧的临界值称单侧onetailedtest或单尾检验单双侧检验时界值间的关系见面积示意图图51图52p4950二第一类错误与第二类错误型错误typeerror
三、假设检验应注意的问题 1、要有严密的研究设计 2、不同变量或资料应选用不同的检验方法 3、正确理解“ 显著性” 一词的含义:差 别有统计学意义,亦称差别有“ 显著性”, 不能理解为差异大。假设检验的结果并不 指差异的大小,只能反映两者是否相同, 差异的大小只能根据专业知识予以确定。 4、作结论不能绝对化:因统计结论具有概 率性质,不宜用“ 肯定”、“ 一定”、 “ 必定‘”等词。报告中最好列出统计量 的值和P值确切范围。以便读者与同类研究
二、第一类错误与第二类错误 I型错误type I error:拒绝了实际上成立的H0, 这类“ 弃真”的错误称I型错误,其概率大 小用α 表示,α 可取单尾亦可取双尾。取 0.05时,表示当无效假设正确时,在100次 抽样中可以有5次推断是错误的。false positive error II型错误:“接受”〔不拒绝〕了实际不 成立的H0 ,这类“取伪”的错误,称type II error。其概率大小用β 表示,β 只取 单尾,其值的大小在进行检验时一般并不 知道。false negative error

统计学 第五章 动态分析方法汇总

统计学 第五章 动态分析方法汇总

则该企业2002年全年平均各季商品销售计划完成百分数为:
a 330 290 290 345 1255 c 107.26% b 300 270 280 320 1170
二、动态数列的编制原则:
1、时间长短应该相等 2、总体范围应该一致 3、经济内容必需相同
4、计算方法应该统一
第二节 动态数列水平指标
一、发展水平
(一)概念:是动态数列中的每项指标数值 (二)分类:
1、按表现形式分:
A、总量指标:
B、相对指标: C、平均指标:
2、按位置不同分:
A、最初水平:数列中第一项指标数值 B、中间水平:数列中最后一项指标数值 C、最末水平:中间各项指标数值
某商品部某年一月份职工人数变动情况表 1日 时间 职工人数 38 45 30 25 9日 15日 31日
则该商品部一月份平均职工人数为:
af a f 28* 8 45* 6 30 *16 25*1 1079 34.8(人) 31 31
(2)间断时点数列平均发展水平的计算: 间断时点数列是指按月末、季末、年末登记取得资料的时点 数列。 A.若掌握的是间隔相等的间断时点数列资料,公式为:
(二)根据相对数动态数列计算平均发展水平: 先分别计算出分子数列和分母数列的平均发展水平,再进行 对比。 计算公式: a c b 举例说明: 例1:某企业2002年商品销售额计划完成情况如下:
某企业2002年商品销售额计划完成情况统计表 一 二 三 季度 计划数(万元) 实际数(万元) 计划完成% 300 330 110.00 280 290 103.57 270 290 107.41 四 320 345 107.81
第五章 动态分析方法

统计学--假设检验(第五章)-(1)-2

统计学--假设检验(第五章)-(1)-2

左侧检验:
×
抽样分布
Region of Rejection
拒绝H0
置信水平
1 -
Region of Non rejection
临界值
H0
观察到的样本统计量
【例3】一家研究机构估计,某城市中家庭拥有汽车的比例超 过30%。为验证这一估计是否正确,该研究机构随机抽取 了一个样本进行检验。试陈述用于检验的原假设与备择 假设。
36.6
36.9
36.7
37.2
36.3
37.1
36.7
36.8
37.0
37.0
36.1
37.0
根据样本数据,计算的平均值为36.8oC,标准差为0.36oC 根据参数估计方法,健康成年人平均体温的95%的置信区
间为(36.7,36.9) 研究人员发现这个区间内并没有包括37oC! 因此,提出了“不应该再把37oC作为正常人体温的一个有
解:研究者抽检的意图是倾向于证实这种洗涤剂的平均
净含量并不符合说明书中的陈述。
建立的原假设和备择假设为:
H0 : 500 H1 : < 500
<提出假设>
【例3】一家研究机构估计,某城市中家庭拥有汽车的比例超 过30%。为验证这一估计是否正确,该研究机构随机抽取 了一个样本进行检验。试陈述用于检验的原假设与备择 假设。
传统上,做出决策所依据的是样本统 计量,现代检验中人们直接使用由统计量
算出的犯第一类错误的概率,即所谓的P
值。
注:假设检验不能证明原假设正确。
① 假设检验只提供不利于原假设的证据。当拒绝原假设时, 表明样本提供的证据证明它是错误的;当没有拒绝原假设时 ,我们也不说“接受原假设”,因为没法证明原假设是正确 的

地大《统计学》章 课堂笔记

地大《统计学》章 课堂笔记

地大《统计学》第五章假设检验课堂笔记◆主要知识点掌握程度假设检验是统计推断的组成部分,本章讨论的主要内容是:对总体的未知参数作出某种假设,然后抽取样本,构造适当的统计量,对假设的正确性进行判断的一套程序。

学习本章时,重点理解假设检验的基本思想和基本原理,掌握假设检验的步骤,并利用这些方法对未知参数的假设进行检验。

本章例题较多大家看懂后要多做练习,掌握巩固。

◆知识点整理一、假设检验的一般问题参数估计:用样本假设检验:对u提出假设,用检验假设是否成立.(一)什么是假设检验(了解)假设检验是对我们所关心的,却又是未知的总体参数先做出假设,然后抽取样本,利用样本提供的信息对假设的正确性进行判断的过程。

它是进行经济管理和决策的有利工具。

(二)假设检验步骤(掌握)1、提出原假设和替换假设;2、确定统计量;3、规定显著性水平;4、计算检验统计量的值;5、进行决策。

(三)假设检验中的小概率原理(理解)所谓小概率原理,是指发生概率很小的随机事件在一次试验中是几乎不可能发生的。

根据这一原理,我们可以作出是否接受原假设的决定。

(四)假设检验中的两类错误(理解)假设检验是根据样本提供的信息进行判断的,也就是由部分来推断整体,因而假设检验不可能绝对正确,它也可能犯错误。

所犯的错误有两种类型:1.弃真错误,又称错误。

2.取伪错误,又称错误。

二、假设检验方法(一)假设检验不同类型(掌握)1. 双侧假设检验2、单侧假设检验(二)均值检验(掌握)1.总体方差已知【例 5.3】某机床厂加工一种零件,根据检验知道,该厂加工零件的椭圆度渐近服从正态分布,其总体均值为0.081mm,总体标准差为0.025mm。

今另换一种新机床进行加工,取200个零件进行检验,得到椭圆度均值为0.076mm。

试问新机床加工零件的椭圆度总体均值与以前有无显著差别?解:按照假设检验的五个步骤进行第一步:建立假设第二步:选统计量第三步:规定水平.令=0.05(已知)第四步:计算检验统计量第五步:决策【例5.4】某纺织厂生产人造纤维,已知其平均拉力强度为1.56公斤,标准差为0.22公斤。

统计学提纲第五章汇总

统计学提纲第五章汇总

第五章抽样推断第一节抽样推断的相关基本概念一、抽样调查(一)什么是抽样调查抽样调查是按随机原则从总体中选取部分单位进行观察,用所获得的样本数据推算总体数量特征的一种非全面调查。

(二)抽样调查的特点:1.按随机原则去抽取调查单位。

随机原则也就是机会均等的原则,每个单位被抽中的机会相等。

其目的是保证抽出的样本是随机样本。

2.以样本数据估计总体参数或检验总体的某种假设。

抽样调查虽仅是直接调查被抽取的那一部分样本,但其目的是着眼于研究总体的数量特征。

3.抽样误差可以事先计算并加以控制。

(三)抽样调查的适用范围:1.能够解决全面调查无法或难以解决的问题;2.对能取得全面资料,但不必进行全面调查的情况。

3.可以补充和订正全面调查的结果;4.可用于对总体的某种假设进行检验,为行动决策提供依据。

(四)抽样调查的基本形式基本形式有简单随机抽样、类型随机抽样、等距抽样、整群抽样。

1.简单随机抽样按随机原则直接从总体中抽选样本单位进行调查。

这里,不论是重复抽样还是不重复抽样,每个单位都有相等的中选机会。

2.类型随机抽样(分层抽样)先将总体单位按某一标志分类,然后按随机原则直接从各类中抽取一定的样本单位进行调查。

3.等距抽样(机械抽样或系统抽样)它是先将总体单位按某一标志进行排列,再按照一定的间隔抽取样本单位进行调查。

4.整群抽样(集团抽样)整群抽样是先将总体单位按某一标志进行分群,再按随机原则从各群中抽取部分群,对抽中的群的所有单位进行调查是抽样组织方式。

二、抽样推断的概念及主要内容(一)抽样推断是在抽样调查的基础上,以样本实际数据计算的样本指标推算总体相应数量特征的一种统计分析方法。

(二)抽样推断的主要内容为:参数估计和假设检验三、抽样的有关基本概念(一)全及总体和样本总体1.全及总体简称总体,又称母体,它是指所要认识的研究对象的全体。

也就是具有某种共同性质的许多单位的集合体。

2.样本总体简称样本,又称子样,是从全及总体中抽取,代表全及总体的那部分单位的集合体。

地大《统计学》第五章 课堂笔记

地大《统计学》第五章 课堂笔记

地大《统计学》第五章假设检验课堂笔记◆主要知识点掌握程度假设检验是统计推断的组成部分,本章讨论的主要内容是:对总体的未知参数作出某种假设,然后抽取样本,构造适当的统计量,对假设的正确性进行判断的一套程序。

学习本章时,重点理解假设检验的基本思想和基本原理,掌握假设检验的步骤,并利用这些方法对未知参数的假设进行检验。

本章例题较多大家看懂后要多做练习,掌握巩固。

◆知识点整理一、假设检验的一般问题参数估计:用样本假设检验:对u提出假设,用检验假设是否成立.(一)什么是假设检验(了解)假设检验是对我们所关心的,却又是未知的总体参数先做出假设,然后抽取样本,利用样本提供的信息对假设的正确性进行判断的过程。

它是进行经济管理和决策的有利工具。

(二)假设检验步骤(掌握)1、提出原假设和替换假设;2、确定统计量;3、规定显著性水平;4、计算检验统计量的值;5、进行决策。

(三)假设检验中的小概率原理(理解)所谓小概率原理,是指发生概率很小的随机事件在一次试验中是几乎不可能发生的。

根据这一原理,我们可以作出是否接受原假设的决定。

(四)假设检验中的两类错误(理解)假设检验是根据样本提供的信息进行判断的,也就是由部分来推断整体,因而假设检验不可能绝对正确,它也可能犯错误。

所犯的错误有两种类型:1.弃真错误,又称错误。

2.取伪错误,又称错误。

二、假设检验方法(一)假设检验不同类型(掌握)1. 双侧假设检验2、单侧假设检验(二)均值检验(掌握)1.总体方差已知【例 5.3】某机床厂加工一种零件,根据检验知道,该厂加工零件的椭圆度渐近服从正态分布,其总体均值为0.081mm,总体标准差为0.025mm。

今另换一种新机床进行加工,取200个零件进行检验,得到椭圆度均值为0.076mm。

试问新机床加工零件的椭圆度总体均值与以前有无显著差别?解:按照假设检验的五个步骤进行第一步:建立假设第二步:选统计量第三步:规定水平.令=0.05(已知)第四步:计算检验统计量第五步:决策【例5.4】某纺织厂生产人造纤维,已知其平均拉力强度为1.56公斤,标准差为0.22公斤。

统计学第五章 概率与概率分布

统计学第五章 概率与概率分布

全概公式
(实例)
【例】某车间用甲、乙、丙三台机床进行生产,各种机床的 次品率分别为5%、4%、2%,它们各自的产品分别占总产量 的 25% 、 35% 、 40% ,将它们的产品组合在一起,求任取一 个是次品的概率。 解:设 A1表示“产品来自甲台机床”, A2表示“产品来自 乙台机床”, A3表示“产品来自丙台机床”, B表示“取到 次品”。根据全概公式有
全概公式

设事件A1,A2,…,An 两两互斥, A1+A2+…+ An=(满足这两个条件的事件组称为一个完备事 件组),且P(Ai)>0(i=1,2, …,n),则对任意事件B, 有 n
P( B) p( Ai ) P( B | Ai )
i 1
我们把事件A1,A2,…,An 看作是引起事件B发 生的所有可能原因,事件B 能且只能在原有A1, A2,…,An 之一发生的条件下发生,求事件B 的 概率就是上面的全概公式
概率的古典定义
(实例)

【例】某钢铁公司所属三个工厂的职工人数如下表。

从 该公司中随机抽取1人,问: (1)该职工为男性的概率 (2)该职工为炼钢厂职工的概率 某钢铁公司所属企业职工人数
工厂 炼钢厂 炼铁厂 轧钢厂 合计 男职工 4000 3200 900 8500 女职工 1800 1600 600 4000 合计 6200 4800 1500 12500
概率的性质与运算法则
随机事件的几个基本概念

1. 2. 3.

在相同条件下,对事物或现象所进行的观察
例如:掷一枚骰子,观察其出现的点数 试验具有以下特点
可以在相同的条件下重复进行 每次试验的可能结果可能不止一个,但试验的所 有可能结果在试验之前是确切知道的 在试验结束之前,不能确定该次试验的确切结果

(完整版)统计学总复习提纲

(完整版)统计学总复习提纲

(完整版)统计学总复习提纲统计学复习提纲第⼀章:绪论1、1)统计的含义:统计⼀词有统计⼯作、统计资料、统计科学三种含义,但最基本的还是统计⼯作。

没有统计⼯作就不会有统计资料,没有丰富的统计实践经验就不会产⽣统计科学。

2)统计的研究对象:统计学的研究对象是统计⼯作的规律,即搜集、整理和分析统计数据的⽅法,是⼀门⽅法论科学。

3)统计的特点:数量性、具体性、综合性2、统计学的基本概念1)总体:总体是指在某种共性的基础上由许多个别事物结合起来的整体。

总体有三⽅⾯特征:同质性、⼤量性、差异性总体可分为有限总体和⽆限总体2)总体单位:构成总体的个别事物叫总体单位。

总体和总体单位是根据统计研究的⽬的来确定的。

3)标志:标志是指说明总体单位特征的名称。

标志可分为数量标志(⽤数字回答问题)和品质标志(⽤⽂字回答问题)。

标志还可分为不变标志和可变标志。

不变标志:所有总体单位共同具有的特征。

它是构成总体的必要条件和确定总体范围的标准。

可变标志:在总体各单位之间必然存在差异的标志。

4)变量:可变标志中既有品质标志也有数量标志。

可变的数量标志就叫变量。

变量的具体数值叫变量值。

凡变量值只能以整数出现的变量,叫离散变量。

凡变量值可作⽆限分割的变量,叫连续变量。

5)指标与指标体系:指标:说明总体数量特征的概念。

指标体系:以共同的研究⽬的为纽带⽽相互联系的⼀系列统计指标。

6)指标与标志的区别与联系区别有⼆:第⼀,指标说明总体的特征;⽽标志说明总体单位的特征。

第⼆,指标只反映总体的数量特征,所有指标都要⽤数字来回答;标志则既有反映总体单位的数量特征(⽤数字回答),也有反映总体单位的品质特征(⽤⽂字回答)。

⼆者联系:主要表现:许多标志的数值都是由总体各单位的数量标志的标志值汇总⽽得来的。

品质标志虽然本⾝不具有数值,但有些指标是按品质标志分组分组计算得出。

由于总体和总体单位可随统计研究的⽬的⽽易位,故指标和数量标志在⼀定的条件下可以变换。

统计学5章

统计学5章
在重复简单随机抽样时,样本平均数的抽样分布
有数学期望值 E ( x ) = a a 代表全及总体平均数) (
设总体变量有 N 个:X1,X2,… , XN,则
样本容量为 n:x1 , x2 , … , xn , 则:
X1 X 2 X N X= N
x1 x2 xn x = n
∵ ∴ =
2 x
x1, x2,…, xn相互独立
1 n2 E x1 X


2
E x2 X


2
E xn X
2


2
E ( xi X )( x j X ) i j
=
1 n2 1 n2
E ( x X )2 E x X 1 2 E X X
对于属性总体来说则有如下对应样本指标: 设样本总体 n 个单位中有 n1 个单位具有某种属性, n0 个单位不具有某种属性,且n1 +n0 = n 。则:
n1 p n n0 n n1 q 1 p n n
样本标准差
s
p1 p
(二)参数和统计量
(三)样本容量与样本个数
样本容量是指一个样本所包含的单位数,用 n 来 表示。一般地讲,样本单位数达到或超过30个的样本 称为大样本,而在30个以下称为小样本。 样本个数又称样本可能数目,是指从全及总体中
二、抽样推断的几个基本概念
抽样推断的几个基本概念(见图5-1)。
图5-1 抽样推断的几个基本概念
(一) 总体和样本
在抽样推断中面临两个不同的总体,即 全及总体和样本总体(见图5-2)。
图5-2 全及总体和样本总体关系示意
(一) 总体和样本
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

统计学提纲第五章总结————————————————————————————————作者:————————————————————————————————日期:第五章抽样推断第一节抽样推断的相关基本概念一、抽样调查(一)什么是抽样调查抽样调查是按随机原则从总体中选取部分单位进行观察,用所获得的样本数据推算总体数量特征的一种非全面调查。

(二)抽样调查的特点:1.按随机原则去抽取调查单位。

随机原则也就是机会均等的原则,每个单位被抽中的机会相等。

其目的是保证抽出的样本是随机样本。

2.以样本数据估计总体参数或检验总体的某种假设。

抽样调查虽仅是直接调查被抽取的那一部分样本,但其目的是着眼于研究总体的数量特征。

3.抽样误差可以事先计算并加以控制。

(三)抽样调查的适用范围:1.能够解决全面调查无法或难以解决的问题;2.对能取得全面资料,但不必进行全面调查的情况。

3.可以补充和订正全面调查的结果;4.可用于对总体的某种假设进行检验,为行动决策提供依据。

(四)抽样调查的基本形式基本形式有简单随机抽样、类型随机抽样、等距抽样、整群抽样。

1.简单随机抽样按随机原则直接从总体中抽选样本单位进行调查。

这里,不论是重复抽样还是不重复抽样,每个单位都有相等的中选机会。

2.类型随机抽样(分层抽样)先将总体单位按某一标志分类,然后按随机原则直接从各类中抽取一定的样本单位进行调查。

3.等距抽样(机械抽样或系统抽样)它是先将总体单位按某一标志进行排列,再按照一定的间隔抽取样本单位进行调查。

4.整群抽样(集团抽样)整群抽样是先将总体单位按某一标志进行分群,再按随机原则从各群中抽取部分群,对抽中的群的所有单位进行调查是抽样组织方式。

二、抽样推断的概念及主要内容(一)抽样推断是在抽样调查的基础上,以样本实际数据计算的样本指标推算总体相应数量特征的一种统计分析方法。

(二)抽样推断的主要内容为:参数估计和假设检验三、抽样的有关基本概念(一)全及总体和样本总体1.全及总体简称总体,又称母体,它是指所要认识的研究对象的全体。

也就是具有某种共同性质的许多单位的集合体。

2.样本总体简称样本,又称子样,是从全及总体中抽取,代表全及总体的那部分单位的集合体。

全及总体是我们所要研究的对象,而样本总体则是我们所要观察和采集数据的对象,两者是有区别。

(二)样本容量和样本个数1.样本容量是指样本所包含的单位数。

2.样本个数又称样本可能数目,也就是从一个总体中可能抽取的样本个数。

重复抽样时:; 不重复抽样时:对于一次抽样调查,全及总体是唯一确定的,而一个全及总体可能抽出很多个样本总体;样本的个数和样本的容量有关,也和抽样的方法有关。

(三)参数和统计量1.根据全及总体各个单位的标志值或标志属性计算的,反映总体某一数量特征的综合指标称为全及指标,也称为总体参数,简称参数。

2.由样本总体各单位标志值或标志属性计算的,反映样本数量特征,并用以估计全及指标的综合指标称为样本指标,或称为抽样指标、统计量。

统计量有:样本平均数nx x ∑= 抽样成数p x =样本方差:()nx x ∑-=22σpq p p =-=)1(2σ样本标准差:()nx x ∑-=2σ[注意:()12-=∑-n S x x ]σ1(p=)pq-p=对于一个问题,全及总体是唯一确定的,而一个总体有多少样本;总体指标值是唯一确定的;而统计量是样本变量的函数,也就是样本统计量就有多种取值。

(四)重复抽样和不重复抽样重复抽样:从有N个单位的总体中,每次随机抽取1个单位,登记其标志表现后放回,再从总体中重新抽取,一直抽取n次。

不重复抽样:从有N个单位的总体中,每次随机抽取1个单位,登记其标志表现后不放回,再从总体中重新抽取,一直抽取n次。

第二节抽样误差一、误差调查资料的检查是指对资料的准确性、完整性、及时性检查(一)登记性误差凡是由于错误判断事实、错误登记事实或错误计算而发生的误差,登记性误差在全面调查与非全面调查中都可能存在。

它分为1.偶然登记性误差;2.系统登记性误差其特点是具有明显的倾向性和一贯性。

(二)代表性误差在没有登记性误差的条件下,由于用样本指标代表总体指标而产生的误差,它分为:1.偏差凡是由于违反随机原则抽样而产生的代表性误差,又称为系统性代表误差、非偶然性代表误差。

2.抽样误差 是指由于随机抽样的偶然因素,使样本的结构不足以代表总体各单位的结构,而引起抽样指标和总体指标之间的误差,也称为随机误差、偶然性代表误差。

抽样误差既不包括登记误差,也不包括系统性代表误差。

影响抽样误差的因素有:总体各单位标志值的差异程度;样本的单位数;抽样的方法;抽样调查的组织形式。

二、抽样平均误差。

抽样平均误差是反映抽样误差一般水平的指标,它反映了抽样指标与总体指标的平均离差程度,即样本指标与总体指标的标准差。

通常用抽样平均数的标准差来衡量MX x x ∑-=2)(μ MP p p∑-=2)(μi x X 为第i 个样本的平均数;为总体平均数; M 为样本个数i p P 为第i 个样本的成数;为总体成数;M 为样本个数抽样平均误差的作用首先表现在它能够说明样本指标代表性的大小。

平均误差大,说明样本指标对总体指标的代表性低;反之,则说明代表性高。

抽样平均数的平均数=总体平均数。

抽样平均误差的计算: (一)简单随机抽样条件下:1、重复抽样: nnσσμ==22、不重复抽样:)1(2--=N nN nσμ当总体单位数N 很大时,)1(2N n n-=σμ当N 很大且很小时,nσμ=其中,σ为总体标准差,n 为样本单位数,在总体标准差未知,用样本标准差2()1x x x S n -'=-∑代替σ;但如果是大样本时,可以用样本标准差nx x S x ∑-=2)(代替xS '。

(二)分层抽样条件下: 分类 1 2 … k 合计 总体单位数 … N 总体标准差 … 样本单位数 …n抽重复抽样:不重复抽样:若总体标准差未知时,可用样本标准差代替。

分层抽样为等比例抽样时: (三)整群抽样条件下:由于整群抽样一般采用不重复抽样,因而有:其中,R 为总体群数;r 为样本群数;为群(组)间方差。

为第i 群的样本平均数;为全样本平均数,。

三、抽样极限误差抽样极限误差是指用绝对值形式表示的样本指标与总体指标之间偏差的最大允许范围。

Xx x -=∆ Pp p -=∆即:x x x X x ∆+≤≤∆- p p p P p ∆+≤≤∆- 四、抽样误差的概率度抽样极限误差以抽样平均误差为标准单位来衡量。

即把极限误差 △x 或 △p 相应除以x μ或p μ,得出相对的误差程度t 倍,t 称为抽样误差的概率度。

于是有:x x t μ=∆或p p t μ=∆概率度与概率保证程度之间的几个数值关系:概率度1234概率保证程度 68.27% 95.45% 99.73% 99.99%五、样本容量的确定 在简单随机抽样下:1.在重复抽样的条件下,样本容量的确定:222xt n ∆=σ 22)1(x p p t n ∆-=2.在不重复抽样的条件下,样本容量:22222xx xNt n N t σσ=∆+ 222(1)(1)p Nt p p n N t p p -=∆+-第三节 抽样估计一、抽样估计的的概念抽样估计就是利用实际调查计算的样本指标值来估计相应的总体指标值。

抽样估计有点估计和区间估计两种估计量是根据样本数据来估计总体参数的形式。

一般情况下估计量就是样本统计量。

估计量的优良标准:(1)无偏性 要求样本指标值的平均数等于被估计的总体指标值,即无系统性误差。

(2)有效性 要求作为优良估计量的方差(标准差)应比其它估计量的方差(标准差)小,即估计量的数学期望等于总体参数;(3)一致性 当作为优良估计量的样本容量充分大时,抽样指标也应充分地靠近总体指标. 即估计量的误差随着样本容量的增大而减小。

二、点估计参数的点估计:直接以样本指标作为相应总体参数的估计量。

总体平均数的估计:用样本平均数估计总体平均数 三、区间估计参数的区间估计:根据给定的概率保证程度的要求,利用实际抽样资料,指出总体被估计值的上限和下限。

抽样估计的置信度是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。

注意:抽样估计的置信度并不是概率度,但两者之间存在一一对应的关系。

2.区间估计步骤:(1)计算抽样平均数和标准差。

(2)计算抽样平均误差(3)计算抽样极限误差x x t μ=∆(4)根据给定的抽样极限误差计算总体平均数的上下限x x x X x ∆+≤≤∆-如果抽样误差的概率度已给出,查《正态分布概率表》得出置信度。

四、抽样估计的精度x x X x x-∆==误差率 估计精度=1-误差率误差率是抽样的相对误差率。

概率保证程度,置信区间长度及估计精度的关系:概率保证程度越大,置信区间长度越长,估计精度越低;反之,概率保证程度越小,置信区间长度越短,估计精度越高。

例1、某学校进行一次统计学测验,为了解学生的考试情况,随机从全校统计学考生中抽选部分学生进行调查,所得资料如下:成绩60以下60-70 70-80 80-9090以上 组中值 55 65758595人数 102022408(1)试以95.45%的可靠性估计该校学生统计学的平均成绩的范围;(2)试以95.45%的可靠性估计该校学生成绩在80分以上的学生所占的比重的范围;(3)如果其它条件不变,将允许极限误差缩小一半,应抽取多少名学生?解:1、该校学生统计学平均成绩的范围: 计算样本平均数:∑∑∑∑⋅==ii iii i ff x f f x x 1008951055⨯++⨯=Λ=76.6(分)计算样本标准差:∑∑-=ii ff x x 2)(σ=11.38(分) 计算抽样平均误差:nxσμ=100377.11==1.1377(分)查《正态概率表》得出误差概率度t=2计算抽样极限误差:△x =t μx =2×1.1377=2.2754 该校学生考试的平均成绩的区间范围是: x-△x ≤X≤x+△x76.6-2.2754≤X≤76.6+2.275474.32≤X≤78.89在95.45%概率保证程度下,该校学生的平均成绩74.32%—78。

89.99%之间。

2、估计该校学生成绩在80分以上的学生所占的比重的范围 计算样本成数平均数:48=0.48100x p == 计算样本成数标准差:(1)0.480.520.4996p p σ=-=⨯=计算抽样平均误差:0.49960.04996100pnσμ=== 查《正态概率表》得出误差概率度t=2 计算抽样极限误差:20.049960.09992p p t μ∆==⨯=80分以上学生所占的比重的范围:p p p P p ∆+≤≤∆-P=p ±△p =0.48±0.09992 0.3801≤P≤0.5799在95.45%概率保证程度下,该校学生成绩在80分以上学生所占的比重在38.01%—57.99%之间。

相关文档
最新文档