统计学大题(1-3)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一,根据以下数据,分别计算:算术平均数,中位数,众数,标准差。 抽取零售企业105家的销售收入如下表:
先求出组中值,如上表所示。 直接按计算器,可得:算术平均数= 标准差=
中位数=60+ {(105/2)-34/26}*20= 众数=60+{(26-19)/(26-19)+(26-20)}*20= 附:计算器按法:开机→mode →2→shift →mode →1→=→
输入数据(30 shift ,15 M+ 50 shift ,19 M+ …… )→shift →2 →计算器即显示各个指标,1为平均数,2为总体标准差,3为样本标准差 2,区间估计
求置信区间的方法与步骤:
第一步 根据中心极限定理,构造一个含未知参数的分布 第二步 对给定的置信度, 1-α 查表得到标准分z α/2 第三步 利用不等式变形,求出未知参数1-α置信区间. 二,总体均值的区间估计
①正态总体,方差已知,(大、小)样本
例1,某种零件长度服从正态分布,从该批产品中随机抽取9件,测得其平均长度为 mm 。已知总体标准差? =,试建立该种零件平均长度的置信区间,给定置信水平为。 解:已知X-N (?,,?x =, n =9, 1-? = ,Z?/2= 总体均值?的置信区间为
结论: 我们可以95%的概率保证该种零件的平均长度在~ mm 间。
当%5>N n 时,需要修正,⎪⎪⎭
⎫
⎝⎛--⋅±1:2N n N n Z x σ
μα 例2,某企业生产某种产品的工人有1000人,某日采用非重复抽样 抽取100人调查他们的当日产量,样本人均产量为35件,如果总体产量的标准差为件,试以%的置信度估计平均产量的抽样极限误差和置信区间。
②正态总体,大样本,当方差未知时,以样本方差替代即可 ③总体比例的区间估计
重复抽样VS 不重复抽样 : ⎪⎪⎭
⎫
⎝
⎛--⋅
±⎪⎪⎭⎫
⎝⎛⋅
±==1::)
,(:222N n N n pq Z p P n pq Z p P pq s p x α
α大样本
例:某企业在一项关于职工流动原因的研究中,从该企业前职工的总体中随机选取了200人组成一个样本。在对其进行访问时,有140人说他们离开该企业是由于同管理人员不能融洽相处。试对由于这种原因而离开该企业的人员的真正比例构造95%的置信区间。
解:已知 n =200 , p
ˆ= , ?= ,Z?/2=
结论:我们可以95%的概率保证该企业职工由于同管理人员不能融洽相处而离开的比例在%~%之间。
S 代替。 自由度为(n-1) 置信区间为:()
⎪⎪⎭
⎫
⎝
⎛⋅
±-n s t x n 12
α
例:某商场从一批袋装食品中随机抽取10袋,测得每袋重量(单位:克)分别为789、780、794、762、802、813、770、785、810、806,如果袋装重量服从正态分布,要求以95%的把握程度,估计这批食品的平均每袋重量的区间范围及其允许误差。 三,样本容量的计算
估计总体均值时样本容量的确定 :
①根据均值区间估计公式可得样本容量n 为 2
2
220∆=σαZ n
②根据比例区间估计公式可得样本容量n 为 2
22)
1(∆
-=p p Z n α(若总体比例P 未知时,可用样本比例来
代替)
例:某超级市场欲估计每个顾客平均每次购物的金额,根据过去的经验,标准差大约为160元,现要求以95%的置信度估计每个顾客的购物金额,并要求允许误差不超过20元,应抽多少顾客作样本? 总体方差未知时样本容量的确定
例1,某品牌电脑公司,准备将电脑销售市场转入拉美地区,事先派出有关人员到该地区查询资料,以便估计一下该地区有电脑的家庭所占的比例。公司希望这一比例的估计允许误差不超过,且置信度为95%。问:要抽取多大容量的样本?(事先对总体一无所知) 。 解: 已知?=,?=,Z ?/2=,当p 未知时用最大方差代替 应抽取的样本容量为
例2,某企业对一批产品进行质量检查,这批产品的总数为5000件,过去几次同类调查所得的产品合格率为93%、95%、和96%,为了使合格率的允许误差不超过3%,在%的概率下应抽查多少件产品? 4. 假设检验
步骤:1、提出原假设和备择假设
原假设:有待检验的假设 备择假设:拒绝原假设后可供选择的假设。 原则:(1)“不轻易拒绝原假设(2) 原假设总是与等号连在一起。 假设的三种形式: (1)双侧检验:
(2)左侧检验:如果指标越大越好以及要求指标是否明显降低。 (3) 右侧检验: 如果指标越小越好以及要求指标是否明显增加
2、选择适当的统计量,并按照中心极限定理确定其分布形式
3、选择选择显着性水平,确定临界值。
显着性水平α表示H 0为真时拒绝H 1 的概率,即拒绝原假设的风险。( α总是与 H 1相对应) 4、抽取样本,计算样本统计量, 比较统计量与临界值的大小。 5、作出统计结论和经营管理决策结。 例题1:(右侧检验)
根据过去大量资料,某厂生产的产品的使用寿命服从正态分布N(1020,1002
), 现从最近生产的一批产品中随机抽取16件,测得样本平均寿命为1080小时。试 在的显着性水平下判断这批产品的使用寿命是否有显着提高? 例题2:(左侧检验)
一个生产宇航飞行器的工厂需要经常购买一种耐高温的零件,要求抗热的 平均温度是1250℃,在过去,供货商提供的产品都符合要求,并从大量的 数据获知零件抗热的标准差为 150 ℃,在最近的一批进货中随机测试了100 个零件,其平均的抗热为 1200 ℃, 能否接 受这批产品?工厂希望对实际产 品符合要求而错误地加以拒绝的风险为。 例题3:(t-检验)
相关知识:正态总体、方差未知、小样本时服从t 分布
某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准 重量为1000克。某日随机抽查9包,测得样本平均重量为986克,样本标准差 为24克。试问在的检验水平上, 能否认为这天自动包装机工作正常?
例题4: (Z-检验)
相关知识: 对总体比例的假设检验通常是在大样本的条件下进行的,根据 正态分布来确定临界值,即采用Z-检验法。
某研究者估计本市居民家庭的电脑拥有率为30%。现随机抽查了200个家庭,
其中68个家庭拥有电脑。试问该研究者的估计是否可信(α=10%)? 5. 相关与回归分析: 相关知识:(1)相关系数的计算公式:
一般用
表示总体相关系数,用r 表示样本相关系数。相关系数r 的平方等于可决系数。()()
∑∑∑∑∑∑∑-⋅--=
2
2
2
2
y y n x x n y
x xy n r
(2)估计标准误差:用来说明回归方程代表性大小的统计分析指标。若估计标准误差小,表明回归方程
ρ