管理统计学期末复习
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、统计学方法可以解决的主要问题有哪些?
1)现状的客观描述(如不同状况的百分比、均值)2)均值、方差、百分比等统计值是否有本质区别(随机差异?本质差异?)3)依据样本推断总体的概率分布是什么4)依据数据找出问题的显著因素与关键因素5)寻找变量的相互关系(相关关系)6)寻找变量间的数量规律7)依据规律把变量分为具有某些共同特性的类别8)依据已有规律,判别新数据属于哪个类别等。
2、统计学的发展经历了哪些阶段?说明每个阶段的特点。
1)古典统计学时代:政治算术派国势学派2)近代统计学时代:数理统计学派社会统计学派3)现代统计学时代:区间估计理论假设检验理论
1、数据计量尺度分为哪几种?不同计量尺度各有什么特点?
答:一、定类尺度二、定序尺度三、定距尺度四、定比尺度A
定类尺度特点:
(1)定类尺度是最粗略、计量层次最低的计量尺度。(2)定类尺度作为代码的数值不反映各类的优劣、量的大小或顺序,不可以区分大小或进行任何数学运算。(3)对定类尺度的计量结果,可以计算每一类或组中各元素或个体出现的频数。
B、定序尺度的特点:(1)定序尺度可以将研究对象分为不同的类别,而且可以反映各类的优劣、量的大小或顺序。(2)定序尺度比定类尺度精确一些,但只是测度了类别之间的顺序,而未测量出类别之间的精确差
值。(3)计量结果只能比较大小,不能进行加、减、乘、除。C、定距尺度特点:
(1)定距尺度不但可以用数字表示现象各类别的不同和顺序大小的差异,还可以用确切的数值反映现象之间在量方面的差异。(2)反映现象规模水平的数据必须以定距尺度计量,例如产品产量、人口数、国内生产总值等(3)结果可以进行加减。D、定比尺度的特点:
(1)反映现象的结构、比重、速度、密度等数量关系(2)定比尺度的计量结果可以进行加、减、乘、除等数学运算
2、统计变量分类有哪些?统计数据有哪几种?
统计变量定类变量、定序变量、数字变量;统计数据有定类数据、定序数据、定距数据和定比数据。
定类变量的值就是定类数据;定序变量的值就是定序数据;数字变量的值即为定距数据或定比数据(这两者统称为定量数据)。
3、抽样调查分为哪两类?各有什么特点?抽样调查分为随机抽样和非随机抽样。
随机抽样:在目标总体中不按任何规则抽取一定数量的样本。特点:总体中每个单位被抽中的概率是相同的,完全由许多随机因素综合作用来决定,既排除了抽样时人的主观随意性,也排除了人的主观能动性。当总体变异性大时,随机抽得的样本代表性差。误差可以估计且所需样本数量大,操作不灵活,成本较高。适合结论性调查非随机抽样:在目标总体中按某种规则抽取一定数量的个体作为样本。特点:误差不可估计,使用与探索性研究。
4、简述企业数据收集过程
1)首先要弄清楚收集的目的,明确收集方向。一般来说,收集调研数据的用途可分为探测性调研、描述性调研和因果性调研三类;
2)制定数据收集计划。计划的制定要贴近现实情况,具备较强的可操作性;3)实施数据收集计划。
1、简述频数分布表的编制过程
2、什么是茎叶图?有什么特点?
2 144677
把每一项观察分解为茎值和叶值
1茎值确定组别,数的大小基本不变或变化不大的位作为一个主干; 3 028 2叶值确定频数,将变化大的位的数作为分枝(叶) 4 1 3计数
1、简述均值、众数和中位数的关系(一)正态分布时三者的关系
正态分布是以算术平均数为对称轴,两边频数相等。其中频数最大的标志值就是数列居中位置的标志值,也就是权数最大、最具有代表性的那个变量值。因此,正态分布时,算术平均数、中位数和众数三者相等,
(二)数据分布不对称时三者的关系
1、左偏时众数大于中位数,中位数大于算术平均数;当右偏时算术平均数大于中位数,而中位数又大于众数。
2、数据左偏分布,峰部在右,即频数最大的变量值在右,则众数在左,左边各组频数虽小,但组数多。必定拉动均值向左边靠。处于频数中间的中位数应在两者之间。
3、数据右偏分布,峰部在左,即频数最大的变量在左,则众数在右,由于算术平均数收极端值影响,在发生右偏出现较大极端值时,算术平均数将增加得更快,而中位数总居于中间位置。
1、伯努利试验的条件是什么?
伯努利试验要满足:1、各次试验独立进行;2、每次试验又有两种结果:事件A发生或不发生。
2、泊松分布的应用条件是什么?
泊松分布的应用条件是总体的大小至少必须是样本大小的10倍;并且某一特征在每次试验中出现的概率P必须小于0.1,适用于描述在单位时间内随机发生的次数。 1、为什么要进行抽样?什么是抽样分布?
有时,由于总体容量太大、耗时长、成本高、检验具有破坏性,实际操作中由于事件和成本等限制条件存在,无法对总体中的样本进行一一分析。这时,只要样本选择得当,抽样便不失为一种可行性高、适用性强的方法和技术。假如从一个总体中随机抽出样本容量相同的所有可能样本,则可以根据这些样本计算出某个统计量得所有可能值,这些可能值形成一个分布,称为这样本统计量的抽样分布。 1、样本容量大小由哪几个因素决定?
1)总体方差数值大小的影响。总体方差大,抽样误差大,应多抽取样本。
2)置信程度的高低,即置信水平的大小。置信水平越大,推断正确的把握就越大。因而要有较大把握就需要更大的样本容量。
3)允许误差的大小,推断精确,误差低,样本容量要求大 1、简述方差分析的原理。方差分析作为一种统计方法,是把实验数据的总变异分解为若干个不同来源的分量。因而它所依据的基本原理是变异的可加性。不同来源的变异只有当它们可加时,才能保证总变异分解的可能。具体地讲,它是将总平方和分解为几个不同来源的平方和(这里的平方和指实验数据与平均数离差的平方和)。
第2/6页
1、简述卡方分布的特征。
1)卡方统计量非负。我们注意到卡方的计算公式为若干个非负数相加,因此,在卡方分布的图像中,只有第一象限才有分布图。
2)卡方分布与自由度有关。自由度越小,分布就越向左边倾斜;而随着自由度的增加,卡方分布的偏斜程度有所缓和,逐渐趋向对称的性质;当自由度继续增大时,卡方分布将逐步趋近于对称,即正态分布。
3)在卡方分布中,数据呈正偏或右偏分布。卡方检验一般是单侧检验,其尾部为拒绝的区域(拒绝区域由显著性水平ɑ决定)。
2、简述拟合优度检验及列联表的自由度如何确定。
1)在进行拟合优度检验时,自由度得计算公式为:df=k-m-1;式中k为数据类别个数,m为样本数据中估计的参数个数,在不考虑任何被估计的参数时,减去1是必须的。
2)列联表自由度的公式为df=(r-1)(c-1);r为列联表中心矩阵的行数;c 为列联表中心矩阵的列数。
、简述时间序列的两种的模型。
时间序列一般有两种的模型:乘法模型和加法模型。
1)乘法模型是假设时间序列各个构成部分对序列的影响均按比例变化。四种因素对事物的
影响是相互的,它们之间存在着一定的关系,因而时间序列中各观察值表现为各种因素的乘积。时间序列的乘法模型可表示为:Y=T*S*C*I;其中T和Y的度量单位相同,是总量指标,而S,C和I为比率,以百分比表示。