统计学第四版答案(贾俊平)知识分享
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学第四版答案(贾
俊平)
请举出统计应用的几个例子:
1、用统计识别作者:对于存在争议的论文,通过统计量推出作者
2、用统计量得到一个重要发现:在不同海域鳗鱼脊椎骨数量变化不大,推断所有各个不同海域内的鳗鱼是由海洋中某公共场所繁殖的
3、挑战者航天飞机失事预测
请举出应用统计的几个领域:
1、在企业发展战略中的应用
2、在产品质量管理中的应用
3、在市场研究中的应用④在财务分析中的应用⑤在经济预测中的应用
你怎么理解统计的研究内容:
1、统计学研究的基本内容包括统计对象、统计方法和统计规律。
2、统计对象就是统计研究的课题,称谓统计总体。
3、统计研究方法主要有大量观察法、数量分析法、抽样推断法、实验法等。④统计规律就是通过大量观察和综合分析所揭示的用数量指标反映的客观现象的本质特征和发展规律。
举例说明分类变量、顺序变量和数值变量:
分类变量:表现为不同类别的变量称为分类变量,如“性别”表现为“男”或“女”,“企业所属的行业”表现为“制造业”、“零售业”、“旅游业”等,“学生所在的学院”可能是“商学院”、“法学院”等
顺序变量:如果类别有一定的顺序,这样的分类变量称为顺序变量,如考试成绩按等级分为优、良、中、及格、不及格,一个人对事物的态度分为赞成、中立、反对。这里的“考试成绩等级”、“态度”等就是顺序变量。
数值变量:可以用数字记录其观察结果,这样的变量称为数值变量,如“企业销售额”、“生活费支出”、“掷一枚骰子出现的点数”。
定性数据和定量数据的图示方法各有哪些:
1、定性数据的图示:条形图、帕累托图、饼图、环形图
2、定量数据的图示:
a、分组数据看分布:直方图
b、未分组数据看分布:茎叶图、箱线图、垂线图、误差图
c、两个变量间的关系:散点图
d、比较多个样本的相似性:雷达图和轮廓图
直方图与条形图有何区别:
1、条形图中的每一个矩形表示一个类别,其宽度没有意义,而直方图的宽度则表示各组的组距。
2、由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。
3、条形图主要用于展示定性数据,而直方图则主要用于展示定量数据。
一组数据的分布特征可以从哪几个方面进行描述:
1、数据的水平,反映数据的集中程度
2、数据的差异,反映各数据的离散程度
3、分布的形状,反映数据分布的偏态和峰态
说明平均数、中位数和众数的特点及应用场合:
平均数也称为均值,它是一组数据相加后除以数据的个数而得到的结果。平均数是度量数据水平的常用统计量,在参数估计以及假设检验中经常用到。
中位数是一组在数据排序后处于中间位置上的数值,用Me表示。中位数是用中间位置上的值代表数据水平,其特点是不受极端值影响,在研究收入分配中很有用。
众数与数据出现的次数有关,着眼于对各数据出现的频率的考察,其大小只与这组数据中的部分数据有关,其特点是不受极端值的影响,具有不惟一性,一组数据中可能会有一个人众数,也可能会有多个或没有。
为什么要计算离散系数:
极差、平均差、方差和标准差等都是反映数据分散程度的绝对值,其数值的大小取决于原变量值本身水平高低的影响。
它们与原变量值的计量单位相同,采用不同计量单位计量的变量值,其离散程度的测度值也就不同。因此,为消除变量值水平高低和数量单位不同对离散程度的测度值的影响,需要计算离散系数。
举例说明离散型随机变量和连续性随机变量:
离散型随机变量:设X是一个随机变量,如果它全部可能的取值只有有限个或可数无穷个,则称X为一个离散型随机变量。包括二项分布、泊松分布、超几何分布,如一定时间内某航空公司接到的订票电话数
连续型概率分布:包括正态分布、均匀分布和指数分布。
叙述正态分布曲线的特点:
正态曲线的图形是关于x=u对称的钟形曲线,且峰值在x=u处。正态分布的两个参数u和σ一旦确定,正态分布的具体形式也惟一确定,不同参数取值的正态分布构成一个完整的“正态分布族”。当X的取值向横轴左右两个方向无限延伸时,正态曲线的左右两个尾端也无限渐近横轴,但理论上永远不会
与之相交。④正态随机变量在特定区间上取值的概率由正态曲线下的面积给出,而且其曲线下的总面积等于1
解释中心极限定理的含义:
随着样本量n的增大(通常要求n>=30),不论原来的总体是否服从正态分布,样本均值的概率分布都将趋于正态分布,其分布的期望值为总体均值u,方差为总体方差的1/n。这一定理可表述为:从均值为u、方差为σ^2的总体中,抽取样本量为n的随机样本,当n充分大时(通常要求n>=30),样本均值的分布近似服从均值为u,方差为σ^2/n的正态分布。
说明区间估计的基本原理:
区间估计,是在点估计的基础上给出总体参数估计的一个估计区间,该区间通常是由样本统计量加减估计误差得到的。与点估计不同,进行区间估计时,根据样本统计量的抽样分布,可以对统计量与总体参数的接近程度给出的一个概率度量。
简述评价估计量的标准:
无偏性:它是指估计量抽样分布的期望值等于被估计的总体参数;有效性:它是指估计量的方差尽可能小;
一致性:它是指随着样本量的增大,点估计量的值越来越接近被估计总体的参数
解释置信水平的含义:
置信水平,是指总体参数值落在样本统计值某一区内的概率;而置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。置信区间越大,置信水平越高。
简述样本量与置信水平、总体方差、估计误差的关系
样本量与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需的样本量也就越大;样本量与总体方差成正比,总体的差异越大,所要求的样本量也越大;样本量与估计误差的平方成正比,即允许的估计误差的平方越大,所要求的样本量就越大。
解释原假设和备择假设:
原假设:它通常是研究者想收集证据予以推翻的假设,用H0表示,原假设所表达的含义总是指参数没有变化或变量之间没有关系,等号“=”总放在原假设上。
备择假设:通常指研究者想收集证据予以支持的假设,用H1或Ha表示。备择假设所表达的含义是总体参数发生了变化或变量之间有某种关系。备择假设的形式总是为H1:u≠u0,H1:u
第一类错误和第二类错误分别是指什么?
它们发生的概率大小之间存在怎样的关系:第Ⅰ类错误(弃真错误):原假设为真时拒绝原假设时所犯的错误第Ⅱ类错误(取伪错误):原假设为假时未拒绝原假设
当样本容量n确定后,当α变小时,则检验的拒绝域变小,相应的接受域会变大,因此β值也就随之变大;相反,若β变小,则α又会变大.
样本量的大小与显著性有怎样的关系:
显著性水平与样本的大小密切相关,相关量越大,检验统计量的值也就越大,显著性水平越小,就越有可能拒绝原假设。
相关分析主要解决哪些问题: