统计学思考题(20200920020408)
统计学思考题
统计学思考题第一章思考题1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。
第二章思考题2.1什么是二手资料?使用二手资料应注意什么问题与研究内容有关,由别人调查和试验而来已经存在,并会被我们利用的资料为“二手资料”。
使用时要进行评估,要考虑到资料的原始收集人,收集目的,收集途径,收集时间使用时要注明数据来源。
2.2比较概率抽样和非概率抽样的特点,指出各自适用情况概率抽样:抽样时按一定的概率以随机原则抽取样本。
统计学思考题课后答案
统计学第一章1.什么是统计学?怎样理解统计学与统计数据的关系?答:统计学是一门收集、整理、显示和分析统计数据的科学。
统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。
2.简要说明统计数据的来源答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。
间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。
3.简要说明抽样误差和非抽样误差答:统计调查误差可分为非抽样误差和抽样误差。
非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。
抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。
4.答:(1)有两个总体:A品牌所有产品、B品牌所有产品(2)变量:口味(如可用10分制表示)(3)匹配样本:从两品牌产品中各抽取1000瓶,由1000名消费者分别打分,形成匹配样本。
(4)从匹配样本的观察值中推断两品牌口味的相对好坏。
第二章、统计数据的描述思考题1描述次数分配表的编制过程答:分二个步骤:(1)按照统计研究的目的,将数据按分组标志进行分组。
按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。
按数量标志进行分组,可分为单项式分组与组距式分组单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。
统计分组应遵循“不重不漏”原则(2)将数据分配到各个组,统计各组的次数,编制次数分配表。
2.解释洛伦兹曲线及其用途答:洛伦兹曲线是20世纪初美国经济学家、统计学家洛伦兹根据意大利经济学家帕累托提出的收入分配公式绘制成的描述收入和财富分配性质的曲线。
洛伦兹曲线可以观察、分析国家和地区收入分配的平均程度。
3. 一组数据的分布特征可以从哪几个方面进行测度?答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。
(完整word版)统计学课后简答题答案
第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
第二章思考题2.1什么是二手资料?使用二手资料应注意什么问题与研究内容有关,由别人调查和试验而来已经存在,并会被我们利用的资料为“二手资料”。
使用时要进行评估,要考虑到资料的原始收集人,收集目的,收集途径,收集时间使用时要注明数据来源。
2.2比较概率抽样和非概率抽样的特点,指出各自适用情况概率抽样:抽样时按一定的概率以随机原则抽取样本。
每个单位别抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽到的概率。
技术含量和成本都比较高。
如果调查目的在于掌握和研究对象总体的数量特征,得到总体参数的置信区间,就使用概率抽样。
非概率抽样:操作简单,时效快,成本低,而且对于抽样中的统计学专业技术要求不是很高。
它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。
统计学复习思考题与练习题参考答案
第一章复习思考题与练习题:一、思考题1.统计的基本任务是什么?2.统计研究的基本方法有哪些?3.如何理解统计总体的基本特征。
4.试述统计总体和总体单位的关系。
5.标志与指标有何区别何联系。
二、判断题1、社会经济统计的研究对象是社会经济现象总体的各个方面。
()2、在全国工业普查中,全国企业数是统计总体,每个工业企业是总体单位。
()3、总体单位是标志的承担者,标志是依附于单位的。
()4、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。
()5、全面调查和非全面调查是根据调查结果所得的资料是否全面来划分的()。
三、单项选择题1、社会经济统计的研究对象是()。
A、抽象的数量关系B、社会经济现象的规律性C、社会经济现象的数量特征和数量关系D、社会经济统计认识过程的规律和方法2、某城市工业企业未安装设备普查,总体单位是()。
A、工业企业全部未安装设备B、工业企业每一台未安装设备C、每个工业企业的未安装设备D、每一个工业3、标志是说明总体单位特征的名称,标志有数量标志和品质标志,因此()。
A、标志值有两大类:品质标志值和数量标志值B、品质标志才有标志值C、数量标志才有标志值D、品质标志和数量标志都具有标志值4、统计规律性主要是通过运用下述方法经整理、分析后得出的结论()。
A、统计分组法B、大量观察法C、综合指标法D、统计推断法25、指标是说明总体特征的,标志是说明总体单位特征的,所以()。
A、标志和指标之间的关系是固定不变的B、标志和指标之间的关系是可以变化的C、标志和指标都是可以用数值表示的D、只有指标才可以用数值表示答案:二、 1.× 2.× 3.√ 4.× 5.×三、 1.C 2.B 3.C 4.B 5.B第三章一、复习思考题1.什么是平均指标?平均指标可以分为哪些种类?2.为什么说平均数反映了总体分布的集中趋势?3.为什么说简单算术平均数是加权算术平均数的特例?4.算术平均数的数学性质有哪些?5.众数和中位数分别有哪些特点?6.什么是标志变动度?标志变动度的作用是什么?7.标志变动度可分为哪些指标?它们分别是如何运用的?8.平均数与标志变动度为什么要结合运用?二、练习题1.某村对该村居民月家庭收入进行调查,获取的资料如下:要求:试用次数权数计算该村居民平均月收入水平。
统计学思考题答案演示教学
统计学思考题答案4.1一组数据的分布特征可以从哪几个方面进行测度?数据分布特征可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或集中的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。
2. 4.5简述众数、中位数和平均数的特点和应用场合。
众数是一组数据分布的峰值,不受极端值的影响,缺点是具有不唯一性。
众数只有在数据量较多时才有意义,数据量较少时不宜使用。
主要适合作为分类数据的集中趋势测度值。
中位数是一组数据中间位置上的代表值,不受极端值的影响。
当数据的分布偏斜较大时,使用中位数也许不错。
主要适合作为顺序数据的集中趋势测度值。
平均数对数值型数据计算的,而且利用了全部数据信息,在实际应用中最广泛。
当数据呈对称分布或近似对称分布时,三个代表值相等或相近,此时应选择平均数。
但平均数易受极端值的影响,对于偏态分布的数据,平均数的代表性较差,此时应考虑中位数或众数。
4.7标准分数有哪些用途?标准分数给出了一组数据中各数值的相对位置。
在对多个具有不同量纲的变量进行处理时,常需要对各变量进行标准化处理。
它还可以用来判断一组数据是否有离群数据。
7.3怎样理解置信区间?置信区间:由样本统计量所构造的总体参数的估计区间7.4解释95%的置信区间。
95%的置信区间指用某种方法构造的所有区间中有95%的区间包含总体参数的真值。
7.5 Za/2的含义是什么含义:Za/2是标准正态分布上侧面积为a/2的z值,公式是统计总体均值时的边际误差。
7.6 解释独立样本和匹配样本的含义。
独立样本:如果两个样本是从两个总体中独立抽取的,即一个样本中的元素与另一个样本中的元素相互独立。
匹配样本:一个样本中的数据与另一个样本中的数据相对应。
7.8简述样本量与置信水平、总体方差、边际误差的关系。
样本量越大置信水平越高,总体方差和边际误差越小10.1什么是方差分析?它研究的是什么?答:方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。
(完整版)统计学思考题
1.1请举出统计应用的几个例子:1.用统计识别作者:对于存在争议的论文,通过统计量推出作者2.用统计量得到一个重要发现:在不同海域鳗鱼脊椎骨数量变化不大,推断所有各个不同海域内的鳗鱼是由海洋中某公共场所繁殖的3.挑战者航天飞机失事预测1.2请举出应用统计的几个领域:1.在企业发展战略中的应用2.在产品质量管理中的应用3.在市场研究中的应用4.在财务分析中的应用5.在经济预测中的应用1.3你怎么理解统计的研究内容:1.统计学研究的基本内容包括统计对象、统计方法和统计规律。
2 .统计对象就是统计研究的课题,称谓统计总体。
3.统计研究方法主要有大量观察法、数量分析法、抽样推断法、实验法等。
4.统计规律就是通过大量观察和综合分析所揭示的用数量指标反映的客观现象的本质特征和发展规律。
1.4举例说明分类变量、顺序变量和数值变量:1.分类变量:表现为不同类别的变量称为分类变量,如“性别”表现为“男”或“女”,“企业所属的行业”表现为“制造业”、“零售业”、“旅游业”等,“学生所在的学院”可能是“商学院”、“法学院”等2.顺序变量:如果类别有一定的顺序,这样的分类变量称为顺序变量,如考试成绩按等级分为优、良、中、及格、不及格,一个人对事物的态度分为赞成、中立、反对。
这里的“考试成绩等级”、“态度”等就是顺序变量。
3.数值变量:可以用数字记录其观察结果,这样的变量称为数值变量,如“企业销售额”、“生活费支出”、“掷一枚骰子出现的点数”。
1.5获得数据的概率抽样方法有哪些?(1)简单随机抽样 ,简单随机抽样又称纯随机抽样,是指在特定总体的所有单位中直接抽取n个组成样本。
它最直观地体现了抽样的基本原理,是最基本的概率抽样。
(2)系统抽样 ,系统抽样也称等距抽样或机械抽样,是按一定的间隔距离抽取样本的方法。
(3)分层抽样 ,分层抽样也叫分类抽样,就是先将总体的所有单位依照一种或几种特征分为若干个子总体,每一个子总体即为一类,然后从每一类中按简单随机抽样或系统随机抽样的办法抽取一个子样本,称为分类样本,它们的集合即为总体样本。
统计学思考题答案
统计学思考题答案统计学思考题⼀、名词解释1.参数:描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值。
所关⼼的参数主要有总体均值、标准差、总体⽐例等。
总体参数通常⽤希腊字母表⽰2.残差:因变量的观测值与根据估计的回归⽅程求出的预测值之差,⽤e表⽰。
反映了⽤估计的回归⽅程去预测⽽引起的误差,可⽤于确定有关误差项ε的假定是否成⽴3.标准分数:变量值与其平均数离差除以标准差后的值就是标准分数也称标准化值或z分数。
P874.次序统计量:⼀组样本观测值X1,X2,…,X n由⼩到⼤的排序X(1)≤X(2)≤…≤ X (i)≤…≤ X(n)后,称X(1),X(2),…,X(n)为次序统计量。
中位数、分位数、四分位数等都是次序统计量5.β错误:原假设为伪是没有拒绝,犯这种错误的概率⽤表⽰,所以也称β错误或取伪错误6.α错误:原假设为真时拒绝原假设,犯这种错误的概率⽤α表⽰,所以也被称为α错误或弃真错误。
7.多元回归⽅程:描述因变量y 的平均值或期望值如何依赖于⾃变量x1,x2,…,x k的⽅程。
多元线性回归⽅程的形式为E( y ) = β+ β1 x1+ β2 x2+…+ βk x k8.多元回归模型:描述因变量y 如何依赖于⾃变量x1, x2,…, x k和误差项ε的⽅程,称为多元回归模型。
其⼀般形式为:E( y ) = β+ β1 x1+ β2 x2+…+ βk x k + ε9.多重判定系数:是多元回归中的回归平⽅和占总平⽅和的⽐例,它是度量多元回归⽅程拟合程度的⼀个统计量,反映了在因变量y的变差中被估计的回归⽅程所解释的⽐例。
10.F分布:设随机变量Y与Z相互独⽴,且Y与Z分别服从于⾃由度为m和n的2χ分布,随机变量X有如下表达式:F=nY/mZ,则称X服从于第⼀⾃由度为m,第⼆⾃由度为n的F分布,记作X~F(m,n)11.⽅差分析:检验各个总体均值是否相等来判断分类型⾃变量对数值型因变量是否有显著影响。
统计学思考题答案
4.1一组数据的分布特征可以从哪几个方面进行测度?数据分布特征可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或集中的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。
2. 4.5简述众数、中位数和平均数的特点和应用场合。
众数是一组数据分布的峰值,不受极端值的影响,缺点是具有不唯一性。
众数只有在数据量较多时才有意义,数据量较少时不宜使用。
主要适合作为分类数据的集中趋势测度值。
中位数是一组数据中间位置上的代表值,不受极端值的影响。
当数据的分布偏斜较大时,使用中位数也许不错。
主要适合作为顺序数据的集中趋势测度值。
平均数对数值型数据计算的,而且利用了全部数据信息,在实际应用中最广泛。
当数据呈对称分布或近似对称分布时,三个代表值相等或相近,此时应选择平均数。
但平均数易受极端值的影响,对于偏态分布的数据,平均数的代表性较差,此时应考虑中位数或众数。
4.7标准分数有哪些用途?标准分数给出了一组数据中各数值的相对位置。
在对多个具有不同量纲的变量进行处理时,常需要对各变量进行标准化处理。
它还可以用来判断一组数据是否有离群数据。
7.3怎样理解置信区间?置信区间:由样本统计量所构造的总体参数的估计区间7.4解释95%的置信区间。
95%的置信区间指用某种方法构造的所有区间中有95%的区间包含总体参数的真值。
7.5 Za/2的含义是什么含义:Za/2是标准正态分布上侧面积为a/2的z值,公式是统计总体均值时的边际误差。
7.6 解释独立样本和匹配样本的含义。
独立样本:如果两个样本是从两个总体中独立抽取的,即一个样本中的元素与另一个样本中的元素相互独立。
匹配样本:一个样本中的数据与另一个样本中的数据相对应。
7.8简述样本量与置信水平、总体方差、边际误差的关系。
样本量越大置信水平越高,总体方差和边际误差越小10.1什么是方差分析?它研究的是什么?答:方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。
统计课后思考题答案
统计课后思考题答案第一章思考题1.1什么是统计学1.3解释描述统计和推断统计1.51.6如说灯泡的寿命。
1.7变量的分类变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
1.8举例说明离散型变量和连续性变量1.8统计应用实例1.9统计应用的领域第二章思考题2.41调查组织者管理容易231返回率低23调查周期长4在数据搜集过程中遇见问题不能及时调整。
1回答率高2数据质量高31成本比较高2搜集数据的方式对调查过程的质量控制有一定难度31速度快2对调查员比较安全31实施地区有限2调查时间不能过长3使用的问卷要简单4第三章思考题2.5数据预处理内容3.2分类数据和顺序数据的整理和图示方法各有哪些行图示分析。
2.6数据型数据的分组方法和步骤1确定组数2确定各组组距3根据分组整理成频数分布表2.7直方图和条形图的区别123图主要展示数值型数据。
第4章数据的概括性度量3.13.4简述四分位数的计算方法。
四分位数是一组数据排序后处于25%和75%3.2G就是平均增长率。
3.3简述众数、中位数和平均数的特点和应用场合。
据量较少时不宜使用。
主要适合作为分类数据的集中趋势测度值。
要适合作为顺序数据的集中趋势测度值。
此时应考虑中位数或众数。
3.5简述异众比率、四分位差、方差或标准差的适用场合测量其离散程度。
3.6标准分数有哪些用途行标准化处理。
它还可以用来判断一组数据是否有离群数据。
3.8测度数据分第五章概率与概率分布5.1在相同条件下随机试验n A 出现m m/n 称为事件A 发生的频率。
随着n围绕某一常数p5.2第8章思考题8.1μ在估计前是未知的。
而在参数假设检验中则是先对μ8.2著等价拒绝00.05或比0.05更小的显著水平上。
8.5解释假设检验中的P 值P8.6显著性水平与P 值有何区别者0.05。
而P 只是原假设为真时所得到的样本观察结果或更极端结果出现的概率被称为观察到的(或实测的)显著性水平 8.7第10章思考题10.1的是非类型自变量对数值型因变量的影响。
统计学思考题
统计学思考题第一章导论1、统计数据可分为哪几种类型?不同类型的数据各有什么特点?按照所采用的计量尺度的不同,可以将统计数据分为分类数据、顺序数据和数值型数据。
按照统计数据的收集方法,可以将其分为观测数据和实验数据。
按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。
分类数据是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。
顺序数据是只能归于某一有序类别的非数字型数据。
顺序数据虽然也是类别,但这些类别是有序的,是用文字来表述的。
数值型数据是按数字尺度测量的观察值,其结果表现为具体的数值。
现实中处理的大多数都是数值型数据。
2、解释分类数据、顺序数据和数值数据的意义。
对分类数据,我们通常计算出各组的频数或频率,计算其众数和异众比率,进行列联表分析和x2检验等;对顺序数据,可以计算其中位数和四分位差,计算等级相关系数等;对数值型数据,可以用更多的统计方法进行分析,如计算各种统计量,进行参数估计和检验等3、举例说明总体、样本、参数、统计量、变量这几个概念。
总体:是包含所研究的全部个体的集合,它通常由所研究的一些个体组成。
如多个企业构成的集合,多个居民户构成的集合,多个人构成的集合样本:是从总体中抽出的一部分元素的集合。
如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。
参数:是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。
在统计中,总体参数通常用希腊字母表示,如,总体平均数用u(miu)表示,总体标准差用(sigma)表示,总体比例用(pai)表示,等。
统计量:是用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数。
样本统计量通常用英文字母来表示。
如,样本平均数用(x-bar)表示,样本标准车用s表示,样本比例用p表示,等。
变量:是说明现象某种特征的概念。
统计学思考题
思考题:1、什么是统计学怎样理解统计学与统计数据的关系答:⑴统计学是一门收集、整理、显示和分析统计数据的科学;其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的;这些方法来源于对统计数据的研究;目的也在于对统计数据的研究;⑶离开了统计数据;统计方法乃至统计学就失去其存在的意义..2、简要说明统计数据的来源..答:1统计数据来源于直接获取的数据和间接获取的数据;2直接获取的数据来自于直接组织的调查、观察和科学试验;3间接获取的数据来源于报纸、杂志、统计年鉴、网络或从调查公司或数据库公司等处购买..3、简要说明抽样误差和非抽样误差..答:1非抽样误差是由于调查过程中各有关环节工作失误造成的..它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误;不完整的抽样框导致的误差;调查中由于被调查者不回答产生的误差等..从理论上看;这类误差是可以避免的;2抽样误差是利用样本推断总体时产生的误差..抽样误差对任何一个随机样本来讲都是不可避免的;可以计量;可以控制..4、怎样理解均值在统计学中的地位答:1反映了一组数据的中心点或代表值;是数据误差互相抵消后的客观事物必然性数量特征的一种反映;2是统计分布的均衡点;3任何统计推断和分析都离不开均值..5、解释洛伦茨曲线及其用途..答:1洛伦茨曲线是累积次数分配曲线;“二八原理”和收入分配公式绘制;2用于描述收入和财富分配性质..6、简述基尼系数的使用..答:基尼系数用于反应收入分配的变化情况;取值在0~1之间①基尼系数小于0.2;表明分配平均;②在0.2~0.4之间;分配比较适当;③0.4 是收入分配不公平的警戒线;超过0.4;收入分配不公平..7、一组数据的分布特征可以从哪几个方面进行测度答:可以从三个方面测度:⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度..8、简述频率与概率的关系..答:①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性;③当观察次数n很大时;频率与概率非常接近..9、概率的三种定义各有什么应用场合..答:⑴古典概率实验的基本事件总数有限;每个基本事件出现的可能性相同;⑵统计概率实验的基本事件总数有限;每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算;也不能根据大量重复试验的频率来估计..10、概率密度函数和分布函数的联系与区别表现在哪些方面答:1联系:概率密度函数的积分是分布函数;分布函数的导数是概率密度函数;2区别:概率密度函数的函数值是某点的概率密度;分布函数的函数值表示某个区间的概率..11、离散型随机变量和连续型随机变量的概率分布的描述有些什么不同 答:⑴离散型随机变量的概率分布可以用表格、函数或图形等形式来表现..最常见的离散型随机变量的概率分布是二项分布;此外还有伯松分布、超几何分布;⑵连续型随机变量的概率分布可以用概率密度和分布函数以及对应的曲线图来表示..最常见的连续型随机变量的概率分布有正态分布、均匀分布等..12、正态分布所描述的随机现象有什么特点 为什么许多随机现象服从或近似服从正态分布答:⑴正态分布所描述的随机现象的特点:①对称的分布;②中间多两端少;⑵许多随机现象的分布都会有集中趋势和离散趋势;即现象的分布表现为中间多两端少的特点;这种分布与正态分布十分贴近..13、解释总体分布、样本分布和抽样分布的含义..答:①总体分布是指总体的全部观察值形成的分布;②样本分布是指一个样本的所有观察值形成的分布;③抽样分布就是由样本观察值计算的统计量的概率分布..14、解释中心极限定理的含义..答:⑴样本来自于任意总体;样本容量充分大;⑵当样本容量充分大时;样本均值的抽样分布近似于一个均值x μμ=和方差22x σσ= 的正态分布..15、简述评价估计量好坏的标准答:①无偏性估计量抽样分布的数学期望等于被估计的总体参数;②有效性无偏估计量与总体参数的离散程度;③相合性随着样本容量的增大;估计量与总体参数的接近程度..16、解释置信水平的含义..答:⑴对总体参数进行区间估计时给定的一个概率值;⑵反应总体参数包括在置信区间的概率..17、简述样本容量与置信水平、总体方差、允许误差的关系..答:①样本容量与置信水平成正比;②样本容量与总体方差成正比;③样本容量与允许误差成反比..18、第Ⅰ类错误和第Ⅱ类错误分别是指什么它们发生的概率大小之间存在怎样的关系答:⑴第Ⅰ类错误是指当原假设为真时拒绝原假设所犯的错误;⑵第Ⅱ类错误是指当原假设为假时没有拒绝原假设所犯的错误;⑶两类错误的概率之间的关系:增大时;减小;增大时;减小..19、什么是显着性水平它对于假设检验决策的意义是什么答:1显着性水平是指假设检验中犯的第Ⅰ类错误的概率;记为;2显着性水平所围成的区域成为拒绝域;3检验统计量落在拒绝域则拒绝原假设的概率;是人们事先指定的犯第Ⅰ类错误概率的最大允许值..20、分别列出小样本情形下总体均值左侧检验、右侧检验及双侧检验的拒绝域..答:1方差已知左侧检验为-∞;-z;右侧检验为z;+∞;双侧检验为-∞;-z/2z/2;+∞;2方差未知左侧检验为-∞;-t;右侧检验为t;+∞;双侧检验为-∞;-t/2t/2;+∞..21、什么是统计上的显着性答:1由于随机因素的作用;点估计量与假设的总体参数出现差异是可以理解的;2点估计量与假设的总体参数出现较小差异是大概率事件;出现过大差异是小概率事件;3在一次试验中;点估计量与假设的总体参数出现差异过大是不正常的;这就是统计上的显着性..22、方差分析中有哪些基本假定答:①每个总体都应服从正态分布;②各个总体的方差σ2必须相同;③观测值是独立的..23、简述方差分析的基本思想..答:①将观测值之间的差异分为两类:组内误差和组间误差;②组内误差只包含随机误差;组间误差既包括随机误差;也包括系统误差;③衡量组内误差与组间误差的大小;推断观测值之间差异产生的原因..24、方差分析包括哪些类型它们有何区别答:⑴主要是两种类型:单因素反差分析和双因素方差分析;双因素方差分析又分为无交互作用和有交互作用的方差分析两类;⑵区别之一是考虑因素的数目不同;⑶区别之二是两个因素是否有交互作用..25、解释方差分析中的水平项平方和、误差项平方和的含义..答:⑴水平项误差平方和是各组平均值与总平均值的误差平方和;反映各总体的样本均值之间的差异程度;⑵误差项平方和是每个水平或组的各个样本数据与其组平均值误差的平方和;反映了每个样本各观测值的离散状况即反映随机误差的大小26、解释试验、试验设计、试验单元的含义答:1试验是指收集样本数据的过程;2试验设计是研究如何科学地安排试验;使人们能用尽可能少的试验获得尽可能多的信息;3试验单元是指接受“处理”的对象或实体..27、简述相关分析与回归分析的联系..答:1具有共同的研究对象;都是对变量间相关关系的分析;两者可以相互补充;2只有当变量间存在相当程度的相关关系时;进行回归分析去寻找变量间相关的具体数学形式才有实际的意义;3相关分析中相关系数的确定建立在回归分析的基础上..28、简述相关分析与回归分析的区别..答:1相关分析是用一定的数量指标度量变量间相互联系的方向和程度;回归分析是寻找变量间联系的具体数学形式;是要根据自变量的固定值去估计和预测因变量的平均值;2相关分析对称的对待相互联系的变量;不考虑二者的因果关系;回归分析对变量的处理是不对称的;必须明确划分自变量和因变量;3相关分析的两个变量均视为随机变量;回归分析中通常假定自变量为取固定值的非随机变量;因变量为随机变量..29、什么是随机误差项和残差 它们之间的区别是什么答:⑴随机误差项是指因变量的观测值i Y 与其相应的条件期望值(|)i E Y X 的偏差;⑵残差是指因变量的实际样本观测值i y 与样本条件期望ˆi y的偏差..⑶随机误差不能直接观测;残差可以直接计算..30、什么是总体回归函数和样本回归函数 它们之间的主要区别是什么答:⑴总体回归函数是指总体因变量的条件期望表示为自变量的某种函数;⑵样本回归函数是指把因变量的样本条件期望表示为自变量的某种函数⑶它们的主要区别是总体回归函数是确定的;样本回归函数随样本波动而变化..31、为什么在对参数进行最小二乘估计时;要对模型提出一些基本的假定答:①基本假定有:零期望值、同方差、无自相关、随机扰动与自变量不相关、正态性等假定;②在基本假定满足的条件下;回归系数的最小二乘估计是最佳线性无偏估计;③如果多次进行估计值计算;或者是扩大样本容量进行估计值计算;按最佳估计方式计算的估计值接近真实值的可能性最大..32、为什么对计算的样本相关系数还要进行检验答:1样本相关系数是根据从总体中抽取的随机样本的观测值计算出来的;它只是对总体相关系数的估计;2样本相关系数是随抽样而变动的随机变量;必需对估计的样本相关系数是否为抽样的偶然结果做出判断..33、为什么用可决系数能够度量回归方程对样本数据的拟合程度答:1回归方程是通过对样本数据拟合而得到;在散点图上;样本回归线与样本观测值总是一定程度上存在或正或负的偏离;即拟合的优劣程度;3可决系数表示回归平方和占总离差平方和的比重;4如果样本回归线对样本观测值拟合程度越好;各样本观测点与回归线靠得越近;由样本回归作出解释的离差平方和在总离差平方和中占的比重也将越大;反之拟合程度越差;这部分占的比重越小;34、利用回归方程作经济预测的基本条件和前提是什么答:1变量分为因变量和解释变量两类;它们之间存在因果关系;2建立的回归方程通过各项统计检验;并且在经济上有实际意义;3影响经济现象的因素及条件始终保持不变..35、为什么对用回归方程计算的预测值要作区间估计答:1由样本回归函数计算的ˆf y只是对y f 的平均值做的点估计;2回归方程中ˆα和ˆβ是随机变量;因而ˆf y 也是随机变量;3对平均值的点估计ˆf y不一定等于因变量预测值的真实个别值y f ;需要对y f 可能的置信区间作出预测..36、对回归系数显着性作t 检验的基本思想是什么答:1回归分析中;最基本的是简单线性回归;人们最关心的是自变量x 对因变量y 是否有显着线性影响;2回归系数显着性检验的原假设是H 0: =0;若不拒绝原假设;表明x 对y 没有显着的线性影响;若拒绝原假设;表明x 对y 存在显着的线性影响;3随机扰动项u i 的方差 2未知;且样本量较小;统计量ˆˆ()Se ββ服从t 分布;只能采用t 检验法进行双侧检验.. 37、总指数的基本编制方式..答:①先综合、后对比的方式 就是先将各种商品的价格或销售量资料加总起来;然后通过对比得到相应的总指数;②先对比、后平均的方式 就是先将各种商品的价格或销售量资料进行对比;然后通过个体指数的平均得到相应的总指数..38、简述统计指数与数学上的指数函数有何不同 ..答:①统计学中的指数是一种对比性的分析指标;②可以反映不同时间、不同空间现象水平的数量对比关系;③再经济分析的各个领域得到广泛应用;又称为“经济指数”..39、与一般相对数比较;总指数所研究现象总体有何特点答:⑴一般反映的是多种现象的综合变动;⑵在经济领域应用广泛;被称为“经济指数”;⑶通常是指不同时间的现象水平的对比..40、相对于简单形式的总指数;加权指数有何优点答:1总指数是考察复杂现象总体数量对比关系的指数;2简单形式的总指数是指在处理复杂现象总体时;对各个现象不加区分;同等对待;进行简单的综合;3加权指数是指在计算总指数时依据各个现象重要性的差别;对各个现象加以综合..加权指数能真实的反映研究现象总体的数量对比关系..。
统计学第五版课后思考题答案(完整版)
统计学第五版课后思考题答案(完整版)统计学(第五版)贾俊平课后思考题答案(完整版)第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。
统计学第一章思考题及习题
第一章思考题及习题:•单选题:•1.在统计学的形成和发展过程中,首先将古典概率论引入社会经济现象研究的学者是( A)。
•A.阿道夫·凯特勒B.威廉·配第 C.约翰·格朗特D.赫尔曼·康令•2. 在确定统计总体时必须注意()A。
•A. 构成总体的单位,必须是同质的 B.构成总体的单位,必须是不同的•C.构成总体的单位,不能有差异 D.构成总体的单位,必须是不相干的单位•3.一个统计总体(D)。
•A.只能有一个标志B.只能有一个指标C.可以有多个标志D.可以有多个指标•4.在某地区2003年GDP和人均GDP资料中,属于下面哪一种类统计指标(B)。
•A.客观指标和主观指标 B.数量指标和质量指标•C.时期指标和时点指标 D.实体指标和行为指标•5.对某市高等学校科研所进行调查,统计总体是(D)。
•A.某市所有的高等学校B.某一高等学校科研所•C.某一高等学校D. 某市所有高等学校科研所•6.要了解某市国有工业企业设备情况,则统计总体是(?)。
•A.该市全部国有工业企业 B.该市每一个国有工业企业•C.该市国有工业企业的全部设备 D.该市国有工业企业的每一台设备•7.有200个公司全部职工每个人的工资资料,如要调查这200个公司职工的工资水平情况,则统计总体为(A)。
•A.200个公司的全部职工工资 B.200个公司C.200个公司职工的全部工资D.200个公司每个职工的工资•8.下列标志中属品质标志的是(A)•A.性别B.年龄C.商品价格D.工业企业的总产值•9.某企业职工人数为1200人,这里的“职工人数1200人”是(C)。
•A.标志B.变量C.指标D.标志值•10.某班四名学生统计学考试成绩分别为70分、80分、86分和95分,这四个数字是(B)。
•A.标志B.标志值C.指标D.变量•11.工业企业的职工人数、职工工资是(D)。
•A.连续型变量B.离散型变量C.前者是连续型变量,后者是离散型变量•D.前者是离散型变量,后者是连续型变量•多选题:•1.对某市工业生产进行调查,得到以下资料,其中的统计指标是(BCE)。
《统计学》课后思考题
《统计学》课后思考题第一章导论1、解释描述统计和推断统计描述统计:研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。
推断统计:研究如何利用样本数据来推断总体特征的统计方法。
2、统计数据可分为哪几个类型?不同类型的数据各有什么特点?3、举例说明总体、样本、参数、统计量、变量这几个概念总体:所研究的全部元素的集合,其中的每一个元素称为个体。
eg.要检验一批灯泡的使用寿命,这批灯泡构成的集合就是总体。
样本:从总体中抽取的一部分元素的集合。
eg.从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。
参数:研究者想要了解的总体的某种特征值。
eg.总体平均数用μ表示,总体标准差用σ表示。
统计量:根据样本数据计算出来的一个量。
eg.样本标准差用s表示变量:说明现象某种特征的概念。
eg.商品销售额、受教育程度等第三章数据的图表展示1、分类数据和顺序数据的整理和图示方法各有哪些分类数据整理:频数、比例、百分比、比率图示:条形图、帕累托图、饼图、环形图顺序数据整理:累计频数、累计频率(累计百分比)图示:累计频数分布图和累计频率分布图分类数据的整理和图示方法同样适用于顺序数据2、茎叶图与直方图相比有什么优点?它们的应用场合是什么?茎叶图是由“茎”和“叶”两部分组成的、反映原始数据分布的图形,其图形是由数字组成的。
通过茎叶图,可以看数据的分布形状及数据的离散状况。
与直方图相比,茎叶图既能给出数据的分布状况,又能给出一个原始数值,即保留了原始数据的信息。
而直方图不能给出原始数值。
在应用方面,直方图一般适用于大批量数据,茎叶图通常适用于小批量数据。
第四章数据的概括性度量1、一组数据的分布特征可以从哪几个方面进行测度?一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。
2、简述众数、中位数和平均数的特点和应用场合(1)众数特点:是一组数据分布的峰值,不受极端值影响。
统计学课后思考题
统计学课后思考题思考题第一章1.1什么是统计学:统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
1.2解释描述统计和推断统计:描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
1.3统计学的类型和不同类型的特点:统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
1.4解释分类数据,顺序数据和数值型数据:答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念:对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
1.6变量的分类:变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
1.7举例说明离散型变量和连续性变量:离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。
统计学课后简答题答案
第一章思考题什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
&(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
第二章思考题什么是二手资料使用二手资料应注意什么问题与研究内容有关,由别人调查和试验而来已经存在,并会被我们利用的资料为“二手资料”。
使用时要进行评估,要考虑到资料的原始收集人,收集目的,收集途径,收集时间使用时要注明数据来源。
、比较概率抽样和非概率抽样的特点,指出各自适用情况概率抽样:抽样时按一定的概率以随机原则抽取样本。
每个单位别抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽到的概率。
技术含量和成本都比较高。
如果调查目的在于掌握和研究对象总体的数量特征,得到总体参数的置信区间,就使用概率抽样。
非概率抽样:操作简单,时效快,成本低,而且对于抽样中的统计学专业技术要求不是很高。
它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
思考题: 1什么是统计学?怎样理解统计学与统计数据的关系?答:⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源于对统计数据的研究,目的也在于对统计数据的研究;⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。
2、简要说明统计数据的来源。
答:(1)统计数据来源于直接获取的数据和间接获取的数据;(2)直接获取的数据来自于直接组织的调查、观察和科学试验;(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或从调查公司或数据库公司等处购买。
3、简要说明抽样误差和非抽样误差。
答:(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。
它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。
从理论上看,这类误差是可以避免的;(2)抽样误差是利用样本推断总体时产生的误差。
抽样误差对任何一个随机样本来讲都是不可避免的,可以计量,可以控制。
4、怎样理解均值在统计学中的地位?答:(1 )反映了一组数据的中心点或代表值,是数据误差互相抵消后的客观事物必然性数量特征的一种反映;(2)是统计分布的均衡点;(3)任何统计推断和分析都离不开均值。
5、解释洛伦茨曲线及其用途。
答:(1)洛伦茨曲线是累积次数分配曲线,由(美)洛伦茨()提出,依据(意)帕累托()的“二八原理”和收入分配公式绘制;(2)用于描述收入和财富分配性质。
6、简述基尼系数的使用。
答:基尼系数用于反应收入分配的变化情况,取值在0〜1之间①基尼系数小于,表明分配平均;②在〜之间,分配比较适当;③是收入分配不公平的警戒线,超过,收入分配不公平。
7、一组数据的分布特征可以从哪几个方面进行测度?答:可以从三个方面测度:⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。
8、简述频率与概率的关系。
答:①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性;③当观察次数n很大时,频率与概率非常接近。
9、概率的三种定义各有什么应用场合。
答:⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;⑵统计概率实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。
10、概率密度函数和分布函数的联系与区别表现在哪些方面?答:(1)联系:概率密度函数的积分是分布函数,分布函数的导数是概率密度函数;别:概率密(2)区度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。
11、离散型随机变量和连续型随机变量的概率分布的描述有些什么不同?答:⑴离散型随机变量的概率分布可以用表格、函数或图形等形式来表现。
最常见的离散型随机变量的概率分布是二项分布,此外还有伯松分布、超几何分布;⑵连续型随机变量的概率分布可以用概率密度和分布函数以及对应的曲线图来表示。
最常见的连续型随机变量的概率分布有正态分布、均匀分布等。
12、正态分布所描述的随机现象有什么特点?为什么许多随机现象服从或近似服从正态分布?答:⑴正态分布所描述的随机现象的特点:①对称的分布;②中间多两端少;⑵许多随机现象的分布都会有集中趋势和离散趋势,即现象的分布表现为中间多两端少的特点,这种分布与正态分布十分贴近。
13、解释总体分布、样本分布和抽样分布的含义。
答:①总体分布是指总体的全部观察值形成的分布;②样本分布是指一个样本的所有观察值形成的分布;③抽样分布就是由样本观察值计算的统计量的概率分布。
14、解释中心极限定理的含义。
答:⑴样本来自于任意总体,样本容量充分大;⑵当样本容量充分大时,样本均值的抽样分布近似于一个均值x 和方差:[n的正态分布。
15、简述评价估计量好坏的标准答:①无偏性估计量抽样分布的数学期望等于被估计的总体参数;②有效性无偏估计量与总体参数的离散程度;③相合性随着样本容量的增大,估计量与总体参数的接近程度。
16、解释置信水平的含义。
答:⑴对总体参数进行区间估计时给定的一个概率值;⑵反应总体参数包括在置信区间的概率。
17、简述样本容量与置信水平、总体方差、允许误差的关系。
答:①样本容量与置信水平成正比;②样本容量与总体方差成正比;③样本容量与允许误差成反比。
18、第I类错误和第n类错误分别是指什么?它们发生的概率大小之间存在怎样的关系?答:⑴第I类错误是指当原假设为真时拒绝原假设所犯的错误;⑵第n类错误是指当原假设为假时没有拒绝原假设所犯的错误;⑶两类错误的概率之间的关系:增大时,减小;增大时,减小。
19、什么是显著性水平?它对于假设检验决策的意义是什么?答:(1)显著性水平是指假设检验中犯的第I类错误的概率,记为;(2)显著性水平所围成的区域成为拒绝域;(3)检验统计量落在拒绝域则拒绝原假设的概率,是人们事先指定的犯第I类错误概率的最大允许值。
20、分别列出小样本情形下总体均值左侧检验、右侧检验及双侧检验的拒绝域。
答:(1 )方差已知左侧检验为(-R,-z ),右侧检验为(z,+ s),双侧检验为(- m,-Z /2)(Z /2,+ s );(2)方差未知左侧检验为(-s,-1 ),右侧检验为(t,+ s ),双侧检验为(-s,- t /2)(t /2,+ s )。
21、什么是统计上的显著性?答:(1)由于随机因素的作用,点估计量与假设的总体参数出现差异是可以理解的;(2)点估计量与假设的总体参数出现较小差异是大概率事件,出现过大差异是小概率事件;(3)在一次试验中,点估计量与假设的总体参数出现差异过大是不正常的,这就是统计上的显著性。
22、方差分析中有哪些基本假定?答:①每个总体都应服从正态分布;②各个总体的方差b 2必须相同;③观测值是独立的。
23、简述方差分析的基本思想。
答:①将观测值之间的差异分为两类:组内误差和组间误差;②组内误差只包含随机误差,组间误差既包括随机误差,也包括系统误差;③衡量组内误差与组间误差的大小,推断观测值之间差异产生的原因。
24、方差分析包括哪些类型?它们有何区别?答:⑴主要是两种类型:单因素反差分析和双因素方差分析,双因素方差分析又分为无交互作用和有交互作用的方差分析两类;⑵区别之一是考虑因素的数目不同;⑶区别之二是两个因素是否有交互作用。
25、解释方差分析中的水平项平方和、误差项平方和的含义。
答:⑴水平项误差平方和是各组平均值与总平均值的误差平方和,反映各总体的样本均值之间的差异程度;⑵误差项平方和是每个水平或组的各个样本数据与其组平均值误差的平方和,反映了每个样本各观测值的离散状况即反映随机误差的大小26、解释试验、试验设计、试验单元的含义?答:(1)试验是指收集样本数据的过程;(2)试验设计是研究如何科学地安排试验,使人们能用尽可能少的试验获得尽可能多的信息;(3)试验单元是指接受“处理”的对象或实体。
27、简述相关分析与回归分析的联系。
答:(1)具有共同的研究对象,都是对变量间相关关系的分析,两者可以相互补充;(2)只有当变量间存在相当程度的相关关系时,进行回归分析去寻找变量间相关的具体数学形式才有实际的意义;(3)相关分析中相关系数的确定建立在回归分析的基础上。
28、简述相关分析与回归分析的区别。
答:(1)相关分析是用一定的数量指标度量变量间相互联系的方向和程度,回归分析是寻找变量间联系的具体数学形式,是要根据自变量的固定值去估计和预测因变量的平均值;(2)相关分析对称的对待相互联系的变量,不考虑二者的因果关系;回归分析对变量的处理是不对称的,必须明确划分自变量和因变量;(3)相关分析的两个变量均视为随机变量;回归分析中通常假定自变量为取固定值的非随机变量,因变量为随机变量。
29、什么是随机误差项和残差?它们之间的区别是什么?答:⑴随机误差项是指因变量的观测值Y与其相应的条件期望值E(Y|XJ的偏差;⑵残差是指因变量的实际样本观测值%与样本条件期望?的偏差。
⑶随机误差不能直接观测,残差可以直接计算。
30、什么是总体回归函数和样本回归函数?它们之间的主要区别是什么?答:⑴总体回归函数是指总体因变量的条件期望表示为自变量的某种函数;⑵样本回归函数是指把因变量的样本条件期望表示为自变量的某种函数⑶它们的主要区别是总体回归函数是确定的,样本回归函数随样本波动而变化。
31、为什么在对参数进行最小二乘估计时,要对模型提出一些基本的假定?答:①基本假定有:零期望值、同方差、无自相关、随机扰动与自变量不相关、正态性等假定;②在基本假定满足的条件下,回归系数的最小二乘估计是最佳线性无偏估计;③如果多次进行估计值计算,或者是扩大样本容量进行估计值计算,按最佳估计方式计算的估计值接近真实值的可能性最大。
32、为什么对计算的样本相关系数还要进行检验?答:(1)样本相关系数是根据从总体中抽取的随机样本的观测值计算出来的,它只是对总体相关系数的估计;(2)样本相关系数是随抽样而变动的随机变量,必需对估计的样本相关系数是否为抽样的偶然结果做出判断。
33、为什么用可决系数能够度量回归方程对样本数据的拟合程度?答:(1)回归方程是通过对样本数据拟合而得到,在散点图上,样本回归线与样本观测值总是一定程度上存在或正或负的偏离,即拟合的优劣程度;(3)可决系数表示回归平方和占总离差平方和的比重;(4)如果样本回归线对样本观测值拟合程度越好,各样本观测点与回归线靠得越近,由样本回归作出解释的离差平方和在总离差平方和中占的比重也将越大,反之拟合程度越差,这部分占的比重越小;34、利用回归方程作经济预测的基本条件和前提是什么?答:(1)变量分为因变量和解释变量两类,它们之间存在因果关系;(2)建立的回归方程通过各项统计检验,并且在经济上有实际意义;(3)影响经济现象的因素及条件始终保持不变。
35、为什么对用回归方程计算的预测值要作区间估计?答:(1)由样本回归函数计算的?f只是对y f的平均值做的点估计;(2)回归方程中?和?是随机变量,因而?f也是随机变量;(3)对平均值的点估计?f不一定等于因变量预测值的真实个别值y f,需要对y f可能的置信区间作出预测。
36、对回归系数显著性作t检验的基本思想是什么?答:(1)回归分析中,最基本的是简单线性回归,人们最关心的是自变量x对因变量y是否有显著线性影响;(2)回归系数显著性检验的原假设是H o:= 0,若不拒绝原假设,表明x 对y没有显著的线性影响,若拒绝原假设,表明x对y存在显著的线性影响;(3 )随机扰动项u i的方差2未知,且样本量较小,统计量? Se( ?)服从t分布,只能采用t检验法进行双侧检验。