统计学基础课后全部详细答案与讲解
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学第一至四章答案
第一章
一、思考题
1.统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。
统计方法可分为描述统计和推断统计。
2.统计数据的分类:按计量尺度:分类数据、顺序数据和数值型数据
按获取数据的方式:观测数据和实验数据
按数据与时间的关系:截面数据和时间序列数据特点:分类数据各类别之间是平等的并列关系,各类别之间的顺序可以任意改变;顺序数据的分类是有序的;数值型数据说明的是现象的数量特征,是定量数据;观测数据是通过调查或观测而收集到的数据,是在没有对事物进行人为控制的条件下得到的;实验数据是在实验中控制实验对象而收集到的数据;截面数据也称静态数据,描述的是现象在某一时刻的变化情况;时间序列数据也称动态数据,描述的是现象随时间的变化情况。
3.对武昌分校的全体教师进行工资调查,那么全体教师就是总体,从中抽取五十名教师进行调查,这五十名教师的集合就是样本,全体教师工资的总体平均值和总体标准差等描述特征的数值就是参数,五十名教师工资的样本平均值和样本标准差等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说教师的工资。
4.有限总体:指总体的围能够明确确定,而且元素的数目是有限可数
的。例如:武昌分校10级金融专业学生
无限总体:指总体所包含的元素是无限的、不可数的。例如:整个宇宙的星球
5.变量可分为分类变量、顺序变量、数值型变量。同时数值型变量可分为离散型变量和连续型变量。
6.离散型变量只能取有限个值,而且其取值都以整位数断开,可以一一列举,例如“产品数量”、“企业数”。连续型变量的取值指连续不断的,不能一一列举。例如“温度”、“年龄”。
二、练习题
1.(1)数值型变量(2)分类变量(3)数值型变量
(4)顺序变量(5)分类变量
2.(1)这一研究的总体是IT从业者,样本是从IT从业者中抽取的1000人,样本量是1000
(2)“月收入”是数值型变量
(3)“消费支付方式”是分类变量
3.(1)这一研究的总体是所有的网上购物者
(2)“消费者在网上购物的原因”是分类变量
第二章
一、思考题
1:答:1:普查的特点:①:普查通常是一次性的或周期性的;
②:普查一般需要规定统一的调查时间;③:普查的数据一般比较准确;4:普查的使用围比较狭窄,只能调查一些最基本的、
特定的现象。2:抽样调查的特点:①:经济性;②:时效性强;
③:适应面广;④:准确性高。
2:答:具体收集方法有:①:询问调查:a:访问调查,b:邮寄调查,c:调查,d:计算机辅助调查,e:座谈会,f:个别深度访问;②:观察与实验:a:观察法,b:实验法。
3:答:调查方案包括以下几个方面的容:调查目的、调查对象和调查单位、调查项目、调查表等。
4:答:⑴:调查问卷指的是用来收集调查数据的一种工具,是调查者根据调查目的和要求所设计的,由一系列问题、备选答案、说明以及码表组成的一种调查形式:⑵组成:由开头部分、甄别部分、主体部分和背景部分组成。
5:注意的问题:①:提问的容尽可能的短;②:用词要确切、通俗;③:一项提问只包括一项容;④:避免诱导性的问题;⑤:避免否定式的提问;⑥:避免敏感性的问题。
6:方法主要有:两项选择法、多项选择法、顺序选择法、评定尺度法、双向列连法五种。
7:问题设计时应注意的问题:①:问题的安排应该具有逻辑性;
②:问题的顺序应该先易后难;③:能引起被调查者兴趣的问题先放在前面;④:开放性问题放在后面。
第三章
一、思考题
1:答:数据预处理容:数据审核(完整性和准确性;适用性和实
效性),数据筛选和数据排序.
2:答:区别:首先:条形图中的每一个矩形表示一个类别,其宽度没有意义,而直方图的宽度则表示各组的组距;其次:由于分组数据具有连续性,直方图的各矩形通常是连续排列的,而条形是分开排列的;最后:条形图主要用于展示定性数据,而直方图则主要是用于展示定量数据。
3:答:区别:饼图只能显示一个样本各部分所占的比例,而环形图可显示多个样本各部分所占的比例。
4:与直方图相比,茎叶图既能给出数据的分布状态况,又能给出每一个原始数值,即保留了原始数据的信息。而直方图虽然能很好地显示数据的分布,但是不能保留数据的原始数据信息。5:应注意的问题:图标中应包括以下特征:①:显示数据、②:让读者把注意力集中在图形的容上,而不是在绘制图形的程序上、③:避免歪曲、④:强调数据之间的比较、⑤:服务于一个明确的目的、⑥:有对图形的统计描述和文字说明。
第四章
一、思考题
1、一组数据的分布特征可以从三个方面进行测度:一是分布的集中趋势,反映各数据向其中心值靠拢或集中的程度:二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。
2、四分位数的计算方法:四分位数是一组数据排序后处于25%
和75%位置上的值,根据原始数据计算四分位数时,首先对数据进行排序,然后确定四分位数所在的位置,该位置上的数值就是四分位数。
3、几何平均数是指一组数据值的连乘积的数据值个数次方根。比率数据属于相对数,它不能如绝对数那样对其进行累加,而只能对其进行连乘。在实际应用中,对于比率数据的平均采用几何平均要比算数平均更合理。
4、众数是一组数据分布的最高峰点所对应的数值,不受极端值的影响。如果数据的分布没有明显的最高峰,众数也有可能不存在;如果有两个或多个最高峰点,也可以有两个或多个众数。主要适合作为分类数据的集中趋势测度值。
中位数是一组数据排序后处于中间位置上的变量值,不受极端值的影响。主要适合作为顺序数据的集中趋势测度值,在研究收入分配是很有用。
平均数对数值型数据计算的,而且利用了全部数据信息,在实际应用中最广泛。当数据呈对称分布或近似对称分布时,三个代表值相等或相近,此时应选择平均数。但平均数易受极端值的影响,对于偏态分布的数据,平均数的代表性较差,此时应考虑中位数或众数。
5、对于顺序数据,主要使用四分位差来测量其离散程度;对于数值型数据主要使用方差或标准差来测量其离散程度。
6、有了平均数和标准差之后,可以计算一组数据中每个数值的