(完整版)贾俊平统计学[第六版]思考题答案解析.docx

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章:

1、什么是统计学?

统计学是一门收集、分析、表述、解释数据的科学和艺术。

2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。

推断统计:研究的是如何利用样本数据来推断总体特征。

3、统计学据可以分成哪几种类型,个有什么特点?

按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。

分类数据:只能归于某一类别的,非数字型数据。

顺序数据:只能归于某一有序类别的,非数字型数据。

数值型数据:按数字尺度测量的观察值,结果表现为数值。

按收集方法不同。分为:观测数据、和实验数据

观测数据:通过调查或观测而收集到的数据;不控制条件;

社会经济领域

实验数据:在试验中收集到的数据;控制条件;自然科学领域。

按时间不同,分为:截面数据、时间序列数据

截面数据:在相同或近似相同的时间点上收集的数据。

时间序列数据:在不同时间收集的数据。

4、举例说明总体、样本、参数、统计量、变量这几个概念。

总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定)

样本:从总体中抽取的一部分元素的集合。

参数:用来描述总体特征的概括性数字度量。(平均数、标准差、比例等)

统计量:用来描述样本特征的概括性数字度量。(平均数、标准差、比例等)

变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。(商品销售额、受教育程度、产品质量等级等)

(对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特

征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数

值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。)

5、变量可以分为哪几类?

分类变量:说明事物类别;取值是分类数据。

顺序变量:说明事物有序类别;取值是顺序数据

数值型变量:说明事物数字特征;取值是数值型数据。

变量也可以分为:随机变量和非随机变量;经验变量和理论变量

6、举例说明离散型变量和连续型变量。

离散型变量:只能取有限个、可数值的变量。(企业个数、产品数量)

连续型变量:可以在一个或多个区间中取任何值的变量。(年龄、温度、零件尺寸误差)7、请举出统计应用的几个例子。

市场调查、人口普查等。

8、请举出应用统计学的几个领域。

社会科学中的经济分析、政府政策制定等;自然科学中的物理、生物领域等。

1、什么是二手资料?使用二手资料需要注意些什么?

什么是二手资料:已经存在的;跟研究内容有关的;别人所做的调查或研究;会被我们

利用的,资料。

注意:需要进行评估:考虑原始数据收集人、收集目的、收集途径、收集时间及数据

来源。

2、比较概率抽样和非概率抽样的特点。举例说明什么情况下适合采用概率抽样,什么情

况下适合采用非概率抽样。

概率抽样:以一定的入样概率,按照一定的随机性原则选取样本(即样本被选中的概

率已知或可计算);技术含量高、成本高。

用于描述性、解释性、推断性研究;研究目的在于掌握对象总体的数字特征,

得到总体参数的置信区间。

非概率抽样:不按照入样概率和随机性原则,而按照方便、滚雪球或配额等抽样形式

选取样本;技术含量低、成本低、时效快、操作简便。

用于探索性研究;研究目的在于发现问题,为更深入的数量分析提供准备。

下面题目(略)

2.3 除了自填式,面访式和电话式还有什么搜集数据的办法

试验式和观察式等

2.4 自填式,面访式和电话式各自的长处和弱点

自填式;优点: 1 调查组织者管理容易 2 成本低,可进行大规模调查 3 对被调查者,可选择

方便时间答卷,减少回答敏感问题压力。缺点: 1 返回率低 2 不适合结构复杂的问卷,调查

内容有限 3 调查周期长 4 在数据搜集过程中遇见问题不能及时调整。

面访式;优点: 1 回答率高 2 数据质量高 3 在调查过程中遇见问题可以及时调整。缺点:1成本比较高 2 搜集数据的方式对调查过程的质量控制有一定难度 3 对于敏感问题,被访者会有压力。

电话式;优点: 1 速度快 2 对调查员比较安全 3 对访问过程的控制比较容易。缺点: 1 实施地区有限 2 调查时间不能过长 3 使用的问卷要简单 4 被访者不愿回答时,不易劝服。

2.6 如何控制调查中的回答误差

对于理解误差,学习一定的心理学知识,记忆误差,缩短所涉及的时间范围,有意识误差,

做好被调查者的心理工作,要遵守职业道德,为被调查者保密,尽量在问卷中不涉及敏感问题。

2.7 怎么减少无回答

对于随机误差,要提高样本容量,对于系统误差,只有做好准备工作并做好补救措施。比如

说要一百份的问卷回复,就要做好一百二十到一百三十的问卷准备,进行面访式的时候要尽量的

劝服不愿意回答的被访者,以小物品的馈赠提高回复率。

1、数据的预处理包括哪些内容?

数据审核:从完整性和准确性方面调查原始数据(完整性:单位、个体是否遗漏;准确

性:检查错误、异常值)

数据筛选:根据需要找出符合特定条件的某类数据。

数据排序:按一定顺序将数据排列,体现数据特征或趋势。

2、分类数据和顺序数据的整理和图示方法各有哪些?

分类数据:整理:制作频数分布表,用比例、百分比、比率进行描述性分析。

图示:条形图、帕累托图、饼图。

顺序数据::整理:制作频数分布表,用比例、百分比、比率进行描述性分析。

图示:累积频数、累计频率分布图、环形图、条形图、帕累托图、饼图。

3、数值型数据的分组方法有哪些?简述组距分组的步骤。

分组方法:单变量分组:把每一个变量值做为一组(只适合离散型变量,变量值较少)

组距分组:将全部变量值依次划分为若干区间,一个区间变量值做为一组。

(组距分组又分为:等距分组、异距分组)

分组步骤:确定组数(5,15);确定各组组距( 5 倍数;组距 >最大变量值 - 最小变量值);根据分组整理成频数分布表。

4、直方图与条形图有何区别?

1、条形图用于展示分类数据;直方图用于展示数值型数据。

2、条形图用长度表示个类别频数,宽度固定(无意义);直方图用面积表示各组频数,

长度表每组频数(或频率),宽度为组距(有意义)。

3、条形图各矩形分开排列,直方图各矩形连续排列。(分组数据具有连续性)

5、绘制线图应注意哪些问题?

时间在横轴,观测值在纵轴;横轴纵轴长度比例大概为 10:7;纵轴下端一般从 0 开始,数据与 0 距离过大的话用折断符。

6、饼图与环形图有什么不同?

饼图:只能绘制一个样本或总体各部分的比例。

条形图:可以同时绘制多个样本或总体各部分的比例。中间有一空洞,每个样本或总体

数据表现为一个环。

7、茎叶图与直方图相比有什么优点?他们的应用场合是什么?

茎叶图在给出数据分布情况的同时,又能给出每一个原始数据(保留了原始数据的信息);直方图用于大批量数据,茎叶图用于小批量数据。

8、鉴别图标优劣的准则有哪些?

显示数据、强调数据间的比较、有对图形的统计描述和文字描述、避免歪曲、把读者注

意力集中于数据内容上、服务于一个明确的目的。

8、制作统计表应注意哪几个问题

合理安排统计表结构;

表头一般包括表号,总标题和表中数据的单位等内容;

表中的上下两条横线一般用粗线,中间的其他用细线;

在使用统计表时,必要时可在下方加注释,注明数据来源。

公式:组中值=(上限 +下限) /2

相关文档
最新文档