统计学第六版贾俊平第4章(无水印)

合集下载

统计学第四章习题答案 贾俊平

统计学第四章习题答案 贾俊平

第四章 统计数据的概括性度量4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下: 2 4 7 10 10 10 12 12 14 15 要求:(1)计算汽车销售量的众数、中位数与平均数。

(2)根据定义公式计算四分位数。

(3)计算销售量的标准差。

(4)说明汽车销售量分布的特征。

解:Statistics汽车销售数量 10 Missing0 Mean 9、60 Median 10、00Mode10 Std 、 Deviation 4、169 Percentiles25 6、25 50 10、00 75单位:周岁19 15 29 25 24 23 21 38 22 18 30 20 19 19 16 23 27 22 34 24 41 20 3117 23要求;(1)计算众数、中位数:排序形成单变量分值的频数分布与累计频数分布:网络用户的年龄(2)根据定义公式计算四分位数。

Q1位置=25/4=6、25,因此Q1=19,Q3位置=3×25/4=18、75,因此Q3=27,或者,由于25与27都只有一个,因此Q3也可等于25+0、75×2=26、5。

(3)计算平均数与标准差;Mean=24、00;Std、Deviation=6、652(4)计算偏态系数与峰态系数:Skewness=1、080;Kurtosis=0、773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6、652、呈右偏分布。

如需瞧清楚分布形态,需要进行分组。

1、确定组数:()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=6 2、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4、3,取53、分组频数表网络用户的年龄 (Binned)分组后的直方图::一种就是所有颐客都进入一个等待队列:另—种就是顾客在三千业务窗口处列队3排等待。

贾俊平统计学ppt正式完整版

贾俊平统计学ppt正式完整版

第 1 章 导论
1.1 统计及其应用领域 1.2 统计数据的计量与类型 1.3 统计中的几个基本概念
1.1 统计及其应用领域
什么是统计学 statistics的定义(不列颠百科全书) statistics: the science of collecting,analyzing,presenting,
族分为汉族和少数民族两类。
2
x30,s 105 有些现象只能定性(分类),例如人口的性别和民族,企业的信誉等。
他们创造性想法是将120回看成是120个样本,然后确定与情节无关的虚词作为变量(所以要抛开情节,是因为在一般情况下,同一情节大家描述 的都差不多,但由于个人写作特点和习惯的不同,所用的虚词是不会一样的),数出每一回里变量出现的次数,作为数据,用多元分析中的聚类分
整理数据 学生)划分为不同的类型,但各类型之间是平行的关系,
收集数据,就必须对所考察的现象进行计量或测度。
展示数据 宝洁: SK-Ⅱ虚假广告风波
linguistics (语言学)
描述性分析 地温度比乙地高15℃,但不能说甲地比乙地热2倍。
25 literature (文学)
目的 1 企业发展战略
2. 对于样本数据,必须采用推断统计学方法才能了解总体的数量 规律
统计的应用领域
1 企业发展战略 2 产品质量管理 3 市场研究 4 财务分析 5 经济预测 6 人力资源管理
经济学
医学
管理学 统计学 工程学
社会学

表1-1 统计的应用领域
actuarial work (精算)
agriculture (农业)
贾俊平统计学课件
《红楼梦》后40回出自谁的手笔
众所周知,《红楼梦》一书共120回,一般认为前80回为曹 雪芹所写,后40回为高鹗所续,长期以来对这个问题一直 有争议。能否从统计上做出论证?

(完整版)贾俊平统计学[第六版]思考题答案解析.docx

(完整版)贾俊平统计学[第六版]思考题答案解析.docx

第一章:1、什么是统计学?统计学是一门收集、分析、表述、解释数据的科学和艺术。

2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。

推断统计:研究的是如何利用样本数据来推断总体特征。

3、统计学据可以分成哪几种类型,个有什么特点?按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。

分类数据:只能归于某一类别的,非数字型数据。

顺序数据:只能归于某一有序类别的,非数字型数据。

数值型数据:按数字尺度测量的观察值,结果表现为数值。

按收集方法不同。

分为:观测数据、和实验数据观测数据:通过调查或观测而收集到的数据;不控制条件;社会经济领域实验数据:在试验中收集到的数据;控制条件;自然科学领域。

按时间不同,分为:截面数据、时间序列数据截面数据:在相同或近似相同的时间点上收集的数据。

时间序列数据:在不同时间收集的数据。

4、举例说明总体、样本、参数、统计量、变量这几个概念。

总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定)样本:从总体中抽取的一部分元素的集合。

参数:用来描述总体特征的概括性数字度量。

(平均数、标准差、比例等)统计量:用来描述样本特征的概括性数字度量。

(平均数、标准差、比例等)变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。

(商品销售额、受教育程度、产品质量等级等)(对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。

)5、变量可以分为哪几类?分类变量:说明事物类别;取值是分类数据。

顺序变量:说明事物有序类别;取值是顺序数据数值型变量:说明事物数字特征;取值是数值型数据。

变量也可以分为:随机变量和非随机变量;经验变量和理论变量6、举例说明离散型变量和连续型变量。

《统计学》完整袁卫-贾俊平

《统计学》完整袁卫-贾俊平

总体 N
N1 N2
n1
n2
样本 n
n1 n2 nk
等额
k
n ni
i 1
等比例
n1
Ni N
n
··· ···
N k nk
最优
n1
Ni
2 i
Ni
2 iBiblioteka n整群抽样方法:首先把总体中的N个单位划分成为若干个群, 并要求每个群对整个总体都具有代表性,然后对群进 行简单随机抽样,并对抽中群内的所有单位进行调查 研究。
1. 描述统计
关于搜集、展示一批数据,并反映这 批数据特征的各种方法,其目的是为 了正确地反映总体的数量特点。
2. 推断统计 根据样本统计量估计和推断总体参 数的技术和方法。
描述统计是推断统计的前提, 推断统计是描述统计的发展。
二、数据
(一) 为何需要数据 ?
统计学要研究各种随机变量,通过对这些随机变量的 观察所获取的数据包含了我们所需的信息,这些信息 能有助于我们在许多场合中做出更为正确的决策。
就是把定量数据按从大到小或从小到大的顺序排列, 把定性数据按习惯的文字顺序排列,便于我们研究其 条理。
统计分组
对于定性数据就是依据属性的不同将数据划分成若干 组,对于定量数据就是依据属性数值的不同将数据划 分成若干组。
组内同质性,组间差异性。
频数分布编制
分组的关键 变量的选择,选择与研究的问题有关的 变量 。 组限的确定。应遵循穷尽和互斥原则 。
就是把政府机构、各种组织和公司所公布的数据作为 来源,这种数据往往是次级数据。 2. 设计一次试验以获取必要的数据。
例如,在检验洗衣机洗净程度的研究中,研究人员通 过实际洗涤脏衣服,来研究哪种牌子的洗衣机效果最 佳。

统计学贾俊平课后习题答案

统计学贾俊平课后习题答案

附录:教材各章习题答案第1章统计与统计数据1.1(1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5)分类数据。

1.2(1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家庭”;(2)城市所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。

1.3(1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。

1.4(1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者的月平均花费;(4)统计量;(5)推断统计方法。

1.5(略)。

1.6(略)。

第2章数据的图表展示2.1(1)属于顺序数据。

(2)频数分布表如下服务质量等级评价的频数分布(3)条形图(略)(4)帕累托图(略)。

2.2(1)频数分布表如下40个企业按产品销售收入分组表(2)某管理局下属40个企分组表2.3频数分布表如下某百货公司日商品销售额分组表直方图(略)。

2.4茎叶图如下箱线图(略)。

2.5(1)排序略。

(2)频数分布表如下100只灯泡使用寿命非频数分布(3)直方图(略)。

(4)茎叶图如下2.6(1)频数分布表如下(2)直方图(略)。

(3)食品重量的分布基本上是对称的。

2.7(1)频数分布表如下(2)直方图(略)。

2.8(1)属于数值型数据。

(2)分组结果如下(3)直方图(略)。

2.9(1)直方图(略)。

(2)自学考试人员年龄的分布为右偏。

2.10(1)茎叶图如下(2)A班考试成绩的分布比较集中,且平均分数较高;B班考试成绩的分布比A班分散,且平均成绩较A班低。

2.11(略)。

2.12(略)。

2.13(略)。

2.14(略)。

2.15箱线图如下:(特征请读者自己分析)第3章 数据的概括性度量 3.1(1)100=M ;10=e M ;6.9=x 。

(2)5.5=L Q ;12=U Q 。

(3)2.4=s 。

(4)左偏分布。

3.2(1)190=M ;23=e M 。

统计学PPT完整袁卫贾俊平

统计学PPT完整袁卫贾俊平
就是把定量数据按从大到小或从小到大的顺序排列, 把定性数据按习惯的文字顺序排列,便于我们研究其 条理。
统计分组
对于定性数据就是依据属性的不同将数据划分成若干 组,对于定量数据就是依据属性数值的不同将数据划 分成若干组。
组内同质性,组间差异性。
频数分布编制
分组的关键 变量的选择,选择与研究的问题有关的 变量 。 组限的确定。应遵循穷尽和互斥原则 。
4.重点调查
特点:在总体中选择个别或部分重点单位进行调查。
重点单位指在总体中有举足轻重地位的单位, 其标志值在总体标志总量中占有绝大比重。
任务:及时了解总体基本情况,为主管部门指导工 作服务。
方式:经常性调查;同报表制度结合,用统计报表 调查。
例如,要了解全国钢铁生产的基本情况,只要调 查鞍钢、宝钢、首钢、武钢、包钢等十几家特大 型的钢铁企业就可以掌握全国钢铁企业生产的基 本情况 。
(二)抽样的优点
1.适用的范围广。
对于有限总体,从理论上讲,既可以进行普查也可以 进行抽样;
对于无限总体,就只能进行抽样。若理论上可以而实 际上很难采用全面普查的情况,也只能采用抽样。
如产品质量的破坏性检验、居民住户调查等。
2.与全面普查相比,抽样最大的优点是节省人、财、物 力和时间。 3.随机抽样可以比普查更为精确。
就是把政府机构、各种组织和公司所公布的数据作为 来源,这种数据往往是次级数据。 2. 设计一次试验以获取必要的数据。
例如,在检验洗衣机洗净程度的研究中,研究人员通 过实际洗涤脏衣服,来研究哪种牌子的洗衣机效果最 佳。
3.从观察研究中获取。研究人员通常是在自然状态下, 进行直接的观察。
例如,观察路口的交通流量、观察顾客在商场的购买 行为和观察流水线上的产品质量等。

2024版统计学贾俊平人大PPT课件

2024版统计学贾俊平人大PPT课件

课件•引言•统计数据的收集与整理•统计描述目•概率论基础•统计推断录•统计指数与因素分析•相关与回归分析•统计决策目•统计学的应用与发展录引言统计学概述统计学的定义统计学的发展历史统计学的分支领域1 2 3统计学在决策中的应用统计学在科学研究中的应用统计学在社会生活中的应用统计学的重要性统计学的研究对象01020304数据的收集数据的整理数据的分析数据的解释统计数据的收集与整理原始数据二手数据定性数据定量数据时序数据030201数据的收集方法观察法调查法实验法数据的整理与显示数据整理数据显示通过图表、图像等方式将数据呈现出来,以便于直观理解和分析。

常见的数据显示方式包括表格、条形图、折线图、饼图等。

统计描述集中趋势的描述算术平均数适用于数值型数据,反映数据的平均水平。

中位数适用于顺序数据,反映数据的中等水平。

众数适用于分类数据,反映数据的多数水平。

离散程度的描述四分位数间距极差上四分位数与下四分位数之差,反映中间50%数据的离散程度。

方差与标准差分布形态的描述偏态峰态统计图表的应用适用于分类数据,表示各类别的频数或频率。

适用于时间序列数据,表示事物随时间的变化趋势。

适用于分类数据,表示各类别在总体中的占比。

适用于两个数值型变量,表示它们之间的相关关系。

条形图折线图饼图散点图概率论基础随机事件与概率随机试验与样本空间随机试验是具有某些基本特点的试验,其所有可能结果构成的集合称为样本空间。

随机事件随机试验的某个(些)样本点构成的集合称为随机事件。

概率的定义概率是描述随机事件发生的可能性大小的数值,常用P(A)表示。

概率的性质与运算法则概率的性质01概率的加法公式02概率的乘法公式03事件的独立性如果事件A 与事件B 相互独立,则P(A∩B)=P(A)P(B)。

条件概率在事件B 发生的条件下,事件A 发生的概率称为条件概率,记作P(A|B)。

多个事件的独立性如果事件A1,A2,...,An 相互独立,则对于任意k 个事件Ai1,Ai2,...,Aik(1≤i1<i2<...<ik≤n),都有P(Ai1∩Ai2∩...∩Aik)=P(Ai1)P(Ai2)...P(Aik)。

(完整版)统计学贾俊平考研知识点总结

(完整版)统计学贾俊平考研知识点总结

统计学重点笔记第一章导论一、比较描述统计和推断统计:数据分析是通过统计方法研究数据,其所用的方法可分为描述统计和推断统计。

(1)描述性统计:研究一组数据的组织、整理和描述的统计学分支,是社会科学实证研究中最常用的方法,也是统计分析中必不可少的一步。

内容包括取得研究所需要的数据、用图表形式对数据进行加工处理和显示,进而通过综合、概括与分析,得出反映所研究现象的一般性特征。

(2)推断统计学:是研究如何利用样本数据对总体的数量特征进行推断的统计学分支。

研究者所关心的是总体的某些特征,但许多总体太大,无法对每个个体进行测量,有时我们得到的数据往往需要破坏性试验,这就需要抽取部分个体即样本进行测量,然后根据样本数据对所研究的总体特征进行推断,这就是推断统计所要解决的问题。

其内容包括抽样分布理论,参数估计,假设检验,方差分析,回归分析,时间序列分析等等。

(3)两者的关系:描述统计是基础,推断统计是主体二、比较分类数据、顺序数据和数值型数据:根据所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。

(1)分类数据是只能归于某一类别的非数字型数据。

它是对事物进行分类的结果,数据表现为类别,是用文字来表达的,它是由分类尺度计量形成的。

(2)顺序数量是只能归于某一有序类别的非数字型数据。

也是对事物进行分类的结果,但这些类别是有顺序的,它是由顺序尺度计量形成的。

(3)数值型数据是按数字尺度测量的观察值。

其结果表现为具体的数值,现实中我们所处理的大多数都是数值型数据。

总之,分类数据和顺序数据说明的是事物的本质特征,通常是用文字来表达的,其结果均表现为类别,因而也统称为定型数据或品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此可称为定量数据或数量数据。

三、比较总体、样本、参数、统计量和变量:(1)总体是包含所研究的全部个体的集合。

通常是我们所关心的一些个体组成,如由多个企业所构成的集合,多个居民户所构成的集合。

贾俊平《统计学》(第6版)章节题库-第五章至第七章【圣才出品】

贾俊平《统计学》(第6版)章节题库-第五章至第七章【圣才出品】

第5章概率与概率分布一、单项选择题1.一项试验中所有可能结果的集合称为()。

A.事件B.简单事件C.样本空间D.基本事件【答案】C【解析】在同一组条件下,对某事物或现象所进行的观察或实验称作试验,观察或试验的结果称作事件。

如果一个事件不能分解成两个或更多个事件,则这个事件称为基本事件或者简单事件。

一个试验中所有的简单事件的全体称为样本空间或基本空间。

2.每次试验可能出现也可能不出现的事件称为()。

A.必然事件B.样本空间C.随机事件D.不可能事件【答案】C【解析】随机事件是指在同一组条件下,每次试验可能出现也可能不出现的事件,也叫偶然事件。

必然事件是指在同一组条件下,每次试验一定出现的事件。

不可能事件是指在同一组条件下,每次试验一定不出现的事件。

3.抛3枚硬币,用0表示反面,l 表示正面,其样本空间为Ω=()。

A.{000,001,010,100,011,101,110,111}B.{l,2,3}C.{0,1}D.{01,10}【答案】A【解析】样本空间为一个试验中所有的简单事件的全体。

抛3枚硬币,每抛一次都是由0和1组成的一个三位数的组合,所有的组合构成了样本空间,即{000,001,010,100,011,101,110,111}。

4.随机抽取一只灯泡,观察其使用寿命t ,其样本空间为Ω=()。

A.{0t =}B.{0t <}C.{0t >}D.{0t ≥}【答案】D【解析】一个试验中所有的简单事件的全体称为样本空间或基本空间。

灯泡的使用寿命样本空间为Ω={0t ≥}。

5.观察一批产品的合格率p ,其样本空间为Ω=()。

A.{01p <<}B.{01p ≤≤}C.{1p ≤}D.{0p ≥}【答案】B【解析】一个试验中所有的简单事件的全体称为样本空间或基本空间。

产品的合格率样本空间为Ω={01p ≤≤}。

6.抛掷一枚硬币,观察其出现的是正面还是反面,并将事件A 定义为:事件A=出现正面,这一事件的概率记作P(A)。

统计学(第六版)贾俊平——-课后习题答案

统计学(第六版)贾俊平——-课后习题答案

第一章导论1。

1.1(1)数值型变量.(2)分类变量.(3)离散型变量.(4)顺序变量。

(5)分类变量.1.2(1)总体是该市所有职工家庭的集合;样本是抽中的2000个职工家庭的集合.(2)参数是该市所有职工家庭的年人均收入;统计量是抽中的2000个职工家庭的年人均收入。

1.3(1)总体是所有IT从业者的集合。

(2)数值型变量。

(3)分类变量。

(4)截面数据。

1.4(1)总体是所有在网上购物的消费者的集合。

(2)分类变量。

(3)参数是所有在网上购物者的月平均花费。

(4)参数(5)推断统计方法。

第二章数据的搜集1.什么是二手资料?使用二手资料需要注意些什么?与研究内容有关的原始信息已经存在,是由别人调查和实验得来的,并会被我们利用的资料称为“二手资料"。

使用二手资料时需要注意:资料的原始搜集人、搜集资料的目的、搜集资料的途径、搜集资料的时间,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。

在引用二手资料时,要注明数据来源。

2。

比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。

概率抽样是指抽样时按一定概率以随机原则抽取样本。

每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽中的概率,概率抽样的技术含量和成本都比较高。

如果调查的目的在于掌握和研究总体的数量特征,得到总体参数的置信区间,就使用概率抽样。

非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。

非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。

它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。

非概率抽样也适合市场调查中的概念测试.3。

调查中搜集数据的方法主要有自填式、面方式、电话式,除此之外,还有那些搜集数据的方法?实验式、观察式等。

贾俊平《统计学》(第6版)章节题库-第一章至第四章【圣才出品】

贾俊平《统计学》(第6版)章节题库-第一章至第四章【圣才出品】

2.指出下面的变量哪一个属于顺序变量?( ) A.年龄 B.工资 C.汽车产量 D.员工对企业某项改革措施的态度(赞成、中立、反对) 【答案】D 【解析】顺序变量又称为有序分类变量,观测结果表现为某种有序类别的变量。C 项员 工对企业某项改革措施的态度按顺序依次表现为:赞成、中立、反对三种,因此属于顺序变
4.某研究部门准备在全市 200 万个家庭中抽取 2000 个家庭,推断该城市所有职工家 庭的年人均收入。这项研究的总体是( )。
A.2000 个家庭 B.200 万个家庭 C.2000 个家庭的人均收入 D.200 万个家庭的总收入 【答案】B 【解析】总体是指包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体 组成。题中的总体为 200 万个家庭。
何利用样本数据来推断总体特征的统计学方法。由此可知 A 项属于推断统计学方法。
12.某大学的一位研究人员希望估计该大学本科生平均每月的生活费支出,为此,他 调查了 200 名学生,发现他们每月平均生活费支出是 500 元。该研究人员感兴趣的总体是 ( )。
A.该大学的所有学生 B.该校所有大学生的总生活费支出 C.该大学所有的在校本科生 D.所调查的 200 名学生 【答案】C 【解析】总体是指包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体 组成。因此题中的总体是“该大学所有的在校本科生”。
8.一家研究机构从 IT 从业者中随机抽取 500 人作为样本进行调查,其中 60%回答他们 的月收人在 5000 元以上,50%回答他们的消费支付方式是用信用卡。这里的总体是( )。
A.IT 业的全部从业者 B.500 个 IT 从业者 C.IT 从业者的总收入 D.IT 从业者的消费支付方式 【答案】A 【解析】总体是指包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体 组成。题中的总体为“所有 IT 从业者”。

统计学贾俊平课后习题答案完整版

统计学贾俊平课后习题答案完整版

统计学贾俊平课后习题答案HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】附录:教材各章习题答案第1章统计与统计数据1.1(1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5)分类数据。

1.2(1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家庭”;(2)城市所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。

1.3(1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。

1.4(1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者的月平均花费;(4)统计量;(5)推断统计方法。

1.5(略)。

1.6(略)。

第2章数据的图表展示2.1(1)属于顺序数据。

(2)频数分布表如下(4)帕累托图(略)。

2.2(1)频数分布表如下2.3频数分布表如下2.5(1)排序略。

(2)频数分布表如下2.6(3)食品重量的分布基本上是对称的。

2.72.8(1)属于数值型数据。

2.9(1)直方图(略)。

(2)自学考试人员年龄的分布为右偏。

2.10A 班分散,且平均成绩较A 班低。

2.11 (略)。

2.12 (略)。

2.13 (略)。

2.14 (略)。

2.15 箱线图如下:(特征请读者自己分析) 第3章 数据的概括性度量3.1(1)100=M ;10=e M ;6.9=x 。

(2)5.5=L Q ;12=U Q 。

(3)2.4=s 。

(4)左偏分布。

3.2(1)190=M ;23=e M 。

(2)5.5=L Q ;12=U Q 。

(3)24=x ;65.6=s 。

(4)08.1=SK ;77.0=K 。

(5)略。

3.3 (1)略。

(2)7=x ;71.0=s 。

(3)102.01=v ;274.02=v 。

(4)选方法一,因为离散程度小。

3.4 (1)x =(万元);M e= 。

统计学第四章习题答案解析贾俊平

统计学第四章习题答案解析贾俊平

第四章统计数据的概括性度量4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。

(2)根据定义公式计算四分位数。

(3)计算销售量的标准差。

(4)说明汽车销售量分布的特征。

解:Statistics10Missing 0Mean 9.60Median 10.00Mode 10Std. Deviation 4.169Percentiles 25 6.2550 10.0075 12.50单位:周岁19 15 29 25 2423 21 38 22 1830 20 19 19 1623 27 22 34 2441 20 31 17 23要求;(1)计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄(2)根据定义公式计算四分位数。

Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。

(3)计算平均数和标准差;Mean=24.00;Std. Deviation=6.652(4)计算偏态系数和峰态系数:Skewness=1.080;Kurtosis=0.773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。

如需看清楚分布形态,需要进行分组。

1、确定组数: ()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=6 2、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4.3,取53、分组频数表网络用户的年龄 (Binned)分组后的直方图:种是所有颐客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待。

统计学第六版贾俊平 无水印

统计学第六版贾俊平 无水印
2. 顺序数据(rank data)
? 对事物类别顺序的测度 ? 数据表现为类别,用文字来表述 ? 例如,产品分为一等品、二等品、三等品、次品等
3. 数值型数据(metric data)
? 对事物的精确测度 ? 结果表现为具体的数值 ? 例如:身高为 175cm、168cm、183cm
统计数据的分类
management science (管理科学 )
marketing (市场营销学 )
medical diagnosis (医学诊断 )
meteorology (气象学 )
military science (军事科学 )
nuclear material safeguards (核材料安全管理 )
ophthalmology (眼科学 )
统计中的几个基本概念
总体
?
? ?
?????
样本
?? ?
参数 ? ? ?
平均数 标准差 比例
统计量 ?x s p
几种常用的统计软件
(Software)
?典型的统计软件
? SAS ? SPSS
? MINITAB
? STATISTICA ? Excel
SAS SPSS
STATISTICA MINITAB Excel
? 有限总体的范围能够明确确定,且元素的数目是有限的 ? 无限总体所包括的元素是无限的,不可数的
2. 样本 (sample)
? 从总体中抽取的一部分元素的集合 ? 构成样本的元素的数目称为样本容量
参数和统计量
1. 参数(parameter)
? 研究者想要了解的总体的某种特征值 ? 所关心的参数主要有总体均值(? )、标准差(? )、

统计学(第六版)贾俊平——_课后习题答案

统计学(第六版)贾俊平——_课后习题答案

第一章导论.1(1)数值型变量。

(2)分类变量。

(3)离散型变量。

(4)顺序变量。

(5)分类变量。

(1)总体是该市所有职工家庭的集合;样本是抽中的2000个职工家庭的集合。

(2)参数是该市所有职工家庭的年人均收入;统计量是抽中的2000个职工家庭的年人均收入。

(1)总体是所有IT从业者的集合。

(2)数值型变量。

(3)分类变量。

(4)截面数据。

(1)总体是所有在网上购物的消费者的集合。

(2)分类变量。

(3)参数是所有在网上购物者的月平均花费。

(4)参数(5)推断统计方法。

第二章数据的搜集1.什么是二手资料使用二手资料需要注意些什么与研究内容有关的原始信息已经存在,是由别人调查和实验得来的,并会被我们利用的资料称为“二手资料”。

使用二手资料时需要注意:资料的原始搜集人、搜集资料的目的、搜集资料的途径、搜集资料的时间,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。

在引用二手资料时,要注明数据来源。

2.比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。

概率抽样是指抽样时按一定概率以随机原则抽取样本。

每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽中的概率,概率抽样的技术含量和成本都比较高。

如果调查的目的在于掌握和研究总体的数量特征,得到总体参数的置信区间,就使用概率抽样。

非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。

非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。

它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。

非概率抽样也适合市场调查中的概念测试。

3.调查中搜集数据的方法主要有自填式、面方式、电话式,除此之外,还有那些搜集数据的方法实验式、观察式等。

4. 自填式、面方式、电话式调查个有什么利弊自填式优点:调查组织者管理容易,成本低,可以进行较大规模调查,对被调查者可以刻选择方便时间答卷,减少回答敏感问题的压力。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

原始数据:
顺序数据:
顺序数据的四分位数
(例题分析)
甲城市家庭对住房状况评价的频数分布
回答类别 非常不满意 不满意 一般 满意 非常满意 合计
甲城市 户数 (户) 24 108 93 45 30 300 累计频数 24 132 225 270 300 —
解:QL位置= (300)/4 =75 QU位置 =(3×300)/4 =225 从累计频数看, QL 在“ 不满意”这一组别中; QU 在“一般”这一组别中。因 此 QL = 不满意
可口可乐 旭日升冰茶 百事可乐 汇源果汁 露露 合计
15 11 9 6 9 50
0.30 0.22 0.18 0.12 0.18 1
30 22 18 12 18 100
顺序数据的众数
(例题分析)
甲城市家庭对住房状况评价的频数分布 回答类别 非常不满意 不满意 一般 满意 非常满意 甲城市 户数 (户) 24 108 93 45 30 百分比 (%) 8 36 31 15 10
加权均值
(权数对均值的影响)
甲乙两组各有10名学生,他们的考试成绩及其分布数据如下
甲组: 考试成绩(x ): 0 人数分布(f ):1
乙组: 考试成绩(x): 0 人数分布(f ):8
20 1
20 1
100 8
100 1
x甲
x
i 1
n
i
x乙
x
i 1
n
n
i
0 1 20 1 100 8 82(分) 10
i i i i i
原来只是计算 时使用了不同 的数据!
M f f
i i
i
调和平均数
(例题分析)
【例】某蔬菜批发市场三种蔬菜的日成交数据如表,计算三 种蔬菜该日的平均批发价格
某日三种蔬菜的批发成交数据 蔬菜 名称 甲 乙 丙 合计 批发价格(元) Mi 1.20 0.50 0.80 — 成交额(元) Mi fi 18000 12500 6400 36900 成交量(公斤) fi 15000 25000 8000 48000
数据分布特征的和测度
(本节位置)
数据的特征和测度
集中趋势
众 数 中位数 均 值
离散程度
异众比率
分布的形状
偏 态
四分位差 方差和标准差 离散系数
峰 态
集中趋势
(Central tendency)
1. 一组数据向其中心值靠拢的倾向和程度 2. 测度集中趋势就是寻找数据水平的代表值或中心值 3. 不同类型的数据用不同的集中趋势测度值
Gm n x1 x2 xn 3 109% 116% 120% 114.91%
年平均增长率=114.91%-1=14.91%
几何平均数
(例题分析)
【例】一位投资者购持有一种股票 ,在 2000 、 2001、2002和2003年收益率分别为4.5%、2.1% 、25.5%、1.9%。计算该投资者在这四年内的平 均收益率 几何平均:
均值
(mean)
1. 2. 3. 4. 5. 集中趋势的最常用测度值 一组数据的均衡点所在 体现了数据的必然性特征 易受极端值的影响 用于数值型数据,不能用于分类数据和顺 序数据
简单均值与加权均值
(simple mean / weighted mean)
设一组数据为: x1 ,x2 ,… ,xn 各组的组中值为:M1 ,M2 ,… ,Mk 相应的频数为: f1 , f2 ,… ,fk
5. 可看作是均值的一种变形
x
i 1
n
i
1 lg Gm (lg x1 lg x 2 lg x n ) n
lg x
i 1
n
i
n
几何平均数
(例题分析)
【例】某水泥生产企业 1999 年的水泥产量为 100 万 吨 , 2000 年 与 1999 年 相 比 增 长 率 为 9% , 2001 年与 2000 年相比增长率为 16%, 2002 年与 2001 年相比增长率为 20% 。求各年的年平均增 长率。
解:这里的数据为 顺序数据。变量为 “回答类别”
甲城市中对住 房表示不满意的户 数 最 多 , 为 108 户 ,因此众数为“不 满意”这一类别, 即
Mo=不满意
合计
300
100.0
顺序数据:中位数和分位数
中位数
(median)
1. 排序后处于中间位置上的值
50%
2. 不受极端值的影响
Me
50%
简单均值 加权均值
x1 x 2 x n x n
x
i 1
n
i
n
M 1 f1 M 2 f 2 M k f k x f1 f 2 f k
M
i 1
k
i
fi
n
加权均值
(例题分析)
某电脑公司销售量数据分组表
按销售量分组 150~160 160~170 170~180 180~190 190~200 200~210 210~220 220~230 230~240 组中值(M ) 已改至此!! 140~150 145
第 4 章 数据分布特征的测度
第 4 章 数据分布特征的测度
4.1 集中趋势的测度 4.2 离散程度的测度 4.3 偏态与峰度的测度
学习目标
1. 2. 3. 4. 5. 6. 集中趋势各测度值的计算方法 集中趋势各测度值的特点及应用场合 离散程度各测度值的计算方法 离散程度各测度值的特点及应用场合 偏态与峰态的测度方法 用Excel计算描述统计量并进行分析
数据类型和所适用的集中趋势测度值
数据类型 适 用 的 测 度 值 分类数据 ※众数 — — — — — 顺序数据 ※中位数 四分位数 众数 — — — 间隔数据 ※均值 众数 中位数 四分位数 — — 比率数据 ※均值 调和平均数 几何平均数 中位数 四分位数 众数
4.2 离散程度的测度
一.分类数据:异众比率 二.顺序数据:四分位差 三.数值型数据:方差及标准差 四.相对位置的测量:标准分数 五.相对离散程度:离散系数
10 6
5 5
9 12 9 8
6 5
8 5
多于一个众数 原始数据: 25 28 28 36 42 42
分类数据的众数
(例题分析)
不同品牌饮料的频数分布 饮料品牌 频数 比例 百分比 (%) 解:这里的变量为“饮料 品牌”,这是个分类变量 ,不同类型的饮料就是变 量值 在 所 调 查 的 50 人 中 , 购买可口可乐的人数最多 , 为 15 人 , 占 总 被 调 查 人数的30%,因此众数为 “可口可乐”这一品牌, 即 Mo=可口可乐
4. 低层次数据的测度值适用于高层次的测量数据,但高 层次数据的测度值并不适用于低层次的测量数据
分类数据:众数
众数
(mode)
1. 出现次数最多的变量值
2. 不受极端值的影响 3. 一组数据可能没有众数或有几个众数 4. 主要用于分类数据,也可用于顺序数据和 数值型数据
众数
(不唯一性)
无众数 原始数据: 一个众数 原始数据:
960 1080 中位数 1020 2
四分位数
(quartile)
1. 排序后处于25%和75%位置上的值
25%
QL
25%
25%
QM
25%
QU
2. 不受极端值的影响 3. 主要用于顺序数据,也可用于数值型数据, 但不能用于分类数据
四分位数
(位置的确定)
n 1 Q L 位置 4 Q 位置 3( n 1) U 4 n QL 位置 4 Q 位置 3n U 4
3. 主要用于顺序数据,也可用数值型数据,但不能 用于分类数据
中位数
(位置的确定)
n 1 中位数位置 2 n 中位数位置 2
原始数据:
顺序数据:
顺序数据的中位数
(例题分析)
甲城市家庭对住房状况评价的频数分布 回答类别
非常不满意 不满意 一般 满意 非常满意 甲城市
户数 (户)
24 108 93 45 30
9
9 1 3(9 1) Q L 位置 2.5 QU 位置 7 .5 4 4 780 850 1500 1630 QL 815 QU 1565 2 2
数值型数据的四分位数
(10个数据的算例)
【例】:10个家庭的人均月收入数据
排 位 序: 置: 660 750 780 850 960 1080 1250 1500 1630 2000
i
频数(fi) 4 9 16 27 20 17 10 8 4 5
Mi fi 580 1395 2640 4725 3700 3315 2050 1720 900 1175
155 165 175 185 195 205 215 225 235
x
M
i 1
k
i
fi
合计

120
22200
n 22200 185 120
QU = 一般
数值型数据的四分位数
(9个数据的算例)
【例】:9个家庭的人均月收入数据
原始数据: 排 序: 位 置: 1500 750 780 1080 850 960 2000 1250 1630 750 780 850 960 1080 1250 1500 1630 2000
1
2
3
4
5
6
7


8
众数 中位数 均值
左偏分布
对称分布
右偏分布
众数、中位数和均值的特点和应用
1. 众数
相关文档
最新文档