统计学思考题
统计学思考题答案
统计学思考题一、名词解释1.参数:描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值。
所关心的参数主要有总体均值、标准差、总体比例等。
总体参数通常用希腊字母表示2.残差:因变量的观测值与根据估计的回归方程求出的预测值之差,用e表示。
反映了用估计的回归方程去预测而引起的误差,可用于确定有关误差项ε的假定是否成立3.标准分数:变量值与其平均数离差除以标准差后的值就是标准分数也称标准化值或z分数。
P874.次序统计量:一组样本观测值X1,X2,…,X n由小到大的排序X(1)≤X(2)≤…≤ X (i)≤…≤ X(n)后,称X(1),X(2),…,X(n)为次序统计量。
中位数、分位数、四分位数等都是次序统计量5.β错误:原假设为伪是没有拒绝,犯这种错误的概率用表示,所以也称β错误或取伪错误6.α错误:原假设为真时拒绝原假设,犯这种错误的概率用α表示,所以也被称为α错误或弃真错误。
7.多元回归方程:描述因变量y 的平均值或期望值如何依赖于自变量x1,x2,…,x k的方程。
多元线性回归方程的形式为E( y ) = β+ β1 x1+ β2 x2+…+ βk x k8.多元回归模型:描述因变量y 如何依赖于自变量x1, x2,…, x k和误差项ε的方程,称为多元回归模型。
其一般形式为:E( y ) = β+ β1 x1+ β2 x2+…+ βk x k + ε9.多重判定系数:是多元回归中的回归平方和占总平方和的比例,它是度量多元回归方程拟合程度的一个统计量,反映了在因变量y的变差中被估计的回归方程所解释的比例。
10.F分布:设随机变量Y与Z相互独立,且Y与Z分别服从于自由度为m和n的2χ分布,随机变量X有如下表达式:F=nY/mZ,则称X服从于第一自由度为m,第二自由度为n的F分布,记作X~F(m,n)11.方差分析:检验各个总体均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。
统计学思考题最新版本
思考题(仅供参考)部分题目超出范围。
同学们仅作上课讲授过的题目即可二、判断题1、对于定性变量不能确定平均数.( )2、根据组距式数列计算的平均数、标准差等都是近似值.( )3、任何平均数都受变量数列中的极端值的影响.( )4、中位数把变量数列分成了两半,一半数值比它大,一半数值比它小.( )5、任何变量数列都存在众数.( )6、如果x <Me<M0,则变量分布存在右偏.( )7、若比较两个变量分布平均数代表性的高低,则方差或标准差大的平均数的代表性差.( )8、只要变量分布具有相同的标准差就会有相同的分布形状.( )9、在统计学实际应用中,调和平均数与算术平均数的计算形式虽然不同,但计算结果及其意义是一样的.( )10.各标志值平方和的算术平均数公式为 ( )11.各个变量值对其算术平均数的离差绝对值之和等于零。
( )12.计算加权算术平均数时,其权数必须是各组的次数或比率。
( )13.计算数值平均数时,要求资料中的各项数值必须大于零。
( )14.根据分组资料计算的算术平均数,只是一个近似值。
( )15.权数的绝对数越大,对算术平均数的影响也就越大。
( )16.组距数列条件下,众数的大小主要取决于众数组相邻两小次数多少的影响。
( )17.两个企业比较,若B A B A x x σσ>>,”,由此可以肯定B 企业生产的均衡性比A 企业好。
( )18.对于分组资料,若不同时期相比,各组平均数均程度不同地上升,则总平均数一定上升。
( )19.n 个同性质独立变量和的方差等于各个变量方差之和。
( )20.n 个同性质独立变量平均数的方差等于各变量方差的平均数。
( )21.变量的方差等于变量平均数的平方减变量平方的平均数。
( )22、峰态一词是由统计学家Galton 于1905年首次提出的。
它是对数据分布平峰或尖峰程度的测度。
( )三、选择题1、某工厂新工人月工资400元,工资总额为200000元,老工人月工资800元,工资总额80000元,则总平均工资为( )A 、 600元B 、 533.33元C 、466.67元D 、 500元2、标志变异指标是反映同质总体的( ).A 、集中程度B 、离中程度C 、一般水平D 、变动程度3、权数对算术平均数的影响作用,实质上取决于( )A 、作为权数的各组单位数占总体单位数比重的大小B 、各组标志值占总体标志总量比重的大小C 、标志值本身的大小D 、标志值数量的多少4、对于不同水平的总体不能直接用标准差比较其标志变动度,这时需分别计算各自的( )来比较A.标准差系数B.平均差C.全距D.均方差5、统计学中最重要的离散指标是( ).A 、平均差B 、全距C 、标准差D 、变异系数6、离散指标中受极端值影响最大的是( )A 、平均差B 、全距C 、标准差D 、方差7、假如学生的考试成绩用优秀、良好、中等、及格和不及格来表示,则全班考试成绩的水平高低应该用什么平均数来说明?( )A 、算术平均数B 、众数C 、众数或中位数D 、中位数8、若两个变量数列的标准差相等且计量单位相同,但平均数不相等,则( )A 、平均数大者代表性强B 、平均数小者代表性强C 、两个平均数的代表性一样D 、无法判断哪个平均数的代表性强9、某企业有A 、B 两个车间,去年A 车间人均产量3.6万件,B 车间人均产量3.5万件.今年A 车间人数增加6%,B 车间增加8%.如果两个车间的人均产量都保持不变,则该企业今年总的人均产量与去年相比( )A 、上升B 、下降C 、不变D 、不能确定如何变化10、已知某变量分布属于钟形分布且M0=900,Me=930,则( )A 、x <900B 、900<x < 930C 、x >930D 、x =91511.受极大值影响较大的平均数是( )。
统计学(第五版)贾俊平 课后思考题和练习题答案(最终完整版)
统计学(第五版)贾俊平课后思考题和练习题答案(最终完整版)整理by__kiss-ahuang第一部分思考题第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。
《统计学》课后思考题
《统计学》课后思考题《统计学》课后思考题第⼀章导论1、解释描述统计和推断统计描述统计:研究的是数据收集、处理、汇总、图表描述、概括与分析等统计⽅法。
推断统计:研究如何利⽤样本数据来推断总体特征的统计⽅法。
2、统计数据可分为哪⼏个类型?不同类型的数据各有什么特点?3、举例说明总体、样本、参数、统计量、变量这⼏个概念总体:所研究的全部元素的集合,其中的每⼀个元素称为个体。
eg.要检验⼀批灯泡的使⽤寿命,这批灯泡构成的集合就是总体。
样本:从总体中抽取的⼀部分元素的集合。
eg.从⼀批灯泡中随机抽取100个,这100个灯泡就构成了⼀个样本。
参数:研究者想要了解的总体的某种特征值。
eg.总体平均数⽤µ表⽰,总体标准差⽤σ表⽰。
统计量:根据样本数据计算出来的⼀个量。
eg.样本标准差⽤s表⽰变量:说明现象某种特征的概念。
eg.商品销售额、受教育程度等第三章数据的图表展⽰1、分类数据和顺序数据的整理和图⽰⽅法各有哪些分类数据整理:频数、⽐例、百分⽐、⽐率图⽰:条形图、帕累托图、饼图、环形图顺序数据整理:累计频数、累计频率(累计百分⽐)图⽰:累计频数分布图和累计频率分布图分类数据的整理和图⽰⽅法同样适⽤于顺序数据2、茎叶图与直⽅图相⽐有什么优点?它们的应⽤场合是什么?茎叶图是由“茎”和“叶”两部分组成的、反映原始数据分布的图形,其图形是由数字组成的。
通过茎叶图,可以看数据的分布形状及数据的离散状况。
与直⽅图相⽐,茎叶图既能给出数据的分布状况,⼜能给出⼀个原始数值,即保留了原始数据的信息。
⽽直⽅图不能给出原始数值。
在应⽤⽅⾯,直⽅图⼀般适⽤于⼤批量数据,茎叶图通常适⽤于⼩批量数据。
第四章数据的概括性度量1、⼀组数据的分布特征可以从哪⼏个⽅⾯进⾏测度?⼀是分布的集中趋势,反映各数据向其中⼼值靠拢或聚集的程度;⼆是分布的离散程度,反映各数据远离其中⼼值的趋势;三是分布的形状,反映数据分布的偏态和峰态。
2、简述众数、中位数和平均数的特点和应⽤场合(1)众数特点:是⼀组数据分布的峰值,不受极端值影响。
统计学思考题课后答案
统计学第一章1.什么是统计学?怎样理解统计学与统计数据的关系?答:统计学是一门收集、整理、显示和分析统计数据的科学。
统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。
2.简要说明统计数据的来源答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。
间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。
3.简要说明抽样误差和非抽样误差答:统计调查误差可分为非抽样误差和抽样误差。
非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。
抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。
4.答:(1)有两个总体:A品牌所有产品、B品牌所有产品(2)变量:口味(如可用10分制表示)(3)匹配样本:从两品牌产品中各抽取1000瓶,由1000名消费者分别打分,形成匹配样本。
(4)从匹配样本的观察值中推断两品牌口味的相对好坏。
第二章、统计数据的描述思考题1描述次数分配表的编制过程答:分二个步骤:(1)按照统计研究的目的,将数据按分组标志进行分组。
按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。
按数量标志进行分组,可分为单项式分组与组距式分组单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。
统计分组应遵循“不重不漏”原则(2)将数据分配到各个组,统计各组的次数,编制次数分配表。
2.解释洛伦兹曲线及其用途答:洛伦兹曲线是20世纪初美国经济学家、统计学家洛伦兹根据意大利经济学家帕累托提出的收入分配公式绘制成的描述收入和财富分配性质的曲线。
洛伦兹曲线可以观察、分析国家和地区收入分配的平均程度。
3. 一组数据的分布特征可以从哪几个方面进行测度?答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。
统计学思考题
统计学思考题(1-6章)
1、简述数据的作用。
2、从随机试验角度说明什么是不确定性。
3、不确定性问题是如何描述的?
4、简述指标的含义和作用?
5、简述统计分组的作用?
6、如何理解总体?
7、如何理解样本?
8、如何理解样本统计量?
9、简述抽样调查的含义及常见的抽样方法。
10、抽样调查方法是如何降低误差的?
11、如何理解估计量的方差可以代表估计误差?
12、估计量误差一般受什么因素影响?
13、估计量的精度和准确度是如何度量的?
14、幂平均的基本形式是什么?在实际中经常使用的形式是什么?
15、简述权数的作用?
16、简述方差的作用?
17、简述变异系数的作用?
18、简述矩估计方法的估计原理?
19、简述极大似然估计方法的估计原理?
20、简述最小二乘法的估计原理?
21、区间估计的构造原理?
22、如何理解小概率原理?在假设检验中是如何利用该原理的?
23、假设检验的基本思想?
24、假设检验是解决什么问题的?
25、在假设检验中为什么会产生错误?并给出在什么情况下产生什么错误?
26、什么是P-值?在假设检验中是如何应用的?
27、给出正态分布、卡方分布、T分布、F分布的含义?临界值表达?并结合正态分布总体(一个或两个)、比例总体(一个或两个)的简单随机样本给出常见统计量的分布。
28、给出单因素方差分析方法的基本思想(包括解决的问题、解决方法等)。
29、给出分布拟合检验的基本思路?
30、给出独立性检验(列联表)的基本思路?。
统计学习题库试题库
第一章思考与练习一、思考题1.简述统计学的产生与发展历程。
2.统计学认识的分歧主要有哪些?3.统计学是怎样一门科学?4.统计研究工作可以分为哪几个阶段?其相互间有什么关系?5.什么是统计总体?什么是总体单位?举例说明总体和总体单位间的关系。
6.什么是标志和指标?它们各有哪些种类?标志和指标之间有什么区别和联系?请举例说明。
二、单项选择题1.社会经济统计学的研究对象是()。
A、社会经济现象的数量方面B、统计工作C、社会经济的内在规律D、统计方法2. 统计一般是指()。
A、统计理论与统计实践B、统计设计、统计调查与统计整理C、统计工作、统计资料与统计科学D、统计分析报告与统计预测模型3. 下列属于品质标志的是()A、年龄B、性别C、体重D、工资4. 研究某市工业企业的生产设备使用情况,则统计总体单位是()。
A、该市全部工业企业B、该市每一个工业企业C、该市工业企业的每一台生产设备D、该市工业企业的全部生产设备5.最早使用统计学这一学术用语的是()。
A、政治算术学派B、国势学派C、社会统计学派D、数理统计学派6.要考察全国工业企业的情况时,以下标志属于不变标志的有()。
A、产业分类B、职工人数C、劳动生产率D、所有制第二章思考与练习一、思考题1.一个完整的统计调查方案内容主要包括哪几个方面?2.什么是重点调查?什么是典型调查?各有什么特点?3.统计报表制度和普查有何区别?4.什么是调查对象、调查单位和报告单位?报告单位和调查单位有什么不同?5.统计工作中为什么要强调多种调查方法结合运用?二、单项选择题1.对百货公司工作人员进行普查,调查单位是()A.所有百货公司B.每个百货公司C.所有工作人员D.每位工作人员2.某城市工商银行拟对占全市储蓄额3/5 的几个大储蓄所进行调查,以了解全市储蓄的一般情况,则这种调查方式是()A.普查B.重点调查C.典型调查D.抽样调查3.目前,我国对城乡居民家庭收支情况的调查是采用()A.普查B.重点调查C.典型调查D.抽样调查4.为了解工业企业的期末在制品数量,调查人员当场进行观察与计数,这种搜集资料的方法是()A.直接观察法B.开调查会法C.个别采访法D.报告法5.对有限总体()A.只能进行全面调查B.只能进行非全面调查C.既能进行全面调查,也能进行非全面调查D.以上答案都不对6.统计调查项目大多数放在()A.调查表的表头中B.调查表的表体中C.调查表的表脚中D.调查对象之中7.调查某市工业企业职工的工种、工龄、文化程度等情况,则()A.调查单位与填报单位是每个工业企业B.调查单位与填报单位是每个职工C.调查单位是每个企业,填报单位是每个职工D.调查单位是每个职工,填报单位是每个企业8.统计调查对象是()A.总体各单位标志值B.现象总体C.总体单位D.统计指标9.我国现行统计调查方法体系中,作为“主体”的是()A.经常性抽样调查B.必要的统计报表C.重点调查及估计推算等D.周期性普查第三章思考与练习一、思考题1.数据预处理包括哪些内容?2.何谓统计整理?统计整理的基本步骤有哪些?3.何谓统计分组?简述统计分组的作用。
(完整版)统计学思考题
1.1请举出统计应用的几个例子:1。
用统计识别作者:对于存在争议的论文,通过统计量推出作者 2.用统计量得到一个重要发现:在不同海域鳗鱼脊椎骨数量变化不大,推断所有各个不同海域内的鳗鱼是由海洋中某公共场所繁殖的3。
挑战者航天飞机失事预测1。
2请举出应用统计的几个领域:1.在企业发展战略中的应用2。
在产品质量管理中的应用3。
在市场研究中的应用 4.在财务分析中的应用 5.在经济预测中的应用1.3你怎么理解统计的研究内容:1。
统计学研究的基本内容包括统计对象、统计方法和统计规律. 2 .统计对象就是统计研究的课题,称谓统计总体。
3。
统计研究方法主要有大量观察法、数量分析法、抽样推断法、实验法等。
4.统计规律就是通过大量观察和综合分析所揭示的用数量指标反映的客观现象的本质特征和发展规律。
1.4举例说明分类变量、顺序变量和数值变量:1.分类变量:表现为不同类别的变量称为分类变量,如“性别”表现为“男”或“女”,“企业所属的行业”表现为“制造业”、“零售业"、“旅游业"等,“学生所在的学院”可能是“商学院"、“法学院"等2。
顺序变量:如果类别有一定的顺序,这样的分类变量称为顺序变量,如考试成绩按等级分为优、良、中、及格、不及格,一个人对事物的态度分为赞成、中立、反对。
这里的“考试成绩等级”、“态度"等就是顺序变量。
3。
数值变量:可以用数字记录其观察结果,这样的变量称为数值变量,如“企业销售额"、“生活费支出”、“掷一枚骰子出现的点数”。
1。
5获得数据的概率抽样方法有哪些?(1)简单随机抽样,简单随机抽样又称纯随机抽样,是指在特定总体的所有单位中直接抽取n个组成样本。
它最直观地体现了抽样的基本原理,是最基本的概率抽样。
(2)系统抽样,系统抽样也称等距抽样或机械抽样,是按一定的间隔距离抽取样本的方法.(3)分层抽样,分层抽样也叫分类抽样,就是先将总体的所有单位依照一种或几种特征分为若干个子总体,每一个子总体即为一类,然后从每一类中按简单随机抽样或系统随机抽样的办法抽取一个子样本,称为分类样本,它们的集合即为总体样本。
统计学第一章思考题及习题
统计学第一章思考题及习题第一章思考题及习题:?单选题:?1.在统计学的形成和发展过程中,首先将古典概率论引入社会经济现象研究的学者是( A)。
?A.阿道夫・凯特勒B.威廉・配第C.约翰・格朗特D.赫尔曼・康令B.构成总体的单位,必须是不同的?2. 在确定统计总体时必须注意()A。
?A. 构成总体的单位,必须是同质的?C.构成总体的单位,不能有差异D.构成总体的单位,必须是不相干的单位?3.一个统计总体(D)。
?A.只能有一个标志 B.只能有一个指标 C.可以有多个标志D.可以有多个指标?4.在某地区2021年GDP和人均GDP资料中,属于下面哪一种类统计指标(B)。
?A.客观指标和主观指标 B.数量指标和质量指标?C.时期指标和时点指标 D.实体指标和行为指标?5.对某市高等学校科研所进行调查,统计总体是(D)。
?A.某市所有的高等学校B.某一高等学校科研所?C.某一高等学校D. 某市所有高等学校科研所?6.要了解某市国有工业企业设备情况,则统计总体是(?)。
?A.该市全部国有工业企业B.该市每一个国有工业企业?C.该市国有工业企业的全部设备D.该市国有工业企业的每一台设备?7.有200个公司全部职工每个人的工资资料,如要调查这200个公司职工的工资水平情况,则统计总体为(A)。
?A.200个公司的全部职工工资 B.200个公司 C.200个公司职工的全部工资 D.200个公司每个职工的工资?8.下列标志中属品质标志的是(A)?A.性别B.年龄C.商品价格D.工业企业的总产值?9.某企业职工人数为1200人,这里的“职工人数1200人”是(C)。
?A.标志B.变量C.指标D.标志值?10.某班四名学生统计学考试成绩分别为70分、80分、86分和95分,这四个数字是(B)。
?A.标志B.标志值C.指标D.变量?11.工业企业的职工人数、职工工资是(D)。
?D.前者是离散型变量,后者是连续型变量?A.连续型变量B.离散型变量C.前者是连续型变量,后者是离散型变量?多选题:?1.对某市工业生产进行调查,得到以下资料,其中的统计指标是(BCE)。
统计课后思考题答案
统计课后思考题答案统计课后思考题答案第一章思考题1.1什么是统计学统计学是关于数据的一门学科它收集处理分析解释来自各个领域的数据并从中得出结论。
1.3解释描述统计和推断统计描述统计它研究的是数据收集处理汇总图表描述概括与分析等统计方法。
推断统计它是研究如何利用样本数据来推断总体特征的统计方法。
1.5解释分类数据顺序数据和数值型数据统计数据按所采用的计量尺度不同分定性数据分类数据只能归于某一类别的非数字型数据它是对事物进行分类的结果数据表现为类别用文字来表述定性数据顺序数据只能归于某一有序类别的非数字型数据。
它也是有类别的但这些类别是有序的。
定量数据数值型数据按数字尺度测量的观察值其结果表现为具体的数值。
统计数据按统计数据都收集方法分观测数据是通过调查或观测而收集到的数据这类数据是在没有对事物人为控制的条件下得到的。
实验数据在实验中控制实验对象而收集到的数据。
统计数据按被描述的现象与实践的关系分截面数据在相同或相似的时间点收集到的数据也叫静态数据。
时间序列数据按时间顺序收集到的用于描述现象随时间变化的情况也叫动态数据。
1.6举例说明总体样本参数统计量变量这几个概念对一千灯泡进行寿命测试那么这千个灯泡就是总体从中抽取一百个进行检测这一百个灯泡的集合就是样本这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量变量就是说明现象某种特征的概念比如说灯泡的寿命。
1.7变量的分类变量可以分为分类变量顺序变量数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
1.8举例说明离散型变量和连续性变量离散型变量只能取有限个值取值以整数位断开比如“企业数”连续型变量取之连续不断不能一一列举比如“温度”。
1.8统计应用实例人口普查商场的名意调查等。
1.9统计应用的领域经济分析和政府分析还有物理生物等等各个领域。
第二章思考题2.4自填式面访式和电话式各自的长处和弱点自填式优点 1调查组织者管理容易2成本低可进行大规模调查3对被调查者可选择方便时间答卷减少回答敏感问题压力。
(完整版)统计学思考题
1.1请举出统计应用的几个例子:1.用统计识别作者:对于存在争议的论文,通过统计量推出作者2.用统计量得到一个重要发现:在不同海域鳗鱼脊椎骨数量变化不大,推断所有各个不同海域内的鳗鱼是由海洋中某公共场所繁殖的3.挑战者航天飞机失事预测1.2请举出应用统计的几个领域:1.在企业发展战略中的应用2.在产品质量管理中的应用3.在市场研究中的应用4.在财务分析中的应用5.在经济预测中的应用1.3你怎么理解统计的研究内容:1.统计学研究的基本内容包括统计对象、统计方法和统计规律。
2 .统计对象就是统计研究的课题,称谓统计总体。
3.统计研究方法主要有大量观察法、数量分析法、抽样推断法、实验法等。
4.统计规律就是通过大量观察和综合分析所揭示的用数量指标反映的客观现象的本质特征和发展规律。
1.4举例说明分类变量、顺序变量和数值变量:1.分类变量:表现为不同类别的变量称为分类变量,如“性别”表现为“男”或“女”,“企业所属的行业”表现为“制造业”、“零售业”、“旅游业”等,“学生所在的学院”可能是“商学院”、“法学院”等2.顺序变量:如果类别有一定的顺序,这样的分类变量称为顺序变量,如考试成绩按等级分为优、良、中、及格、不及格,一个人对事物的态度分为赞成、中立、反对。
这里的“考试成绩等级”、“态度”等就是顺序变量。
3.数值变量:可以用数字记录其观察结果,这样的变量称为数值变量,如“企业销售额”、“生活费支出”、“掷一枚骰子出现的点数”。
1.5获得数据的概率抽样方法有哪些?(1)简单随机抽样 ,简单随机抽样又称纯随机抽样,是指在特定总体的所有单位中直接抽取n个组成样本。
它最直观地体现了抽样的基本原理,是最基本的概率抽样。
(2)系统抽样 ,系统抽样也称等距抽样或机械抽样,是按一定的间隔距离抽取样本的方法。
(3)分层抽样 ,分层抽样也叫分类抽样,就是先将总体的所有单位依照一种或几种特征分为若干个子总体,每一个子总体即为一类,然后从每一类中按简单随机抽样或系统随机抽样的办法抽取一个子样本,称为分类样本,它们的集合即为总体样本。
统计学思考题[教育]
思考题(仅供参考)部分题目超出范围。
同学们仅作上课讲授过的题目即可二、判断题 1、对于定性变量不能确定平均数.( )2、根据组距式数列计算的平均数、标准差等都是近似值.( )3、任何平均数都受变量数列中的极端值的影响.( )4、中位数把变量数列分成了两半,一半数值比它大,一半数值比它小.( )5、任何变量数列都存在众数.( )6、如果x <Me<M0,则变量分布存在右偏.( )7、若比较两个变量分布平均数代表性的高低,则方差或标准差大的平均数的代表性差.( )8、只要变量分布具有相同的标准差就会有相同的分布形状.( ) 9、在统计学实际应用中,调和平均数与算术平均数的计算形式虽然不同,但计算结果及其意义是一样的.( )10.各标志值平方和的算术平均数公式为 ( )11.各个变量值对其算术平均数的离差绝对值之和等于零。
( )12.计算加权算术平均数时,其权数必须是各组的次数或比率。
( )13.计算数值平均数时,要求资料中的各项数值必须大于零。
( )14.根据分组资料计算的算术平均数,只是一个近似值。
( ) 15.权数的绝对数越大,对算术平均数的影响也就越大。
( ) 16.组距数列条件下,众数的大小主要取决于众数组相邻两小次数多少的影响。
( )17.两个企业比较,若B A B A x x σσ>>,”,由此可以肯定B 企业生产的均衡性比A 企业好。
( )18.对于分组资料,若不同时期相比,各组平均数均程度不同地上升,则总平均数一定上升。
( )19.n 个同性质独立变量和的方差等于各个变量方差之和。
( )20.n 个同性质独立变量平均数的方差等于各变量方差的平均数。
( ) 21.变量的方差等于变量平均数的平方减变量平方的平均数。
( )22、峰态一词是由统计学家Galton 于1905年首次提出的。
它是对数据分布平峰或尖峰程度的测度。
( )三、选择题1、某工厂新工人月工资400元,工资总额为200000元,老工人月工资800元,工资总额80000元,则总平均工资为( ) A 、 600元 B 、 533.33元 C 、466.67元 D 、 500元2、标志变异指标是反映同质总体的( ). A 、集中程度 B 、离中程度 C 、一般水平 D 、变动程度3、权数对算术平均数的影响作用,实质上取决于( )A 、作为权数的各组单位数占总体单位数比重的大小B 、各组标志值占总体标志总量比重的大小C 、标志值本身的大小D 、标志值数量的多少4、对于不同水平的总体不能直接用标准差比较其标志变动度,这时需分别计算各自的( )来比较A.标准差系数B.平均差C.全距D.均方差 5、统计学中最重要的离散指标是( ).A 、平均差B 、全距C 、标准差D 、变异系数6、离散指标中受极端值影响最大的是( )A 、平均差B 、全距C 、标准差D 、方差7、假如学生的考试成绩用优秀、良好、中等、及格和不及格来表示,则全班考试成绩的水平高低应该用什么平均数来说明?( )A 、算术平均数B 、众数C 、众数或中位数D 、中位数8、若两个变量数列的标准差相等且计量单位相同,但平均数不相等,则( )A 、平均数大者代表性强B 、平均数小者代表性强C 、两个平均数的代表性一样D 、无法判断哪个平均数的代表性强9、某企业有A 、B 两个车间,去年A 车间人均产量3.6万件,B 车间人均产量3.5万件.今年A 车间人数增加6%,B 车间增加8%.如果两个车间的人均产量都保持不变,则该企业今年总的人均产量与去年相比( )A 、上升B 、下降C 、不变D 、不能确定如何变化 10、已知某变量分布属于钟形分布且M0=900,Me=930,则( )A 、x <900B 、900<x < 930C 、x >930D 、x =91511.受极大值影响较大的平均数是( )。
统计学思考题
统计学思考题第一章导论1、统计数据可分为哪几种类型?不同类型的数据各有什么特点?按照所采用的计量尺度的不同,可以将统计数据分为分类数据、顺序数据和数值型数据。
按照统计数据的收集方法,可以将其分为观测数据和实验数据。
按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。
分类数据是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。
顺序数据是只能归于某一有序类别的非数字型数据。
顺序数据虽然也是类别,但这些类别是有序的,是用文字来表述的。
数值型数据是按数字尺度测量的观察值,其结果表现为具体的数值。
现实中处理的大多数都是数值型数据。
2、解释分类数据、顺序数据和数值数据的意义。
对分类数据,我们通常计算出各组的频数或频率,计算其众数和异众比率,进行列联表分析和x2检验等;对顺序数据,可以计算其中位数和四分位差,计算等级相关系数等;对数值型数据,可以用更多的统计方法进行分析,如计算各种统计量,进行参数估计和检验等3、举例说明总体、样本、参数、统计量、变量这几个概念。
总体:是包含所研究的全部个体的集合,它通常由所研究的一些个体组成。
如多个企业构成的集合,多个居民户构成的集合,多个人构成的集合样本:是从总体中抽出的一部分元素的集合。
如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。
参数:是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。
在统计中,总体参数通常用希腊字母表示,如,总体平均数用u(miu)表示,总体标准差用(sigma)表示,总体比例用(pai)表示,等。
统计量:是用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数。
样本统计量通常用英文字母来表示。
如,样本平均数用(x-bar)表示,样本标准车用s表示,样本比例用p表示,等。
变量:是说明现象某种特征的概念。
统计学第四版(贾俊平)课后思考题答案
统计课后思考题答案第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。
统计学(贾俊平第八版)课后思考题及答案
统计学(贾俊平第八版)课后思考题及答案第一章:统计学基本概念和方法思考题1:什么是统计学?统计学的研究对象是什么?统计学是从观察数据的现象和规律出发,运用数理统计方法进行概括、分析和推断的科学。
统计学研究的对象是数据的概括和整体行为特征,即基本统计量和统计分布。
答案:统计学是一门应用数学的学科,其研究范围包括数据的收集、整理、描述、分析和推断等方面。
统计学通过运用数理统计方法,帮助我们从观察到的数据中发现其中的规律和趋势,从而对现象和问题作出合理的判断和推断。
统计学的研究对象主要包括两个方面。
一方面,统计学关注数据的概括和整体行为特征,例如对数据集的中心趋势(平均数、中位数)和离散程度(标准差、方差)进行描述和分析,这些统计量可以帮助我们对数据进行概括和比较。
另一方面,统计学研究数据的统计分布,即数据的分布形状和特征,例如正态分布、偏态分布等,这些分布有助于我们根据数据的特点进行进一步的推断和推测。
第二章:统计学的数据描述思考题2:试举例说明数据分为哪些类型?数据分为定性数据和定量数据两种类型。
答案:数据可以分为定性数据和定量数据两种类型。
定性数据是指不能用数字表示的数据,其特征主要是描述性的,例如性别、喜好等。
定性数据通常采用文字或符号进行记录和表达。
定量数据是指可以用数字表示的数据,其特征主要是数量性的,例如身高、体重等。
定量数据可以进行数学运算和统计分析。
举例来说,一个学生调查问卷中的“性别”以及“对某个电影的评价(好、中、差)”是属于定性数据;而问卷中的“年龄”和“观看该电影的次数”则是属于定量数据。
第三章:概率与概率分布思考题3:什么是概率?请以一个例子来解释。
概率是指某个事件发生的可能性。
它在统计学中用于描述随机现象的规律性和不确定性。
答案:概率是描述某个事件发生的可能性的数值。
概率可以从0到1之间的任何一个数值,其中0表示不可能发生,1表示肯定会发生。
举个例子来说明,假设有一个标准的骰子,每个面上有1到6的数字。
统计学思考题
思考题(仅供参考)部分题目超出范围。
同学们仅作上课讲授过的题目即可二、判断题1、对于定性变量不能确定平均数.( )2、根据组距式数列计算的平均数、标准差等都是近似值.( )3、任何平均数都受变量数列中的极端值的影响.( )4、中位数把变量数列分成了两半,一半数值比它大,一半数值比它小.( )5、任何变量数列都存在众数.( )6、如果x <Me<M0,则变量分布存在右偏.( )7、若比较两个变量分布平均数代表性的高低,则方差或标准差大的平均数的代表性差.( )8、只要变量分布具有相同的标准差就会有相同的分布形状.( )9、在统计学实际应用中,调和平均数与算术平均数的计算形式虽然不同,但计算结果及其意义是一样的.( )10.各标志值平方和的算术平均数公式为 ( )11.各个变量值对其算术平均数的离差绝对值之和等于零。
( )12.计算加权算术平均数时,其权数必须是各组的次数或比率。
( )13.计算数值平均数时,要求资料中的各项数值必须大于零。
( )14.根据分组资料计算的算术平均数,只是一个近似值。
( )15.权数的绝对数越大,对算术平均数的影响也就越大。
( )16.组距数列条件下,众数的大小主要取决于众数组相邻两小次数多少的影响。
( )17.两个企业比较,若B A B A x x σσ>>,”,由此可以肯定B 企业生产的均衡性比A 企业好。
( )18.对于分组资料,若不同时期相比,各组平均数均程度不同地上升,则总平均数一定上升。
( )19.n 个同性质独立变量和的方差等于各个变量方差之和。
( )20.n 个同性质独立变量平均数的方差等于各变量方差的平均数。
( )21.变量的方差等于变量平均数的平方减变量平方的平均数。
( )22、峰态一词是由统计学家Galton 于1905年首次提出的。
它是对数据分布平峰或尖峰程度的测度。
( )三、选择题1、某工厂新工人月工资400元,工资总额为200000元,老工人月工资800元,工资总额80000元,则总平均工资为( )A 、 600元B 、 533.33元C 、466.67元D 、 500元2、标志变异指标是反映同质总体的( ).A 、集中程度B 、离中程度C 、一般水平D 、变动程度3、权数对算术平均数的影响作用,实质上取决于( )A 、作为权数的各组单位数占总体单位数比重的大小B 、各组标志值占总体标志总量比重的大小C 、标志值本身的大小D 、标志值数量的多少4、对于不同水平的总体不能直接用标准差比较其标志变动度,这时需分别计算各自的( )来比较A.标准差系数B.平均差C.全距D.均方差5、统计学中最重要的离散指标是( ).A 、平均差B 、全距C 、标准差D 、变异系数6、离散指标中受极端值影响最大的是( )A 、平均差B 、全距C 、标准差D 、方差7、假如学生的考试成绩用优秀、良好、中等、及格和不及格来表示,则全班考试成绩的水平高低应该用什么平均数来说明?( )A 、算术平均数B 、众数C 、众数或中位数D 、中位数8、若两个变量数列的标准差相等且计量单位相同,但平均数不相等,则( )A 、平均数大者代表性强B 、平均数小者代表性强C 、两个平均数的代表性一样D 、无法判断哪个平均数的代表性强9、某企业有A 、B 两个车间,去年A 车间人均产量3.6万件,B 车间人均产量3.5万件.今年A 车间人数增加6%,B 车间增加8%.如果两个车间的人均产量都保持不变,则该企业今年总的人均产量与去年相比( )A 、上升B 、下降C 、不变D 、不能确定如何变化10、已知某变量分布属于钟形分布且M0=900,Me=930,则( )A 、x <900B 、900<x < 930C 、x >930D 、x =91511.受极大值影响较大的平均数是( )。
统计学复习思考题与练习题参考答案doc
第一章复习思考题与练习题:一、思考题1.统计的基本任务是什么?2.统计研究的基本方法有哪些?3.如何理解统计总体的基本特征。
4.试述统计总体和总体单位的关系。
5.标志与指标有何区别何联系。
二、判断题1、社会经济统计的研究对象是社会经济现象总体的各个方面。
()2、在全国工业普查中,全国企业数是统计总体,每个工业企业是总体单位。
()3、总体单位是标志的承担者,标志是依附于单位的。
()4、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。
()5、全面调查和非全面调查是根据调查结果所得的资料是否全面来划分的()。
三、单项选择题1、社会经济统计的研究对象是()。
A、抽象的数量关系B、社会经济现象的规律性C、社会经济现象的数量特征和数量关系D、社会经济统计认识过程的规律和方法2、某城市工业企业未安装设备普查,总体单位是()。
A、工业企业全部未安装设备B、工业企业每一台未安装设备C、每个工业企业的未安装设备D、每一个工业3、标志是说明总体单位特征的名称,标志有数量标志和品质标志,因此()。
A、标志值有两大类:品质标志值和数量标志值B、品质标志才有标志值C、数量标志才有标志值D、品质标志和数量标志都具有标志值4、统计规律性主要是通过运用下述方法经整理、分析后得出的结论()。
A、统计分组法B、大量观察法C、综合指标法D、统计推断法5、指标是说明总体特征的,标志是说明总体单位特征的,所以()。
A、标志和指标之间的关系是固定不变的B、标志和指标之间的关系是可以变化的C、标志和指标都是可以用数值表示的D、只有指标才可以用数值表示答案:二、 1.× 2.× 3.√ 4.× 5.×三、 1.C 2.B 3.C 4.B 5.B第三章一、复习思考题1.什么是平均指标?平均指标可以分为哪些种类?2.为什么说平均数反映了总体分布的集中趋势?3.为什么说简单算术平均数是加权算术平均数的特例?4.算术平均数的数学性质有哪些?5.众数和中位数分别有哪些特点?6.什么是标志变动度?标志变动度的作用是什么?7.标志变动度可分为哪些指标?它们分别是如何运用的?8.平均数与标志变动度为什么要结合运用?二、练习题1.某村对该村居民月家庭收入进行调查,获取的资料如下:3.某蔬菜市场某种蔬菜上午1元可买1.5公斤,中午1元可买2公斤,下午1元可买2.5公斤。
统计学习题
第一章总论一、思考题1、一个完整的统计工作过程包括哪些内容?2、简述统计指标和标志的关系?3、如何理解统计指标体系比统计指标的应用更为广泛和重要?二、单项选择题1、“统计”一词的基本涵义是()。
A.统计方法,统计分析,统计预测B.统计学,统计工作,统计资料C.统计调查,统计整理,统计分析D.统计分组,统计指标,统计计算2、统计学的基本方法包括有()。
A.调查方法,汇总方法,预测方法B.相对数法,平均数法,指数法C.大量观察法,综合分析法,归纳推断法D.整理方法,调查方法,分析方法3.要了解50个学生的学习成绩,则总体单位是()。
A.50个学生B.50个学生的学习成绩C.每个学生D.每个学生的学习成绩4、变量是指()。
A.可变的数量标志B.数量标志C.可变的品质标志D.数量标志的标志值5、有四名工人的月工资额分别为825、840、865、900元。
这四个数字是()。
A.数量指标B.变量C.变量值D.品质标志三、多项选择题1、统计的职能有()。
A.信息职能B.咨询职能C.监督职能D.决策职能E.协调职能2、统计总体的基本特征表现为()。
A.大量性B.数量性C.同质性D.差异性E.客观性3、离散变量的数值()。
A.是连续不断的B.是以整数断开的C.相邻两值之间不可能有小数D.要用测量或计量的方法取得数据E.只能用计数的方法取得数据4、总体和总体单位不是固定不变的,它们随着研究目的的不同()。
A.总体可以转化为总体单位B.总体单位可以转化为总体C.只能是总体转化为总体单位D.只能是总体单位转化为总体E.总体和总体单位可以相互转化5、品质标志表示质的特征,数量标志表示事物量的特征,所以()。
A.数量标志是可以用数值表示B.品质标志可以用数值表示C.数量标志不可以用数值表示D.品质标志不可以用数值表示E.两者都可以用数值表示第二章统计调查与统计数据的整理一、思考题1、一个完整的统计调查调查方案应包括哪些主要内容?2、简述三种非全面调查的主要区别。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
精品文档.第一章 导论1、统计数据可分为哪几种类型?不同类型的数据各有什么特点?按照所采用的计量尺度的不同,可以将统计数据分为分类数据、顺序数据和数值型数据。
按照统计数据的收集方法,可以将其分为观测数据和实验数据。
按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。
分类数据是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。
顺序数据是只能归于某一有序类别的非数字型数据。
顺序数据虽然也是类别,但这些类别是有序的,是用文字来表述的。
数值型数据是按数字尺度测量的观察值,其结果表现为具体的数值。
现实中处理的大多数都是数值型数据。
2、解释分类数据、顺序数据和数值数据的意义。
对分类数据,我们通常计算出各组的频数或频率,计算其众数和异众比率,进行列联表分析和x 2检验等;对顺序数据,可以计算其中位数和四分位差,计算等级相关系数等;对数值型数据,可以用更多的统计方法进行分析,如计算各种统计量,进行参数估计和检验等 3、举例说明总体、样本、参数、统计量、变量这几个概念。
总体:是包含所研究的全部个体的集合,它通常由所研究的一些个体组成。
如多个企业构成的集合,多个居民户构成的集合,多个人构成的集合样本:是从总体中抽出的一部分元素的集合。
如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。
参数:是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。
在统计中,总体参数通常用希腊字母表示,如,总体平均数用u (miu )表示,总体标准差用(sigma )表示,总体比例用(pai )表示,等。
统计量:是用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数。
样本统计量通常用英文字母来表示。
如,样本平均数用(x-bar )表示,样本标准车用s 表示,样本比例用p 表示,等。
变量:是说明现象某种特征的概念。
如,商品销售额,受教育程度,产品的质量等级等。
4、变量可分为哪几类?变量可以分为分类变量、顺序变量、数值型变量,数值型变量根据其取值的不同,又可分为离散型变量和连续型变量。
分类变量是说明事物类别的一个名称,顺序变量是说明事物有序类别的一个名称,数值型变量是说明事物数字特征的一个名称。
5、举例说明离散型变量和连续性变量。
离散型变量是只能取可数值的变量,只能取有限个值,而且其取值都以整位数断开,可以一一列举,如,企业量,产品数量;连续型变量是可以在一个或多个区间中取任何值的变量。
它的取值是连续不断的,不能一一列举,如,年龄,温度,零件尺寸的误差等。
第二章 数据的搜集1、比较概率抽样和非概率抽样的特点。
举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。
概率抽样也称随机抽样,是指遵守随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。
它具有以下几个特点:首先,抽样时是按一定的概率以随机抽样原则抽取样本;其次,每个单位被抽中的概率是已知的,或是可以计算出来的;最后,当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率。
非概率抽样是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。
如果调查的目的在于掌握研究对象总体的数量特征,根据调查的结果对总体参数进行评估,得到总体参数的置信区间,就应当采用概率抽样的方法。
非概率抽样适合探索性的研究,调查的结果用于发现问题,为更深入的数量分析做好准备。
非抽样调查也适合市场调查中概念测试,如产品包装测试、广告测试等。
第三章 数据的图表表示1、分类数据和顺序数据的整理和图示方法各有那些?分类数据的整理方法有频数和频数分布,图示方法有条形图、帕累托图、饼图、环形图;顺序数据的整理方法有累积频数和累积频率,图示方法有累积频数分布和频率图。
2、数值型数据的分组方法有哪些?简述组距分组的步骤。
数据分组的方法有单变量值分组和组距分组。
组距分组的步骤:(1)确定组数,一般数据所分组数不应少于5组且不多于15组;(2)确定各组的组距,组距=(最大值-最小值)/组数,组距宜取5或10的倍数;(3)确定上下限,第一组的下限应低于最小变量值,最后一组的上限应高于最大变量值。
3、直方图与条形图有何区别?直方图与条形图不同。
首先,条形图是用条形的长度表示各类别频数的多少,其宽度则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。
其次,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。
最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。
第四章 数据的概括性变量1、一组数据的分布特征可以从那几个方面进行测度?一组数据的分布特征可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。
2、对于比率数据的平均为什么采用几何平均?3、简述众数、中位数、和平均数的特点和应用场合。
众数是一组数据分布的峰值,不受极端值的影响。
其缺点是具有不唯一性,一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。
众数只有在数据量较多时才有意义,当数据量较少时,不宜采用众数。
众数主要适合作为分类数据的集中趋势测度值。
中位数是一组数据中间位置上的代表值,不受数据极端值的影响。
当一组数据的分布偏斜程度较大时,使用中位数也许是一个好的选择。
中位数主要适合作为顺序数据的集中趋势测度值。
平均数是针对数值型数据计算的,而且利用了全部数据信息,它是实际中应用最广泛的集中趋势测度值。
当数据呈对称分布或接近对称分布时,3个代表值相等或接近相等时,这时则应选择平均数作为集中趋势的测度值。
但平均数的主要缺点是易受数据极端值的影响,对于偏态分布的数据,平均数的代表性较差。
因此,当数据为偏态分布,特别是偏斜程度较大时,可以考虑选择中位数或众数,这时它们的代表性要比平均数好。
4、为什么要计算离散系数?方差和标准差是反映数据离散程度的绝对值,其数值的大小一方面受原变量值自身水平高低的影响,也就是与变量的平均数大小有关,变量值绝对水平高的,离散程度的测度值自然也就大,绝对水平低的离散程度的测度值自然也就小;另一方面,它们与原变量值的计量单位相同,采用不同计量单位计量的变量值,其离散程度的测度值也就不同。
因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能用标准差直接比较其离散程度的,为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。
离散系数也成为变异系数,它是一组数据的标准差与其相应的平均数之比,其计算公式为:v s =s/(x-bar),离散系数是测度数据离散程度的相对统计量,主要是用于比较不同样本数据的离散程度。
离散系数大,说明数据的离散程度也大;离散系数小,说明数据的离散程度也小。
第五章 参数估计1、怎样理解置信区间?在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间,其中区间的最小值称为置信下限,最大值称为置信上限,由于统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间。
2、解释95%的置信区间如果抽取了许多不同的样本,比如说抽取了100个样本,根据每一个样本构造一个置信区间,这样,由100个样本构造的总体参数的100个置信区间中,有95%的区间包含了总体参数的真值,而5%则没包含,则95%这个值称为置信水平。
一般地,如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例成为置信水平,也称为置信度或置信系数。
第六章 假设检验1、什么是假设检验中的显著性水平?统计显著是什么意思?通常把(a-er-fa )称为显著性水平,显著性水平是一个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险,其实这就是前面所说假设检验中犯弃真错误的概率,它是由人们根据检验的要求确定的,通常取0.05或0.01.2、什么是假设检验中的两类错误?对于原假设提出的命题,我们需要做出判断,这种判断可以用“原假设正确”或“原假设错误”来表述。
当然,这是依据样本提供的信息进行判断的,也就是由部分来推断,总体。
因而判断有可能正确,也有可能错误,也就是说,我们面临着犯错误的可能。
所犯的错误有两种类型,第一类错误是原假设H 0为真却被我们拒绝了,犯这种错误的概率用(a-er-fa )表示所以成为其真错误;第二类错误是原假设为伪我们却没有拒绝,犯这类错误的概率用(bei-ta )表示,所以成为取伪错误。
3、解释假设检验中的P 值。
P 值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。
如果P 值很小,说明这种情况发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设,P 值越小,我们拒绝原假设的理由就越充分。
第七章 方差分析1、什么是方差分析?它研究的是什么?方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型隐变量是否有显著影响。
方差分析是检验多个总体均值是否相等的统计方法,但本质上它所研究的是分类型自变量对数值型因变量的影响。
2、简述方差分析的基本思想。
为了研究分类型自变量对对数值型因变量的影响,需要从对数据误差来源的分析入手,误差主要分为组内误差和组间误差,组内误差只包含随机误差,而组间误差除了包含随机误差,还会包含系统误差。
3、解释组内误差和组间误差的含义。
组内误差(SSE ):反映组内误差大小的平方和,也称为残差平方和,是由于抽样的随机性所造成的随机误差。
它反映了每个样本内各观测值之间的离散状况。
组间误差(SSA ):反映组间误差大小的平方和,也称为因素平方和,是随机误差和系统误差的总和。
它反映了样本均值之间的差异程度。
4、解释则内方差和组间方差的含义。
组间误差和组内误差经过平均后的数值称为均方或方差。
组间方差(MSA )=组间平方和/自由度(SSA/k-1) 组内误差(MSE )=组内平方和/自由度(SSE/n-k ) 5、简述方差分析的基本步骤。
1、提出假设;2、构造检验的统计量;(1)计算各样本的均值(2)计算全部观测值的总均值(3)计算各误差平方和(4)计算统计量3、统计决策;4、方差分析表;5、用Excel 进行方差分析。
第八章 一元线性回归1、解释相关关系的含义,说明相关系的特点。
相关关系1)变量间关系不能用函数关系精确表达;2)一个变量的取值不能由另一个变量唯一确定;3)当变量 x 取某个值时,变量 y 的取值可能有几个。