统计学思考题
统计学思考题答案

统计学思考题一、名词解释1.参数:描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值。
所关心的参数主要有总体均值、标准差、总体比例等。
总体参数通常用希腊字母表示2.残差:因变量的观测值与根据估计的回归方程求出的预测值之差,用e表示。
反映了用估计的回归方程去预测而引起的误差,可用于确定有关误差项ε的假定是否成立3.标准分数:变量值与其平均数离差除以标准差后的值就是标准分数也称标准化值或z分数。
P874.次序统计量:一组样本观测值X1,X2,…,X n由小到大的排序X(1)≤X(2)≤…≤ X (i)≤…≤ X(n)后,称X(1),X(2),…,X(n)为次序统计量。
中位数、分位数、四分位数等都是次序统计量5.β错误:原假设为伪是没有拒绝,犯这种错误的概率用表示,所以也称β错误或取伪错误6.α错误:原假设为真时拒绝原假设,犯这种错误的概率用α表示,所以也被称为α错误或弃真错误。
7.多元回归方程:描述因变量y 的平均值或期望值如何依赖于自变量x1,x2,…,x k的方程。
多元线性回归方程的形式为E( y ) = β+ β1 x1+ β2 x2+…+ βk x k8.多元回归模型:描述因变量y 如何依赖于自变量x1, x2,…, x k和误差项ε的方程,称为多元回归模型。
其一般形式为:E( y ) = β+ β1 x1+ β2 x2+…+ βk x k + ε9.多重判定系数:是多元回归中的回归平方和占总平方和的比例,它是度量多元回归方程拟合程度的一个统计量,反映了在因变量y的变差中被估计的回归方程所解释的比例。
10.F分布:设随机变量Y与Z相互独立,且Y与Z分别服从于自由度为m和n的2χ分布,随机变量X有如下表达式:F=nY/mZ,则称X服从于第一自由度为m,第二自由度为n的F分布,记作X~F(m,n)11.方差分析:检验各个总体均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。
统计学课后思考题答案

统计学课后思考题答案统计学课后思考题答案统计学课后思考题答案~~ 来源: 张倩倩Orange的日志在百度文库上下载下来的,奉献给同胞们~统计课后思考题答案第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
统计学思考题最新版本

思考题(仅供参考)部分题目超出范围。
同学们仅作上课讲授过的题目即可二、判断题1、对于定性变量不能确定平均数.( )2、根据组距式数列计算的平均数、标准差等都是近似值.( )3、任何平均数都受变量数列中的极端值的影响.( )4、中位数把变量数列分成了两半,一半数值比它大,一半数值比它小.( )5、任何变量数列都存在众数.( )6、如果x <Me<M0,则变量分布存在右偏.( )7、若比较两个变量分布平均数代表性的高低,则方差或标准差大的平均数的代表性差.( )8、只要变量分布具有相同的标准差就会有相同的分布形状.( )9、在统计学实际应用中,调和平均数与算术平均数的计算形式虽然不同,但计算结果及其意义是一样的.( )10.各标志值平方和的算术平均数公式为 ( )11.各个变量值对其算术平均数的离差绝对值之和等于零。
( )12.计算加权算术平均数时,其权数必须是各组的次数或比率。
( )13.计算数值平均数时,要求资料中的各项数值必须大于零。
( )14.根据分组资料计算的算术平均数,只是一个近似值。
( )15.权数的绝对数越大,对算术平均数的影响也就越大。
( )16.组距数列条件下,众数的大小主要取决于众数组相邻两小次数多少的影响。
( )17.两个企业比较,若B A B A x x σσ>>,”,由此可以肯定B 企业生产的均衡性比A 企业好。
( )18.对于分组资料,若不同时期相比,各组平均数均程度不同地上升,则总平均数一定上升。
( )19.n 个同性质独立变量和的方差等于各个变量方差之和。
( )20.n 个同性质独立变量平均数的方差等于各变量方差的平均数。
( )21.变量的方差等于变量平均数的平方减变量平方的平均数。
( )22、峰态一词是由统计学家Galton 于1905年首次提出的。
它是对数据分布平峰或尖峰程度的测度。
( )三、选择题1、某工厂新工人月工资400元,工资总额为200000元,老工人月工资800元,工资总额80000元,则总平均工资为( )A 、 600元B 、 533.33元C 、466.67元D 、 500元2、标志变异指标是反映同质总体的( ).A 、集中程度B 、离中程度C 、一般水平D 、变动程度3、权数对算术平均数的影响作用,实质上取决于( )A 、作为权数的各组单位数占总体单位数比重的大小B 、各组标志值占总体标志总量比重的大小C 、标志值本身的大小D 、标志值数量的多少4、对于不同水平的总体不能直接用标准差比较其标志变动度,这时需分别计算各自的( )来比较A.标准差系数B.平均差C.全距D.均方差5、统计学中最重要的离散指标是( ).A 、平均差B 、全距C 、标准差D 、变异系数6、离散指标中受极端值影响最大的是( )A 、平均差B 、全距C 、标准差D 、方差7、假如学生的考试成绩用优秀、良好、中等、及格和不及格来表示,则全班考试成绩的水平高低应该用什么平均数来说明?( )A 、算术平均数B 、众数C 、众数或中位数D 、中位数8、若两个变量数列的标准差相等且计量单位相同,但平均数不相等,则( )A 、平均数大者代表性强B 、平均数小者代表性强C 、两个平均数的代表性一样D 、无法判断哪个平均数的代表性强9、某企业有A 、B 两个车间,去年A 车间人均产量3.6万件,B 车间人均产量3.5万件.今年A 车间人数增加6%,B 车间增加8%.如果两个车间的人均产量都保持不变,则该企业今年总的人均产量与去年相比( )A 、上升B 、下降C 、不变D 、不能确定如何变化10、已知某变量分布属于钟形分布且M0=900,Me=930,则( )A 、x <900B 、900<x < 930C 、x >930D 、x =91511.受极大值影响较大的平均数是( )。
《统计学》课后思考题

《统计学》课后思考题《统计学》课后思考题第⼀章导论1、解释描述统计和推断统计描述统计:研究的是数据收集、处理、汇总、图表描述、概括与分析等统计⽅法。
推断统计:研究如何利⽤样本数据来推断总体特征的统计⽅法。
2、统计数据可分为哪⼏个类型?不同类型的数据各有什么特点?3、举例说明总体、样本、参数、统计量、变量这⼏个概念总体:所研究的全部元素的集合,其中的每⼀个元素称为个体。
eg.要检验⼀批灯泡的使⽤寿命,这批灯泡构成的集合就是总体。
样本:从总体中抽取的⼀部分元素的集合。
eg.从⼀批灯泡中随机抽取100个,这100个灯泡就构成了⼀个样本。
参数:研究者想要了解的总体的某种特征值。
eg.总体平均数⽤µ表⽰,总体标准差⽤σ表⽰。
统计量:根据样本数据计算出来的⼀个量。
eg.样本标准差⽤s表⽰变量:说明现象某种特征的概念。
eg.商品销售额、受教育程度等第三章数据的图表展⽰1、分类数据和顺序数据的整理和图⽰⽅法各有哪些分类数据整理:频数、⽐例、百分⽐、⽐率图⽰:条形图、帕累托图、饼图、环形图顺序数据整理:累计频数、累计频率(累计百分⽐)图⽰:累计频数分布图和累计频率分布图分类数据的整理和图⽰⽅法同样适⽤于顺序数据2、茎叶图与直⽅图相⽐有什么优点?它们的应⽤场合是什么?茎叶图是由“茎”和“叶”两部分组成的、反映原始数据分布的图形,其图形是由数字组成的。
通过茎叶图,可以看数据的分布形状及数据的离散状况。
与直⽅图相⽐,茎叶图既能给出数据的分布状况,⼜能给出⼀个原始数值,即保留了原始数据的信息。
⽽直⽅图不能给出原始数值。
在应⽤⽅⾯,直⽅图⼀般适⽤于⼤批量数据,茎叶图通常适⽤于⼩批量数据。
第四章数据的概括性度量1、⼀组数据的分布特征可以从哪⼏个⽅⾯进⾏测度?⼀是分布的集中趋势,反映各数据向其中⼼值靠拢或聚集的程度;⼆是分布的离散程度,反映各数据远离其中⼼值的趋势;三是分布的形状,反映数据分布的偏态和峰态。
2、简述众数、中位数和平均数的特点和应⽤场合(1)众数特点:是⼀组数据分布的峰值,不受极端值影响。
统计学习题库试题库

第一章思考与练习一、思考题1.简述统计学的产生与发展历程。
2.统计学认识的分歧主要有哪些?3.统计学是怎样一门科学?4.统计研究工作可以分为哪几个阶段?其相互间有什么关系?5.什么是统计总体?什么是总体单位?举例说明总体和总体单位间的关系。
6.什么是标志和指标?它们各有哪些种类?标志和指标之间有什么区别和联系?请举例说明。
二、单项选择题1.社会经济统计学的研究对象是()。
A、社会经济现象的数量方面B、统计工作C、社会经济的内在规律D、统计方法2. 统计一般是指()。
A、统计理论与统计实践B、统计设计、统计调查与统计整理C、统计工作、统计资料与统计科学D、统计分析报告与统计预测模型3. 下列属于品质标志的是()A、年龄B、性别C、体重D、工资4. 研究某市工业企业的生产设备使用情况,则统计总体单位是()。
A、该市全部工业企业B、该市每一个工业企业C、该市工业企业的每一台生产设备D、该市工业企业的全部生产设备5.最早使用统计学这一学术用语的是()。
A、政治算术学派B、国势学派C、社会统计学派D、数理统计学派6.要考察全国工业企业的情况时,以下标志属于不变标志的有()。
A、产业分类B、职工人数C、劳动生产率D、所有制第二章思考与练习一、思考题1.一个完整的统计调查方案内容主要包括哪几个方面?2.什么是重点调查?什么是典型调查?各有什么特点?3.统计报表制度和普查有何区别?4.什么是调查对象、调查单位和报告单位?报告单位和调查单位有什么不同?5.统计工作中为什么要强调多种调查方法结合运用?二、单项选择题1.对百货公司工作人员进行普查,调查单位是()A.所有百货公司B.每个百货公司C.所有工作人员D.每位工作人员2.某城市工商银行拟对占全市储蓄额3/5 的几个大储蓄所进行调查,以了解全市储蓄的一般情况,则这种调查方式是()A.普查B.重点调查C.典型调查D.抽样调查3.目前,我国对城乡居民家庭收支情况的调查是采用()A.普查B.重点调查C.典型调查D.抽样调查4.为了解工业企业的期末在制品数量,调查人员当场进行观察与计数,这种搜集资料的方法是()A.直接观察法B.开调查会法C.个别采访法D.报告法5.对有限总体()A.只能进行全面调查B.只能进行非全面调查C.既能进行全面调查,也能进行非全面调查D.以上答案都不对6.统计调查项目大多数放在()A.调查表的表头中B.调查表的表体中C.调查表的表脚中D.调查对象之中7.调查某市工业企业职工的工种、工龄、文化程度等情况,则()A.调查单位与填报单位是每个工业企业B.调查单位与填报单位是每个职工C.调查单位是每个企业,填报单位是每个职工D.调查单位是每个职工,填报单位是每个企业8.统计调查对象是()A.总体各单位标志值B.现象总体C.总体单位D.统计指标9.我国现行统计调查方法体系中,作为“主体”的是()A.经常性抽样调查B.必要的统计报表C.重点调查及估计推算等D.周期性普查第三章思考与练习一、思考题1.数据预处理包括哪些内容?2.何谓统计整理?统计整理的基本步骤有哪些?3.何谓统计分组?简述统计分组的作用。
(完整版)统计学思考题

1.1请举出统计应用的几个例子:1。
用统计识别作者:对于存在争议的论文,通过统计量推出作者 2.用统计量得到一个重要发现:在不同海域鳗鱼脊椎骨数量变化不大,推断所有各个不同海域内的鳗鱼是由海洋中某公共场所繁殖的3。
挑战者航天飞机失事预测1。
2请举出应用统计的几个领域:1.在企业发展战略中的应用2。
在产品质量管理中的应用3。
在市场研究中的应用 4.在财务分析中的应用 5.在经济预测中的应用1.3你怎么理解统计的研究内容:1。
统计学研究的基本内容包括统计对象、统计方法和统计规律. 2 .统计对象就是统计研究的课题,称谓统计总体。
3。
统计研究方法主要有大量观察法、数量分析法、抽样推断法、实验法等。
4.统计规律就是通过大量观察和综合分析所揭示的用数量指标反映的客观现象的本质特征和发展规律。
1.4举例说明分类变量、顺序变量和数值变量:1.分类变量:表现为不同类别的变量称为分类变量,如“性别”表现为“男”或“女”,“企业所属的行业”表现为“制造业”、“零售业"、“旅游业"等,“学生所在的学院”可能是“商学院"、“法学院"等2。
顺序变量:如果类别有一定的顺序,这样的分类变量称为顺序变量,如考试成绩按等级分为优、良、中、及格、不及格,一个人对事物的态度分为赞成、中立、反对。
这里的“考试成绩等级”、“态度"等就是顺序变量。
3。
数值变量:可以用数字记录其观察结果,这样的变量称为数值变量,如“企业销售额"、“生活费支出”、“掷一枚骰子出现的点数”。
1。
5获得数据的概率抽样方法有哪些?(1)简单随机抽样,简单随机抽样又称纯随机抽样,是指在特定总体的所有单位中直接抽取n个组成样本。
它最直观地体现了抽样的基本原理,是最基本的概率抽样。
(2)系统抽样,系统抽样也称等距抽样或机械抽样,是按一定的间隔距离抽取样本的方法.(3)分层抽样,分层抽样也叫分类抽样,就是先将总体的所有单位依照一种或几种特征分为若干个子总体,每一个子总体即为一类,然后从每一类中按简单随机抽样或系统随机抽样的办法抽取一个子样本,称为分类样本,它们的集合即为总体样本。
统计学第一章思考题及习题

统计学第一章思考题及习题第一章思考题及习题:?单选题:?1.在统计学的形成和发展过程中,首先将古典概率论引入社会经济现象研究的学者是( A)。
?A.阿道夫・凯特勒B.威廉・配第C.约翰・格朗特D.赫尔曼・康令B.构成总体的单位,必须是不同的?2. 在确定统计总体时必须注意()A。
?A. 构成总体的单位,必须是同质的?C.构成总体的单位,不能有差异D.构成总体的单位,必须是不相干的单位?3.一个统计总体(D)。
?A.只能有一个标志 B.只能有一个指标 C.可以有多个标志D.可以有多个指标?4.在某地区2021年GDP和人均GDP资料中,属于下面哪一种类统计指标(B)。
?A.客观指标和主观指标 B.数量指标和质量指标?C.时期指标和时点指标 D.实体指标和行为指标?5.对某市高等学校科研所进行调查,统计总体是(D)。
?A.某市所有的高等学校B.某一高等学校科研所?C.某一高等学校D. 某市所有高等学校科研所?6.要了解某市国有工业企业设备情况,则统计总体是(?)。
?A.该市全部国有工业企业B.该市每一个国有工业企业?C.该市国有工业企业的全部设备D.该市国有工业企业的每一台设备?7.有200个公司全部职工每个人的工资资料,如要调查这200个公司职工的工资水平情况,则统计总体为(A)。
?A.200个公司的全部职工工资 B.200个公司 C.200个公司职工的全部工资 D.200个公司每个职工的工资?8.下列标志中属品质标志的是(A)?A.性别B.年龄C.商品价格D.工业企业的总产值?9.某企业职工人数为1200人,这里的“职工人数1200人”是(C)。
?A.标志B.变量C.指标D.标志值?10.某班四名学生统计学考试成绩分别为70分、80分、86分和95分,这四个数字是(B)。
?A.标志B.标志值C.指标D.变量?11.工业企业的职工人数、职工工资是(D)。
?D.前者是离散型变量,后者是连续型变量?A.连续型变量B.离散型变量C.前者是连续型变量,后者是离散型变量?多选题:?1.对某市工业生产进行调查,得到以下资料,其中的统计指标是(BCE)。
统计课后思考题答案

统计课后思考题答案统计课后思考题答案第一章思考题1.1什么是统计学统计学是关于数据的一门学科它收集处理分析解释来自各个领域的数据并从中得出结论。
1.3解释描述统计和推断统计描述统计它研究的是数据收集处理汇总图表描述概括与分析等统计方法。
推断统计它是研究如何利用样本数据来推断总体特征的统计方法。
1.5解释分类数据顺序数据和数值型数据统计数据按所采用的计量尺度不同分定性数据分类数据只能归于某一类别的非数字型数据它是对事物进行分类的结果数据表现为类别用文字来表述定性数据顺序数据只能归于某一有序类别的非数字型数据。
它也是有类别的但这些类别是有序的。
定量数据数值型数据按数字尺度测量的观察值其结果表现为具体的数值。
统计数据按统计数据都收集方法分观测数据是通过调查或观测而收集到的数据这类数据是在没有对事物人为控制的条件下得到的。
实验数据在实验中控制实验对象而收集到的数据。
统计数据按被描述的现象与实践的关系分截面数据在相同或相似的时间点收集到的数据也叫静态数据。
时间序列数据按时间顺序收集到的用于描述现象随时间变化的情况也叫动态数据。
1.6举例说明总体样本参数统计量变量这几个概念对一千灯泡进行寿命测试那么这千个灯泡就是总体从中抽取一百个进行检测这一百个灯泡的集合就是样本这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量变量就是说明现象某种特征的概念比如说灯泡的寿命。
1.7变量的分类变量可以分为分类变量顺序变量数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
1.8举例说明离散型变量和连续性变量离散型变量只能取有限个值取值以整数位断开比如“企业数”连续型变量取之连续不断不能一一列举比如“温度”。
1.8统计应用实例人口普查商场的名意调查等。
1.9统计应用的领域经济分析和政府分析还有物理生物等等各个领域。
第二章思考题2.4自填式面访式和电话式各自的长处和弱点自填式优点 1调查组织者管理容易2成本低可进行大规模调查3对被调查者可选择方便时间答卷减少回答敏感问题压力。
统计学思考题

思考题(仅供参考)部分题目超出范围。
同学们仅作上课讲授过的题目即可 二、判断题1、对于定性变量不能确定平均数.( )2、根据组距式数列计算的平均数、标准差等都是近似值.( )3、任何平均数都受变量数列中的极端值的影响.( )4、中位数把变量数列分成了两半,一半数值比它大,一半数值比它小.( )5、任何变量数列都存在众数.( )6、如果x <Me<M0,则变量分布存在右偏.( )7、若比较两个变量分布平均数代表性的高低,则方差或标准差大的平均数的代表性差.( )8、只要变量分布具有相同的标准差就会有相同的分布形状.( )9、在统计学实际应用中,调和平均数与算术平均数的计算形式虽然不同,但计算结果及其意义是一样的.( )10.各标志值平方和的算术平均数公式为 ( )11.各个变量值对其算术平均数的离差绝对值之和等于零。
( ) 12.计算加权算术平均数时,其权数必须是各组的次数或比率。
( ) 13.计算数值平均数时,要求资料中的各项数值必须大于零。
( ) 14.根据分组资料计算的算术平均数,只是一个近似值。
( ) 15.权数的绝对数越大,对算术平均数的影响也就越大。
( )16.组距数列条件下,众数的大小主要取决于众数组相邻两小次数多少的影响。
( ) 17.两个企业比较,若B A B A x x σσ>>,”,由此可以肯定B 企业生产的均衡性比A 企业好。
( )18.对于分组资料,若不同时期相比,各组平均数均程度不同地上升,则总平均数一定上升。
( )19.n 个同性质独立变量和的方差等于各个变量方差之和。
( )20.n个同性质独立变量平均数的方差等于各变量方差的平均数。
( )21.变量的方差等于变量平均数的平方减变量平方的平均数。
( )22、峰态一词是由统计学家Galton于1905年首次提出的。
它是对数据分布平峰或尖峰程度的测度。
()三、选择题1、某工厂新工人月工资400元,工资总额为200000元,老工人月工资800元,工资总额80000元,则总平均工资为()A、 600元B、元 C 、元 D、 500元2、标志变异指标是反映同质总体的().A、集中程度B、离中程度C、一般水平D、变动程度3、权数对算术平均数的影响作用,实质上取决于()A、作为权数的各组单位数占总体单位数比重的大小B、各组标志值占总体标志总量比重的大小C、标志值本身的大小D、标志值数量的多少4、对于不同水平的总体不能直接用标准差比较其标志变动度,这时需分别计算各自的()来比较A.标准差系数B.平均差C.全距D.均方差5、统计学中最重要的离散指标是().A、平均差B、全距C、标准差D、变异系数6、离散指标中受极端值影响最大的是()A、平均差B、全距C、标准差D、方差7、假如学生的考试成绩用优秀、良好、中等、及格和不及格来表示,则全班考试成绩的水平高低应该用什么平均数来说明()A、算术平均数B、众数C、众数或中位数D、中位数8、若两个变量数列的标准差相等且计量单位相同,但平均数不相等,则()A、平均数大者代表性强B、平均数小者代表性强C、两个平均数的代表性一样D、无法判断哪个平均数的代表性强9、某企业有A 、B 两个车间,去年A 车间人均产量万件,B 车间人均产量万件.今年A 车间人数增加6%,B 车间增加8%.如果两个车间的人均产量都保持不变,则该企业今年总的人均产量与去年相比( )A 、上升B 、下降C 、不变D 、不能确定如何变化 10、已知某变量分布属于钟形分布且M0=900,Me=930,则( ) A 、x <900 B 、900<x < 930 C 、x >930 D 、x =915 11.受极大值影响较大的平均数是( )。
(完整版)统计学思考题

1.1请举出统计应用的几个例子:1.用统计识别作者:对于存在争议的论文,通过统计量推出作者2.用统计量得到一个重要发现:在不同海域鳗鱼脊椎骨数量变化不大,推断所有各个不同海域内的鳗鱼是由海洋中某公共场所繁殖的3.挑战者航天飞机失事预测1.2请举出应用统计的几个领域:1.在企业发展战略中的应用2.在产品质量管理中的应用3.在市场研究中的应用4.在财务分析中的应用5.在经济预测中的应用1.3你怎么理解统计的研究内容:1.统计学研究的基本内容包括统计对象、统计方法和统计规律。
2 .统计对象就是统计研究的课题,称谓统计总体。
3.统计研究方法主要有大量观察法、数量分析法、抽样推断法、实验法等。
4.统计规律就是通过大量观察和综合分析所揭示的用数量指标反映的客观现象的本质特征和发展规律。
1.4举例说明分类变量、顺序变量和数值变量:1.分类变量:表现为不同类别的变量称为分类变量,如“性别”表现为“男”或“女”,“企业所属的行业”表现为“制造业”、“零售业”、“旅游业”等,“学生所在的学院”可能是“商学院”、“法学院”等2.顺序变量:如果类别有一定的顺序,这样的分类变量称为顺序变量,如考试成绩按等级分为优、良、中、及格、不及格,一个人对事物的态度分为赞成、中立、反对。
这里的“考试成绩等级”、“态度”等就是顺序变量。
3.数值变量:可以用数字记录其观察结果,这样的变量称为数值变量,如“企业销售额”、“生活费支出”、“掷一枚骰子出现的点数”。
1.5获得数据的概率抽样方法有哪些?(1)简单随机抽样 ,简单随机抽样又称纯随机抽样,是指在特定总体的所有单位中直接抽取n个组成样本。
它最直观地体现了抽样的基本原理,是最基本的概率抽样。
(2)系统抽样 ,系统抽样也称等距抽样或机械抽样,是按一定的间隔距离抽取样本的方法。
(3)分层抽样 ,分层抽样也叫分类抽样,就是先将总体的所有单位依照一种或几种特征分为若干个子总体,每一个子总体即为一类,然后从每一类中按简单随机抽样或系统随机抽样的办法抽取一个子样本,称为分类样本,它们的集合即为总体样本。
统计学原理 第三版 思考题

1.时期指标与时点指标有何异同?2.简要说明平均指标与变异指标在说明同质总体特征方面的联系和区别。
3.动态数列有哪些作用?4.什么是同度量因素?同度量因素在统计指数中有何作用?5.简述统计工作,统计资料和统计科学的关系。
6.重点调查中的重点单位的含义是什么?重点调查有什么优点?7.试述统计分组在统计整理中的重要性?8.正确运用平均指标应遵循哪些原则?1.答:时期指标与时点指标都是总量指标,均表示现象的总量。
两者的区别表现在:(1)时期指标反映现象在一段时期内发展过程的总数量,时点指标表示现象处在某一时刻上的状态;(2)时期指标可以累计相加,时点指标则不能;(3)时期指标数值的大小与计算时期的长短有直接关系,时点指标的数值大小与时间间隔长短没有直接关系。
2.答:平均指标与变异指标都是用来说明同质总体数量方面的特征的指标,不同的是平均指标是反映总体数量分配方面集中程度的指标,而变异指标是反映离中程度的指标。
数列中有变异,就会有集中,而变异指标又恰是以平均指标为中心计算的,所以平均指标与变异指标即相互联系又有区别。
3.答:(1)它可描述被研究现象的发展过程和结果;(2)它为分析被研究现象的发展速度、趋势和规律,提供最基本的统计数字,以便进行趋势预测;(3)将不同地区、国家的同一现象,或将两个以上相关现象,在同一历史时期的动态数列进行对比,可分析它们变化中的数量关系或是否协调。
4.答:在计算总指数时,为了解决复杂社会经济现象总体中,各个要素不能直接相加,而使用的媒介因素,统计中称这个因素为同度量因素。
同度量因素在计算总指数中除了具有同度量因素的作用外,还具有权数的作用。
5答:统计资料、统计工作和统计科学有着密切联系。
统计工作的成果是统计资料。
统计科学是统计工作实践经验的理论概括和科学总结,它来源于统计实践,又高于统计实践,指导统计实践。
6答:重点调查中的重点单位是从现象数量方面考虑的,即这些单位的标志值之和占总体全部单位该标志总量的绝大部分。
统计学思考题答案

4.1一组数据的分布特征可以从哪几个方面进行测度?数据分布特征可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或集中的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。
2. 4.5简述众数、中位数和平均数的特点和应用场合。
众数是一组数据分布的峰值,不受极端值的影响,缺点是具有不唯一性。
众数只有在数据量较多时才有意义,数据量较少时不宜使用。
主要适合作为分类数据的集中趋势测度值。
中位数是一组数据中间位置上的代表值,不受极端值的影响。
当数据的分布偏斜较大时,使用中位数也许不错。
主要适合作为顺序数据的集中趋势测度值。
平均数对数值型数据计算的,而且利用了全部数据信息,在实际应用中最广泛。
当数据呈对称分布或近似对称分布时,三个代表值相等或相近,此时应选择平均数。
但平均数易受极端值的影响,对于偏态分布的数据,平均数的代表性较差,此时应考虑中位数或众数。
4.7标准分数有哪些用途?标准分数给出了一组数据中各数值的相对位置。
在对多个具有不同量纲的变量进行处理时,常需要对各变量进行标准化处理。
它还可以用来判断一组数据是否有离群数据。
7.3怎样理解置信区间?置信区间:由样本统计量所构造的总体参数的估计区间7.4解释95%的置信区间。
95%的置信区间指用某种方法构造的所有区间中有95%的区间包含总体参数的真值。
7.5 Za/2的含义是什么含义:Za/2是标准正态分布上侧面积为a/2的z值,公式是统计总体均值时的边际误差。
7.6 解释独立样本和匹配样本的含义。
独立样本:如果两个样本是从两个总体中独立抽取的,即一个样本中的元素与另一个样本中的元素相互独立。
匹配样本:一个样本中的数据与另一个样本中的数据相对应。
7.8简述样本量与置信水平、总体方差、边际误差的关系。
样本量越大置信水平越高,总体方差和边际误差越小10.1什么是方差分析?它研究的是什么?答:方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。
统计学思考题[教育]
![统计学思考题[教育]](https://img.taocdn.com/s3/m/3c87236700f69e3143323968011ca300a6c3f6c6.png)
思考题(仅供参考)部分题目超出范围。
同学们仅作上课讲授过的题目即可二、判断题 1、对于定性变量不能确定平均数.( )2、根据组距式数列计算的平均数、标准差等都是近似值.( )3、任何平均数都受变量数列中的极端值的影响.( )4、中位数把变量数列分成了两半,一半数值比它大,一半数值比它小.( )5、任何变量数列都存在众数.( )6、如果x <Me<M0,则变量分布存在右偏.( )7、若比较两个变量分布平均数代表性的高低,则方差或标准差大的平均数的代表性差.( )8、只要变量分布具有相同的标准差就会有相同的分布形状.( ) 9、在统计学实际应用中,调和平均数与算术平均数的计算形式虽然不同,但计算结果及其意义是一样的.( )10.各标志值平方和的算术平均数公式为 ( )11.各个变量值对其算术平均数的离差绝对值之和等于零。
( )12.计算加权算术平均数时,其权数必须是各组的次数或比率。
( )13.计算数值平均数时,要求资料中的各项数值必须大于零。
( )14.根据分组资料计算的算术平均数,只是一个近似值。
( ) 15.权数的绝对数越大,对算术平均数的影响也就越大。
( ) 16.组距数列条件下,众数的大小主要取决于众数组相邻两小次数多少的影响。
( )17.两个企业比较,若B A B A x x σσ>>,”,由此可以肯定B 企业生产的均衡性比A 企业好。
( )18.对于分组资料,若不同时期相比,各组平均数均程度不同地上升,则总平均数一定上升。
( )19.n 个同性质独立变量和的方差等于各个变量方差之和。
( )20.n 个同性质独立变量平均数的方差等于各变量方差的平均数。
( ) 21.变量的方差等于变量平均数的平方减变量平方的平均数。
( )22、峰态一词是由统计学家Galton 于1905年首次提出的。
它是对数据分布平峰或尖峰程度的测度。
( )三、选择题1、某工厂新工人月工资400元,工资总额为200000元,老工人月工资800元,工资总额80000元,则总平均工资为( ) A 、 600元 B 、 533.33元 C 、466.67元 D 、 500元2、标志变异指标是反映同质总体的( ). A 、集中程度 B 、离中程度 C 、一般水平 D 、变动程度3、权数对算术平均数的影响作用,实质上取决于( )A 、作为权数的各组单位数占总体单位数比重的大小B 、各组标志值占总体标志总量比重的大小C 、标志值本身的大小D 、标志值数量的多少4、对于不同水平的总体不能直接用标准差比较其标志变动度,这时需分别计算各自的( )来比较A.标准差系数B.平均差C.全距D.均方差 5、统计学中最重要的离散指标是( ).A 、平均差B 、全距C 、标准差D 、变异系数6、离散指标中受极端值影响最大的是( )A 、平均差B 、全距C 、标准差D 、方差7、假如学生的考试成绩用优秀、良好、中等、及格和不及格来表示,则全班考试成绩的水平高低应该用什么平均数来说明?( )A 、算术平均数B 、众数C 、众数或中位数D 、中位数8、若两个变量数列的标准差相等且计量单位相同,但平均数不相等,则( )A 、平均数大者代表性强B 、平均数小者代表性强C 、两个平均数的代表性一样D 、无法判断哪个平均数的代表性强9、某企业有A 、B 两个车间,去年A 车间人均产量3.6万件,B 车间人均产量3.5万件.今年A 车间人数增加6%,B 车间增加8%.如果两个车间的人均产量都保持不变,则该企业今年总的人均产量与去年相比( )A 、上升B 、下降C 、不变D 、不能确定如何变化 10、已知某变量分布属于钟形分布且M0=900,Me=930,则( )A 、x <900B 、900<x < 930C 、x >930D 、x =91511.受极大值影响较大的平均数是( )。
统计学思考题

统计学思考题第一章导论1、统计数据可分为哪几种类型?不同类型的数据各有什么特点?按照所采用的计量尺度的不同,可以将统计数据分为分类数据、顺序数据和数值型数据。
按照统计数据的收集方法,可以将其分为观测数据和实验数据。
按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。
分类数据是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。
顺序数据是只能归于某一有序类别的非数字型数据。
顺序数据虽然也是类别,但这些类别是有序的,是用文字来表述的。
数值型数据是按数字尺度测量的观察值,其结果表现为具体的数值。
现实中处理的大多数都是数值型数据。
2、解释分类数据、顺序数据和数值数据的意义。
对分类数据,我们通常计算出各组的频数或频率,计算其众数和异众比率,进行列联表分析和x2检验等;对顺序数据,可以计算其中位数和四分位差,计算等级相关系数等;对数值型数据,可以用更多的统计方法进行分析,如计算各种统计量,进行参数估计和检验等3、举例说明总体、样本、参数、统计量、变量这几个概念。
总体:是包含所研究的全部个体的集合,它通常由所研究的一些个体组成。
如多个企业构成的集合,多个居民户构成的集合,多个人构成的集合样本:是从总体中抽出的一部分元素的集合。
如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。
参数:是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。
在统计中,总体参数通常用希腊字母表示,如,总体平均数用u(miu)表示,总体标准差用(sigma)表示,总体比例用(pai)表示,等。
统计量:是用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数。
样本统计量通常用英文字母来表示。
如,样本平均数用(x-bar)表示,样本标准车用s表示,样本比例用p表示,等。
变量:是说明现象某种特征的概念。
第四版统计学课后习题答案

时间在横轴,观测值绘在纵轴。一般是长宽比例10:7的长方形,纵轴下端一般从0开始,数据与0距离过大的话用折断符号折断。
3.6饼图和环形图的不同
饼图只能显示一个样本或总体各部分所占比例,环形图可以同时绘制多个样本或总体的数据系列,其图形中间有个“空洞”,每个样本或总体的数据系类为一个环。
4.6简述异众比率、四分位差、方差或标准差的适用场合
对于分类数据,主要用异众比率来测量其离散程度;对于顺序数据,虽然也可以计算异众比率,但主要使用四分位差来测量其离散程度;对于数值型数据,虽然可以计算异众比率和四分位差,但主要使用方差或标准差来测量其离散程度。
4.7标准分数有哪些用途?
4.9测度数据分布形状的统计量有哪些?
对分布形状的测度有偏态和峰态,测度偏态的统计量是偏态系数,测度峰态的统计量是峰态系数。
第五章 概率与概率分布
5.1频率与概率有什么关系?
在相同条件下随机试验n次,某事件A出现m次,则比值m/n称为事件A发生的频率。随着n的增大,该频率围绕某一常数p波动,且波动幅度逐渐减小,趋于稳定,这个频率的稳定值即为该事件的概率。
1.4解释分类数据,顺序数据和数值型数据
答案同1.3
1.5举例说明总体,样本,参数,统计量,变量这几个概念
对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
《统计学》第四版
统计课后思考题答案
第一章思考题
统计学思考题

思考题(仅供参考)部分题目超出范围。
同学们仅作上课讲授过的题目即可二、判断题1、对于定性变量不能确定平均数.( )2、根据组距式数列计算的平均数、标准差等都是近似值.( )3、任何平均数都受变量数列中的极端值的影响.( )4、中位数把变量数列分成了两半,一半数值比它大,一半数值比它小.( )5、任何变量数列都存在众数.( )6、如果x <Me<M0,则变量分布存在右偏.( )7、若比较两个变量分布平均数代表性的高低,则方差或标准差大的平均数的代表性差.( )8、只要变量分布具有相同的标准差就会有相同的分布形状.( )9、在统计学实际应用中,调和平均数与算术平均数的计算形式虽然不同,但计算结果及其意义是一样的.( )10.各标志值平方和的算术平均数公式为 ( )11.各个变量值对其算术平均数的离差绝对值之和等于零。
( )12.计算加权算术平均数时,其权数必须是各组的次数或比率。
( )13.计算数值平均数时,要求资料中的各项数值必须大于零。
( )14.根据分组资料计算的算术平均数,只是一个近似值。
( )15.权数的绝对数越大,对算术平均数的影响也就越大。
( )16.组距数列条件下,众数的大小主要取决于众数组相邻两小次数多少的影响。
( )17.两个企业比较,若B A B A x x σσ>>,”,由此可以肯定B 企业生产的均衡性比A 企业好。
( )18.对于分组资料,若不同时期相比,各组平均数均程度不同地上升,则总平均数一定上升。
( )19.n 个同性质独立变量和的方差等于各个变量方差之和。
( )20.n 个同性质独立变量平均数的方差等于各变量方差的平均数。
( )21.变量的方差等于变量平均数的平方减变量平方的平均数。
( )22、峰态一词是由统计学家Galton 于1905年首次提出的。
它是对数据分布平峰或尖峰程度的测度。
( )三、选择题1、某工厂新工人月工资400元,工资总额为200000元,老工人月工资800元,工资总额80000元,则总平均工资为( )A 、 600元B 、 533.33元C 、466.67元D 、 500元2、标志变异指标是反映同质总体的( ).A 、集中程度B 、离中程度C 、一般水平D 、变动程度3、权数对算术平均数的影响作用,实质上取决于( )A 、作为权数的各组单位数占总体单位数比重的大小B 、各组标志值占总体标志总量比重的大小C 、标志值本身的大小D 、标志值数量的多少4、对于不同水平的总体不能直接用标准差比较其标志变动度,这时需分别计算各自的( )来比较A.标准差系数B.平均差C.全距D.均方差5、统计学中最重要的离散指标是( ).A 、平均差B 、全距C 、标准差D 、变异系数6、离散指标中受极端值影响最大的是( )A 、平均差B 、全距C 、标准差D 、方差7、假如学生的考试成绩用优秀、良好、中等、及格和不及格来表示,则全班考试成绩的水平高低应该用什么平均数来说明?( )A 、算术平均数B 、众数C 、众数或中位数D 、中位数8、若两个变量数列的标准差相等且计量单位相同,但平均数不相等,则( )A 、平均数大者代表性强B 、平均数小者代表性强C 、两个平均数的代表性一样D 、无法判断哪个平均数的代表性强9、某企业有A 、B 两个车间,去年A 车间人均产量3.6万件,B 车间人均产量3.5万件.今年A 车间人数增加6%,B 车间增加8%.如果两个车间的人均产量都保持不变,则该企业今年总的人均产量与去年相比( )A 、上升B 、下降C 、不变D 、不能确定如何变化10、已知某变量分布属于钟形分布且M0=900,Me=930,则( )A 、x <900B 、900<x < 930C 、x >930D 、x =91511.受极大值影响较大的平均数是( )。
统计学复习思考题与练习题参考答案doc

第一章复习思考题与练习题:一、思考题1.统计的基本任务是什么?2.统计研究的基本方法有哪些?3.如何理解统计总体的基本特征。
4.试述统计总体和总体单位的关系。
5.标志与指标有何区别何联系。
二、判断题1、社会经济统计的研究对象是社会经济现象总体的各个方面。
()2、在全国工业普查中,全国企业数是统计总体,每个工业企业是总体单位。
()3、总体单位是标志的承担者,标志是依附于单位的。
()4、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。
()5、全面调查和非全面调查是根据调查结果所得的资料是否全面来划分的()。
三、单项选择题1、社会经济统计的研究对象是()。
A、抽象的数量关系B、社会经济现象的规律性C、社会经济现象的数量特征和数量关系D、社会经济统计认识过程的规律和方法2、某城市工业企业未安装设备普查,总体单位是()。
A、工业企业全部未安装设备B、工业企业每一台未安装设备C、每个工业企业的未安装设备D、每一个工业3、标志是说明总体单位特征的名称,标志有数量标志和品质标志,因此()。
A、标志值有两大类:品质标志值和数量标志值B、品质标志才有标志值C、数量标志才有标志值D、品质标志和数量标志都具有标志值4、统计规律性主要是通过运用下述方法经整理、分析后得出的结论()。
A、统计分组法B、大量观察法C、综合指标法D、统计推断法5、指标是说明总体特征的,标志是说明总体单位特征的,所以()。
A、标志和指标之间的关系是固定不变的B、标志和指标之间的关系是可以变化的C、标志和指标都是可以用数值表示的D、只有指标才可以用数值表示答案:二、 1.× 2.× 3.√ 4.× 5.×三、 1.C 2.B 3.C 4.B 5.B第三章一、复习思考题1.什么是平均指标?平均指标可以分为哪些种类?2.为什么说平均数反映了总体分布的集中趋势?3.为什么说简单算术平均数是加权算术平均数的特例?4.算术平均数的数学性质有哪些?5.众数和中位数分别有哪些特点?6.什么是标志变动度?标志变动度的作用是什么?7.标志变动度可分为哪些指标?它们分别是如何运用的?8.平均数与标志变动度为什么要结合运用?二、练习题1.某村对该村居民月家庭收入进行调查,获取的资料如下:3.某蔬菜市场某种蔬菜上午1元可买1.5公斤,中午1元可买2公斤,下午1元可买2.5公斤。
统计学习题

第一章总论一、思考题1、一个完整的统计工作过程包括哪些内容?2、简述统计指标和标志的关系?3、如何理解统计指标体系比统计指标的应用更为广泛和重要?二、单项选择题1、“统计”一词的基本涵义是()。
A.统计方法,统计分析,统计预测B.统计学,统计工作,统计资料C.统计调查,统计整理,统计分析D.统计分组,统计指标,统计计算2、统计学的基本方法包括有()。
A.调查方法,汇总方法,预测方法B.相对数法,平均数法,指数法C.大量观察法,综合分析法,归纳推断法D.整理方法,调查方法,分析方法3.要了解50个学生的学习成绩,则总体单位是()。
A.50个学生B.50个学生的学习成绩C.每个学生D.每个学生的学习成绩4、变量是指()。
A.可变的数量标志B.数量标志C.可变的品质标志D.数量标志的标志值5、有四名工人的月工资额分别为825、840、865、900元。
这四个数字是()。
A.数量指标B.变量C.变量值D.品质标志三、多项选择题1、统计的职能有()。
A.信息职能B.咨询职能C.监督职能D.决策职能E.协调职能2、统计总体的基本特征表现为()。
A.大量性B.数量性C.同质性D.差异性E.客观性3、离散变量的数值()。
A.是连续不断的B.是以整数断开的C.相邻两值之间不可能有小数D.要用测量或计量的方法取得数据E.只能用计数的方法取得数据4、总体和总体单位不是固定不变的,它们随着研究目的的不同()。
A.总体可以转化为总体单位B.总体单位可以转化为总体C.只能是总体转化为总体单位D.只能是总体单位转化为总体E.总体和总体单位可以相互转化5、品质标志表示质的特征,数量标志表示事物量的特征,所以()。
A.数量标志是可以用数值表示B.品质标志可以用数值表示C.数量标志不可以用数值表示D.品质标志不可以用数值表示E.两者都可以用数值表示第二章统计调查与统计数据的整理一、思考题1、一个完整的统计调查调查方案应包括哪些主要内容?2、简述三种非全面调查的主要区别。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章思考题1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。
第二章思考题2.1什么是二手资料?使用二手资料应注意什么问题与研究内容有关,由别人调查和试验而来已经存在,并会被我们利用的资料为“二手资料”。
使用时要进行评估,要考虑到资料的原始收集人,收集目的,收集途径,收集时间使用时要注明数据来源。
2.2比较概率抽样和非概率抽样的特点,指出各自适用情况概率抽样:抽样时按一定的概率以随机原则抽取样本。
每个单位别抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽到的概率。
技术含量和成本都比较高。
如果调查目的在于掌握和研究对象总体的数量特征,得到总体参数的置信区间,就使用概率抽样。
非概率抽样:操作简单,时效快,成本低,而且对于抽样中的统计学专业技术要求不是很高。
它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。
它同样使用市场调查中的概念测试(不需要调查结果投影到总体的情况)。
2.4自填式,面访式和电话式各自的长处和弱点自填式;优点:1调查组织者管理容易2成本低,可进行大规模调查3对被调查者,可选择方便时间答卷,减少回答敏感问题压力。
缺点:1返回率低2不适合结构复杂的问卷,调查内容有限3调查周期长4在数据搜集过程中遇见问题不能及时调整。
面访式;优点:1回答率高2数据质量高3在调查过程中遇见问题可以及时调整。
缺点:1成本比较高2搜集数据的方式对调查过程的质量控制有一定难度3对于敏感问题,被访者会有压力。
电话式;优点:1速度快2对调查员比较安全3对访问过程的控制比较容易。
缺点:1实施地区有限2调查时间不能过长3使用的问卷要简单4被访者不愿回答时,不易劝服。
2.6如何控制调查中的回答误差对于理解误差,我会去学习一定的心理学知识,对于记忆误差,我会尽量去缩短所涉及的时间范围,对于有意识的误差,我要做好被调查者的心理工作,要遵守职业道德,为被调查者保密,尽量在问卷中不涉及敏感问题。
第三章思考题3.2分类数据和顺序数据的整理和图示方法各有哪些分类数据:制作频数分布表,用比例,百分比,比率等进行描述性分析。
可用条形图,帕累托图和饼图进行图示分析。
顺序数据:制作频数分布表,用比例,百分比,比率。
累计频数和累计频率等进行描述性分析。
可用条形图,帕累托图和饼图,累计频数分布图和环形图进行图示分析。
3.3数据型数据的分组方法和步骤分组方法:单变量值分组和组距分组,组距分组又分为等距分组和异距分组。
分组步骤:1确定组数2确定各组组距3根据分组整理成频数分布表3.4直方图和条形图的区别1条形图使用图形的长度表示各类别频数的多少,其宽度固定,直方图用面积表示各组频数,矩形的高度表示每一组的频数或频率,宽度表示组距,2直方图各矩形连续排列,条形图分开排列,3条形图主要展示分类数据,直方图主要展示数值型数据。
第四章4.3简述四分位数的计算方法。
四分位数是一组数据排序后处于25%和75%位置上的值。
根据未分组数据计算四分位数时,首先对数据进行排序,然后确定四分位数所在的位置,该位置上的数值就是四分位数。
4.5简述众数、中位数和平均数的特点和应用场合。
众数是一组数据分布的峰值,不受极端值的影响,缺点是具有不唯一性。
众数只有在数据量较多时才有意义,数据量较少时不宜使用。
主要适合作为分类数据的集中趋势测度值。
中位数是一组数据中间位置上的代表值,不受极端值的影响。
当数据的分布偏斜较大时,使用中位数也许不错。
主要适合作为顺序数据的集中趋势测度值。
平均数对数值型数据计算的,而且利用了全部数据信息,在实际应用中最广泛。
当数据呈对称分布或近似对称分布时,三个代表值相等或相近,此时应选择平均数。
但平均数易受极端值的影响,对于偏态分布的数据,平均数的代表性较差,此时应考虑中位数或众数。
4.6简述异众比率、四分位差、方差或标准差的适用场合对于分类数据,主要用异众比率来测量其离散程度;对于顺序数据,虽然也可以计算异众比率,但主要使用四分位差来测量其离散程度;对于数值型数据,虽然可以计算异众比率和四分位差,但主要使用方差或标准差来测量其离散程度。
第七章7.1评价估计量的标准:无偏性:估计量抽样分布的数学期望等于被估计的总体参数有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数7.8 样本量越大置信水平越高,总体方差和边际误差越小第8章思考题8.1假设检验和参数估计有什么相同点和不同点?答:参数估计和假设检验是统计推断的两个组成部分,它们都是利用样本对总体进行某种推断,然而推断的角度不同。
参数估计讨论的是用样本统计量估计总体参数的方法,总体参数μ在估计前是未知的。
而在参数假设检验中,则是先对μ的值提出一个假设,然后利用样本信息去检验这个假设是否成立。
8.2什么是假设检验中的显著性水平?统计显著是什么意思?答:显著性水平是一个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率和风险。
统计显著等价拒绝H0,指求出的值落在小概率的区间上,一般是落在0.05或比0.05更小的显著水平上。
8.3什么是假设检验中的两类错误?答:假设检验的结果可能是错误的,所犯的错误有两种类型,一类错误是原假设H0为真却被我们拒绝了,犯这种错误的概率用α表示,所以也称α错误或弃真错误;另一类错误是原假设为伪我们却没有拒绝,犯这种错误的概论用β表示,所以也称β错误或取伪错误。
8.7假设检验依据的基本原理是什么?答:假设检验依据的基本原理是“小概率原理”,即发生概率很小的随机事件在一次试验中是几乎不可能发生的。
根据这一原理,可以作出是否拒绝原假设的决定。
第10章思考题10.3方差分析包括哪些类型?它们有何区别?答:方差分析可分为单因素方差分析和双因素方差分析。
区别:单因素方差分析研究的是一个分类型自变量对一个数值型因变量的影响,而双因素涉及两个分类型自变量。
10.4方差分析中有哪些基本假定?答:方差分析中有三个基本假定:(1)每个总体都应服从正态分布(2)各个总体的方差σ2必须相同(3)观测值是独立的10.6解释因子与处理的含义。
答:在方差分析中,所要检验的对象称为因素或因子,因素的不同表现称为水平或处理。
10.7解释组内误差和组间误差的含义。
答:组内误差(SSE)是指每个水平或组的个样本数据与其组平均值误差的平方和,反映了每个样本各观测值的离散状况;组间误差(SSA)是指各组平均值X i与总平均值的误差平方和,反映各样本均值之间的差异程度。
10.9简述方差分析的基本步骤。
答:(1)提出假设(一般提法形式如下:H0:μ1=μ2=μ3=…=μi=….μk,自变量对因变量没有显著影响, H1:μi (i=1,2,3…..,k)不全相等,自变量对因变量有显著影响)(2)构造检验统计量(包括:计算各样本的均值,计算全部观测值的总均值,计算各误差平方和,计算统计量)(3)统计决策。
(将统计量的值F与给定的显著性水平α的临界值Fα进行比较,作出对原假设H0的决策)第13章思考题13.1简述时间序列的构成要素。
时间序列的构成要素:趋势,季节性,周期性,随机性13.2利用增长率分析时间序列时应注意哪些问题。
(1)当时间序列中的观察值出现0或负数时,不宜计算增长率;(2)不能单纯就增长率论增长率,要注意增长率与绝对水平的综合分析;大的增长率背后,其隐含的绝对值可能很小,小的增长率背后其隐含的绝对值可能很大。
13.3简述平稳序列和非平稳序列的含义。
1.平稳序列(stationary series)基本上不存在趋势的序列,各观察值基本上在某个固定的水平上波动或虽有波动,但并不存在某种规律,而其波动可以看成是随机的2.非平稳序列 (non-stationary series)是包含趋势、季节性或周期性的序列,它可能只含有其中的一种成分,也可能是几种成分的组合。
因此,非平稳序列又可以分为有趋势的序列、有趋势和季节性的序列、几种成分混合而成的复合型序列。
13.4简述时间序列的预测程序。
第一步:确定时间序列所包含的成分,也就是确定时间序列的类型。
第二步:找出适合此类时间序列的预测方法。
第三步:对可能的预测方法进行评估,以确定最佳预测方案。
第四步:利用最佳预测方案进行预测。
第十四章拉式公式:将权数的各变量值固定在基期。
帕式公式:把作为权数的变量值固定在报告期。
1.什么是指数体系?答:指数体系是指由总量指数及其若干个因素指数构成的数量关系式。
总量指数等于各因素指数的乘积总量的变动差额等于各因素指数变动差额之和两个因素指数中通常一个为数量指数,另一个为质量指数各因素指数的权数必须是不同时期的2.什么是加权综合指数体系?答:由加权综合指数及其各因素指数构成的等式。
比较常用的是基期权数加权的数量指数和报告期权数加权的质量指数形成的指数体系。