统计学复习资料解答
统计学复习题及答案
统计学复习题及答案1. 什么是统计学?答:统计学是一门应用数学,它涉及数据的收集、分析、解释、展示和预测。
2. 描述统计学和推断统计学有什么区别?答:描述统计学关注于数据的总结和描述,而推断统计学则使用样本数据来推断总体特征。
3. 列举三种常见的概率分布。
答:正态分布、二项分布和泊松分布。
4. 什么是中心极限定理?答:中心极限定理表明,当样本量足够大时,独立同分布的随机变量之和的分布将趋近于正态分布。
5. 什么是置信区间?答:置信区间是一个区间估计,它给出了总体参数的一个可能范围,并且该范围有一定的置信水平。
6. 解释什么是假设检验。
答:假设检验是一种统计方法,用于根据样本数据来判断一个关于总体的假设是否成立。
7. 什么是相关系数?答:相关系数是度量两个变量之间线性关系强度和方向的统计量。
8. 什么是回归分析?答:回归分析是一种统计方法,用于研究变量之间的关系,特别是一个或多个自变量对因变量的影响。
9. 什么是方差分析?答:方差分析是一种统计方法,用于比较三个或更多组数据的均值是否存在显著差异。
10. 什么是标准差?答:标准差是衡量数据分散程度的一个指标,它是方差的平方根。
11. 什么是均值?答:均值是一组数据的算术平均值,它是所有数据值的总和除以数据的数量。
12. 什么是中位数?答:中位数是一组数据的中间值,当数据按照大小顺序排列时,位于中间位置的数值。
13. 什么是众数?答:众数是一组数据中出现次数最多的数值。
14. 什么是样本?答:样本是从总体中抽取的一部分个体,用于代表总体进行研究。
15. 什么是总体?答:总体是指研究中所有可能的个体的集合。
16. 什么是抽样误差?答:抽样误差是指由于样本的随机性导致样本统计量与总体参数之间的差异。
17. 什么是系统误差?答:系统误差是由于测量或实验设计中的偏差导致的误差,它会导致测量结果持续地偏离真实值。
18. 什么是数据的正态性?答:数据的正态性指的是数据分布接近正态分布,即呈现出对称的钟形曲线。
《统计学》试题及答案
《统计学》试题及答案(解答仅供参考)第一套一、名词解释1. 样本:在统计学中,样本是从总体中抽取的一部分个体,用于推断总体的特性。
2. 概率:概率是描述随机事件发生可能性的数值,范围在0到1之间。
3. 中位数:在一个数据集中,将所有数据按照大小排序后位于中间位置的数值称为中位数。
4. 方差:方差是描述一组数据分散程度的统计量,是各个数据与其平均数离差平方的平均数。
5. 相关系数:相关系数是衡量两个变量之间线性关系强度和方向的统计指标,其值介于-1和1之间。
二、填空题1. 在统计学中,______是描述数据集中趋势的常用指标,包括平均数、中位数和众数。
答案:集中趋势2. 如果一个随机变量的所有可能取值出现的概率相等,则该随机变量服从______分布。
答案:均匀分布3. 在进行假设检验时,我们通常会设定______水平,以决定拒绝原假设的标准。
答案:显著性水平(或称alpha水平)4. ______是通过观察样本来估计总体参数的一种方法。
答案:抽样5. 在回归分析中,______表示因变量的变化中能被自变量解释的比例。
答案:判定系数(R^2)三、单项选择题1. 下列哪种图表最适合展示各分类变量的频数分布?()A. 条形图B. 折线图C. 散点图D. 直方图答案:A2. 当两个随机变量完全正相关时,相关系数为()。
A. 0B. 1C. -1D. 无法确定答案:B3. 下列哪个统计量可用于度量数据的离散程度?()A. 平均数B. 中位数C. 众数D. 标准差答案:D4. 在t检验中,如果p值小于0.05,我们可以()。
A. 接受原假设B. 拒绝原假设C. 不能确定D. 都可以答案:B5. 在线性回归模型中,如果某个自变量的系数为负,那么这个自变量与因变量的关系是()。
A. 正相关B. 负相关C. 无关D. 不确定答案:B四、多项选择题1. 下列哪些是描述性统计分析的主要内容?()A. 平均数B. 中位数C. 众数D. 方差E. 相关系数答案:A、B、C、D、E2. 下列哪些是常用的概率分布?()A. 正态分布B. 均匀分布C. 泊松分布D. 二项分布E. 卡方分布答案:A、B、C、D、E3. 统计学中,总体与样本的关系是:A. 总体是全部数据,样本是部分数据B. 总体是随机抽取的部分数据,样本是全部数据C. 总体是固定不变的,样本是可以变动的D. 总体是随机的,样本也是随机的答案:A、C、D4. 下列哪种情况适合使用卡方检验?()A. 检验两个分类变量之间是否存在关联性B. 比较两组样本的平均值是否有显著差异C. 研究一个连续变量是否符合正态分布D. 预测一个响应变量的未来值E. 分析一个因素对实验结果的影响答案:A5. 在进行线性回归分析时,以下哪些假设通常需要满足?()A. 因变量和自变量之间存在线性关系B. 自变量之间不存在多重共线性C. 残差服从正态分布D. 同一样本中的观测值是独立的E. 样本数据必须是完整的,不能有缺失值答案:A、B、C、D五、判断题1. 标准差越大,数据的离散程度越大。
统计学复习题与答案
统计学复习题与答案1. 什么是总体和样本?总体是指研究对象的全体,而样本是从总体中抽取的一部分个体。
样本的选取应具有代表性,以便能够通过样本来推断总体的特征。
答案:总体是指研究对象的全部个体,样本则是从总体中随机抽取的一部分个体。
总体和样本的关系是,样本是总体的子集,通过样本可以对总体进行推断。
2. 描述统计和推断统计有何区别?描述统计主要关注对数据的收集、整理和描述,目的是对数据集进行总结和描述。
推断统计则侧重于利用样本数据来推断总体的特征,包括估计总体参数和进行假设检验。
答案:描述统计学关注于数据的收集、整理、描述和展示,目的是对数据集进行总结。
而推断统计学则利用样本数据来推断总体的特征,包括参数估计和假设检验。
3. 什么是中心极限定理?中心极限定理指出,如果样本量足够大,那么样本均值的分布将近似正态分布,无论总体分布的形状如何。
答案:中心极限定理表明,对于足够大的样本量,样本均值的分布将趋向于正态分布,即使总体分布本身不是正态分布。
4. 什么是相关系数?它如何衡量变量之间的关系?相关系数是一个统计量,用于衡量两个变量之间线性关系的强度和方向。
其值介于-1和1之间,其中1表示完全正相关,-1表示完全负相关,0表示没有线性关系。
答案:相关系数是衡量两个变量之间线性关系强度和方向的统计量。
它的取值范围是-1到1,其中1代表完全正相关,-1代表完全负相关,0则表示没有线性关系。
5. 什么是回归分析?它在统计学中有何应用?回归分析是一种统计方法,用于研究一个或多个自变量对因变量的影响。
它广泛应用于预测、趋势分析和因果关系研究等领域。
答案:回归分析是研究一个或多个自变量与因变量之间关系的统计方法。
它在预测、趋势分析、因果关系研究等多个领域都有重要应用。
6. 如何理解假设检验中的零假设和备择假设?零假设(H0)通常表示没有效应或没有差异的假设,而备择假设(H1)则是研究者试图证明的假设。
进行假设检验的目的是确定是否有足够的证据拒绝零假设,以支持备择假设。
统计学复习题解答
《应用统计学》期末复习解答一、单选题1.统计总体的同质性是指( A )A.总体各单位具有某一共同的品质标志或数量标志B.总体各单位具有某一共同的品质标志属性或数量标志值C.总体各单位具有若干互不相同的品质标志或数量标志D.总体各单位具有若干互不相同的品质标志属性或数量标志值2.按某一标志分组的结果,表现出( A )A.组内同质性和组间差异性B.组内差异性和组间差异性C.组内同质性和组间同质性D.组内差异性和组间同质性3.设某地区有800家独立核算的工业企业,要研究这些企业的产品生产情况,总体是( D )A.全部工业企业B.800家工业企业C.每一件产品D.800家工业企业的全部工业产品4.统计调查的基本任务是取得原始统计资料,所谓原始统计资料是(C)A.统计部门掌握的资料B.对历史统计资料进行整理后取得的资料C.直接向调查单位进行登记取得的资料D.统计年鉴或统计公报上发布的资料5.已知两个同类企业的职工平均工资的标准差分别为10元和6元,而平均工资分别为3000元、3500元,则两个企业的工资离散程度为( A )A.甲大于乙B.乙大于甲C.两者相等D.无法判断6.一个连续性生产的工厂,为检验产品的质量,在一天中每隔1小时取5分钟的产品做检验,这种抽样方法属于( C )A.简单随机抽样B.整群抽样C.系统抽样D.分层抽样7.进行统计分组的关键是(B)A.划分各组组限B.正确选择分组标志C.确定各组组距D.计算各组组中值8.对一批进口商品的质量进行假设检验,在显著性水平为0.01时,原假设被拒绝;如果使用0.05的显著性水平,则原假设( A)A.一定会被拒绝B.可能会被拒绝C.一定会被接受D.必须重新假设检验 9.下列分组中按品质标志分组的是(B )A.人口按年龄分组B.产品按质量优劣分组C.企业按固定资产原值分组D.乡镇按工业产值分组 10.当一组数据属于右偏分布时,则(B ) A.平均数、中位数与众数是合而为一的 B.众数在左边,平均数在右边C.众数的数值较小,平均数的数值较大D.众数在右边,平均数在左边11.下列关于相关系数的陈述中哪一个是错误的( A ) A.数值越大说明两个变量之间的关系就越强B.仅仅是两个变量之间线性关系的一个度量,不能用于描述非线性关系C.只是两个变量之间线性关系的一个度量,不一定意味两个变量之间存在因果关系D.绝对值不会大于112.如果报告期商品价格计划降低5%,销售额计划增加10%,则销售量应增加( D ) A.15% B.5% C.5.25% D.15.79% 13.某橡胶厂生产汽车轮胎,根据历史资料统计结果,平均里程为25000公里,标准差为1900公里。
统计复习题及答案
统计复习题及答案1. 什么是统计学?统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。
2. 描述统计学和推断统计学的主要区别是什么?描述统计学关注于数据的组织、汇总和描述,而推断统计学则利用样本数据来推断总体特征。
3. 什么是总体和样本?总体是指研究对象的全部个体,样本则是从总体中抽取的一部分个体。
4. 什么是随机抽样?随机抽样是指每个样本单位被选中的概率相等的抽样方法。
5. 什么是变量?变量是可取不同值的量,通常用于描述数据集中的属性或特征。
6. 什么是参数和统计量?参数是总体的特征值,统计量则是样本的特征值。
7. 什么是频率分布?频率分布是将数据分组并计算每组中数据出现的次数。
8. 什么是正态分布?正态分布是一种连续概率分布,其形状呈钟形,也称为高斯分布。
9. 什么是中位数?中位数是将数据集从小到大排序后位于中间位置的数值。
10. 什么是众数?众数是数据集中出现次数最多的数值。
11. 什么是方差和标准差?方差是衡量数据分布离散程度的量,标准差则是方差的平方根。
12. 什么是相关系数?相关系数是衡量两个变量之间线性关系强度和方向的统计量。
13. 什么是回归分析?回归分析是一种统计方法,用于估计变量之间的关系,特别是一个因变量和一个或多个自变量之间的关系。
14. 什么是假设检验?假设检验是一种统计方法,用于根据样本数据对总体参数进行推断。
15. 什么是置信区间?置信区间是一个值的范围,在这个范围内,我们有特定置信水平认为总体参数会落在其中。
答案:1. 统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。
2. 描述统计学关注于数据的组织、汇总和描述,而推断统计学则利用样本数据来推断总体特征。
3. 总体是指研究对象的全部个体,样本则是从总体中抽取的一部分个体。
4. 随机抽样是指每个样本单位被选中的概率相等的抽样方法。
5. 变量是可取不同值的量,通常用于描述数据集中的属性或特征。
6. 参数是总体的特征值,统计量则是样本的特征值。
统计学复习资料解答
统计学复习资料解答统计学复习资料一、单项选择题1、一个统计总体( D )A、只能有一个标志;B、只能有一个指标;C、可以有多个标志;D、可以有多个指标。
2、调查某大学2000名学生学习情况,则总体单位是( C )A 、2000名学生;B、 2000名学生的学习成绩;C、每一名学生;D、每一名学生的学习成绩。
3、某地进行国有商业企业经营情况调查,则调查对象是( B )。
A、该地所有商业企业;B、该地所有国有商业企业;C、该地每一国有商业企业;D、该地每一商业企业。
4、以下哪种调查的报告单位与调查单位是一致的( C )。
A、工业普查;B、工业设备调查;C、职工调查;D、未安装设备调查。
5、某市进行工业企业生产设备普查,要求在7月1日至7月10日全部调查完毕,则这一时间规定是( B )。
A、调查时间;B、调查期限;C、标准时间;D、登记期限。
6、某连续变量分为5组:第一组为40——50,第二组为50——60,第三组为60——70,第四组为70——80,第五组为80以上,则( B )A、50在第一组,70在第四组;B、60在第三组,80在第五组;C、70在第四组,80在第五组;D、80在第四组,50在第二组。
7、已知某局所属12个工业企业的职工人数和工资总额,要求计算该局职工的平均工资,应该采用( A )A 、简单算术平均法;B 、加权算术平均法;C 、加权调和平均法;D 、几何平均法。
8、用水平法检查长期计划完成程度,应规定( B )A 、计划期初应达到的水平;B 、计划期末应达到的水平;C 、计划期中应达到的水平;D 、整个计划期应达到的水平。
9、某地区有10万人,共有80个医院。
平均每个医院要服务1250人,这个指标是( B )。
A 、平均指标;B 、强度相对指标;C 、总量指标;D 、发展水平指标。
10、时间序列中,每个指标数值可以相加的是( B )。
A 、相对数时间序列;B 、时期数列;C 、间断时点数列;D 、平均数时间序列。
统计学必考试题库及答案
统计学必考试题库及答案一、单项选择题1. 统计学是一门研究数据的科学,其主要研究内容包括数据的收集、处理、分析和解释。
()A. 正确B. 错误答案:A2. 描述统计学主要关注数据的收集和整理,而不涉及数据的推断。
()A. 正确B. 错误答案:B3. 在统计学中,总体是指研究对象的全部个体。
()A. 正确B. 错误答案:A4. 样本容量是指样本中包含的个体数量,它不能小于总体中的个体数量。
()A. 正确B. 错误答案:B5. 统计学中的参数是指用来描述总体特征的数值,而统计量则是用来描述样本特征的数值。
()A. 正确B. 错误答案:A二、多项选择题6. 以下哪些是统计学中常用的数据类型?()A. 定性数据B. 定量数据C. 时间序列数据D. 空间数据答案:ABCD7. 在统计分析中,以下哪些因素会影响样本的代表性?()A. 抽样方法B. 样本容量C. 总体的异质性D. 抽样误差答案:ABC8. 以下哪些统计图可以用来展示数据的分布情况?()A. 条形图B. 直方图C. 散点图D. 箱线图答案:BCD9. 以下哪些是统计学中常用的参数估计方法?()A. 点估计B. 区间估计C. 假设检验D. 方差分析答案:AB10. 以下哪些是统计学中常用的回归分析方法?()A. 简单线性回归B. 多元线性回归C. 逻辑回归D. 泊松回归答案:ABCD三、判断题11. 统计学中的抽样调查可以完全代替全面调查。
()答案:错误12. 统计学中的相关性意味着因果关系。
()答案:错误13. 在统计学中,中位数是不受极端值影响的中心趋势度量。
()答案:正确14. 统计学中的置信区间越宽,表示估计的精确度越高。
()答案:错误15. 统计学中的假设检验可以用来确定两个总体参数之间是否存在显著差异。
()答案:正确四、简答题16. 简述统计学中样本与总体的关系。
答案:样本是从总体中抽取的一部分个体,用于代表总体进行研究和分析。
样本的代表性和容量直接影响统计分析的结果和推断的准确性。
统计学简答题参考答案
统计学简答题参考答案第一章绪论1.什么是统计学怎样理解统计学与统计数据的关系答:统计学是一门收集、整理、显示和分析统计数据的科学;统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义;2.简要说明统计数据的来源;答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查;间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得;3.简要说明抽样误差和非抽样误差;答:统计调查误差可分为非抽样误差和抽样误差;非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的;抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的;4.解释描述统计和推断统计的概念P5答:描述统计是用图形、表格和概括性的数字对数据进行描述的统计方法; 推断统计是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法;第二章统计数据的描述1描述次数分配表的编制过程;答:分二个步骤:(1)按照统计研究的目的,将数据按分组标志进行分组;按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细;按数量标志进行分组,可分为单项式分组与组距式分组单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围区间作为一个组; 统计分组应遵循“不重不漏”原则(2)将数据分配到各个组,统计各组的次数,编制次数分配表;2. 一组数据的分布特征可以从哪几个方面进行测度答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度;常用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数;3.怎样理解均值在统计中的地位答:均值是对所有数据平均后计算的一般水平的代表值,数据信息提取得最充分,具有良好的数学性质,是数据误差相互抵消后的客观事物必然性数量特征的一种反映,在统计推断中显示出优良特性,由此均值在统计中起到非常重要的基础地位;受极端数值的影响是其使用时存在的问题;4. 简述众数、中位数和均值的特点和应用场合;答:众数、中位数和均值是分布集中趋势的三个主要测度,众数和中位数是从数据分布形状及位置角度来考虑的,而均值是对所有数据计算后得到的;众数容易计算,但不是总是存在,应用场合较少;中位数直观,不受极端数据的影响,但数据信息利用不够充分;均值数据提取的信息最充分,但受极端数据的影响;5.为什么要计算离散系数答:在比较二组数据的差异程度时,由于方差和标准差受变量值水平和计量单位的影响不能直接比较,由此需计算离散系数作为比较的指标;6.描述茎叶图和直方图,箱线图的画法,并说明它们的用途P41、42答:茎叶图将数据分为“茎”和“叶”两部分,绘制茎叶图的关键是设计好树茎,通常是以该组数据的高位数值作 为树茎,而且树叶上 只保留该数值的最后一个数字;通过茎叶图可以看出数据的分布形状及数据的离散状况; 直方图的绘制方法:在平面直角坐标系上,将分组标志作为横轴,并将各组次数作为纵轴,绘出的长方形图即直方图;通过直方图 可以看出数据的分配特征; 箱线图是由一个箱子和两条线段组成的;其绘制方法是:首先找出一组数据的五个特征值,即数据的最大值、最小值、中位数和两 个四分位数;然后连接两个四分位数画出箱子;再将两个极值点与箱子相连接;通过箱线图可以看出数据分布的特征;7.设计一张规范的统计表应该注意哪些问题答:1、统计表一般为横长方形,上下两端封闭且为粗线,左右两端开口; 2、统计表栏目多时要编号,一般主词部分按甲、乙、丙;宾词部分按12等次序编号; 3、统计表总标题应简明扼要,符合表的内容; 4、主词与宾词位置可互换;各栏排列次序应以时间先后、数量大小、空间位置等自然顺序编排; 5、计量单位一般写在表的右上方或总栏标题下方; 6、表内资料需要说明解释部分,如:注解、资料来源等,写在表的下方;7、填写数字资料不留空格,即在空格处划上斜线;统计表经审核后,制表人和填报单位应签名并盖章,以示负责;第三章 概率、概率分布与抽样分布1.解释总体分布、样本分布和抽样分布的含义答:总体分布指某个变量在总体中各个个体上的取值所形成的分布,它是未知的,是统计推断的对象;从总体中随机抽取容量为n 的样本()12,,,n x x x ,它的分布称为样本分布;由样本的某个函数所形成的统计量()12,,,n f x x x ,它的分布称为抽样分布如样本均值、样本方差的分布2.重复抽样与不重复抽样相比,抽样均值抽样分布的标准差有什么不同答:重复抽样和不重复抽样下,样本均值的标准差分别为:因此不重复抽样下的标准差小于重复抽样下的标准差,两者相差一个调整系数3.解释中心极限定理的含义答:在抽样推断中,中心极限定理指出,不论总体服从何种分布,只要其数学期望和方差存在,对总体进行重复抽样时,当样本容量充分大,样本均值趋近于正态分布;中心极限定理为均值的抽样推断奠定了理论基础;4.简述系统抽样组织方式组织实施的基本步骤P98答:在抽样中先将总体各单位按某种顺序排列,并按某种规则确定一个随机起点,然后,每隔一定的间隔抽取一个单位,直至抽取n 个 单位形成一个样本;5.整群抽样的优缺点是什么P98答:整群抽样的优点:可以简化抽样框的编制;样本单元比较集中,实施调查便利,且能节约费用; 整群抽样的缺点:当群内具有一定的相似性,而不同群之间的差别比较大时,相同样本量下整群抽样的抽样效率比简单随机抽样差 ,抽样误差较大;6.什么是必要的样本容量,其影响因素有哪些答:是指一个样本的必要抽样单位数目;在组织抽样调查时,抽样误差的大小直接影响样本指标代表性的大小,而必要的样本单位数目是保证抽样误差不超过某一给定范围的重要因素之一影响因素:1 研究对象的变化程度;2 所要求或允许的误差大小即精度要求;3 要求推断的置信程度;也就是说,当所研究的现象越复杂,差异越大时,样本量要求越大;当要求的精度越高,可推断性要求越高时,样本量越大;第四章 参数估计1.简述评价估计量好坏的标准答:评价估计量好坏的标准主要有:无偏性、有效性和相合性;设总体参数θ的估计量有1ˆθ和2ˆθ,如果()1ˆE θθ=,称1ˆθ是无偏估计量;如果1ˆθ和2ˆθ是无偏估计量,且()1ˆD θ小于()2ˆD θ,则1ˆθ比2ˆθ更有效;如果当样本容量n →∞,1ˆθθ→,则1ˆθ是相合估计量; 2.简述样本容量与置信水平、总体方差、允许误差的关系答:以估计总体均值时样本容量的确定公式为例:()22/22z n E ασ= 样本容量与置信水平成正比、与总体方差成正比、与允许误差成反比;第五章 假设检验1.理解原假设与备择假设的含义,并归纳常见的几种建立原假设与备择假设的原则. 答:原假设通常是研究者想收集证据予以反对的假设;而备择假设通常是研究者想收集证据予以支持的假设;建立两个假设的原则有:1原假设和备择假设是一个完备事件组;2一般先确定备择假设;再确定原假设;3等号“=”总是放在原假设上;4假设的确定带有一定的主观色彩;5假设检验的目的主要是收集证据来拒绝原假设;2.第一类错误和第二类错误分别是指什么它们发生的概率大小之间存在怎样的关系 答:第I 类错误指,当原假设为真时,作出拒绝原假设所犯的错误,其概率为α;第II 类错误指当原假设为假时,作出接受原假设所犯的错误,其概率为β;在其他条件不变时,α增大,β减小;β增大,α减小;3.什么是显着性水平它对于假设检验决策的意义是什么答:假设检验中犯第一类错误的概率被称为显着性水平;显着性水平通常是人们事先给出的一个值,用于检验结果的可靠性度量,但确定了显着性水平等于控制了犯第一错误的概率,但犯第二类错误的概率却是不确定的,因此作出“拒绝原假设”的结论,其可靠性是确定的,但作出“不拒绝原假设”的结论,其可靠性是难以控制的;4.什么是p 值p 值检验和统计量检验有什么不同答:p 值是当原假设为真时,检验统计量小于或等于根据实际观测样本数据计算得到的检验统计量值的概率;P 值常常作为观察到的数据与原假设不一致程度的度量;统计量检验采用事先确定显着性水平α,来控制犯第一类错误的上限,p 值可以有效地补充α提供地关于检验可靠性的有限信息;p 值检验的优点在于,它提供了更多的信息,让人们可以选择一定的水平来评估结果是否具有统计上的显着性;5.什么是统计上的显着性答:一项检验在统计上是显着的拒绝原假设,是指这样的样本结果不是偶然得到的,或者说,不是靠机遇能够得到的;显着性的意义在于“非偶然的;第七章 相关与回归分析1.相关分析与回归分析的区别与联系是什么答:相关与回归分析是研究变量之间不确定性统计关系的重要方法,相关分析主要是判断两个或两个以上变量之间是否存在相关关系,并分析变量间相关关系的形态和程度;回归分析主要是对存在相关关系的现象间数量变化的规律性作出测度;但它们在研究目的和对变量的处理上有明显区别;它们均是统计方法,不能揭示现象之间的本质关系;2.什么是总体回归函数和样本回归函数它们之间的区别是什么答:以简单线性回归模型为例,总体回归函数是总体因变量的条件期望表现为自变量的函数:()()i i i E Y X f X X αβ==+,或i i i Y X u αβ=++;总体回归函数是确定的和未知的,是回归分析所估计的对象;样本回归函数是根据样本数据所估计出的因变量与自变量之间的函数关系:ˆˆˆi i y x αβ=+或ˆˆi i iy x e αβ=++;回归分析的目的是用样本回归函数来估计总体回归函数;它们的区别在于,总体回归函数是未知但是确定的,而样本回归函数是随样本波动而变化;总体回归函数的参数,αβ是确定的,而样本回归函数的系数ˆˆ,αβ是随机变量;总体回归函数中的误差项i u 不可观察的,而样本回归函数中的残差项i e 是可以观察的;3. 什么是随机误差项和残差它们之间的区别是什么答:随机误差项i u 表示自变量之外其他变量的对因变量产生的影响,是不可观察的,通常要对其给出一定的假设;残差项i e 指因变量实际观察值与样本回归函数计算的估计值之间的偏差,是可以观测的;它们的区别在于,反映的含义是不同且可观察性也不同,它们的联系可有下式:4.为什么在对参数进行最小二乘估计时,要对模型提出一些基本的假定答:最小二乘法只是寻找估计量的一种方法,其寻找到的估计量是否具有良好的性质则依赖模型的一些基本的假定;只有在一系列的经典假定下,最小二乘估计量才是BLUE;5. 为什么在多元回归中要对可决系数进行修正答:在样本容量一定下,随着模型中自变量个数的增加,可决系数2R 会随之增加,模型的拟合程度上升,但自由度会损失,从而降低推断的精度,因此需要用自由度来修正可决系数,用修正的可决系数来判断增加自变量的合适性;6.在多元线性回归中,对参数作了t 检验后为什么还要作方差分析和F 检验答:t 检验仅是对单个系数的显着性进行检验,由于自变量之间存在着较为复杂的关系,因此有必要对回归系数进行整体检验,方差分析和F 检验就是对回归方程的整体统计显着性进行的检验方法;7.函数关系与相关关系有何不同答:1函数关系指变量之间的关系是确定的,而相关关系的两变量的关系则是不确定的;可以在一定范围内变动;2函数关系变 量之间的依存可以用一定的方程y=fx 表现出来,可以给定自变量来推算因变量,而相关关系则不能用一定的方程表示;函数关 系是相关关系的特例,即函数关系是完全的相关关系,相关关系是不完全的相关关系;8.什么是标准差和标准误差,两者有和差别答:标准差作为随机误差 的代表,是随机误差绝对值的统计均值;在抽样试验或重复的等精度测量 中, 常用到样本平均数的标准差,亦称样本平均数的标准误或简称标准误; 区别:标准差是表示个体间变异大小的指标,反映了整个样本对样本平均数的离散程度,是数据精密度的衡量指标;而标准误反映样本平均数对总体平均数的变异程度,从而反映抽样误差的大小 ,是量度结果精密度的指标;第八章时间序列分析与预测1.从要素分解的角度,时间序列可分解成哪四个要素答:一个时间序列通常由4种要素组成:趋势、季节变动、循环波动和不规则波动;趋势:是时间序列在长时期内呈现出来的持续向上或持续向下的变动;季节变动:是时间序列在一年内重复出现的周期性波动;它是诸如气候条件、生产条件、节假日或人们的风俗习惯等各种因素影响的结果;循环波动:是时间序列呈现出得非固定长度的周期性变动;循环波动的周期可能会持续一段时间,但与趋势不同,它不是朝着单一方向的持续变动,而是涨落相同的交替波动;不规则波动:是时间序列中除去趋势、季节变动和周期波动之后的随机波动;不规则波动通常总是夹杂在时间序列中,致使时间序列产生一种波浪形或震荡式的变动;只含有随机波动的序列也称为平稳序列;2.什么是季节变动测定季节变动的“趋势—循环”剔除法的基本步骤和原理是什么答:季节变动是指客观现象因受自然因素或社会因素的影响,而形成的在一年内有规则的周期性变动;P275 步骤和原理:①求出原数列中的趋势值或趋势-循环值;②以原数列各项数值分别除以其对应的趋势值或趋势-循环值,目的是为了剔除数列中的趋势或趋势-循环因素③将剔除趋势或趋势-循环因素的数据,求其各年同期月或季的平均数,并使其平均为1得到季节比率④调整季节比率P277.3.测定季节变动的“原始资料平均法”的基本步骤和原理是什么答:A基本步骤1计算各年同期的平均数,为了消除各年同季数据的不规则变动2,计算全部数据的总平均数,找出整个数列的水平趋势3 计算季节指数B原理是不考虑长期趋势影响,根据原始数据直接计算季节指数测定季节变动4.为什么平均发展速度要用几何平均法计算,计算平均发展速度的几何平均法的特点是什么答:现象发展的平均速度,一般用几何平均法计算;平均速度是总速度的平均,但现象发展的总速度不等于各年发展速度之和,而等于各年环比发展速度的连乘积,所以求平均发展速度要用几何平均法; 几何平均法的实质是要求从最初水平出发,按所求的平均发展速度发展,计算出的末期水平应等于实际末期水平,这种方法可以只根据最初水平与最末水平计算而不考虑中间水平的变化,其侧重点在于考虑最末一期发展水平;5.时间序列有哪些速度分析指标他们之间的关系是什么答:发展速度:报告期发展水平与基期发展水平之比,用于描述现象在观察期内的发展变化程度增长速度:也称增长率,是增长量与基期水平之比,用于描述现象的相对增长程度;按照采用基期的不同,增长速度可分为定基增长速度与环比增长速度,两者之间没有直接的换算关系,在由环比增长速度推算定基增长速度时,可先将各环比增长速度加1后连乘,再将结果减1,即得定基增长速度平均发展速度:各个时期环比发展速度的平均数,用于描述现象在整个观察期内平均发展变化的程度平均增长速度平均增长率:用于描述现象在整个观察期内平均增长变化的程度,它通常用平均发展速度减1来求得第九章统计指数1.同度量因素固定的固定的一般原则答:在编制数量指标指数时,用质量指标指数作为同度量因素,并把这个同度量因素固定在基期;在编制质量指标指数时,用数量指标做同度量因素,并且把这个同度量因素,并且把这个同度量因素固定在报告期;2.同度量因素的作用答:不仅起着同度量的作用;同时还起着对指标“加权”的作用3.拉氏指数与帕氏指数同度量因素固定的原则答:拉氏指数:以基期的质量指标作为同度量因素帕氏指数:以报告期的数量指标作为同度量因素4.指数体系的概念,用公式写出指数体系的两个涵义相对数与绝对数涵义,指数体系有何作用P305答:广义的指数体系类似于指标体系的概念,泛指由若干个内容上相互关联的统计指数所结成的体系;狭义的指数体系仅指几个指数在一定的经济基础上所结成的较为严密的数量关系式;相对指标:相对指标又称相对数,是用两个有联系的指标进行对比的比值来反映社会经济现象数量特征和数量关系的综合指标;公式:相对数=总体中某一部分数值/总体全部数值X100%绝对指标:统计中常用的总量指标就是绝对数;它是反映客观现象总体在一定时间、地点条件下的总规模、总水平的综合指标;公式:相对数=比较数值比数/ 基础数值基数作用:①因素分析,即分析现象的总变动中各有关因素的影响程度;②指数推算,即根据已知的指数推算未知的指数。
学期末统计学简答答案
复习题1.什么是统计学?为什么统计学可以通过对数据的分析达到对事物性质的认识?答:(1)统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据内在的数量规律性。
(2)这是由客观事物本身的特点和统计方法的特性共同决定的。
a.从客观事物方面来说,根据辩证法的基本原理,任何客观事物都是必然性与偶然性的对立统一。
同样,任何一个数据,也都是必然性与偶然性共同作用的结果,是二者作用的对立统一。
b.从统计方法来看,统计学提供了一系列的方法,专门用来收集数据、整理数据、显示数据的特征,进而分析和探索(或推断)出事物总体的数量规律性。
2.解释总体与样本、参数和统计量的含义。
总体是我们所要研究的所有基本单位的总和。
样本是总体的一部分单位。
描述总体或概率分布的数量值称为参数。
统计量是对样本数据特征的数量描述。
3.解释总体分布、样本分布和抽样分布的含义。
答:(1)总体分布:整体取值的概率分布规律,通常称为总体分布。
(2)样本分布:从总体中抽取容量为n的样本,得到n个样本观测值的概率分布,则为样本分布。
(3)抽样分布:就是由样本n个观察值计算的统计量的概率分布。
4.简述描述统计学和推断统计学的概念及其联系。
描述统计学是研究如何取得、加工整理和显示数据资料,进而通过综合、概括与分析得出反映客观现象的规律性数量特征的科学。
推断统计学是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对总体未知的数量特征做出以概率论为基础的推断和估计。
联系:描述统计学和推断统计学是现代统计学的两个组成部分,相辅相成、缺一不可。
描述统计学是现代统计学的基础和前提,推断统计学是现代统计学的核心和关键。
5.简述中心极限定理。
从均值为μ、方差为σ2的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n≥30),样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。
6.解释置信水平、置信区间、显著性水平的含义,它们有什么联系。
统计学发给学生复习题(含答案)
1.只能归于某一类别的非数字型数据,称为()。
A.顺序数据 B.分类数据 C.数值型数据 D.比例数据2.人们对某件事情的“满意度”是()。
A.分类数据 B.顺序数据 C.数值型数据 D.相对数据3.下列数据中层次最高、也最精确的数据是()。
A.分类数据 B.顺序数据 C.数值型数据 D.调查数据4.一个学生的统计课考试成绩是90分,则“成绩”是()。
A.分类变量 B.顺序变量 C.数值型变量 D.品质变量5.变量值可以做无限分割的变量,称为()。
A.离散型变量 B.连续型变量 C.随机变量 D.平均变量1.B 2.B 3.C 4.C 5.B6.普查之所以要规定统一的标准调查时间,是为了( )A.避免调查数据的重复或遗漏B.使数据更全面C.使数据更及时D.使数据更大7.通过观察与实验取得统计数据时,常常采用( )A.访问调查B.观察法C.电脑辅助调查D.问卷调查8.确定调查对象是为了解决( )A.为什么要调查B.调查范围C.调查什么D.调查时间9.问卷调查中,提问项目的设计,应注意( )A一项提问可包含几项内容B.注意敏感性问题提问C.用词要确切、通俗D.时间10.我们国家和地方政府部门统计数据主要来源于( )A.普查B.抽样调查C.统计报表D.典型调查6.A7.B8.B9.C 10.C11.________ =频数÷组距,它能准确反映频数分布的实际情况。
A.组中值B.组数C.频数密度D.频率密度12.对连续型变量分组,相邻组的组限必须()。
A.重叠B.间断C.相等D.相离13.将某地区100个工厂按产值多少分组而编制的频数分布中,频数是()。
A.各组的产值数B.各组的工人数 C.各组的工厂数 D.各组职工人数14.某管理局对其所属企业的生产计划完成百分比采用如下分组,指出哪项是正确的。
()A.80%~90% 90%~99% 100%~109% 110%以上B.80%以下 90%~100% 89%~100% 100%~110%C.90%以下 90%~100% 100%~110 110%以上D.90% 90%~105% 100%~110 115%以上15.频数分布中,靠近中间的变量值分布的频数少,靠近两端的变量值分布频数多,这种分布的类型是()。
统计学复习题和答案
统计学复习题和答案1. 什么是总体和样本?它们之间有什么区别?2. 解释什么是参数估计,并给出一个例子。
3. 描述中心趋势的度量方法,并解释它们的适用场景。
4. 什么是标准差?它在数据分析中的作用是什么?5. 什么是正态分布?它的特点是什么?6. 解释什么是假设检验,并给出一个实际应用的例子。
7. 什么是相关系数?它如何帮助我们理解变量之间的关系?8. 描述线性回归分析的基本原理,并解释其在实际问题中的应用。
9. 什么是置信区间?它在统计推断中的作用是什么?10. 解释什么是样本量,为什么样本量的大小会影响研究结果的可靠性?答案1. 总体是指研究中所有可能的观察对象的集合,而样本是从总体中随机抽取的一部分观察对象。
总体通常很大,而样本是总体的一个代表性子集。
2. 参数估计是指使用样本统计量来估计总体参数的过程。
例如,使用样本均值来估计总体均值。
3. 中心趋势的度量方法包括均值、中位数和众数。
均值适用于数据分布对称的情况,中位数适用于数据分布不对称或包含异常值的情况,众数用于描述数据中出现频率最高的值。
4. 标准差是衡量数据分布离散程度的一个指标,它表示数据点与均值的平均距离。
标准差越大,数据的波动性越大。
5. 正态分布是一种连续概率分布,其特点是数据分布呈对称的钟形曲线,均值、中位数和众数三者相等。
6. 假设检验是一种统计方法,用于确定样本数据是否足以支持或反对某个关于总体的假设。
例如,检验一个新药是否比现有药物更有效。
7. 相关系数是衡量两个变量之间线性关系强度和方向的统计量。
它的值范围在-1到1之间,值越接近1或-1,表示变量之间的关系越强。
8. 线性回归分析是一种用于预测一个变量(因变量)与一个或多个其他变量(自变量)之间线性关系的统计方法。
它在经济、社会科学和生物统计学等领域有广泛应用。
9. 置信区间是一个范围,表示在给定的置信水平下,总体参数可能的取值范围。
它在统计推断中用于表达对总体参数估计的不确定性。
统计学原理期末复习资料(题目及答案)
统计学原理期末复习资料汇总一、考试题型单选:12%,每小题2分,共12分,见平时作业手册;多选:8%,每小题2分,共8分,见平时作业手册;判断:10%,每小题2分,共10分,见平时作业手册;简答题:20%,每小题10分,共20分;计算题:50%考试时间:90分钟,闭卷,可以带计算器二、简答题1、举例说明统计标志与标志表现有何不同?答:标志是总体中各单位所共同具有的某特征或属性,即标志是说明总体单位属性和特征的名称。
标志表现是标志特征在各单位的具体表现,是标志的实际体现者。
例如:工人的“工资”是标志,而工资为“1200”分,则是标志表现。
2、一个完整的统计调查方案包括哪些内容?答:一个完整的统计调查方案包括发下主要内容:(1)确定调查目的;(2)确定调查对象和调查单位;(3)确定调查项目,拟定调查表;(4)确定调查时间和时限;(5)确定调查的组织和实施计划.3、简述调查对象、调查单位与填报单位的关系并举例说明。
答:调查对象即统计总体,是根据调查目的所确定的研究事物的全体.统计总体这一概念在统计调查阶段称调查对象。
调查单位也就是总体单位,它是调查对象的组成要素,即调查对象所包含的具体单位.报告单位也成填报单位,也是调查对象的组成要素,它是提交调查资料的单位,一般是基层企事业组织。
调查单位是调查资料的直接承担者,报告单位是调查资料的提交者,二者有时一致,有时不一致。
例如对工业企业进行全部设备调查时,工业企业的全部设备是调查对象,每台设备是调查单位,而每个工业企业则是填报单位。
4、某地区对占该地区工业增加值三分之二的10个企业进行调查,你认为这种调查方式是重点调查还是典型调查?为什么?答:首先,从该题内容可知该地区对工业企业进行的是一种非全面调查;第二,非全面调查包括抽样调查、重点调查额典型调查。
这三种非全面调查的主要区别是选择调查单位的方法不同,抽样调查是按随机原则抽选单位,重点调查是根据单位标志总量占总体标志总量的比重来确定调查单位,而典型调查时依据对总体的分析,有意识地选取调查单位.因此,根据本题选择调查单位的方法可判断出该地区对工业企业进行调查,采用的是典型调查方式。
统计学复习题及答案
统计学复习题及答案统计学是一门研究数据收集、分析、解释、展示和预测的科学。
以下是一些统计学的复习题及答案,以帮助学生更好地准备考试。
一、选择题1. 以下哪项不是描述性统计的内容?A. 均值B. 中位数C. 众数D. 相关性答案:D2. 标准差是衡量数据的:A. 集中趋势B. 离散程度C. 正态分布D. 样本大小答案:B3. 以下哪个不是假设检验的类型?A. 单尾检验B. 双尾检验C. 方差分析D. 相关性检验答案:C二、填空题4. 总体是指研究对象的________,样本是总体中所抽取的一部分个体。
答案:全部5. 一个变量的方差是衡量该变量数据的________。
答案:离散程度6. 正态分布的特点是数据集中在________,两端较少。
答案:均值附近三、简答题7. 描述什么是中心极限定理,并简述其在实际应用中的重要性。
答案:中心极限定理指出,大量独立同分布的随机变量之和,在样本量足够大时,其分布接近正态分布,无论原始分布是什么。
这一定理在实际应用中非常重要,因为它允许我们使用正态分布的性质来近似其他分布的总体均值的分布,从而简化了统计分析。
8. 解释什么是置信区间,并说明它在统计推断中的作用。
答案:置信区间是一个范围,用来估计总体参数的值。
它基于样本统计量,给出了一个区间,使得在多次重复抽样的情况下,该区间以一定的概率包含总体参数的真实值。
置信区间在统计推断中的作用是提供对总体参数估计的不确定性的量化,帮助我们理解估计的可靠性。
四、计算题9. 假设有一个样本数据集:2, 4, 6, 8, 10。
计算这组数据的均值、中位数和标准差。
答案:均值 = (2+4+6+8+10)/5 = 6;中位数 = 6;标准差 =sqrt(((2-6)^2 + (4-6)^2 + (6-6)^2 + (8-6)^2 + (10-6)^2)/5) = 2.83(保留两位小数)10. 如果进行一个假设检验,检验一个样本均值是否显著不同于总体均值,给定样本均值为10,样本标准差为2,样本大小为25,总体均值的假设值为8,使用0.05的显著性水平。
《统计学》复习题及答案
《统计学》复习题及答案《统计学》复习题一、单选题1.某城市展开工业企业未加装设备普查,个体就是(b)a.工业企业全部未安装设备b.工业企业每一台未安装设备c.每个工业企业的未安装设备d.每一个工业企业2.工业企业的设备数,产品产值是(a)a.连续变量b.离散变量c.前者就是连续变量,后者就是线性变量d.前者就是线性变量,后者就是连续变量3.对某班学生按年龄分为16-18岁、19-21岁、22-24岁三组,则24岁就是(a)a.最大值b.组中值c.第三组的下限d.第三组的组中值4.一个组的下限与上限之差称作(d)a.组中值b.组数c.全距d.组距5.连续变量数列中,其末组与开口组,上限就是1000,相连组的组中值为975,则末组的组中值为(d)a.987.5b.1000c.1025d.10506.在建筑业设备普查中,每个建筑企业是(b)a.调查对象b.投档单位c.调查单位d.调查项目7.向上总计次数则表示截至至某一组年才(a)a.上限以下的累计次数b.下限以上的累计次数c.各组分布的次数d.各组分布的频率8.一组样本数据为3、3、1、5、13、12、11、9、7。
这组与数据的中位数就是(d)a.3b.13c.7.1d.79.算术平均数、众数和中位数之间的数量关系同意于总体次数的原产状况。
在等距的钟形原产中(a)a.算术平均数=中位数=众数b.算术平均数>中位数>众数c.算术平均数算术平均数.>众数10.用不能考量顺序的不能重复样本方法,从8个人中抽取3个人,税金样本可能将数目的公式为(b)8!8!(8?3?1)!3a.3!(8?3)!b.8c.(8?3)!d.3!(8?3)!11.某同学的英语成绩为80分后,则“成绩”就是(a)a.品质标志b.数量标志c.标志值d.数量指标12.了解某地区工业企业职工的情况,下列哪个是统计指标(c)a.该地区每名职工的工资额b.该地区职工的文化程度c.该地区职工的工资总额d.该地区职工从事的工种13.对于统计分组设计,下列哪种说法是错误的(b)a.分组时各组之间界限要明确,不允许重叠和交叉b.总体中的每一个单位,不都应只属于其中的一个组c.分组时,不能出现有任何一个单位无组可归的情况d.分组方案中,拟定的所有组一定要能够包容总体的所有单位14.随着总体范围的扩大,据以计算的质量指标数值(d)a.一定增大b.肯定不变c.一定增大d.和总体范围不断扩大并无轻易关系15.对某市全部商业企业职工的生活状况进行调查,调查对象是(b)a.该市全部商业企业b.该市全部商业企业职工c.该市每一个商业企业d.该市商业企业的每一名职工16.下列调查中,调查单位与填报单位一致的是(d)a.企业设备调查b.人口普查c.农村耕畜调查d.工业企业现状调查17.某连续变量分成五组:第一组为40―50,第二组为50―60,第三组为60―70,第四组为70―80,第五组为80以上,依习惯上规定(b)a.50在第一组,70在第四组b.60在第二组,80在第五组c.70在第四组,80在第五组d.80在第四组,50在第二组18.次数分布有朝数量大的一边偏尾,曲线高峰偏向数量小的方向,该分布曲线属于(d)a.正态分布曲线b.j型原产曲线c.右偏原产曲线d.左偏原产曲线19.某地区有10万人口,共80个商业网点,平均每个商业网点要服务1250人,这个指标是(a)a.平均指标b.强度相对指标c.总量指标d.发展水平20.将对照的基数抽象化为10,则计算出来的相对数称作(d)a.倍数b.百分数c.系数d.成数二、多选题1.下列属于连续变量的是(ace)a.厂房面积b.职工人数c.原材料库存量d.设备数量e.产值2.下列各项中,属于品质标志分组的有(ab)a.职工按性别分组b.工人按工种分组c.职工按工龄分组d.企业按利润额分组e.企业按经济类型分组3.统计分组的主要作用有(abcd)a.研究总体内部各个组成部分之间的相互关系b.研究总体的内部结构c.叙述相互关联的统计数据变量之间的依存关系d.描述统计变量的原产情况e.根据研究目的挑选分组标志4.某市为了解本年年末的煤炭库存情况,特别向各单位颁发调查表要求填报,这种调查属于(bcd)a.统计数据报表制度b.普查c.专门调查d.经常性调查e.一次性调查5.在统计上,通常使用的频率分布图主要有(acd)a.直方图b.图表c.折线图d.曲线图6.从均值为200、标准差为50的总体中,抽取一个容量为100的简单随机样本,则有(bd)a.样本均值的期望值就是2b.样本均值的期望值就是200c.样本均值的标准差就是5d.样本的均值的标准差就是507.直观随机抽样根据采样的方式相同分成(ae)a.重复样本b.等距样本c.整群样本d.分层抽样e.不重复样本8.影响组距数列分布的要素有(bcd)a.组类b.组限c.组距d.组中值e.组数据9.分布在各组的总体单位数称为(ae)a.次数b.频率c.比率d.次数密度e.频数10.以下属数值平均数的存有(abd)a.算术平均数b.调和平均数c.中位数d.几何平均数e.众数11.以下关于确认组限的观点中恰当的就是(abc)a.无法把相同性质的单位分割在一个组b.尽量让组中值同分到组内各单位的标志值的平均数接近c.有重叠组限与非重叠组限之分d.重合组限的含义就是下限在本组内,上限无此本组内e.当资料中有特大、特小异常值时,可相应采取开口组的形式,开口组不存在组中值12.在全国工业普查中,每个工业企业就是(bde)a.调查总体b.调查单位c.调查对象d.报告单位e.总体单位13.统计调查表的形式有(ad)a.单一表中b.直观表中c.分组表中d.一览表e.无机分组表中14.对于组距数列以下各项表述正确的有(abcde)a.最小组上限必须高于最轻变量值b.最小组下限必须低于最小变量值c.组的确认必须有助于整体表现总体原产规律d.连续变量相连组限通常必须重合e.线性变量相连组限通常必须间断15.以下属时点指标的存有(ae)a.某地区人口数b.某地区死亡人口数c.某地区出生人口数d.某地区生产总值e.某地区的学校数16.以下指标中属平均指标的存有(bc)a.人均国民收入b.人口平均年龄c.粮食亩产量d.人口密度e.人口自然增长率17.等距样本按样本单位提取的方法相同分成(bce)a.毫无关系标志等距样本b.随机起点等距样本c.中点等距抽样d.有关标志等距抽样e.对称等距抽样18.当现象全然有关时:(bc)a.r=0b.r=?1c.r=1d.r=0.5e.r=?0.519.测量现象之间有没有有关关系的方法存有(abc)a.编制相关表b.绘制相关图c.对客观现象做定性分析d.排序估算标准误e.协调重回直线20.根据连续五年的历史资料计算得到各季的季节比率为(abcde)a.120%b.80%c.50%d.140%e.150%三、名词解释1.统计数据指标体系:统计指标体系是指若干个相互联系的统计指标所构成的总体,用以说明被研究现象各个方面相互依存和相互制约的关系,从不同角度、不同侧面全面反映研究对象的总体状况。
《统计学》复习资料精选全文完整版
可编辑修改精选全文完整版《统计学》复习资料一、单项选择题1.对某城市工业企业未安装设备进行普查,则个体是( )。
A.工业企业全部未安装设备B.工业企业每一台未安装设备C.每个工业企业的未安装设备D.每一个工业企业2.工业企业的设备台数、产品产值是( )。
A.连续变量B.离散变量C.前者是连续变量,后者是离散变量D.前者是离散变量,后者是连续变量3.调查几个重要铁路枢纽,就可以了解我国铁路货运量的基本情况和问题,这种调查属于( )。
A.普查B.重点调查C.典型调查D.抽样调查4.统计分组的结果表现为()A.组内的差异性和组间的同质性B.组内的同质性和组间的差异性C.组内的差异性和组间的差异性D.组内的同质性和组间的同质性5.对百货商店工作人员进行普查,调查对象是()A.所有的百货商店B.每一个百货商店C.各百货商店的全体工作人员D.每一位工作人员6.对一批商品进行质量检验,最适宜采用的方法是( )。
A.全面调查B.抽样调查C.典型调查D.重点调查7.在分组时,凡遇到某单位的标志值刚好等于相邻两组上下限数值时,一般是( )。
A.将此值归入上限所在组B.将此值归入下限所在组C.此值归入两组均可D.另立一组8.在总量指标中,其数值受时期长短影响的指标是()A.实物指标B.价值指标C.时期指标D.时点指标9.计划规定单位产品成本应比上年降低5%,实际降低了3%,则单位产品成本计划完成程度为( ) A.97.94% B.8% C.2% D.102.11%10.反映社会经济现象发展总规模、总水平的综合指标是( )。
A.质量指标B.总量指标C.相对指标D.平均指标11.采用加权算术平均计算时,当各组的权数都增加1倍时,平均数( ) A.不变 B.增加1倍C.是原来的一半D.无法判断12.我国人口中,男女人口的性别比为 106:100,这是( )。
A.比例相对指标B.比较相对指标C.强度相对指标D.平均指标 13.在出生婴儿中,男婴比重53%,女婴比重47%,这两个指标是( ) A.比例相对数 B.强度相对数 C.结构相对数D.比较相对数14.序时平均数中的“首尾折半法”适用于计算( ) A.时期数列的资料B.间隔相等的间断的时点数列的资料C.间隔不等的时点数列的资料D.由两个时期数列构成的相对数动态数列资料15.动态数列中的发展水平( )A.只能是总量指标B.只能是相对指标C.只能是平均指标D.上述三种指标均可以16.已知各环比增长速度分别为5%、8%、6%和10%,则相应的定基增长速度计算方法() A. 105%×108%×106%×110%B.(105%×108%×106%×110%)-100%C.(5%×8%×6%×10%)-100%D.5%+8%+6%+10%17.编制数量指标综合指数时,其同度量因素最好固定在( ) A.报告期 B.计划期 C.基期D.任一时期18.按综合指数变形的要求,采用加权调和平均数指数形式编制质量指标总指数时,其权数应该是( )A.11pq B.01p q C.10p q D.00p q19.设p 为商品价格,q 为销售量,则指数∑∑010qp qp 的实际意义是综合反映( )A.商品销售额的变动程度B.商品价格变动对销售额的影响程度C.商品销售量变动对销售额的影响程度D.商品价格和销售量变动对销售额的影响程度20.某企业的产值,2013年比2012年增长21%,其原因是() A.产品价格上升9%,产量增长了12% B.产品价格上升10%,产量增长了11% C.产品价格上升10.5%,产量增长了10.5% D.产品价格上升了10%,产量增长了10%21.某省教育主管部门要了解所属高校教学设备的使用状况,则统计研究的总体单位是() A.该省每一所高校B.该省全部高校的全部设备C.该省每一所高校的每一台设备D.该省每一所高校的每一台教学设备22.次数分布中的频数愈大,该组的标志值对总体平均水平所起的作用() A.愈大B.愈小C.可能大,也可能小D.无法确定23.在同一变量数列中,组距的大小与组数的多少之间的关系是() A.成正比 B.成反比 C.不确定D.无关24.下列关于标志变异指标的说法正确的是() A.反映现象总体的一般水平 B.反映现象总体的集中程度C.反映现象总体的联系程度D.反映现象总体各单位标志值分布的差异程度25.是非标志的标准差为() A.1-p B.pq C.)p 1(p -D.p (1-p)26.定基发展速度等于() A.环比发展速度之和 B.环比发展速度之积 C.环比增长速度之和 D.环比增长速度之积 27.1011q p q p ∑-∑表明() A.由于销售量变化对销售额的影响 B.由于价格变化对销售量的影响 C.由于价格变化对销售额的影响D.由于销售量变化对价格的影响 28.编制数量指标综合指数的一般原则是() A.采用基期的数量指标作为同度量因素 B.采用基期的质量指标作为同度量因素C.采用报告期的数量指标作为同度量因素D.采用报告期的质量指标作为同度量因素29.若两数列平均水平不同,在比较两数列离散程度时,应采用()A.全距B.平均差C.标准差D.标准差系数30.累计增长量等于()A.报告期水平与基期水平之差B.报告期水平与前一期水平之差C.报告期水平与某一固定基期水平之差D.逐期增长量之差31.工业企业的设备台数和利润额( )A.均是连续型变量B.均是离散型变量C.前者是连续型变量,后者是离散型变量D.前者是离散型变量,后者是连续型变量32.下列属于全面调查的是( )A.对一批产品质量进行抽检B.对工业设备的普查C.对某市工业企业进行典型调查D.调查几大彩电厂商,借此了解全国彩电的生产情况33.统计分组是根据统计研究的目的和任务,将总体按照一个或几个分组标志分成( )A.性质相同的若干部分B.性质不同的若干部分C.数量相同的若干部分D.数量不同的若干部分34.在出生婴儿中,男婴比重53%,女婴比重47%,这两个指标是( )A.比例相对数B.强度相对数C.结构相对数D.比较相对数35.在下列平均数中,不.受.极端数值影响的是( )A.中位数B.调和平均数C.几何平均数D.算术平均数36.增长速度的计算公式是( )A.增长速度=增长量/报告期水平B.增长速度=增长量/基期水平C.增长速度=增长量/平均水平D.增长速度=增长量/最末水平37.根据个体价格指数和报告期销售额计算的价格总指数是( )A.固定构成指数B.可变构成指数C.加权调和平均指数D.加权算术平均指数38.抽样调查应遵循的基本原则是( ) A.随机原则B.准确性原则C.系统原则D.及时性原则39.统计指数按其所反映的指标性质不同可分为( ) A.个体指数和总指数 B.数量指标指数和质量指标指数 C.综合指数和平均数指数 D.算术平均数指数和调和平均数指数40.某企业2003年比2002年产量增长了10%,产值增长了20%,则产品的价格提高了( ) A.10% B.30% C.100% D.9.09% 二、多项选择题1. 我国统计调查的方法有( )A.统计报表B.普查C.抽样调查D.重点调查E.典型调查 2.时期指标的特点有( )A.只能间断计数B.数值大小与时期长短有关C.具有可加性D.不具有可加性E.数值大小与间隔长短无关 3.已知各时期的环比发展速度,便能计算出()A.平均发展速度B.平均增长速度C.平均增长量D.平均发展水平E.定基发展速度4.对某商店某时期商品销售额变动情况分析,其指数体系包括 ( ) A.销售量指数 B.销售价格指数 C.总平均价格指数 D.销售额指数 E.个体指数5.受两极端值影响的平均数有() A.算术平均数 B.调和平均数C.几何平均数D.众数E.中位数 6.加权算术平均数的数学性质是( ) A.0)X X (=-∑B.)X X (-∑f=0C.)X X (-∑为最小D.2)X X (-∑为最小E.2)X X (-∑f 为最小7.关于趋势直线方程,bt a yˆt +=下列表述正确的有( ) A.a 是t 等于零时的趋势值 B.b 是趋势线在y 轴上的截距 C.b 是趋势线的斜率D.b表示时间t变动一个单位时,趋势值t yˆ平均变动的数量E.当b前面是负号时,说明y t与t是负相关8.常用的统计调查方法有()A.普查B.抽样调查C.统计报表D.典型调查E.重点调查9.用综合指数形式计算的价格总指数,所能够反映的是()A.价格的总体变动情况B.销售额的总体变动情况C.销售量的总体变动情况D.价格水平固定时的销售额变动情况E.销售量水平固定时的销售额变动情况10.时期数列的特点是()A.指标数值具有可加性B.指标数值不能直接相加C.指标数值通过连续登记加总取得D.指标数值只能间断计量E.指标数值的大小与时间长短有直接关系三、简答题1.简述统计的三种含义。
统计学简答题及参考答案
统计学简答题及参考答案1、简述统计的概念以及统计研究对象的特征。
答:统计是人们认识客观世界总体数量变动关系和变动规律的活动的总称。
统计研究对象具有数量性、总体性与变异性的特征。
2、什么是统计总体和总体单位?答:(1)统计总体就是根据一定目的确定的所要研究的事物的全体。
它是由客观存在的,具有某种共同性质的许多个别事物构成的整体。
(2)组成总体的各个个体是总体单位。
总体各单位的具体表现有差别。
3、简述品质标志与数量标志的区别。
答:品质标志表明单位属性方面的特征,品质标志的表现只能用文字、语言来描述,无法量化。
(1)概念不同。
标志是说明总体单位属性的,一般不具有综合的特征;指标是说明总体综合数量特征的,具有综合的性质。
(2)统计指标都可以用数量来表示;标志中,数量标志可以用数量来表示,品质标志只能用文字表示。
(1)统计指标的指标值是由各单位的标志值汇总或计算得来的;(2)随着研究目的不同,指标与标志之间可以相互转化。
5、简述时点指标与时期指标的特点。
答:时期指标的特点:(1)可加性;(2)指标值的大小与所属时间的长短有直接关系;(3)指标值采用连续统计的方式获得。
时点指标的特点:(1)不可加性;(2)指标数值的大小与时点间隔的长短一般没有直接关系;(3)指标值采用间断统计的方式获得。
6、抽样调查有哪些特点?答:抽样调查的特点有:(1)按随机原则抽取样本答:凡是反映现象的总规模、总水平的统计指标都称为数量指标,用绝对数来表示;凡是反映现象相对水平和工作质量的统计指标都称为质量指标,用相对数或平均数来表示。
9、统计调查方案主要包括哪些内容?答:统计调查方案主要包括以下内容:(1)确定调查的目的(2)确定调查对象和调查单位(3)确定调查项目(4)调查表格和问卷的设计(5)确定调查时间(6)确定调查组织实施计划10、什么叫统计分组?统计分组可以分为哪几类?统计分组应遵循什么原则答:统计分组就是根据统计研究的目的和客观对象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组,就称为统计分组。
大学统计学简答题复习及答案
习题一总论1.简述统计总体和总体单位的含义及其关系。
统计总体(简称总体)是指统计所研究的事物的全体,它是由客观存在的具有某种共同性质的许多个别事物组成的集合体.总体单位是指构成统计总体的个别事物,是组成总体的基本单位,简称个体。
统计总体和总体单位所指的具体内容不是固定不变的,而是随着研究的目的不同而变化的。
总体可以变为总体单位,总体单位可以变为总体。
2.什么是指标和标志?指标与标志的关系如何?指标即统计指标,指反映统计总体综合数量特征的概念和数值.标志指说明总体单位特征的名称.指标与标志的区别:①指标是说明总体特征的,而标志是说明总体单位特征的;②所有指标都能用数值表示,而标志中的数量标志能用数值表示,品质标志却通常不能用数值表示。
指标与标志的联系:①指标是对总体中各单位标志表现进行综合的结果,有许多统计指标其数值是由数量标志值汇总而来的,品质标志本身虽无数值,但许多指标却是按品质标志分组计算出来的.②指标和数量标志之间存在着变换关系,由于研究目的的变化,原来的总体变成总体单位,则相对应的统计指标就变成数量标志;反之,则相对应的数量标志就变成了统计指标。
习题二统计调查1.完整的统计调查方案应包括哪些主要内容?应包括:①确定调查目的;②确定调查对象和调查单位;③确定调查内容,拟订调查表;④确定调查时间和调查期限;⑤确定调查的组织和实施计划。
2.调查对象、调查单位和填报单位有何区别?调查对象是指根据调查目的确定的需要进行调查研究的现象总体,它是由性质相同的许多个别单位组成的。
调查单位是指调查对象中所要调查的具体单位,它是进行登记的标志的承担者;报告单位也叫填报单位,它是提交调查资料的单位,它与调查单位有时一致,有时不一致。
3.重点调查与典型调查的区别是什么?主要区别表现在两个方面:①典型单位和重点单位性质不同。
典型调查强调被选单位在同类社会经济现象中所具有的代表性、典型性,是有意识地选取的;而重点调查则强调被选单位某标志值在总体标志值总和中所占的比重较大,是客观存在的。
统计学期末复习题及答案
【统计学复习资料】(一)一、单选题1、构成统计总体的个别事物称为(C )。
A.调查总体 B.调查单位 C.总体单位 D.标志值2、某市工业企业2007年生产经营成果年报呈报时间规定在2008年1月31日,则调查期限为( B )。
A、一日B、一个月C、一年D、一年零一个月3、全面调查和非全面调查的划分依据是( B )。
A、调查组织规模的大小B、调查对象所包括的单位是否完全C、最后取得的调查资料是否全面D、调查时间是否连续4、直接反映总体规模大小的指标是( A )。
A、总量指标B、相对指标C、平均指标D、变异指标5、抽样误差是指( C )A、调查中所产生的登记性误差 B 调查中所产生的系统性误差C、随机的代表性误差 D 计算过程中产生的误差6.计算结构相对指标时,总体各部分数值与总体数值的对比求得的比重之和( C ).A.小于100%B.大于100%C.等于100%D.小于或大于100%7、物价上涨后,同样多的人民币只能购买原有商品的80%,则物价上涨了(A )A 25% B20% C23% D125%8.反映总体标志差异程度大小的指标是( D ).A.总量指标B.相对指标C.平均指标D.变异指标9.对某市工业企业未安装设备进行普查,调查对象是( C )A 各工业企业B 一个工业企业C 各种未安装设备D 一台安装设备10、重点调查中的重点单位是指(D )A 这些单位是工作中的重点B 这些单位在全局工作中处于重要位置C 这些单位的单位数量占总体单位数量的很大比重D 这些单位的标志值在标志总量中占有很大比重11、下列哪个属于数量指标( D )A 劳动生产率B 废品率C 成本利润率D 上缴利润额12、经常性调查要随着被研究对象的变化,连续不断的进行登记以取得资料,下述调查中属于经常性调查的是( D)A 每隔若干年进行一次工业普查B 对2001级毕业生就业状况的调查C 对近年来物价变动情况进行一次摸底D 按旬上报钢铁产量13、某企业的某月产品销售额为20万元,月末库存商品为30万元,这两个总量指标是( C )A时期指标 B时点指标 C前者为时期指标,后者为时点指标 D前者为时点指标,后者为时期指标14、在分组时,凡遇到某单位的标志值刚好等于相邻两组上下限数值时,一般是( B ).A.将此值归入上限所在组B. 将此值归入下限所在组C. 将此值归入两组均可D.另立一组15、说明现象在较长时期内发展的总速度的指标是( C )。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学复习资料
一、单项选择题
1、一个统计总体( D )
A、只能有一个标志;
B、只能有一个指标;
C、可以有多个标志;
D、可以有多个指标。
2、调查某大学2000名学生学习情况,则总体单位是( C )
A 、2000名学生;B、 2000名学生的学习成绩;
C、每一名学生;
D、每一名学生的学习成绩。
3、某地进行国有商业企业经营情况调查,则调查对象是( B )。
A、该地所有商业企业;
B、该地所有国有商业企业;
C、该地每一国有商业企业;
D、该地每一商业企业。
4、以下哪种调查的报告单位与调查单位是一致的( C )。
A、工业普查;
B、工业设备调查;
C、职工调查;
D、未安装设备调查。
5、某市进行工业企业生产设备普查,要求在7月1日至7月10日全部调查完毕,则这一时间规定是( B )。
A、调查时间;
B、调查期限;
C、标准时间;
D、登记期限。
6、某连续变量分为5组:第一组为40——50,第二组为50——60,第三组为60——70,第四组为70——80,第五组为80以上,则( B )
A、50在第一组,70在第四组;
B、60在第三组,80在第五组;
C、70在第四组,80在第五组;
D、80在第四组,50在第二组。
7、已知某局所属12个工业企业的职工人数和工资总额,要求计算该局职工的平均工资,应该采用( A )
A、简单算术平均法;
B、加权算术平均法;
C、加权调和平均法;
D、几何平均法。
8、用水平法检查长期计划完成程度,应规定( B )
A、计划期初应达到的水平;
B、计划期末应达到的水平;
C、计划期中应达到的水平;
D、整个计划期应达到的水平。
9、某地区有10万人,共有80个医院。
平均每个医院要服务1250人,这个指标是( B )。
A、平均指标;
B、强度相对指标;
C、总量指标;
D、发展水平指标。
10、时间序列中,每个指标数值可以相加的是( B )。
A、相对数时间序列;
B、时期数列;
C、间断时点数列;
D、平均数时间序列。
11、根据时间序列用最小平方法配合二次曲线,所依据的样本资料的特点是( B )。
A 、时间序列中各期的逐期增长量大体相等;
B 、各期的二级增长量大体相等;
C 、各期的环比发展速度大体相等;
D 、各期同比增长量的大体相。
12、红星机械厂计划规定,今年甲产品的单位产品成本比去年降低4%,实际执行的结果降低了5%,则该产品单位成本降低计划完成程度的算式为( C )。
A 、%4%5 ; B 、%104%105; C 、%96%
95;D 、%4%5 。
13、在回归分析中,要求两变量 ( B )
A 、都是随机变量;
B 、自变量是确定性变量,因变量是随机变量;
C 、都是确定性变量;
D 、因变量是确定性变量,自变量是随机变量。
14、无偏性是指( A )
A 、抽样指标的平均数等于被估计的总体指标;
B 、当样本容量n 充分大时,样本指标充分靠近总体指标;
C 、随着n 的无限增大,样本指标与未知的总体指标之间的离差任意小的可能性趋于实际必然性。
D 、作为估计量的方差比其他估计量的方差小
15、在一定的抽样平均误差条件下 ( A )
A 、扩大极限误差范围,可以提高推断的可靠程度;
B 、扩大极限误差范围,会降低推断的可靠程度;
C 、缩小极限误差范围,可以提高推断的可靠程度;
D 、缩小极限误差范围,不改变推断的可靠程度。
二、多项选择题
1、下列各项中属于品质标志的有( ACD )。
A 、性别;
B 、年龄;
C 、职务;
D 、民族;
E 、工资。
2、从表式上看,统计表由哪些部分构成( ACDE )。
A 、总标题;
B 、主词;
C 、纵栏标题;
D 、横行标题;
E 、指标数值
3、在相对数中,子项和母项可以互换位置的有( BC )。
A .结构相对数;
B .比例相对数;
C .比较相对数;
D .动态相对数。
E .计划完成相对数
4、下列统计指标属于总量指标的是( ABCDE )
A 、工资总额;
B 、商业网点密度;
C 、商品库存量;
D 、人均国内生产总值;
E 、进出口总额。
5、定基增长速度等于( ADE )。
A.定基发展速度-1;
B.环比发展速度的连乘积;
C.环比增长速度的连乘积;
D.环比增长速度加1后的连乘积再减1;
E.定基增长量除以最初水平。
6、某企业为了分析本厂生产的两种产品产量的变动情况,已计算出产量指数为118.6%,这一指数是( ABD )。
A .综合指数;
B .总指数;
C .个体指数;
D .数量指标指数;
E .质量指标指数。
7、影响抽样误差的因素有( CD )。
A 、是有限总体还是无限总体;
B 、是平均数还是成数;
C 、是重复抽样还是不重复抽样;
D 、总体标志变异程度大小;
E 、以上答案都对。
8、统计指标和统计标志是不同的,下面属于统计指标的是( AVDE )。
A 、某地区人口的性别比例;
B 、某人的性别;
C 、一台完好的设备;
D 、设备完好率;
E 、平均身高
9、下列指标中属于时点指标的有( ABD )。
A 、企业数;
B 、在册职工人数;
C 、某种商品的销售量;
D 、某地区2004年人口数;
E 、某种产品的产量。
10、影响抽样平均误差的因素有( ACDE )。
A 、总体标志变异程度;
B 、样本容量;
C 、抽样组织形式;
D 、抽样方法;
E 、样本指标值的大小。
三、判断题
( √ )1、分层抽样和整群抽样都需要事先按某一标志对总体进行划分的随机抽样。
( √ )2、参数估计就是用样本统计量去估计总体的参数。
( )3、不存在趋势的时间序列称为平稳时间序列。
( )4、相关系数为0表明两个变量之间不存在任何关系。
( )5、广义地讲,任何两个数值对比形成的相对数都可以称为指数。
( )6、11、在假设检验中,如果检验统计量的P 值小于给定的显著性水平则在做决策时,需要在显著性水平的情况下,接受原假设。
( )7、抽样分布是指样本统计量的概率分布。
( )8.欲对一批成品合格率进行抽样调查,前不久曾经进行的两次全面调查,合格率分别为p 1=90%,p 2=80%,根据p 1计算样本容量。
( )9.当相关系数r 为正时,回归系数b 一定为正。
( )10.甲产品产量与单位成本的相关系数是-0.89。
乙产品单位成本与利润率的相关系数是-0.93。
因此,甲比乙的相关程度高。
四、问答题
1、统计指标的概念
2、普查的组织原则
3、统计分组的核心
4、相对指标的作用
5、变异指标的作用
6、动态数列的作用
7、统计指数的作用
8、相关关系的种类
五、计算题
1、一个电视节目主持人想了解观众对某个电视专题的喜欢程度,他选取了500个观众作样本(重复抽样),结果发现喜欢该节目的有175人。
(1)试以95%的概率估计观众喜欢这一专题节目的区间范围。
(2)若该节目主持人希望估计
,问有多大把握程度?
2、2014年某月甲、乙两市场某商品价格、销售量和销售额资料如下:
试分别计算该商品在两个市场上的平均价格。
4、已知:279,30268,1481y xy ===∑∑∑∑∑2n=6 ,x=21 , y=426 , x 要求:(1)计算变量x 与变量y 间的相关系数;(2)建立变量y 倚变量x 变化的直线回归方程。
(要求写出公式和计算过程,结果保留四位小数。
)
5、已知:279,30268,1481y xy ===∑∑∑∑∑2n=6 ,x=21 , y=426 , x 要求:(1)计算变量x 与变量y 间的相关系数;(2)建立变量y 倚变量x 变化的直线回归方程。
(要求写出公式和计算过程,结果保留四位小数。
)
六、结合实际谈谈学习本门课程的感悟。