《应用统计学》模拟考试题及参考答案(全)
应用统计试题及答案

应用统计试题及答案一、单项选择题(每题2分,共20分)1. 统计学中,用来描述数据集中趋势的量数是()。
A. 方差B. 标准差C. 平均数D. 中位数答案:C2. 在统计学中,一组数据的离散程度可以通过()来衡量。
A. 平均数B. 方差C. 众数D. 极差答案:B3. 以下哪个不是描述数据分布形状的统计量?()A. 偏度B. 峰度C. 平均数D. 标准差答案:C4. 抽样调查中,样本容量的大小对估计的准确性()。
A. 没有影响B. 有正向影响C. 有负向影响D. 影响不确定答案:B5. 以下哪个统计图最适合展示变量间的关系?()A. 条形图B. 折线图C. 散点图D. 饼图答案:C6. 假设检验中,拒绝原假设意味着()。
A. 原假设一定错误B. 有充分证据表明原假设不成立C. 有充分证据表明原假设成立D. 无法确定原假设是否成立答案:B7. 以下哪个统计量不是度量数据的离散程度?()A. 极差B. 方差C. 标准差D. 众数答案:D8. 相关系数的取值范围是()。
A. (-∞, ∞)B. (-1, 1)C. [0, 1)D. (0, ∞)答案:B9. 回归分析中,用于衡量自变量对因变量解释程度的统计量是()。
A. 相关系数B. 回归系数C. 决定系数D. 残差答案:C10. 在方差分析中,F统计量用于检验()。
A. 总体均值是否相等B. 样本均值是否相等C. 总体方差是否相等D. 样本方差是否相等答案:A二、多项选择题(每题3分,共15分)1. 以下哪些是描述数据分布中心的统计量?()A. 平均数B. 中位数C. 众数D. 极差E. 方差答案:ABC2. 以下哪些是描述数据分布形状的统计量?()A. 偏度B. 峰度C. 平均数D. 标准差E. 极差答案:AB3. 以下哪些是描述数据离散程度的统计量?()A. 平均数B. 方差C. 标准差D. 众数E. 极差答案:BCE4. 以下哪些是假设检验的步骤?()A. 建立假设B. 收集数据C. 计算检验统计量D. 确定显著性水平E. 做出决策答案:ABCDE5. 以下哪些是回归分析中常用的诊断方法?()A. 残差图B. 方差膨胀因子C. 相关系数D. 决定系数E. 多重共线性检验答案:ABE三、简答题(每题5分,共10分)1. 请简述什么是置信区间,并说明它在统计推断中的作用。
《应用统计学》模拟考试题参考标准答案

《应用统计学》模拟考试题参考答案————————————————————————————————作者:————————————————————————————————日期:应用统计学模拟考试题答案得分评阅人一、判断题(共10小题,每小题1分,共10分)请在你认为正确的题号前的括号内划“√”,在你认为错误的题号前的括号内划“×”。
(√)1、在统计调查中,抽样调查因为诸多优点而最经常被采用。
(√)2、按照计量尺度的差异,可以将统计数据分为分类数据、顺序数据和数值型数据三类。
(×)3、抽样误差是抽样调查中可以设法消除的误差。
(×)4、在假设检验中,如果所计算的P值越小,说明检验结果越不显著。
(√)5、不存在趋势的时间序列称为平稳时间序列。
(√)6、拉氏物价指数是以基期的商品交易量作为同度量因素加权的。
(√)7、展示时间序列数据的最佳图形是线图。
(√)8、统计表主要由表头、行标题、列标题、数字资料和表外附加五部分组成。
(×)9、多数情况下,t分布是一个右偏分布。
(×)10、平均数、中位数、众数等都是用来衡量数据离散趋势的。
得分评阅人二、单选题(共10小题,每小题1分,共10分)请将唯一的正确答案选项写在题号前的括号内。
( A)11、下列变量中属于数值型变量的是A、汽车轮胎的直径B、汽车的内燃机类型C、产品等级D、学生生源类别(C)12、以下各种抽样方式中一定属于非随机抽样的方式是:A、简单随机抽样B、等距抽样C、重点抽样D、类型抽样(C )13、下列图形中不能展示分类数据的图是:A、条形图B、饼图C、直方图D、环状图(B)14、经验数据表明某电话订票点每小时接到订票电话的数目X是服从常数为120的泊松分布,请问该订票点每10分钟内接到订票电话数目Y的分布类型是:A、正态分布B、泊松分布C、二项分布D、超几何分布(D)15、下列有关统计分组的一些说法中,错误的是:A、统计分组是指按照某些重要标志把总体分成若干部分的科学分类B、数值型数据的分组的组数主要取决于数据的全距和组距的大小C、统计分组的目的是为了展现总体的内部结构或分布规律D、统计分组只能按照一个标志单独进行(C)16、下面有关相关关系的一些说法错误的是:A、相关关系是一种普遍存在的关系B、简单相关系数是用来定量描述变量之间线性相关程度的C、简单相关系数为零时,说明两个变量之间不存在任何关系D、简单相关系数绝对值越大,两个变量之间的相关程度越密切(B)17、已知一组数据为10,8,7,3,5,6,8,请问这组数据的中位数为 A、8 B、7 C、6.5 D、10(B)18、某样本数据的方差是36,均值是10,则该组数据的离散系数是:A、3.60B、0.60C、1.67D、0.28(D)19、下列有关参数估计的说法错误的是A、参数估计就是利用样本统计量的值来对总体的参数进行估计B、参数估计有点估计和区间估计等形式C、区间估计必须有相应的置信度作为保证D、区间估计的宽度越大说明估计的精确度越高(C)20、下列有关时间序列的说法错误的是:A、长期趋势是指指标值随时间变化呈现出持续的上升或下降的变动B、循环波动是一种周期性变动C、季节变动是指周期为一年上的周期性变动D、不规则变动是没有特定规律的随机变动得分评阅人三、填空题(共10空,每空1分,共10分)21、在假设检验中,如果检验统计量的P值大于给定的显著性水平α,则在做决策时,需要在显著性水平α的情况下,___不能拒绝_原假设。
应用统计学考试和答案

应用统计学考试和答案一、单项选择题(每题2分,共20分)1. 以下哪个选项是描述性统计学的主要任务?A. 建立统计模型B. 推断总体参数C. 描述数据特征D. 预测未来趋势答案:C2. 在统计学中,总体是指:A. 研究对象的全部个体B. 研究对象的样本C. 研究对象的子集D. 研究对象的随机变量答案:A3. 以下哪个选项是统计学中的离散型随机变量?A. 身高B. 体重C. 年龄D. 班级人数答案:D4. 以下哪个选项是统计学中的连续型随机变量?A. 班级人数B. 考试分数C. 家庭收入D. 学生人数答案:C5. 以下哪个选项是统计学中的参数?A. 样本均值B. 样本方差C. 总体均值D. 总体方差答案:C6. 以下哪个选项是统计学中的统计量?A. 总体均值B. 总体方差C. 样本均值D. 样本方差答案:C7. 以下哪个选项是统计学中的抽样误差?A. 样本均值与总体均值的差异B. 样本方差与总体方差的差异C. 样本均值与样本均值的差异D. 样本方差与样本方差的差异答案:A8. 以下哪个选项是统计学中的置信区间?A. 总体均值的估计区间B. 总体方差的估计区间C. 样本均值的估计区间D. 样本方差的估计区间答案:A9. 以下哪个选项是统计学中的假设检验?A. 检验总体均值是否等于某个值B. 检验总体方差是否等于某个值C. 检验样本均值是否等于某个值D. 检验样本方差是否等于某个值答案:A10. 以下哪个选项是统计学中的回归分析?A. 研究两个变量之间的关系B. 研究三个变量之间的关系C. 研究一个变量与多个变量之间的关系D. 研究多个变量与多个变量之间的关系答案:A二、多项选择题(每题3分,共15分)11. 以下哪些选项是统计学中的中心趋势度量?A. 均值B. 中位数C. 众数D. 方差答案:ABC12. 以下哪些选项是统计学中的离散程度度量?A. 极差B. 方差C. 标准差D. 变异系数答案:ABCD13. 以下哪些选项是统计学中的相关系数?A. 皮尔逊相关系数B. 斯皮尔曼等级相关系数C. 肯德尔等级相关系数D. 协方差答案:ABC14. 以下哪些选项是统计学中的假设检验类型?A. 单尾检验B. 双尾检验C. 方差分析D. 卡方检验答案:ABCD15. 以下哪些选项是统计学中的回归分析类型?A. 简单线性回归B. 多元线性回归C. 非线性回归D. 逻辑回归答案:ABCD三、判断题(每题2分,共20分)16. 描述性统计学和推断性统计学是统计学的两个主要分支。
应用统计学模拟试卷和答案

应用统计学模拟试卷和答案一. 单项选择题(10%, 每小题1分)1、某工人月工资500元,则“工资”是()。
A、数量标志B、品质标志C、质量指标D、数量指标2、现对某企业生产设备的运转情况进行统计调查,则()。
A、调查对象是企业B、调查对象是该企业的全部设备运转情况C、调查对象是该企业每一台设备运转情况D、调查单位是该企业的每一台设备3、某市组织一次物价大检查,要求12月15日至12月30日全部调查完毕,这一调查时间规定的是()。
A、调查时间B、调查期限C、标准时间D、登记时间4、统计表中的主词是指()。
A、表中全部统计资料的内容B、描述研究对象的指标C、各种指标所描述的研究对象D、分布在各栏中的指标数值5、将不同地区、部门、单位之间同类指标进行对比所得的综合指标称为()。
A、动态相对指标B、结构相对指标C、比例相对指标D、比较相对指标6、权数的最根本作用体现在()的变动上。
A、次数B、标志值C、比重D、标志值和次数7、两个总体的平均数不等,但标准差相等,则()。
A、小平均数的代表性大B、大平均数的代表性大C、两个平均数代表性相同D、无法判断代表性大小8、年劳动生产率x(千元)和工人工资y(元)之间的回归方程为y = 10 + 70x,这意味着年劳动生产率每提高1千元,工人工资平均()。
A、增加70元B、减少70元C、增加80元D、减少80元9、变量间相关程度越低,则相关系数的数值( )。
A、越小B、越接近于0C、越接近于– 1D、越接近于110、产品产量报告期比基期增长25%,单位产品成本减少20%,则生产总成本()。
A、增长5%B、增长20%C、减少80%D、没有变动二. 填空题(20%, 每小题1分)1、根据标志的表现不同,可把标志分为两种,其中,(1)是用数值来表现总体单位数量特征的标志,其表现的具体数值称为(2)。
2、按调查登记时间的连续性不同,统计调查分为(3)和(4)两种3、统计调查搜集资料的方法主要有(5)法、(6)法、(7)法和(8)法。
应用统计学模拟试卷及答案

二、单项选择题(每题2分,共30分)1~5:ACBCA 6~10: DCDBC 11~15: BACDD三、计算题(每题15分,共60分) 1、(1)第二种排队时间的平均数:(3分)第二种排队时间的标准差: (3分)(2)1112221.970.277.20.6730.0967x x συσυ======(6分)由于12υυ〉,所以,第一种排队方式的离散程度大于第二种排队方式。
选第二种排队方式,因为其排队的平均等待时间短,且排队时间较为稳定。
(3分) 2、118098.33%12001450103.57%1400118014502630101.15%120014002600======+====+实际进货数(1)第一季度进货计划完成程度(5分)计划进货数实际进货数第二季度进货计划完成程度(5分)计划进货数上半年实际进货数(2)上半年计划完成程度(5分)上半年计划进货数3、4'312071682213526843723(1)2286.2()5(37231207)629()143723(2)132.52%12071132.52%132.52%(3)20228664.38b G G G a a n b n x x x ++++===∆-===-===-=-=⨯=∑年平均发展水平亿元年平均增长水平为:亿元(5分)年平均发展速度(5分)年的销售额应为:3723132.52%亿元。
(5分),8,3.9745 53.94a ytt = =-(2分)4分)(2分)(3分)年开始,。
应用统计学---模拟试题与答案(六)

综合测试题(六)一、单项选择题(每题1.5分,共18分)1、商品销售是是()A、质量指标B、数量指标C、品质标志D、数量标志2、对某社区5000名居民的生活状况进行调查,其总体是()。
A、5000名居民B、每名居民C、每个居民收入D、每个居民生活支出3、某市为了掌握流动人口情况,拟对该市几个流动人口较集中的地区进行调查,这种调查的组织方式是()A、重点调查B、典型调查C、普查D、抽样调查4、全国人口普查,其调查单位是()A、各街乡单位B、各社区单位C、全部人口D、每个城乡居民5、分配数列各组标志值都减少,每组次数都增加1倍,中位数()A、减少B、增加1倍C、增加2倍D、不变6、下列的平均数属于位置平均数的是()A、众数和中位数B、算术平均数C、调和平均数D、几何平均数7、动态数列中各个指标数值不具有可加性的是()A、时点数列B、时期数列C、时期指标D、时期绝对数指标8、相对数动态数列中的各个指标都是()A、绝对数B、相对数C、平均数D、序时平均数9、大数定律证明,随着样本容量n的增加,抽样平均数x()。
A.有远离总体平均数的趋扫势 B.与总体平均数若即若离C.有接近于总体平均数的趋势 D.的数值的固定的10、相关关系是现象间确实存在的,但相关关系数值是()的相关依存关系。
A.不完全确定B.可以确定C.不确定D.无法确定=5元,=6元,则两个企业职工平均工11、已知两个同类型企业职工平均工资的标准差分别为:资的代表性是()A、甲大于乙B、乙大于甲C、一样的D、无法判断12、由组距数列计算算术平均数时,用组中值代表组内变量的一般水平,有一个假定条件,即()A、各组的次数必须相等B、各组变量值必须相等C、各组变量值在本组内呈均匀分布D、各组必须是封闭组二、多项选择题(每题2 分,共12分)1、几何平均数的计算应满足的条件是()A、若干个比率的乘积等于总比率B、若干个比率之和等于总比率C、若干个速度相乘结果是总速度D、相乘的各比率必须是正数E、相乘的各速度不能为负数2、指出下列动态数列属于平均数动态数列的有()A、城乡居民人均粮食产量动态数列B、平均每平方公里人口数动态数列C、劳动生产率动态数列D、产品单位成本动态数列E、职工平均工资动态数列3、用综合指数形式计算的商品销售价格指数,表明了()A、商品销售量的变动幅度B、销售的商品销售品种的变动C、商品销售价格的变动程度D、商品销售价格的变动趋向E、销售价格变动对销售额产生的影响4、平均指数的权数在形式上较灵活,可以采用()为权数。
应用统计学---模拟试题与答案(二)

综合测试题(二)一、单项选择题(每题1.5分,共18分)1、统计指标按其计量单位不同可分为()A、实物指示和价值指标B、数量指标和质量指标C、时点指标和时期指标D、客观指标和主观指标2、2000年北京市三次产业比重分别是3.7%、38.0%和58.3%,这些指标是()A、动态相对指标B、强度相对指标C、平均指标D、结构相对指标3、分配数列各组标志值,每组次数增加15%,加权算术平均数的数值()A、减少15%B、增加15%C、不变化D、判断不出4、与数量指标综合指数对应的平均数指数形式是()。
A、 B、 C、 D、5、抽样平均误差公式不重置抽样相比,多了一个修正系数()。
A、 B、 C、 D、6、抽样估计就是根据样本指标数值对总体指标数值做出()。
A、直接计算B、估计和推断C、最终结论D、一定替代7、两个变量之间的变化方向相反,一个上升而另一个是下降,或者一个下降而另一个是上升,这是()。
A、完全相关B、负相关C、正相关D、不完全相关8、当相关关系的一个变量动时,另一个变量相应地发生变动,但这种变动是不均等的,这称为()。
A、线性相关B、直线相关C、非线性相关D、非完全相关9、点估计是用实际样本指标数值()。
A、代替总体指标数值B、估计总体指标的可能范围C、估计总体旨标的可能范围程度D、以上都不对10、当抽样单位数增3倍或2.5倍时,随机重置抽样平均误差分别是原来的()。
A、90%和81.6%B、50%和53.5%C、53.5%和81.6%D、90%和50%11、平均发展速度的计算方法有()A、简单算术平均数B、加权算术平均数C、调和平均数D、几何平均法E、方程法12、能形成连续变量数列的数量标志有()A、企业的从业人员数量B、企业的生产设备台数C、企业的工业增加值D、企业从业人员工资总额E、企业的利税总额二、多项选择题(每题2 分,共12分)1、如下指标中有()是强度相对指标。
A、人口密度B、平均每人占有粮食产量C、人口自然增长率D、平均每人拥有国内生产总值E、生产工人劳动生产率2、动态数列的种类有()A、绝对数动态数列B、相对数动态数列C、平均数动态数列D、分配数列E、增长速度3、下列各项指标属于价值指标的有()A、全国粮食产量B、国内生产总值C、国民生产总值D、社会商品零售额E、全国发电量4、下列各项标志属于品质标志的有()A、性别B、年龄C、职业D、民族E、出生地5、众数是()。
大学课程《应用统计学》试题及答案(1)

大学课程《应用统计学》试题及答案一、单项选择题1、统计学具有()特点A. 数量性和总体性B.数量性和差异性C. 总体性和差异性D.数量性和答案:A2、“统计”作为社会经济生活中经常使用的名词,以下哪项不是其含义()A. 统计工作B.统计资料C. 统计数据D.统计科学答案:C3、专业、性别属于以下哪项统计数据的计量尺度()。
A. 定类尺度B.定序尺度C. 定距尺度D.定比尺度答案:A4、在对工业企业的生产设备进行普查时,调查对象是()。
A . 所有工业企业 B. 每一个工业企业D. 工业企业的每台生产设备C . 工业企业的所有生产设备答案:C5、统计有三种涵义,其中()是基础、是源。
A. 统计学B. 统计资料C. 统计工作D. 统计方法答案:C6、要了解100 个学生的学习情况,则总体单位()。
A. 100 个学生B. 100 个学生的学习情况D. 每一个学生的学习情况C. 每一个学答案:C7、下列变量中属于连续变量的是()。
A. 职工人数B. 设备台数C . 学生的年龄 D. 工业企业数答案:C8、其数量随总体范围的大小而增减的指标是()。
A. 数量指标B. 质量指标D.相对指标C. 品质指标答案:A二、多项选择题1、下列哪项可以归于无限总体内。
()A. 中国目前居民B. 电脑内所有零件C. 某快递公司所有订单D. 报警电话E.美国现在的农业科研所数答案:CD2、要了解100 个工业企业的生产情况,则统计指标有()。
A. 100 个工业企业的工业总产值B. 每一个工人的月工资C. 全部工业企业D. 一个工业企业的工资总额E. 全部工业企业的劳动生产率答案:AE3、下面哪些属于变量()。
A、可变品质标志B、质量指标C、数量指标D、可变的数量标志E、某一指标数值答案:BCD4、指标是说明总体特征的,标志是说明总体单位特征的,则()。
A. 数量指标可以用数值表示B. 质量指标不能用数值表示C. 数量标志可以用数值表示D. 品质标志不能用数值表示F.品质标志和质量指标都可以用数值表示答案:ACD三、判断题1、总体性是统计研究的前提。
应用统计 试题及答案

应用统计试题及答案一、选择题1.统计学是一门研究什么的科学?A. 数字B. 数据C. 模型D. 计算答案:B. 数据2.统计学的基本任务是什么?A. 数据分析B. 模型建立C. 结果预测D. 变量选择答案:A. 数据分析3.以下哪个是统计学的一个分支?A. 物理学B. 化学C. 经济学D. 历史学答案:C. 经济学4.统计学中,样本是指什么?A. 全体实验对象B. 全体研究对象C. 随机选取的一部分对象D. 不具备代表性的对象答案:C. 随机选取的一部分对象5.哪个指标用于衡量数据的离散程度?A. 均值B. 中位数C. 标准差D. 方差答案:D. 方差二、填空题1.描述数据离散程度的指标是__________。
答案:标准差2.样本容量为100,抽样误差为0.05,那么置信度为__________。
答案:0.953.样本的均值称为__________。
答案:样本均值4.样本容量为200,样本均值为25,样本标准差为5,总体标准差为10,那么样本的标准误差为__________。
答案:0.35365.样本的方差称为__________。
答案:样本方差三、计算题1.某城市有60%的居民喜欢看电影,现在随机调查了200名居民,其中有120人表示喜欢看电影。
根据这个调查结果,估计该城市所有居民喜欢看电影的比例,并给出95%的置信区间。
答案:样本比例 = 120/200 = 0.6标准误差 = sqrt(0.6(1-0.6)/200) = 0.0346置信区间 = 样本比例 ± 1.96 ×标准误差= 0.6 ± 1.96 × 0.0346= [0.5322, 0.6678]结论:根据这个调查结果,我们可以估计该城市所有居民喜欢看电影的比例为0.6,并且有95%的置信度认为比例在0.5322到0.6678之间。
2.某农场种植了1000棵苹果树,调查其中200棵树的产量,平均每棵树的产量为150斤,样本标准差为30斤。
应用统计学模拟试卷及参考答案10套

基础篇模拟试题一一、单项选择题(每小题1分,共15分)1.属于古典统计学时期的学派有()A.国势学派B.社会经济统计学派C.数理统计学派D.社会统计学派2.“我是搞统计的”这里的统计具体含义是指()A.统计工作B.统计资料C.统计学D.统计过程3.数量指标用()表示A.相对数B.绝对数C.平均数D.众数4.人口普查取得的是()。
A.时期资料B.时点资料C.主要是时期D.可能是时期也可能是时点,看具体情况5.对某校学生统计学成绩进行调查,那么总体单位是()。
A.该校所有学生B.该校所有学生成绩C.该校每一位学生D.该校每一位学生成绩6.统计调查方案首要解决的问题是()。
A.确定调查对象B.确定调查目的C.确定调查项目D.确定调查时间7.统计分组要求是唯一性、互斥性和()。
A.差异性B.周延性C.适用性D.准确性8.通过直接调查取得的原始数据,应从()方面去审核。
A.完整性和准确性B.完整性和时效性C.准确性和时效性D.准确性和适用性9.按分组标志性质的不同,分配数列可分为变量数列和()。
A.质量数列B.数量数列C.组距数列D.品质数列10.总量指标大小与总体范围大小()。
A.成反比B.一般情况下成反比C.成正比D.一般情况下成正比11.数值平均数包括算术平均数、调和平均数和()A.标准差B. 中位数C.几何平均数D.众数12.反映抽样指标与总体指标之间抽样的可能范围的指标是()。
A.抽样平均误差B.抽样误差系数C.概率度D.抽样极限误差。
13.增长速度()。
A.可能为正值B.可能为负值C.可能为零D. ABC14.统计指数起源于人们对()动态的关注。
A.产量B.产值C.价格D. 复杂社会经济现象15.销售额和销售价格之间是()。
A.函数关系B.相关关系C.回归关系D. 没有关系二、判断题(每小题1分,共15分。
只作判断,不作更正。
)1.统计标志按各单位上具体表现是否相同分为不变标志和可变标志。
()2.指标都是用数值表示的,标志都是用文字表示的。
应用统计学试题和答案

应用统计学试题和答案统计学(Statistics)是研究收集、整理、描述、分析和解释数据的一门学科,广泛应用于各个领域。
本文将介绍一些应用统计学的试题以及相应的答案,旨在帮助读者加深对统计学概念和方法的理解。
一、选择题1. 下列哪个量不是描述数据分布的度量指标?A. 平均值B. 方差C. 中位数D. 相关系数答案:D2. 如果一组数据呈正态分布,那么其中约有多少比例的数据会落在1个标准差范围内?A. 34%B. 68%C. 95%D. 99.7%答案:B3. 在某班级的成绩中,小明的成绩排在全班第80%的位置,那么小明的排名在班级中大约是第几名?A. 第16名B. 第20名C. 第24名D. 第32名答案:C二、填空题1. 某产品的年销售量(单位:万件)如下:18、21、25、16、19、23、20。
请计算这组数据的平均值。
答案:平均值= (18 + 21 + 25 + 16 + 19 + 23 + 20) / 7 = 142 / 7 ≈ 20.292. 某网络游戏每天的在线人数(单位:千人)如下:12、10、9、14、15、11、13。
请计算这组数据的中位数。
答案:首先将数据排序:9、10、11、12、13、14、15。
中位数为中间值,即第4个数和第5个数的平均值,所以中位数为 (12 + 13) / 2 = 12.5三、计算题某班级学生的数学考试成绩如下:1. 请计算这组数据的标准差。
答案:首先计算平均值:(85 + 76 + 92 + 88 + 79 + 81 + 90 + 84 + 87 + 93) / 10 ≈ 85.5然后计算每个数据与平均值的差的平方,并求和:(85-85.5)^2 + (76-85.5)^2 + ... + (93-85.5)^2 ≈ 230.5标准差= √(230.5 / 10) ≈ 4.82. 请计算这组数据的相关系数。
答案:首先计算每个数据与平均值的差,并求平方:(85-85.5)^2,(76-85.5)^2,...,(93-85.5)^2然后计算每个数据与平均值的差的乘积,并求和:(85-85.5)(76-85.5),(85-85.5)(92-85.5),...,(93-85.5)(87-85.5)最后计算相关系数:相关系数 = (每个数据与平均值的差的乘积的和) / √[(每个数据与平均值的差的平方的和) × (每个数据与平均值的差的平方的和)]计算结果为相关系数≈ 0.757四、应用题某超市的顾客每天购买的商品件数如下:1. 请计算这组数据的众数。
(完整版)应用统计学练习题(含答案)

(完整版)应用统计学练习题(含答案)应用统计学练习题第一章绪论一、填空题1.统计工作与统计学的关系是__统计实践____和___统计理论__的关系。
2.总体是由许多具有_共同性质_的个别事物组成的整体;总体单位是__总体_的组成单位。
3.统计单体具有3个基本特征,即__同质性_、__变异性_、和__大量性__。
4.要了解一个企业的产品质量情况,总体是_企业全部产品__,个体是__每一件产品__。
5.样本是从__总体__中抽出来的,作为代表_这一总体_的部分单位组成的集合体。
6.标志是说明单体单位特征的名称,按表现形式不同分为__数量标志_和_品质标志_两种。
7.8.统计指标按其数值表现形式不同可分为__总量指标__、__相对指标_和__平均指标__。
9.指标与标志的主要区别在于:(1)指标是说明__总体__特征的,而标志则是说明__总体单位__特征的。
(2)标志有不能用__数量__表示的_品质标志_与能用_数量_表示的_数量标志_,而指标都是能用_数量_表示的。
10.一个完整的统计工作过程可以划分为_统计设计_、_统计调查_、_统计整理_和__统计分析__4个阶段。
二、单项选择题1.统计总体的同质性是指(A)。
A.总体各单位具有某一共同的品质标志或数量标志B.总体各单位具有某一共同的品质标志属性或数量标志值C.总体各单位具有若干互不相同的品质标志或数量标志D.总体各单位具有若干互不相同的品质标志属性或数量标志值2.设某地区有800家独立核算的工业企业,要研究这些企业的产品生产情况,总体是( D)。
A.全部工业企业B.800家工业企业C.每一件产品D.800家工业企业的全部工业产品3.有200家公司每位职工的工资资料,如果要调查这200家公司的工资水平情况,则统计总体为(A)。
A.200家公司的全部职工B.200家公司C.200家公司职工的全部工资D.200家公司每个职工的工资4.一个统计总体( D)。
应用统计学模拟测试题库

应用统计学模拟测试题库一、选择题(每题 5 分,共 50 分)1、下列数据中,属于分类数据的是()A 年龄B 工资C 性别D 体重2、为了调查某校学生的购书费用支出,从男生中抽取 60 名学生调查,从女生中抽取 40 名学生调查,这种抽样方法是()A 简单随机抽样B 分层抽样C 系统抽样D 整群抽样3、一组数据的众数是()A 出现次数最多的变量值B 出现次数最少的变量值C 按顺序排列居于中间位置的变量值D 最大的变量值4、下列关于样本均值的说法中,正确的是()A 样本均值是总体均值的无偏估计B 样本均值是总体均值的有偏估计C 样本均值的抽样分布是正态分布D 样本均值的抽样分布与总体分布相同5、在假设检验中,原假设和备择假设()A 都有可能成立B 都有可能不成立C 只有一个成立而且必有一个成立D 原假设一定成立,备择假设不一定成立6、对于两个变量之间的线性关系,下列说法正确的是()A 相关系数的绝对值越大,线性关系越强B 相关系数的绝对值越小,线性关系越强C 相关系数为 0 时,线性关系最强D 相关系数为 1 时,线性关系最弱7、下列指数中,属于质量指数的是()A 销售额指数B 销售量指数C 价格指数D 产量指数8、时间序列中,逐期增长量之和等于()A 累计增长量B 平均增长量C 定基增长量D 环比增长量9、进行回归分析时,预报变量的取值()A 只能由解释变量唯一确定B 可以由解释变量和随机误差共同确定C 不能由解释变量确定D 与解释变量无关10、在方差分析中,组内方差()A 只包含随机误差B 只包含系统误差C 既包含随机误差,也包含系统误差D 有时包含随机误差,有时包含系统误差二、填空题(每题 5 分,共 30 分)1、统计数据的类型分为_____、_____和_____。
2、数据的集中趋势测度指标包括_____、_____和_____。
3、抽样误差是由于_____引起的样本统计量与总体参数之间的差异。
应用统计学模拟题和答案

应用统计学模拟题和答案一. 单项选择题(10%, 每题1分)1、一个统计总体()。
A.只能有一个标志B.只能有一个指标C.可以有多个标志D.可以有多个指标2、在统计调查中,调查项目的承担者是()。
A.调查对象B.调查单位C.填报单位D.调查者3、次数分配中,靠近中间的变量值分布的次数少,靠近两端的量值分布次数多,这种分布的类型是()。
A.钟型分布B.U型分布C.J型分布D.倒J型分布4、把基数抽象为1 000计算出来的相对数叫()。
A.百分数B.倍数C.成数D.千分数5、某地区500万人口,有商业零售点1万个,其商业网点密度指标的正指标为()。
A、100人/个B、0.002个/人C、1个/ 百人D、0.002人/个6、平均数是对()。
A、总体单位数的平均B、变量值的平均C、标志的平均D、变异的平均7、设有8个工人生产同种产品,他们某日的产量(件)排序是:4 、6、6、8、9、10、12、14,则日产量的中位数是()。
A、6台B、8台C、8.5台D、9台8、某车间抽查100个零件,算得废品率为5%,若以85%的概率保证(t=1.44)推断,全部产品的废品率区间为()。
A.4.5%≤P≤5.6% B.6.2%≤P≤3.8%C.1.86%≤P≤8.14% D.4.5%≤P≤5.5%9、铸件废品率(%)和每一吨铸铁成本(元)之间的回归方程为y = 56 + 8x,这意味着( )。
A、废品率增加1%,成本每吨增加64元B、废品率增加1%,成本每吨增加8%C、废品率增加1%,则成本每吨增加8元D、废品率增加1%,每吨成本为56元10、某机关单位的职工工资水平今年比去年提高了5%,职工人数增加了2%,则该机关单位的工资总额增长了()。
A、10%B、7.1%C、7%D、11%二. 多项选择题(20%, 每题2分)1.统计工作是搜集、整理、分析和研究数据资料,以形成研究结论的工作过程,具体包括( )等环节。
A.统计设计B.统计调查C.统计整理D.统计分析2.下列情况,调查单位和填报单位不一致的是()。
《应用统计学》模拟考试题及参考答案(全)

应用统计学模拟考试题答案( √ )1、在统计调查中,抽样调查因为诸多优点而最经常被采用。
( √ )2、按照计量尺度的差异,可以将统计数据分为分类数据、顺序数据和数值型数据三类。
( × )3、抽样误差是抽样调查中可以设法消除的误差。
( × )4、在假设检验中,如果所计算的P 值越小,说明检验结果越不显着。
( √ )5、不存在趋势的时间序列称为平稳时间序列。
( √ )6、拉氏物价指数是以基期的商品交易量作为同度量因素加权的。
( √ )7、展示时间序列数据的最佳图形是线图。
( √ )8、统计表主要由表头、行标题、列标题、数字资料和表外附加五部分组成。
( × )9、多数情况下,、多数情况下,t t 分布是一个右偏分布。
( × )1010、平均数、中位数、众数等都是用来衡量数据离散趋势的。
、平均数、中位数、众数等都是用来衡量数据离散趋势的。
( A )1111、下列变量中属于数值型变量的是、下列变量中属于数值型变量的是A A、汽车轮胎的直径、汽车轮胎的直径、汽车轮胎的直径B B B、汽车的内燃机类型、汽车的内燃机类型、汽车的内燃机类型C 、产品等级、产品等级D D D、学生生源类别、学生生源类别( C )1212、以下各种抽样方式中一定属于非随机抽样的方式是:、以下各种抽样方式中一定属于非随机抽样的方式是: A A、简单随机抽样、简单随机抽样、简单随机抽样 B B B、等距抽样、等距抽样、等距抽样 C C C、重点抽样、重点抽样、重点抽样 D D D、类型抽样、类型抽样( C )1313、下列图形中不能展示分类数据的图是、下列图形中不能展示分类数据的图是、下列图形中不能展示分类数据的图是:: A A、条形图、条形图、条形图 B B B、饼图、饼图、饼图 C C C、直方图、直方图、直方图 D D D、环状图、环状图( B )1414、经验数据表明某电话订票点每小时接到订票电话的数目、经验数据表明某电话订票点每小时接到订票电话的数目X 是服从常数为120的泊松分布,请问该订票点每10分钟内接到订票电话数目Y 的分布类型是:A A、正态分布、正态分布、正态分布B B B、泊松分布、泊松分布、泊松分布C C C、二项分布、二项分布、二项分布D D D、超几何分布、超几何分布( D )1515、下列有关统计分组的一些说法中,错误的是:、下列有关统计分组的一些说法中,错误的是:A A、统计分组是指按照某些重要标志把总体分成若干部分的科学分类、统计分组是指按照某些重要标志把总体分成若干部分的科学分类B 、数值型数据的分组的组数主要取决于数据的全距和组距的大小C 、统计分组的目的是为了展现总体的内部结构或分布规律D 、统计分组只能按照一个标志单独进行( C )1616、下面有关相关关系的一些说法错误的是:、下面有关相关关系的一些说法错误的是: A A、相关关系是一种普遍存在的关系、相关关系是一种普遍存在的关系B B、简单相关系数是用来定量描述变量之间线性相关程度的、简单相关系数是用来定量描述变量之间线性相关程度的C C、简单相关系数为零时,说明两个变量之间不存在任何关系、简单相关系数为零时,说明两个变量之间不存在任何关系D 、简单相关系数绝对值越大,两个变量之间的相关程度越密切( B )1717、已知一组数据为、已知一组数据为1010,,8,7,3,5,6,8,请问这组数据的中位数为 A A、、8 B 8 B、、7 C 7 C、、 D D、、10( B )1818、某样本数据的方差是、某样本数据的方差是3636,均值是,均值是1010,则该组数据的离散系数是:,则该组数据的离散系数是:A A、、B B、、C C、、D D、、( D )1919、下列有关参数估计的说法错误的是、下列有关参数估计的说法错误的是A A、参数估计就是利用样本统计量的值来对总体的参数进行估计、参数估计就是利用样本统计量的值来对总体的参数进行估计B B、参数估计有点估计和区间估计等形式、参数估计有点估计和区间估计等形式C C、区间估计必须有相应的置信度作为保证、区间估计必须有相应的置信度作为保证D D、区间估计的宽度越大说明估计的精确度越高、区间估计的宽度越大说明估计的精确度越高( C )2020、下列有关时间序列的说法错误的是:、下列有关时间序列的说法错误的是:A 、长期趋势是指指标值随时间变化呈现出持续的上升或下降的变动B 、循环波动是一种周期性变动C 、季节变动是指周期为一年上的周期性变动D 、不规则变动是没有特定规律的随机变动2121、、在假设检验中,如果检验统计量的P 值大于给定的显着性水平值大于给定的显着性水平??????则在做决策则在做决策时,需要在显着性水平时,需要在显着性水平??的情况下,的情况下,_________不能拒绝不能拒绝不能拒绝 _ _ _原假设。
应用统计学模拟题和答案

应用统计学模拟题和答案一. 单项选择题(10%, 每小题1分)1.要了解某企业职工的文化水平情况,则总体单位是()。
A.该企业的全部职工B.该企业每一个职工的文化程度C.该企业的每一个职工D.该企业全部职工的平均文化程度2.对一批食品进行质量检验,最适宜采用的调查方法是()。
A.全面调查B.抽样调查C.典型调查D.重点调查3.将某地区40个工业企业按产值多少分组而编制的变量数列中,变量值是()。
A.产值B.工厂数C.各组的产值数D.各组的工厂数4.某企业某月产品销售额为20万元,月末库存商品为30万元,这两个总量指标是()。
A.时期指标B.时点指标C.前者为时期指标,后者为时点指标D.前者为时点指标,后者为时期指标5.离散程度大小与平均数代表性之间存在()。
A.正比关系B.反比关系C.恒等关系D.依存关系6.变量数列中,各组频率之和应()。
A.小于1 B.等于1C.大于1D.不等于17.在材料单耗综合指数中,每种产品的材料单耗指标是()。
A.质量指标B.数量指标C.相对指标D.总量指标8.某厂2009年完成产值200万元,2010年计划增长10%,实际完成231万元,则超额完成计划()。
A.15.5%B.5.5%C.115.5%D.5%9.牲畜以头为计量单位,这种计量单位属于()。
A.自然单位B.度量衡单位C.劳动单位D.货币单位10.对某市全部商业企业职工的生活状况进行调查,调查对象是()。
A.该市全部商业企业B.该市全部商业企业职工C.该市每一个商业企业D.该市商业企业每一名职工二. 多项选择题(40%, 每小题2分)1.下面说法正确的是()。
A.性别、文化程度、企业所属行业类型都是品质标志B.企业的职工人数、企业管理人员数都是数量标志C.某地区职工的工资总额是统计指标D.在校学生的年龄是连续变量2.我国第六次人口普查的标准时间是2010年11月1日零时,下列情况应统计人口数的有()。
A.2010年11月2日1时出生的婴儿B.2010年10月30日6时出生的婴儿C.2010年10月30日14时死亡的人D.2010年11月1日1时死亡的人E.2010年10月29日出生,11月1日3时死亡的婴儿3.下列按数量标志分组的有()。
应用统计学试题和答案

【统计学】模拟试卷(一)一、填空题〔每空1分,共10分〕1、依据统计数据的收集方法不同,可将其分为____________数据和_____________数据。
2、收集的属于不同时间上的数据称为 数据。
3、设总体X 的方差为1,从总体中随机取容量为100的样本,得样本均值x =5,那么总体均值的置信水平为99%的置信区间_________________。
(Z 0.005=2.58)4、某地区2005年1季度完成的GDP=50亿元,2005年3季度完成的GDP =55亿元,那么GDP 年度化增长率为 。
5、在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:1080、750、1080、850、960、2000、1250、1080、760、1080、950、1080、660,那么其众数为 ,中位数为 。
6、判定系数的取值范围是 。
7、设总体X ~) ,(2σμN ,x 为样本均值,S 为样本标准差。
当σ未知,且为小样本时, 那么n s x μ-服从自由度为n-1的___________________分布。
8、假设时间序列有20年的数据,采用5年移动平均,修匀后的时间序列中剩下的数据有 个。
二、单项选择题〔在每题的3个备选答案中选出正确答案,并将其代号填在题干后面的括号内。
每题1分,共14分〕1、.研究如何对现象的数量特征进行计量、观察、概括和表述的理论和方法属于 ( )①、应用统计学 ②、描述统计学 ③、推断统计学2、假设各个标志值都扩大2倍,而频数都减少为原来的1/3,那么平均数 〔 〕①、扩大2倍 ②、减少到1/3 ③、不变3、在处理快艇的6次试验数据中,得到以下最大速度值:27、38、30、37、35、31. 那么最大艇速的均值的无偏估计值为 〔 〕①、32.5 ②、33 ③、39.64、某地区粮食作物产量年平均开展速度:1998~2000年三年平均为1.03,2001~2002年两年平均为1.05,试确定1998~2002五年的年平均开展速度 〔 〕5、假设两个变量的平均水平接近,平均差越大的变量,其 ( )①、平均值的代表性越好 ②、离散程度越大 ③、稳定性越高6、对正态总体均值进行区间估计时,其它条件不变,置信水平α-1越小,那么置信上限与置信下限的差〔 〕 ①、越大 ②、越小 ③、不变7、假设某总体次数分布呈轻微左偏分布,那么成立的有 〔 〕①、x > e M >o M ②、x <e M <o M ③、x >o M >e M8、方差分析中的原假设是关于所研究因素 ( )①、各水平总体方差是否相等 ②、各水平的理论均值是否相等③、同一水平内部数量差异是否相等9、某年某地区甲乙两类职工的月平均收入分别为1060元和3350元,标准差分别为230元和680元,那么职工月平均收入的离散程度 ( )①、甲类较大 ②、乙类较大 ③、两类相同10、某企业2004年与2003年相比,各种产品产量增长了8%,总生产费用增长了 15%,那么该企业2004年单位本钱指数为 〔 〕①、187.5% ②、7% ③、106.48%11、季节指数刻画了时间序列在一个年度内各月或季的典型季节特征。
应用统计学试题与答案(doc 7页)

应用统计学试题与答案(doc 7页)点单位D.使用部分单位的指标数值去推断和估计总体的指标数值E.通常会产生偶然的代表性误差,但这类误差事先可以控制或计算2.某种产品单位成本计划比上年降低5%,实际降低了4%,则下列说法正确的是()A.单位成本计划完成程度为80%B. 单位成本计划完成程度为101.05%C.没完成单位成本计划D.完成了单位成本计划E.单位成本实际比计划少降低了1个百分点3.数据离散程度的测度值中,不受极端数值影响的是()A.极差B.异众比率C.四分位差D.标准差E.离散系数4.下列指标属于时点指标的是()A.增加人口数B.在校学生数C.利润额D.商品库存额E.银行储蓄存款余额5.两个变量x与y之间完全线性相关,以下结论中正确的是()A.相关系数|r|=1B.相关系数|r|=0C.估计=0标准误差Sy=1 E.判定系数r2=1 F.判定 D.估计标准误差Sy系数r2=0四、填空题(每空1分,共10分)1.有10个人的年龄资料:10,20,15,20,25,30,15,20,30,25岁。
由该资料确定的中位数为,众数为,极差为。
2.平均指标反映总体分布的趋势,标志变异指标反映总体分布的趋势。
3.某地国民生产总值1988年比1980年增长了1倍,若计划到2005年国民生产总值将达到1980年的5倍,则1988年以后的17年间与1988年相比总增长速度应为 %,年平均增长速度应为 %。
4. 某地本年与上年相比粮食总产量增长了10%,粮食作物播种面积增加了7%,则粮食作物单位面积产量增长了 %。
5. 相关系数r是说明两变量之间的方向和紧密程度的统计指标,其取值范围是。
五、简答题(5分)加权算术平均数受哪几个因素的影响?若报告期与基期相比各组平均数没变,则总平均数的变动情况可能会怎样?请说明原因。
六、计算题(共60分)1.某茶叶制造商声称其生产的一种包装茶叶平均每包重量不低于150克,已知茶叶包装重量服从正态分布,现从一批包装茶叶中随机抽取100包,检验结果如下:每包重量(克)包数(包)148—149 149—150 150—151 151—152 10 20 50 20合计100要求:(1)计算该样本每包重量的均值和标准差;(2)以99%的概率估计该批茶叶平均每包重量的置信区间(t0.005(99)≈2.626);(3)在α=0.01的显著性水平上检验该制造商的说法是否可信(t0.01(99)≈2.364);(4)以95%的概率对这批包装茶叶达到包重150克的比例作出区间估计(Z0.025=1.96);(写出公式、计算过程,标准差及置信上、下限保留3位小数)(24分)2.某商业企业商品销售额1月、2月、3月分别为216,156,180.4万元,月初职工人数1月、2月、3月、4月分别为80,80,76,88人,试计算该企业1月、2月、3月各月平均每人商品销售额和第一季度平均每月人均销售额。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
应用统计学模拟考试题答案(√)1、在统计调查中,抽样调查因为诸多优点而最经常被采用。
(√)2、按照计量尺度的差异,可以将统计数据分为分类数据、顺序数据和数值型数据三类。
(×)3、抽样误差是抽样调查中可以设法消除的误差。
(×)4、在假设检验中,如果所计算的P值越小,说明检验结果越不显著。
(√)5、不存在趋势的时间序列称为平稳时间序列。
(√)6、拉氏物价指数是以基期的商品交易量作为同度量因素加权的。
(√)7、展示时间序列数据的最佳图形是线图。
(√)8、统计表主要由表头、行标题、列标题、数字资料和表外附加五部分组成。
(×)9、多数情况下,t分布是一个右偏分布。
(×)10、平均数、中位数、众数等都是用来衡量数据离散趋势的。
( A)11、下列变量中属于数值型变量的是A、汽车轮胎的直径B、汽车的内燃机类型C、产品等级D、学生生源类别(C)12、以下各种抽样方式中一定属于非随机抽样的方式是:A、简单随机抽样B、等距抽样C、重点抽样D、类型抽样(C )13、下列图形中不能展示分类数据的图是:A、条形图B、饼图C、直方图D、环状图(B)14、经验数据表明某电话订票点每小时接到订票电话的数目X是服从常数为120的泊松分布,请问该订票点每10分钟内接到订票电话数目Y的分布类型是:A、正态分布B、泊松分布C、二项分布D、超几何分布(D)15、下列有关统计分组的一些说法中,错误的是:A、统计分组是指按照某些重要标志把总体分成若干部分的科学分类B、数值型数据的分组的组数主要取决于数据的全距和组距的大小C、统计分组的目的是为了展现总体的内部结构或分布规律D、统计分组只能按照一个标志单独进行(C)16、下面有关相关关系的一些说法错误的是:A、相关关系是一种普遍存在的关系B、简单相关系数是用来定量描述变量之间线性相关程度的C、简单相关系数为零时,说明两个变量之间不存在任何关系D、简单相关系数绝对值越大,两个变量之间的相关程度越密切(B)17、已知一组数据为10,8,7,3,5,6,8,请问这组数据的中位数为 A、8 B、7 C、6.5 D、10(B)18、某样本数据的方差是36,均值是10,则该组数据的离散系数是:A、3.60B、0.60C、1.67D、0.28(D)19、下列有关参数估计的说法错误的是A、参数估计就是利用样本统计量的值来对总体的参数进行估计B、参数估计有点估计和区间估计等形式C、区间估计必须有相应的置信度作为保证D、区间估计的宽度越大说明估计的精确度越高(C)20、下列有关时间序列的说法错误的是:A、长期趋势是指指标值随时间变化呈现出持续的上升或下降的变动B、循环波动是一种周期性变动C、季节变动是指周期为一年上的周期性变动D、不规则变动是没有特定规律的随机变动21、在假设检验中,如果检验统计量的P值大于给定的显著性水平α,则在做决策时,需要在显著性水平α的情况下,___不能拒绝_原假设。
22、一组数据的最大值是85,最小值是33,中位数是55,众数是42,则该组数据的极差是52 。
23、样本统计量的概率分布称为抽样分布。
24、利用样本统计量的值来估计总体参数的过程称为参数估计。
25、统计分组中,同一组的上组限与下组限之差称为组距。
26、两个变量之间的简单线性相关系数的取值范围为[-1 , 1] 。
27、样本或总体中各不同类别数值之间的比值称为比率。
28、狭义地讲,指数都是衡量多个项目综合变动的相对数。
29、在互联网上主动参与某项调查的网民所构成的样本,称为自愿样本。
30、一元线性回归中,使得残差平方和最小的估计回归系数的方法称为最小二乘法。
31、评价估计量好坏的标准有哪些?答:评价估计量好坏的标准有三个:(1)无偏性。
无偏性是指估计量抽样分布的数学期望等于被估计的总体的参数。
(2分)(2)有效性。
有效性是指对同一总体参数的两个无偏统计量,有更小标准差的估计量更有效。
(2分)(3)一致性。
一致性是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。
(1分)32、何谓第II类错误与第Ⅰ类错误?第II类错误也称为取伪错误,指在假设检验操作过程中,当原假设实际上为假,但由于随机性,从总体中抽得的样本所构建的检验统计量值却落在了接受域之内,以致做出不能推翻(可以认为接受)原假设的判断,这样就称为犯了第II 类错误;(2.5分)第Ⅰ类错误是指原假设实际上为真,但作出了拒绝原假设的判断,这样就称为犯了第Ⅰ类错误。
(2.5分)33、什么是二手资料?使用二手资料应该注意什么问题?答:二手资料是指与研究内容相关的已经存在的数据资料,这些资料已经由其他人员搜集整理汇总完毕,以各种形式保存。
研究者可以通过各种渠道获取这些数据,而无需亲自进行调查或做实验获得相关数据。
(2分)研究者在使用二手资料时候需要对资料的真实性、合适性和时效性进行检查,看资料是否符合研究的目的。
(即弄清楚资料的搜集者是谁,为什么目的,在什么时候,怎样搜集,以保证数据的真实性、合适性和时效性)。
(3分)34、请解释总体和样本。
总体就是所研究的全部元素的集合 (2.5分)样本就是从总体中抽取的一部分元素的集合 (2.5分)1.36、某城市的一家研究机构聘请一位社会学家作一项社会调查,调查的内容涉及到职工每年无故缺勤的天数和职工从家里到工作单位的距离(公里)之间的关系。
选取了10名职工组成一个样本,采集的数据及其经excel有关方法的处理后的结果如下表:回归统计Multiple R 0.843121R Square 0.710854Adjusted R0.674711Square标准误差 1.289415观测值10方差分析df SS MS F Significance F回归分析 1 32.69927536 32.69927536 19.66766549 0.002182936残差8 13.30072464 1.66259058总计9 46Coefficients 标准误差t Stat P-value Intercept 8.097826087 0.808822137 10.01187494 8.4133E-06 到工作单位的距离-0.344202899 0.077613652 -4.434824178 0.0021829365.344234420978 5.34428*3442.00978.8ˆ=-=y 34420978xy 3442.00978.8ˆ-=试根据以上数据处理结果,分析:1) 到工作单位的距离x 与无故缺勤的天数y 的简单相关系数是多少?两变量之间呈现怎样的相关关系?(2分)答:相关系数是0.843121;(1分) 两变量之间呈现高度线性负相关(1分)2) 写出y 关于x 的回归方程,并解释回归系数的意义。
(4分)2分回归系数的实际意义: 到单位距离每增加1公里,无故缺勤天数平均减少0.3442天3) 请解释标准误差为 1.289415的含义。
(2分)答:说明用该线性回归方程来估计无故缺勤天数时,观测值与估计值平均相差了1.289415天。
4) 无故缺勤天数的变差中有多少是由于到单位的距离的变动引起的?(2分) 答:71.0854%5) 检验回归方程的显著性 (α =0.05) (2分) 答:H 0:β1=0由于F 检验的P 值为0.00218293远远小于0.05(1分),因此,在显著性水平0.05的情况下,回归方程通过了显著性检验(1分)。
6) 如果有一名职工住在离公司有8公里远的地方,利用在2)中得到的估计的回归方程,求出该职工每年无故缺勤天数的点估计值。
(2分)六、计算分析题(共3小题,每小题12分,共36分)4.5cm ,长期积累的数据资料表明,零件的直径服从正态分布,现在从一批零件中抽得容量为5的样本,测得其直径(单位:cm )分别为4,4.5,5,5.5,6,试根据抽样结果判断零件的平均直径是否符合规定要求,显著性水平α取值为0.05。
注:可能需要使用的值 Z 0.05=1.645, Z 0.025=1.96,236.25=,791.0625.0=t 0.025(4)=2.776, t 0.05(4)=2.132, t 0.025(5) =2.571,t 0.05(5)=2.015解:首先根据题意建立假设:5.40=:μH 5.41≠μ:H 2分样本容量为n=5,通过样本数据计算得到样本均值为: 2分)(5565.555.44cm x =++++=样本方差: 3分625.04)56()55.5()55()55.4()54(1)(22222122=-+-+-+-+-=--=∑=n x xS ni i此时总体为正态分布,且不知道总体方差,样本为小样本,因此需要构建t 检验统计量。
4134.1236.2/791.05.455/5.4t =-=-=S x 3分由于776.24134.1t 776.2<=<-,检验值落在非拒绝域内,因此根据样本数据信息,在0.05的显著性水平下无法拒绝原假设,可以认为该批零件的平均直径符合规定要求。
2分38、某商店甲、乙、丙三种商品的基期和报告期销售量和销售价格资料如表2, 表2 某商店甲乙丙三种商品两期的销售量和销售价格(万元/单位)资料(1)、根据题目所给的资料,将表中空白填写完整(4分); (2)、计算该商店三种商品帕氏销售量总指数(4分); (3)、计算该商店三种商品拉氏价格总指数(4分); 解:(1) 根据所给资料,表格已经在原表中填写完整。
4分 (2) 该商店三种商品的帕氏销售量指数为%%=%6.124100635.781000111s⨯=⨯=∑∑qp q p K 4分(3) 该商店三种商品的拉氏价格指数为%90100706310001p%=%⨯=⨯=∑∑qp q p K 4分(1)该超市2000年至2005年的平均销售额(2分);(2)以2000年为基期,计算该超市2005年销售额的定基增长速度、环比增长速度 (4分);(3)以2000年为基期,计算该超市2001年至2005年间销售额的平均增长速度(3分)。
(4)根据2001年至2005年间销售额的平均增长速度预测2007年的销售额(3分) 解:(1)该超市6年平均销售额是(亿元)=+++357.16620.1540.1331.1300.1169.1180.1++ 2分 (2)2005年该超市的销售额与2000年相比,其定基增长速度为%%29.371100180.1620.1=-⨯ 2分 环比增长速度为:%%19.51100540.1620.1=-⨯ 2分(3)该超市销售额5年的平均增长速度是 %%54.61100180.1/620.15=-⨯3分(4)2007年的销售额为:亿元)(8389.1%)54.61(*620.1)1(*20=+=+=n n G a a 3分。