非参数统计——期末试卷
统计学期末考试试题及答案

统计学期末考试试题及答案一、单项选择题(共40题,每题2分,共80分)1. 统计学是一门研究____________________。
A. 数学方法B. 概率论C. 社会现象D. 统计方法答案:D2. 如果一组数据服从正态分布,那么它的偏度应该是___________。
A. 0B. 1C. -1D. 2答案:A3. 在描述数据离散程度的指标中,____________用于衡量数据集中趋势。
A. 方差B. 标准差C. 中位数D. 众数答案:B......二、填空题(共10题,每题4分,共40分)1. 样本均值的计算公式是____________。
答案:样本总和/样本容量2. 当两个事件相互独立时,它们的联合概率为____________。
答案:各自概率的乘积三、简答题(共4题,每题20分,共80分)1. 请简要解释什么是样本调查,列举一些常见的样本调查方法。
答案:样本调查是通过采集和分析一部分受试者或对象的数据来推断总体特征的方法。
常见的样本调查方法包括随机抽样、系统抽样、分层抽样等等。
2. 请说明在统计学中什么是“假设检验”,并简要介绍其基本步骤。
答案:假设检验是用来判断总体参数是否满足给定假设的统计方法。
基本步骤包括设定原假设和备择假设、选择合适的统计量、计算统计量的观察值、确定显著水平、进行假设检验、得出结论。
......四、计算题(共3题,每题20分,共60分)1. 已知某班级学生的体重数据如下(单位:kg):50, 55, 60, 65, 70, 75求这组数据的标准差。
答案:计算过程省略,标准差为9.432. 某商品在1月、2月、3月的销售额分别为1000元、1200元和1500元,求这三个月的平均销售额和销售额的方差。
答案:平均销售额为1233.33元,销售额的方差为13133.33五、分析题(共2题,每题30分,共60分)1. 研究人员想要通过一份问卷调查了解某公司员工的满意度,问卷包括多个问题,如“您对公司的福利待遇满意程度如何?”和“您对公司的发展前景满意程度如何?”等等。
统计期末考试题及答案

统计期末考试题及答案一、选择题(每题2分,共20分)1. 在统计学中,哪个术语描述了数据集中的数值变化?A. 方差B. 均值C. 标准差D. 中位数答案:A2. 以下哪个不是描述性统计的用途?A. 描述数据集的中心趋势B. 描述数据集的分散程度C. 预测未来数据D. 描述数据集的形状答案:C3. 以下哪个是参数统计分析中的一个基本假设?A. 正态分布B. 随机抽样C. 独立性D. 所有选项都是答案:D4. 假设检验中的零假设(Null Hypothesis)通常表示什么?A. 研究者想要证明的假设B. 研究者想要拒绝的假设C. 研究者认为没有效应的假设D. 研究者认为有效应的假设答案:C5. 以下哪个统计图最适合展示时间序列数据?A. 条形图B. 散点图C. 折线图D. 饼图答案:C6. 以下哪个统计量用于衡量数据集中的偏斜程度?A. 方差B. 标准差C. 偏度D. 峰度答案:C7. 以下哪个不是统计学中的抽样方法?A. 简单随机抽样B. 分层抽样C. 系统抽样D. 随机抽样答案:D8. 以下哪个统计量用于衡量两个变量之间的线性关系?A. 相关系数B. 回归系数C. 协方差D. 标准差答案:A9. 以下哪个是多元回归分析中的一个重要概念?A. 因变量B. 自变量C. 交互作用D. 所有选项都是答案:D10. 以下哪个不是非参数统计方法?A. 卡方检验B. 曼-惠特尼U检验C. 斯皮尔曼等级相关D. 方差分析答案:D二、简答题(每题10分,共30分)1. 请简述什么是标准正态分布,并说明其特征。
答案:标准正态分布是一种特殊的正态分布,其均值为0,标准差为1。
它是一个对称分布,以均值为中心,数据点在均值两侧对称分布。
标准正态分布是许多统计分析的基础,常用于转换原始数据,使其适用于正态分布的假设。
2. 解释什么是置信区间,并说明其在统计推断中的作用。
答案:置信区间是一个范围,用于估计总体参数的值。
它基于样本统计量和抽样分布,提供了一个估计值的可信度。
非参数统计A

湖北科技学院数学与统计学院 2013年秋季学期2011级统计本科《非参数统计》期末考查试卷(A 卷、开卷)一.某批发商从厂家购置一批灯泡,根据合同的规定,灯泡的使用寿命平均不低于1000h,已知灯泡的使用寿命服从正态分布,标准差是20h. 从总体中随机抽取了100只灯泡,得知样本均值为996h. 问题是:批发商是否应该购买该批灯泡? (1) 零假设和备择假设应该如何设置?为什么?(2) 在零假设1000<μ下,给出检验的过程并做出决策。
(15分)二.下表中的数据是两个篮球联赛中三分球的进球次数,该数据的目的是考察两个联赛中三分球的得分次数是否存在显著性差异。
(1)符号检验;(2)配对Wilcoxon 符号秩检验;(3)该问题中哪个检验更好?( 25分)三分球的进球次数 队伍序号 联赛1 联赛2 1 91 81 2 46 51 3 108 63 4 99 51 5 110 46 6 105 45 7 191 66 8 57 64 9 34 90 10 81 28三.在一项研究毒品对增强人体攻击性影响的实验中,组A 使用毒品,组B 使用安慰剂。
试验后进行攻击性测试,测量得分如下表(得分越高表示攻击性越强)。
组A 组B10 12 8 15 12 20 16 18 5 13 9 14 7 9 11 16 6(1) 给出这个实验的零假设;(2)对数据进行统计分析。
(20分)四.下表是美国三大汽车公司(A, B, C三种处理)的五种不同的车型某年产品的油耗,试分析不同公司的油耗是否存在差异。
(20分)1 2 3 4 5A 20.3 21.2 18.2 18.6 18.5B 25.6 24.7 19.3 19.3 20.7C 24.0 23.1 20.6 19.8 21.4五.美国某年总统选举前,由社会调查总部抽查黑白种族与支持不同政党是否有关,数据如下表种族民主党共和党无党白人黑人3411034051110515问:不同种族与所支持的政党之间是否存在独立性?(20分)。
第7章 非参数检验试题

第7章非参数检验试题选择题:1、4组学生成绩(优、良、中、差)比较,宜用(B)。
A 方差分析B 秩和检验C 卡方检验D 四格表直接计算概率法2、两样本秩和检验的无效假设是(B)。
A 两样本秩和相等B 两总体分布相同C 两样本分布相同D 两总体秩和相等3、(C),应该用非参数统计方法。
A 正态分布资料n不相等时两样本均数比较B 正态分布资料两样本方差都比较大时两样本均数的比较C 两组等级资料的比较D 两组百分比资料的平均数比较4、在统计检验中是否选择用非参数统计方法,(A)。
A 要根据研究目的和数据特征作决定B 可在算出几个统计量和得出初步结论后进行选择C要看哪个统计结论符合专业理论实验组对照组实测值甲的编秩乙的编秩实测值甲的编秩乙的编秩10 7.5 7.5 10 7.5 7.512 9 9 8 4 515 10 10.5 8 5 515 11 10.5 6 1 217 12 13 6 2 217 13 13 6 3 217 14 13 8 6 519 17 17 19 17 1719 17 17 20 20 20.519 17 17 20 21 20.519 17 17 21 22 22D 要看哪个P值更小5、下表列出了成组设计的两样本资料及甲乙两个研究者的编秩结果,下面哪一个说法是对的?(C)A 甲的编秩方法是错的B 乙的编秩方法是错的C 甲乙两人方法均对D 甲乙两人的编秩方法均错6、以下检验方法中,(A)不属于非参数统计方法。
A.t检验B.H检验C.T检验D.χ2检验7、为判断各总体均数是否相等,对于来自方差齐性及正态分布总体的多个样本比较,可以作秩和(H)检验,通过判断各总体分布的位置是否相同而判断各总体均数是否相等,与作方差分析相比( C )。
A.应该把α定得小一点B.将增大犯I类错误的概率C.将增大犯II类错误的概率D.将同时增大犯两类错误的概率8、通过随机抽样分析两种对象头发中某种金属元素含量是否有高低,若不符合t检验的条件,并无法通过数据转换改善正态性和方差齐性,则(B)。
统计学期末考试题库及答案

统计学期末考试题库及答案一、单项选择题(每题2分,共20分)1. 统计学中,数据的收集方法不包括以下哪一项?A. 观察法B. 实验法C. 调查法D. 推理法答案:D2. 以下哪一项不是统计数据的类型?A. 定量数据B. 定性数据C. 时间序列数据D. 空间数据答案:D3. 在统计分析中,以下哪一项不是描述性统计的内容?A. 数据的集中趋势B. 数据的离散程度C. 数据的分布形态D. 数据的预测分析答案:D4. 以下哪个统计量用于描述数据的离散程度?A. 平均数B. 中位数C. 众数D. 标准差答案:D5. 相关系数的取值范围是?A. -1到1之间B. 0到1之间C. -1到0之间D. 0到正无穷答案:A6. 以下哪一项是统计推断的主要内容?A. 描述性统计B. 概率论C. 假设检验D. 数据收集答案:C7. 以下哪一项不是非参数统计分析的方法?A. 卡方检验B. 秩和检验C. 符号检验D. t检验答案:D8. 在回归分析中,以下哪一项不是回归模型的基本组成部分?A. 因变量B. 自变量C. 误差项D. 常数项答案:D9. 以下哪一项不是时间序列分析的主要方法?A. 移动平均法B. 指数平滑法C. 回归分析D. 聚类分析答案:D10. 以下哪一项不是多元统计分析的内容?A. 聚类分析B. 判别分析C. 因子分析D. 描述性统计答案:D二、多项选择题(每题3分,共30分)11. 以下哪些是统计学的主要分支?A. 描述性统计B. 推断性统计C. 应用统计学D. 理论统计学答案:A, B, C, D12. 在统计学中,以下哪些是常见的概率分布?A. 正态分布B. 二项分布C. 泊松分布D. 均匀分布答案:A, B, C, D13. 以下哪些是统计学中用于描述数据集中趋势的统计量?A. 平均数B. 中位数C. 众数D. 方差答案:A, B, C14. 以下哪些是统计学中用于描述数据离散程度的统计量?A. 极差B. 标准差C. 方差D. 变异系数答案:A, B, C, D15. 以下哪些是统计学中用于描述数据分布形态的统计量?A. 偏度B. 峰度C. 标准差D. 四分位数间距答案:A, B, D16. 在统计推断中,以下哪些是常见的假设检验方法?A. Z检验B. t检验C. F检验D. 卡方检验答案:A, B, C, D17. 以下哪些是时间序列分析中常用的方法?A. 移动平均法B. 指数平滑法C. 自回归模型D. 季节性分解答案:A, B, C, D18. 在多元统计分析中,以下哪些是常用的方法?A. 聚类分析B. 判别分析C. 主成分分析D. 因子分析答案:A, B, C, D19. 以下哪些是统计学中用于数据可视化的方法?A. 条形图B. 折线图C. 散点图D. 饼图答案:A, B, C, D20. 以下哪些是统计学中用于数据预处理的方法?A. 数据清洗B. 数据转换C. 数据归一化D. 数据降维答案:A, B, C, D三、判断题(每题2分,共20分)21. 统计学中的样本量越大,估计的准确性就越高。
非参数统计(附答案)

《非参数统计》试卷注意事项:1.本试卷适用于经济统计专业学生使用。
2.本试卷共6 页,满分100分,答题时间120分钟。
题号 一 二 三 四 总分 得分一、 选择题(本大题共10小题,每小题1分,共10分)1、以下对非参数检验的描述,哪一项是错误的( )。
A.非参数检验方法不依赖于总体的分布类型 B.应用非参数检验时不考虑被研究对象的分布类型 C.非参数检验的假定条件比较宽松D.非参数检验比较简便2、秩和检验又叫做( )A 、参数检验B 、Wilcoxon 检验C 、非参数检验D 、近似正态检验 3、( )同分校正后,统计量会变小。
A. Kruskal-Wallis 检验B.弗里德曼(Friedman )检验C. Mann-Whitney 检验D. Spearman 等级相关检验 4、配对比较的秩和检验的基本意思是:如果检验假设成立,则对样本来说( )。
A.正秩和的绝对值小于负秩和的绝对值 B.正秩和的绝对值大于负秩和的绝对值C.正秩和的绝对值与负秩和的绝对值不会相差很大D.正秩和的绝对值与负秩和的绝对值相等5、成组设计多个样本比较的秩和检验,当组数大于3时,统计量H 近似( )分布A 、正态B 、2C 、FD 、二项 6、Wilcoxon 符号秩检验不适用于( )。
A 位置的检验 B 连续总体 C 随机性的检验 D 配对样本的检验7、成组设计两样本比较的秩和检验中,描述不正确的是( )。
A .遇有相同数据,若在同一组,取平均秩次 B .遇有相同数据,若在同一组,按顺序编秩2.本评卷人C .遇有相同数据,若不在同一组,按顺序编秩D .遇有相同数据,若不在同一组,取其秩次平均值8、m=4,n=7,Tx=14的双侧检验,则( ) A. Ty=41,在显著性水平0.05时接受原假设 B. Ty=41,在显著性水平0.05时拒绝原假设 C. Ty=42,在显著性水平0.05时拒绝原假设 D. Ty=42,在显著性水平0.05时接受原假设 9、序列3 5 2 7 9 8 6的一致对数目为( )。
统计期末试题题库(附答案)

第一章1、指出下面的变量那一个属于分类变量( D)A.年龄B.工资C.汽车产量D.购买商品时的支付方式(现金、信用卡、支票)2指出下面的变量那一个属于顺序变量(D )A.年龄B.工资C.汽车产量D.员工对企业某项改革措施的态度(赞成、中立、反对)3、指出下面的变量那一的属于数值型变量(A )A.年龄B.性别C.企业类型D。
员工对企业某项改革措施的态度(赞成、中立、反对)4.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。
这项研究的总体是(B )A 2000个家庭B 200万个家庭C 2000个家庭的人均收入D 200万个家庭的总收入5.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。
这项研究的样本是(A )A2000个家庭B200万个家庭C2000个家庭的总收入D200万个家庭的人均收入6.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。
这项研究的参数是(D )A2000个家庭B200万个家庭C2000个家庭的人均收入D200万个家庭的人均收入7.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。
这项研究的统计量是(C )A2000个家庭B200万个家庭C2000个家庭的人均收入D200万个家庭的人均收入8一项研究机构从IT从业者中抽取500人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%回答他们的消费支付方式是用信用卡。
这里的总体是(A )AIT业的全部从业者B500个IT从业者CIT从业者的总收入DIT从业者的消费支付方式9下列不属于描述统计问题的是(A )A根据样本信息对总体进行的推断B了解数据分布的特征C分析感兴趣的总体特征D利用图、表或其他数据汇总工具分析数据10某大学的一位研究人员希望估计该大学本科生平均每月的生活费支出,为此,他调查了200名学生,发现他们平均每月生活费支出是500元。
统计期末考试试题及答案

统计期末考试试题及答案一、选择题(每题2分,共20分)1. 以下哪个是描述性统计中的集中趋势度量?A. 方差B. 标准差C. 平均数D. 极差2. 总体参数和样本统计量的区别在于:A. 总体参数是固定的,样本统计量是变化的B. 总体参数是变化的,样本统计量是固定的C. 两者都是固定的D. 两者都是变化的3. 假设检验中的零假设(H0)通常表示:A. 两组数据有显著差异B. 两组数据没有显著差异C. 数据服从正态分布D. 数据不服从正态分布4. 以下哪个是统计学中用来衡量变量之间线性关系强度的度量?A. 相关系数B. 方差C. 标准差D. 中位数5. 以下哪个是时间序列分析中常用的方法?A. 回归分析B. 方差分析C. 因子分析D. 移动平均6. 在统计推断中,P值的含义是:A. 观测到的样本统计量与零假设一致的概率B. 观测到的样本统计量与零假设不一致的概率C. 零假设为真时,观测到的样本统计量或更极端情况出现的概率D. 零假设为假时,观测到的样本统计量或更极端情况出现的概率7. 以下哪个是统计学中用来衡量数据分布形态的指标?A. 偏度B. 方差C. 标准差D. 相关系数8. 以下哪个是统计学中用来衡量数据分布集中程度的指标?A. 偏度B. 方差C. 标准差D. 峰度9. 在统计学中,样本容量增加时,样本均值的抽样分布将:A. 变得更加分散B. 变得更加集中C. 保持不变D. 无法确定10. 以下哪个是统计学中用来衡量数据变异程度的指标?A. 平均数B. 中位数C. 方差D. 极差二、简答题(每题10分,共30分)1. 解释什么是中心极限定理,并说明其在实际应用中的重要性。
2. 描述什么是回归分析,并解释其在预测和决策中的作用。
3. 简述什么是假设检验,并举例说明其在数据分析中的应用。
三、计算题(每题25分,共50分)1. 给定一组数据:10, 12, 14, 16, 18, 20, 22, 24, 26, 28。
(完整版)非参数统计试题

非参数统计试题
一、试比较参数统计与非参数统计的区别和联系。
(15)
二、请你结合实际谈谈非参数统计的应用。
(15)
三、试验者把一只老鼠放入一个有两扇门的笼子里,并且把门都关上,一扇涂红色一扇涂
蓝
色,然后给老鼠播放一段音乐,再同时打开两扇门,记录老鼠逃出选择的门的颜色,重复了10次,发现有7次从红色门中出来,他的结论是:此时老鼠更喜欢红色。
他同时做另一个试验向10只老鼠注射某种药物,5分钟后有7只死亡,他断定这个结果具有偶然性,即药物不具有危险性。
试分析他的结论的合理性,如果是你,你怎样分析这一问题?可以通过适当计算来说明你的结论。
(20)
四、下列数据是从某个总体中,随机抽取的,数据如下:
34 38 56 23 41 52 37 53 46 37 29 48 35 43试问利用这一组数据我们能分析什么?(不需要计算,只说明怎样分析);若还有一组数据,如:38 45 27 34 46 63 34 48 30 43,我们又如何分析他们?写出你的分析思路。
(20)
五、下面是关于非参数统计的一段文献,试叙述其主要意思(30)。
统计心理学期末考试试题及答案

统计心理学期末考试试题及答案一、选择题(每题2分,共20分)1. 统计心理学中,描述数据集中趋势的量度是:A. 方差B. 标准差C. 平均数D. 众数2. 下列哪项不是描述数据离散程度的统计量?A. 极差B. 标准差C. 均值D. 四分位数间距3. 假设检验中,我们通常使用的显著性水平是:A. 0.01B. 0.05C. 0.10D. 0.504. 相关系数的取值范围是:A. -1到1B. 0到1C. -∞到∞D. 1到∞5. 以下哪个选项是统计心理学中的非参数检验?A. t检验B. 方差分析C. 卡方检验D. 曼-惠特尼U检验二、判断题(每题1分,共10分)6. 标准差总是正值。
7. 相关系数的绝对值越接近1,表示变量间的线性关系越强。
8. 统计心理学中的样本量越大,估计的总体参数越准确。
9. 正态分布是统计心理学中唯一重要的分布。
10. 统计心理学中的回归分析只能用于线性关系。
三、简答题(每题5分,共20分)11. 简述统计心理学中样本和总体的区别。
12. 解释什么是统计显著性,并举例说明其在心理学研究中的应用。
13. 描述回归分析在心理学研究中的作用。
14. 什么是效应量,它在心理学研究中的重要性是什么?四、计算题(每题10分,共30分)15. 给定一组数据:2, 4, 6, 8, 10,计算其平均数、标准差和方差。
16. 如果一个心理学实验的样本大小为30,平均数为50,标准差为10,计算其95%置信区间。
17. 假设有两组数据,A组的均值为20,标准差为5,B组的均值为25,标准差为7,计算两组数据的t值,并且判断是否有统计学上的显著差异。
五、论述题(每题15分,共15分)18. 论述统计心理学在现代心理学研究中的重要性,并举例说明其在实际研究中的应用。
六、案例分析题(每题15分,共10分)19. 假设你是一名心理学研究者,你正在研究不同教育背景对个体心理健康的影响。
请设计一个实验方案,并使用适当的统计方法来分析数据。
非参数统计十道题

非参数统计----十道题09统计学 王若曦114一、 Wilcoxon 符号秩检验下面是10个欧洲城镇每人每年平均消费的酒类相当于纯酒精数,数据已经按升序排列: 4.12 5.81 7.63 9.74 10.39 11.92 12.32 12.89 13.54 14.45 人们普遍认为欧洲各国人均年消费酒量的中位数相当于纯酒精8升,试用上述数据检验这种看法。
数据来源:《非参数统计(第二版)》 吴喜之手算:建立假设组:01H :M=8H :M>8T 2467891046T 5319n=10+-=++++++==++=查表得P=0.032<α=0.05,因此拒绝原假设,即认为欧洲各国人均年消费酒量的中位数多于8升。
SPSS :操作:Analyze ——Nonparametric Tests ——2-Related Sample TestRanksNMean RankSum of Ranksc - xNegative Ranks 7a 6.57 46.00 Positive Ranks 3b 3.009.00Ties 0c Total10由输出结果可知,单侧精确显著性概率P=0.032<=0.05,因此拒绝原假设,即认为欧洲各国人均年消费酒量的中位数多于8升。
与手算结果相同。
R语言:> x=c(4.12,5.81,7.63,9.74,10.39,11.92,12.32,12.89,13.54,14.45)> wilcox.test(x-8,alt="greater")Wilcoxon signed rank testdata: x - 8V = 46, p-value = 0.03223alternative hypothesis: true location is greater than 0由输出结果可知,P=0.03223<α=0.05,因此拒绝原假设,即认为欧洲各国人均年消费酒量的中位数多于8升。
Minitab非参数统计分析试卷及答案

桂林电子科技大学试卷2012—2013学年第 2 学期课号课程名称非参数统计分析(机试)适用班级(或年级、专业)统计学考试时间95 分钟班级学号姓名一、(25分) 桂林市12年3月和13年6月出售的部分精品楼盘均价(单位:千元/平方米)数据分别如下所示:12年3月:7.0,4.3,8.0,4.2,8.5,4.2,8.2,4.2,4.15,4.6,3.5,3.8,4.5,8.7,4.3,5.513年6月:4.2,4.6,6.5,9.0,7.0,6.8,6.2,7.0,8.9,5.5,7.24.6试问:桂林市一年来楼盘价格是否有变化?解:用统计软件Minitab进行Mood中位数检验的步骤如下:1)输入数据:将3月的16指数点值数据输入到C1列的第1到第16个单元格,将6月的12个指数点值数据输入到C1列的第17到28个单元格中:2)输入数据的类别:在C2列中与C1列的数据相对应的第1到第16个单元格都输入“1”,在C2列中与C1列的数据相对应的的第17到28个单元格对输入“2”;结果如下图。
3)选择Stat下拉菜单中选择Nonparametrics选项;4)在Nonparametrics的下拉菜单中选Mood’s Median Test择子选项;5)在对话框的Response方框内键入C1,Factor方框内键入C2.单击OK即可。
主要运行结果及分析:图 1 Mood 中位数检验的输出结果从上图的输出结果可知,整体的中位数为5.5,此时在四格表中5.511 N 的个数是11,检验的p 值为0.063.所以认为桂林市一年来楼盘价格没有变化。
二、(25分) 某汽车驾驶员记录了使用5种不同牌子的汽油每5加仑行驶的距离(哩),数据如下:牌1: 38.5 32.3 31.6 31.5 牌2: 35.3 31.6 34.3 37.2 牌3: 39.0 39.9 44.4 45.9 牌4: 35.8 43.5 42.7 41.2 牌5: 40.3 31.9 36.5 35.8这些数据是否说明这5种牌子的汽油每加仑平均行驶的里程数全相等?解:用统计软件Minitab 进行Kruskal-Wallis 秩和检验的步骤如下:a.输入数据(如将来自牌1、牌2和牌3,牌4,牌5的数据输入到C1列的第1到第4个单元格、第5到第8个单元格和第9到第12个单元格,第13到第16单元格,第17到第20单元格);b.输入数据的类别(如与C1列的数据相对应,在C2列的第1个到第4个单元格都输入“1”,第5到第8个单元格输入“2”,第9到第12个单元格输入“3”,第13到第16个单元格输入“4”,第,17到第20个单元格输入“5”);c.选择Stat下拉菜单;d.选择Nonparametrics选项中的Kruskal-Wallis子选项;e.在Kruskal-Wallis对话框的Response方框中选择C1,Factor方框中选择C2,如下图。
统计学期末考试试卷

统计学期末考试试卷一、选择题(每题2分,共20分)1. 统计学中,用于描述数据集中趋势的度量是()。
A. 方差B. 标准差C. 平均数D. 中位数2. 在统计分析中,以下哪项不是数据的类型()。
A. 定性数据B. 定量数据C. 离散数据D. 连续数据3. 以下哪个选项是统计学中用于描述数据分布形状的统计量()。
A. 均值B. 众数C. 峰度D. 偏度4. 假设检验中,用于确定拒绝或不拒绝原假设的临界值是()。
A. 显著性水平B. 置信区间C. P值D. 检验统计量5. 回归分析中,用于衡量自变量对因变量影响大小的统计量是()。
A. 相关系数B. 回归系数C. 决定系数D. 标准误差6. 在统计学中,以下哪项不是描述数据离散程度的度量()。
A. 极差B. 四分位距C. 标准差D. 均值7. 以下哪项是用于衡量数据分布中心趋势的统计量()。
A. 方差B. 标准差C. 众数D. 极差8. 统计学中,用于描述数据分布的对称性的统计量是()。
A. 均值B. 众数C. 偏度D. 峰度9. 在统计分析中,以下哪项不是数据的类型()。
A. 定类数据B. 定序数据C. 定距数据D. 定比数据10. 以下哪个选项是统计学中用于描述数据分布形状的统计量()。
A. 均值B. 众数C. 峰度D. 偏度二、填空题(每题2分,共20分)1. 统计学中,用于描述数据离散程度的度量之一是________。
2. 在统计分析中,数据的类型包括定性数据和________。
3. 统计学中,用于描述数据分布形状的统计量之一是________。
4. 假设检验中,用于确定拒绝或不拒绝原假设的临界值是________。
5. 回归分析中,用于衡量自变量对因变量影响大小的统计量是________。
6. 在统计学中,用于描述数据分布中心趋势的统计量之一是________。
7. 统计学中,用于描述数据分布的对称性的统计量是________。
8. 在统计分析中,数据的类型包括定类数据、定序数据、定距数据和________。
统计学期末复习试题9套部分含答案

一、 简答题(共10题,每题6分)1. 计量资料的集中趋势和离散趋势的指标有哪些?计量资料集中趋势的指标有:均数、几何均数、中位数;计量资料离散趋势的指标有:极差与四分位数间距、方差与标准差、变异系数。
2. 实验设计的基本要素和基本原则分别是什么?基本要素:受试对象、处理因素、实验效应;基本原则:对照原则、随机化原则、重复原则。
3. 常用的统计图有哪几种?有条图、圆图、百分比条图、线图、直方图、散点图、箱式图、统计地图 4. 线性回归模型的前提条件是什么?一是线性,反应变量与自变量呈线性变化趋势;二是独立性,任意两个观察值相互独立,一个个体的取值不受其他个体的影响;三是正态性,在给定值X 时,Y 的取值服从正态分布;四是方差齐性,对于不同的X 值,Y 值的总体变异相同5. 某年级一班、二班各有学生50人。
从两个半各抽取10人测量身高,并求其平均身高。
如果一班的平均身高高于二班,能否推论一班学生的平均身高高于二班?为什么? 不能进行此推论,理由如下。
从一、二班分别抽取的10人,测量其身高,得到的分别是一、二班的一个样本。
样本的平均身高只是一、二班所有同学平均身高的一个点估计值。
既使是按随机化原则进行抽样,由于存在抽样误差,样本均数与总体均数一般很难恰好相等。
因此,不能仅凭两个样本均数高低就作出两总体均数高低的判断,而应通过统计分析,进行统计推断,才能作出判断。
6. 某地区某疾病连续3年患病率分别为6.0%、9.0%、12.0%,则该病3年总的患病率为:(6.0+9.0+12.0)/3=9.00%。
此算法是否正确?为什么? 不正确,理由如下。
对于分组资料计算合计率时,不能简单地把各组率取平均数,而应分别将分子和分母合计,再求出合计率。
7. 某研究探讨体身高与体重的关系,得到r =0.67,同时算得b =-1.8,该分析结果是否正确?为什么?不正确,理由如下。
YYXX XY l l l Y Y X X Y Y X X r =----=∑∑22)()())((,2()()()XY XXX X Y Y l b X X l --==-∑∑r/b=÷,所以r/b>0,而题中求得r/b<0,所以结果不正确。
2017.6非参数统计研究生试题

哈尔滨商业大学
硕士生2016 —2017学年第二学期非参数统计课程试题
五、下表是美国三大汽车公司(A:通用,B:福特,C:克莱斯勒,作为三个处理)的五种不同尺寸的车(I:超小型,II:小型,III:中型,IV:大型,V:运动型,作为五个区组)某年产品的油耗及在相应区组中的秩(括号中)为
I II III IV V 合计(j R)
A 20.3(1)21.2(1)18.2(1)18.6(1)18.5(1) 5
B 25.6(3)24.7(3)19.3(2)19.3(2)20.7(2)12
C 24.0(2)23.1(2)20.6(3)19.8(3)21.4(3)13
检测三个公司的汽车油耗是否有显著差异。
(先指出用什么方法进行检验)
(显著性水平为α=0.05)(10`)
六、一种原料来自三个不同的地区,原料质量被分成三个不同等级。
从这批原料中随机抽取500件进行检验,得样本数据如下表所示,要求检验地区与原料质量之间有无依赖关系(15`)
一级二级三级合计地区1 52 64 24 140
地区2 60 59 52 171
地区3 50 65 74 189
合计162 188 150 500
χ2分布表
主考教师张宇教研室主任签章第 2 页共2页样本
区组。
非参数统计期末九道题(手算+机算)

非参数统计—期末九题汇总目录1.单样本Wilcoxon符号秩检验〔SAS〕 (2)2.Wald-Wolfowitz游程检验法 (4)3.两样本的Kolmogorov-Smirnov检验 (5)4.两个独立样本的M-W-W检验〔SAS〕 (6)5.k个样本的2 检验 (9)6.k个独立样本的Kruskal-Wallis检验(R) (10)7.k个相关样本的Friedman检验〔R〕 (11)8.k个相关样本的Cochran Q检验 (12)9.完全秩评定的Kendall协和系数〔R〕 (14)1.单样本Wilcoxon 符号秩检验〔SAS 〕设5.0ε是对称的连续型分布的中位数,现随机抽查了10名普通男子的血压如下: 98 160 136 128 130 114 123 134 129 107试用Wilcoxon 符号检验法检验假设0H :5.0ε=130,1H :5.0ε≠130,显著性水平为α=0.05。
解 手算:i)秩次和计算表ii)根据表中D 的符号和D 的秩,可以计算得到-T =9+2+6+5+1+7=30 +T =8+4+3=15根据n=9,+T =15,-T =30,查表得-T 的右尾概率为0.213,P=0.213⨯2=0.426,P 值相对于显著性水平α=0.05已足够大,因此抽查数据不拒绝0H ,即认为5.0ε=130。
机算:SPSS 输出结果表2Test Statistics by – xZ -.889aAsymp. Sig. (2-tailed) .374Exact Sig. (2-tailed) .426Exact Sig. (1-tailed) .213Point Probability .033a. Based on positive ranks.b. Wilcoxon Signed Ranks Test表1显示:y-x的负秩即满足y<x的为6,而y-x的正秩即满足y-x>3的为3,同分的既满足x=y的为1,总共10。
非参数统计试题及答案

非参数统计试题及答案一、选择题1. 非参数统计方法是指在统计分析中不依赖于数据的分布形态的统计方法。
以下哪项不是非参数统计方法的特点?A. 不需要预先假定总体分布B. 对数据的分布形态要求严格C. 适用于小样本数据D. 可用于顺序变量和计数数据答案:B2. 以下哪个统计量是用来检验两个独立样本的中位数是否有显著差异的?A. t检验B. 方差分析C. Wilcoxon秩和检验D. 卡方检验答案:C3. 在非参数统计中,如果样本量很小,以下哪个方法可以用来估计总体分布?A. 直方图B. 箱线图C. 核密度估计D. 以上都是答案:D二、简答题1. 请简述非参数统计方法相对于参数统计方法的优势。
答案:非参数统计方法的优势在于它们不依赖于数据的分布形态,因此对于不符合正态分布的数据集也能适用。
此外,非参数方法通常对异常值不敏感,适用于小样本数据,并且可以处理顺序变量和计数数据。
2. 描述一下Kruskal-Wallis H检验的基本原理及其适用场景。
答案:Kruskal-Wallis H检验是一种非参数方法,用于比较三个或更多个独立样本的中位数是否存在显著差异。
其基本原理是将所有数据合并并进行秩次排序,然后比较各组的秩和。
如果所有组的中位数相同,则各组的秩和应该大致相等。
如果发现某个组的秩和显著高于或低于其他组,则该组的中位数可能与其他组存在显著差异。
该检验适用于样本量不均等、数据不满足正态分布或未知分布的情况。
三、计算题1. 假设有四个独立样本的数据如下,使用Kruskal-Wallis H检验来检验这四个样本的中位数是否有显著差异。
样本1: 10, 12, 8样本2: 15, 18, 20, 17样本3: 22, 25, 23, 24, 21样本4: 30, 28, 29, 27, 26答案:首先,将所有数据合并并进行秩次排序。
然后计算每个样本的秩和,接着使用Kruskal-Wallis H检验的公式计算H值。
医学统计学期末试卷四A(1)(1)

医学统计学期末试卷四A题型:A11.关于率的标准化,以下错误的是A.两个率相等时,其标化后的标化率也一定相等B.比较两个内部构成不同的率时,要做标化处理C.标化率只是相对水平,不能代表实际水平D.标准不同,标化率也不同E.两个率相等时,其标化后的标化率不一定相等2.由于仪器未进行归零校正,所引起的误差是A.系统误差B.随机测量误差C.抽样误差D.偶然误差E.相对误差3.从正态分布资料中随机抽样,变量值位于μ-2.58σ到μ+1.96σ间的概率是A.95%B.97%C.99.5%D.视均数而定E.视标准差而定4.描述某地300名健康成人发汞含量的分布,宜绘制的统计图是A.直条图B.直方图C.线图D.散点图E.百分条图5.在下列均数多重比较的方法中,最为保守的是A.LSD法B.SNK法C.Dunnett法D.Bonfferoni法E.z检验6.在总体方差相等的条件下,由两个独立样本计算两个总体均数之差的可信区间包含了0,则A.可认为两样本均数差别无统计学意义B.可认为两样本均数差别有统计学意义C.可认为两总体均数差别无统计学意义D.可认为两总体均数差别有统计学意义E.可认为两总体均数和样本均数差别都有统计学意义7.一般地,方差分析适用的变量类型的资料为A.定性变量B.有序变量C.定量变量D.二分类变量E.多分类变量8.在统计检验中,是否选用非参数统计方法,正确的是A.根据研究目的和数据特征确定B.可在算出几个统计量和得出初步结论后进行选择C.要看哪个统计结论更符合专业理论D.要看哪个P值更小E.基于研究目的9.当两总体方差不等时,适用于两样本均数比较的方法是A.t检验B.t'检验C.Z检验D.方差齐性F检验E.方差分析10.利用一次横断面调查资料,描述职业和肝炎患病率关系应该用A.散点图B.直方图C.直条图D.圆图E.箱式图11.直方图可用于A.某现象的内部构成B.各现象的比较C.某现象随另一现象的伴随变化趋势D.某现象的频数分布E.某现象的发展速度12.百分条图可用于A.某现象的内部构成B.各现象的比较C.某现象随另一现象的伴随变化趋势D.某现象的频数分布E.某现象的发展速度13.观察意外死亡在不同年份的变化趋势,宜选择的图形A.直条图B.线图C.圆图D.半对数线图E.直方图14.描述婴儿和成人的体重变异度大小,宜选择的指标是A.变异系数B.方差C.标准差D.标准误E.全距15.从正态分布资料中随机抽样,变量值位于μ-1.96σ到μ+1.96σ间的概率是A.95%B.92.5%C.99%D.视均数而定E.视标准差而定16.计算相对数的目的是A.为了进行显著性检验B.为了便于比较C.为了表示绝对水平D.为了表示实际水平E.为了表示相对水平17.关于随机抽样,下列说法正确的是A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.随机抽样即随意抽取个体C.研究者在抽样时应精心挑选个体,以使样本更能代表总体D.通过统计设计可以消除抽样误差E.为确保样本具有更好的代表性,样本量应越大越好18.20个人每人抽取一个样本量为50的随机样本并计算80%可信区间。
非参数统计——期末试卷

每小题20分1. 下面是DMBA 公司为了研究某一种癌症所做的试验。
Group 1和2分别代表试验的控制组和对照组。
下面是所得的试验老鼠的生存数据,*代表数据被右删失。
请回答下面问题:Group 1: 164 188 190 192 206 209 213 216 220 230 234 246265 304 216* 244*Group 2: 156 163 198 205 232 233 239 240 261 280 296 323204* 344*1)请给出非参数的Kaplan-Meier 估计的公式,并计算在时间点t=156,164这两点的具体估计值,若假设在t=164处被删失,计算此处的估计值。
2)如果协变量分别取为1和0,请用Cox 模型模拟上述数据,给出计算协变量的系数的相关公式;3)给出Kaplan-Meier 估计的Matlab 程序。
2. 下面是16个学生的体能测试数据: P81例3.1482 53 70 73 103 71 69 80 54 38 87 91 62 75 65 77。
1) 请用顺序统计量方法构造置信度为95%的中位数的置信区间;2) 编写上述计算的Matlab 程序3. 下面是申请进入法学院学习的学生的LSAT 测试成绩和GPA 成绩。
LSAT: 576 635 558 578 666 580 555 661 651 605 653 575 545 572 594GPA: 3.39 3.30 2.81 3.03 3.44 3.07 3.00 3.43 3.36 3.13 3.12 2.742.76 2.883.96每个数据点用(,),i i i X Y Z 其中i Y 表示LSAT 成绩,i Z 表示GPA 成绩1) 计算i Y 和i Z 的Pearson 相关系数 (只写出公式); (5分)2) 使用Boostrap 方法估计相关系数的标准误差(只写出算法步骤);(5分)3) 编写相应的Matlab 程序。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
每小题20分
1. 下面是DMBA 公司为了研究某一种癌症所做的试验。
Group 1和2分别代表试验的控制组和对照组。
下面是所得的试验老鼠的生存数据,*代表数据被右删失。
请回答下面问题:
Group 1: 164 188 190 192 206 209 213 216 220 230 234 246
265 304 216* 244*
Group 2: 156 163 198 205 232 233 239 240 261 280 296 323
204* 344*
1)请给出非参数的Kaplan-Meier 估计的公式,并计算在时间点t=156,164这两点的具体估计值,若假设在t=164处被删失,计算此处的估计值。
2)如果协变量分别取为1和0,请用Cox 模型模拟上述数据,给出计算协变量的系数的相关公式;
3)给出Kaplan-Meier 估计的Matlab 程序。
2. 下面是16个学生的体能测试数据: P81例3.14
82 53 70 73 103 71 69 80 54 38 87 91 62 75 65 77。
1) 请用顺序统计量方法构造置信度为95%的中位数的置信区间;
2) 编写上述计算的Matlab 程序
3. 下面是申请进入法学院学习的学生的LSAT 测试成绩和GPA 成绩。
LSAT: 576 635 558 578 666 580 555 661 651 605 653 575 545 572 594
GPA: 3.39 3.30 2.81 3.03 3.44 3.07 3.00 3.43 3.36 3.13 3.12 2.74
2.76 2.88
3.96
每个数据点用(,),i i i X Y Z 其中i Y 表示LSAT 成绩,i Z 表示GPA 成绩
1) 计算i Y 和i Z 的Pearson 相关系数 (只写出公式); (5分)
2) 使用Boostrap 方法估计相关系数的标准误差(只写出算法步骤);(5分)
3) 编写相应的Matlab 程序。
(10分)
4. 假设数据12(,,)n X X X 是来自真实密度为()f x 的简单随机字样,
1) 请给出该密度函数的直方图密度估计;
2) 求直方图密度估计的期望和方差;
3) 给出在平方损失下的最优窗宽公式,并证明此结论
5. 已知 随机变量i Y =()i i m x ξ+,设计变量i x 来自均匀分布[0,1]U ,i ξ是服从均值和方
差分别为0和2的正态分布,请回答下列问题(每问各5分)
1) 假设函数()m x 完全未知,请用局部回归给出它的一个估计(取p=1,只写出公式);
2) 写出最优窗宽选择公式;
3) 请用Matlab 实现上述计算(编写程序)[选Epanechikov 核,假设2()sin()m x x x =+]
4) 并作图比较()m x 和它的估计(并做出散点图);。