非参数统计期末九道题(手算+机算)
非参数统计部分课后习题参考答案
课后习题参考答案第一章p23-252、(2)有两组学生,第一组八名学生的成绩分别为x 1:100,99,99,100,99,100,99,99;第二组三名学生的成绩分别为x 2:75,87,60。
我们对这两组数据作同样水平a=0.05的t检验(假设总体均值为u ):H 0:u=100 H 1:u<100。
第一组数据的检验结果为:df=7,t 值为3.4157,单边p 值为0.0056,结论为“拒绝H 0:u=100。
”(注意:该组均值为99.3750);第二组数据的检验结果为:df=2,t 值为3.3290,单边p值为0.0398;结论为“接受H 0:u=100。
”(注意:该组均值为74.000)。
你认为该问题的结论合理吗?说出你的理由,并提出该如何解决这一类问题。
答:这个结论不合理(6分)。
因为,第一组数据的结论是由于p-值太小拒绝零假设,这时可能犯第一类错误的概率较小,且我们容易把握;而第二组数据虽不能拒绝零假设,但要做出“在水平a时,接受零假设”的说法时,还必须涉及到犯第二类错误的概率。
(4分)然而,在实践中,犯第二类错误的概率多不易得到,这时说接受零假设就容易产生误导。
实际上不能拒绝零假设的原因很多,可能是证据不足(样本数据太少),也可能是检验效率低,换一个更有效的检验之后就可以拒绝了,当然也可能是零假设本身就是对的。
本题第二组数据明显是由于证据不足,所以解决的方法只有增大样本容量。
(4分)第三章p68-713、在某保险种类中,一次关于1998年的索赔数额(单位:元)的随机抽样为(按升幂排列): 4632,4728,5052,5064,5484,6972,7596,9480,14760,15012,18720,21240,22836,52788,67200。
已知1997年的索赔数额的中位数为5064元。
(1)是否1998年索赔的中位数比前一年有所变化?能否用单边检验来回答这个问题?(4分) (2)利用符号检验来回答(1)的问题(利用精确的和正态近似两种方法)。
非参数统计作业
非参数统计2010-11-14一、思考题1.当一组配对计量资料既可作参数又可作非参数检验,应首选何种检验方法,为什么?2.两小样本比较的假设检验首先应如何考虑?3.当总体分布类型不清楚时最好采用何种检验方法?4.参数检验和非参数检验的区别何在,各有何优缺点?5.非参数检验是针对总体分布之间的比较吗?6.简要回答进行非参数统计检验的适用条件。
7.你学过哪些设计的秩和检验,各有什么用途?8.试写出非参数统计方法的主要有缺点。
二、选择题1.配对比较秩和检验的基本思想是:若检验假设成立,则对样本来说( )。
A .正秩和与负秩和的绝对值不会相差很大 B .正秩和与负秩和的绝对值相等 C .正秩和与负秩和的绝对值相差很大 D .不能得出结论 E .以上都不对2.设配对资料的变量值为1X 和2X ,则配对资料的秩和检验是( )。
A .把1X 和2X 的差数从小到大排序 B .分别按1X 和2X 从小到大排序 C .把1X 和2X 综合从小到大排序 D .把1X 和2X 的和数从小到大排序 E .把1X 和2X 的差数的绝对值从小到大排序 3.下列哪项不是非参数统计的优点( )。
A .不受总体分布的限制 B .适用于等级资料 C .适用于未知分布型资料 D .适用于正态分布资料 E .适用于分布呈明显偏态的资料 4.等级资料的比较宜采用( )。
A .秩和检验B .F 检验C .t 检验D .2检验 E .u 检验 5.在进行成组设计两样本秩和检验时,以下检验假设哪种是正确的( )。
A .两样本均数相同B .两样本的中位数相同C .两样本对应的总体均数相同D .两样本对应的总体分布相同E .两样本对应的总体均数不同6.以下检验方法中,不属于非参数检验方法的是( )。
A .Friedman 检验 B .符号检验 C .Kruskal-Wallis 检验 D .Wilcoxon 检验 E .t 检验7.成组设计两样本比较的秩和检验中,描述不正确的是( )。
非参数统计Wald-Wolfowitz游程检验
二、Wald-Wolfowitz
游程检验
有低蛋白和高蛋白两种料喂养大白鼠, 以比较它们对大白鼠体重的增加是否 有显著不同的影响,为此对m=10,n=10只大白鼠分别喂养低蛋白和高蛋白两种饲 料,得增重量X,Y(单位:g)的表如下:
饲料 低蛋白 X 高蛋白 Y 64 42 71 52 72 61 75 65 82 69 增重量 83 75 84 78 90 78 91 78 96 81
给定显著性水平 =0.05,试用游程检验法检验两种饲料的影响有无显著差异。 1、手算 建立假设: H0:两种饲料对大白鼠无显著差异 H1:两种饲料对大白鼠有显著差异 将X,Y的数据按从小到大混合排列,得X,Y的混合样本序列: Y Y Y X Y Y X X X Y Y Y Y Y X X X X X X 故得游程总数U=6, m=10,n=10,查表得,U=6的概率为0.019,由于是双 侧检验,对于显著性水平α=0.05,对应的P值为2× 0.019 = 0.038 < ������. ������5,因 此拒绝原假设,即表明两种饲料对大白鼠有显著差异。 2、Spss告效应是否显著。 1、手算 建立假设: H0:广告效应不显著 H1:广告效应显著 不看广告组记为 x,看广告组记为 y。 检验统计量计算表
X 62 83 96 99 71 60 97 100 Y 87 92 90 86 94 95 82 91 D=x-y -25 -9 6 13 -23 -35 15 9 |D| 25 9 6 13 23 35 15 9 |D|的秩 7 2.5 1 4 6 8 5 2.5 D 的符号 + + + +
在非参数检验中选择两个独立样本检验
对话框: 在Define Groups输入1和2。 在Test Type选中Wald-Wolfowitz runs。
非计算机专业学生计算机基础考试必过题及答案
非计算机专业学生计算机基础考试必过题及答案一、选择题1. 计算机硬件系统主要包括哪些部分?A. 运算器、控制器、存储器、输入设备、输出设备B. 运算器、控制器、存储器、鼠标、键盘C. 运算器、控制器、存储器、显示器、打印机答案:A2. 以下哪个软件不属于办公自动化软件?A. WordB. ExcelC. Photoshop答案:C3. 下列哪种计算机语言被称为“机器语言”?A. 汇编语言B. 高级语言C. 机器语言答案:C二、填空题1. 计算机网络的目的是实现______和______。
答案:数据传输、资源共享2. 计算机病毒是指______、______和______。
答案:程序、破坏性、自我复制3. 下列属于计算机输出设备的是______、______和______。
答案:显示器、打印机、绘图仪三、判断题1. 计算机只能进行数值计算。
(错误)2. 计算机操作系统的功能是管理计算机硬件和软件资源。
(正确)3. 计算机网络的传输速率与带宽成正比。
(正确)四、简答题1. 简述计算机硬件系统和软件系统的关系。
答案:计算机硬件系统是计算机的物理实体,包括运算器、控制器、存储器、输入设备和输出设备等。
计算机软件系统是计算机的运行程序和相关的文档,分为系统软件和应用软件。
硬件系统和软件系统相互依赖,共同构成计算机系统。
2. 简述计算机病毒的特点。
答案:计算机病毒具有以下特点:(1)破坏性:病毒会破坏计算机内的数据和程序;(2)自我复制:病毒具有自我复制功能,能够迅速传播;(3)隐藏性:病毒隐藏在正常程序中,不易被发现;(4)激发性:病毒在特定条件下被激发,执行破坏操作。
通过以上题目及答案的学习,希望非计算机专业的同学们能够在计算机基础考试中取得好成绩。
同时,也建议同学们在平时的学习中,加强对计算机基础知识的学习,提高自己的计算机操作能力。
非参数统计部分课后练习习题参考答案.docx
课后习题参考答案第一章 p23-252、( 2)有两组学生,第一组八名学生的成绩分别为x1: 100, 99,99,100,99, 100, 99,99;第二组三名学生的成绩分别为x2:75,87,60 。
我们对这两组数据作同样水平a=的t检验(假设总体均值为u): H0: u=100 H 1:u<100。
第一组数据的检验结果为:df=7 , t 值为,单边p 值为,结论为“拒绝H0:u=100。
”(注意:该组均值为);第二组数据的检验结果为:df=2 , t值为,单边p值为; 结论为“接受H0: u=100。
”(注意:该组均值为)。
你认为该问题的结论合理吗说出你的理由,并提出该如何解决这一类问题。
答:这个结论不合理( 6 分)。
因为,第一组数据的结论是由于p-值太小拒绝零假设,这时可能犯第一类错误的概率较小,且我们容易把握;而第二组数据虽不能拒绝零假设,但要做出“在水平a时,接受零假设”的说法时,还必须涉及到犯第二类错误的概率。
( 4 分)然而,在实践中,犯第二类错误的概率多不易得到,这时说接受零假设就容易产生误导。
实际上不能拒绝零假设的原因很多,可能是证据不足(样本数据太少),也可能是检验效率低,换一个更有效的检验之后就可以拒绝了,当然也可能是零假设本身就是对的。
本题第二组数据明显是由于证据不足,所以解决的方法只有增大样本容量。
(4 分)第三章 p68-713、在某保险种类中,一次关于1998 年的索赔数额(单位:元)的随机抽样为(按升幂排列):4632 ,4728, 5052, 5064, 5484, 6972, 7596, 9480 ,14760,15012, 18720, 21240, 22836, 52788,67200。
已知 1997 年的索赔数额的中位数为5064 元。
( 1)是否 1998 年索赔的中位数比前一年有所变化能否用单边检验来回答这个问题(4分)( 2)利用符号检验来回答(1)的问题(利用精确的和正态近似两种方法)。
(完整版)非参数统计试题
非参数统计试题
一、试比较参数统计与非参数统计的区别和联系。
(15)
二、请你结合实际谈谈非参数统计的应用。
(15)
三、试验者把一只老鼠放入一个有两扇门的笼子里,并且把门都关上,一扇涂红色一扇涂
蓝
色,然后给老鼠播放一段音乐,再同时打开两扇门,记录老鼠逃出选择的门的颜色,重复了10次,发现有7次从红色门中出来,他的结论是:此时老鼠更喜欢红色。
他同时做另一个试验向10只老鼠注射某种药物,5分钟后有7只死亡,他断定这个结果具有偶然性,即药物不具有危险性。
试分析他的结论的合理性,如果是你,你怎样分析这一问题?可以通过适当计算来说明你的结论。
(20)
四、下列数据是从某个总体中,随机抽取的,数据如下:
34 38 56 23 41 52 37 53 46 37 29 48 35 43试问利用这一组数据我们能分析什么?(不需要计算,只说明怎样分析);若还有一组数据,如:38 45 27 34 46 63 34 48 30 43,我们又如何分析他们?写出你的分析思路。
(20)
五、下面是关于非参数统计的一段文献,试叙述其主要意思(30)。
非参数统计
(9-4)
实例演示
本例,将 N=30,R1=202, R2=172, R3=91, 代入公式 得:H=8.508, Hc=8.517 差卡方值表,P252
a =0.05, df=2 卡方界值χ2=5.99
结论: P<0.05,按=0.05的检验水准, 拒绝 H0 ,接受 H1 ,说明 三组大鼠糖水进食量
解题分析
━━━━━━━━━━━━━━━━ 组别 例数 均数 标准差 ──────────────── 逍遥散 10 20.120 4.350 西药 10 18.570 3.806 空白对照 10 15.080 1.370 ━━━━━━━━━━━━━━━━ 经Bartlett 方差齐性检验, 卡方 =9.87,p值 0.0072,推断得三个总体方差不等。不能 采用F检验。
1.建立假设、确定显著水平α=0.05 H0 :中药组与西药组患者疗后的IL-8值 总体分布位置相同 H1 :中药组与西药组患者疗后的IL-8值 总体分布位置不同
(2)求秩和: 以样本例数小者为n1,其秩和(T1)为T, 若两样本例数相等,可任取一样本的秩 和(T1或T2)为T, 本例T=62.5;
解决办法
表9-3数据资料分析: 排队后各组的秩和--- Kruskal-Wallis H非参 数统计检验。
中位数
本例中, 逍遥散组中位数为18.7g, 西药组中位数为18.2g, 空白对照组中位数为15.05g, 三组样本的中位数不同的原因?
解题步骤:
1.建立假设、确定显著水平α=0.05 H0:三组大鼠糖水进食量总体分布位置 相同 H1:三组大鼠糖水进食量总体分布位置 不全相同
2.计算统计量u
方法
(1)求差值 (2)编秩
Minitab非参数统计分析试卷及答案
桂林电子科技大学试卷2012—2013学年第 2 学期课号课程名称非参数统计分析(机试)适用班级(或年级、专业)统计学考试时间95 分钟班级学号姓名一、(25分) 桂林市12年3月和13年6月出售的部分精品楼盘均价(单位:千元/平方米)数据分别如下所示:12年3月:7.0,4.3,8.0,4.2,8.5,4.2,8.2,4.2,4.15,4.6,3.5,3.8,4.5,8.7,4.3,5.513年6月:4.2,4.6,6.5,9.0,7.0,6.8,6.2,7.0,8.9,5.5,7.24.6试问:桂林市一年来楼盘价格是否有变化?解:用统计软件Minitab进行Mood中位数检验的步骤如下:1)输入数据:将3月的16指数点值数据输入到C1列的第1到第16个单元格,将6月的12个指数点值数据输入到C1列的第17到28个单元格中:2)输入数据的类别:在C2列中与C1列的数据相对应的第1到第16个单元格都输入“1”,在C2列中与C1列的数据相对应的的第17到28个单元格对输入“2”;结果如下图。
3)选择Stat下拉菜单中选择Nonparametrics选项;4)在Nonparametrics的下拉菜单中选Mood’s Median Test择子选项;5)在对话框的Response方框内键入C1,Factor方框内键入C2.单击OK即可。
主要运行结果及分析:图 1 Mood 中位数检验的输出结果从上图的输出结果可知,整体的中位数为5.5,此时在四格表中5.511 N 的个数是11,检验的p 值为0.063.所以认为桂林市一年来楼盘价格没有变化。
二、(25分) 某汽车驾驶员记录了使用5种不同牌子的汽油每5加仑行驶的距离(哩),数据如下:牌1: 38.5 32.3 31.6 31.5 牌2: 35.3 31.6 34.3 37.2 牌3: 39.0 39.9 44.4 45.9 牌4: 35.8 43.5 42.7 41.2 牌5: 40.3 31.9 36.5 35.8这些数据是否说明这5种牌子的汽油每加仑平均行驶的里程数全相等?解:用统计软件Minitab 进行Kruskal-Wallis 秩和检验的步骤如下:a.输入数据(如将来自牌1、牌2和牌3,牌4,牌5的数据输入到C1列的第1到第4个单元格、第5到第8个单元格和第9到第12个单元格,第13到第16单元格,第17到第20单元格);b.输入数据的类别(如与C1列的数据相对应,在C2列的第1个到第4个单元格都输入“1”,第5到第8个单元格输入“2”,第9到第12个单元格输入“3”,第13到第16个单元格输入“4”,第,17到第20个单元格输入“5”);c.选择Stat下拉菜单;d.选择Nonparametrics选项中的Kruskal-Wallis子选项;e.在Kruskal-Wallis对话框的Response方框中选择C1,Factor方框中选择C2,如下图。
算法题-计算机算法设计与分析期末试题4套(含答案)
算法题-计算机算法设计与分析期末试题4套(含答案)(1)用计算机求解问题的步骤:1、问题分析2、数学模型建立3、算法设计与选择4、算法指标5、算法分析6、算法实现7、程序调试8、结果整理文档编制(2)算法定义:算法是指在解决问题时,按照某种机械步骤一定可以得到问题结果的处理过程(3)算法的三要素1、操作2、控制结构3、数据结构算法具有以下5个属性:有穷性:一个算法必须总是在执行有穷步之后结束,且每一步都在有穷时间内完成。
确定性:算法中每一条指令必须有确切的含义。
不存在二义性。
只有一个入口和一个出口可行性:一个算法是可行的就是算法描述的操作是可以通过已经实现的基本运算执行有限次来实现的。
输入:一个算法有零个或多个输入,这些输入取自于某个特定对象的集合。
输出:一个算法有一个或多个输出,这些输出同输入有着某些特定关系的量。
算法设计的质量指标:正确性:算法应满足具体问题的需求;可读性:算法应该好读,以有利于读者对程序的理解;健壮性:算法应具有容错处理,当输入为非法数据时,算法应对其作出反应,而不是产生莫名其妙的输出结果。
效率与存储量需求:效率指的是算法执行的时间;存储量需求指算法执行过程中所需要的最大存储空间。
一般这两者与问题的规模有关。
经常采用的算法主要有迭代法、分而治之法、贪婪法、动态规划法、回溯法、分支限界法迭代法也称“辗转法”,是一种不断用变量的旧值递推出新值的解决问题的方法。
利用迭代算法解决问题,需要做好以下三个方面的工作:一、确定迭代模型。
在可以用迭代算法解决的问题中,至少存在一个直接或间接地不断由旧值递推出新值的变量,这个变量就是迭代变量。
二、建立迭代关系式。
所谓迭代关系式,指如何从变量的前一个值推出其下一个值的公式(或关系)。
迭代关系式的建立是解决迭代问题的关键,通常可以使用递推或倒推的方法来完成。
三、对迭代过程进行控制。
在什么时候结束迭代过程?这是编写迭代程序必须考虑的问题。
不能让迭代过程无休止地重复执行下去。
2022年南京理工大学计算机科学与技术专业《数据结构与算法》科目期末试卷A(有答案)
2022年南京理工大学计算机科学与技术专业《数据结构与算法》科目期末试卷A(有答案)一、选择题1、有一个100*90的稀疏矩阵,非0元素有10个,设每个整型数占2字节,则用三元组表示该矩阵时,所需的字节数是()。
A.60B.66C.18000D.332、下列排序算法中,占用辅助空间最多的是()。
A.归并排序B.快速排序C.希尔排序D.堆排序3、以下数据结构中,()是非线性数据结构。
A.树B.字符串C.队D.栈4、动态存储管理系统中,通常可有()种不同的分配策略。
A.1B.2C.3D.45、在用邻接表表示图时,拓扑排序算法时间复杂度为()。
A.O(n)B.O(n+e)C.O(n*n)D.O(n*n*n)6、下列选项中,不能构成折半查找中关键字比较序列的是()。
A.500,200,450,180 B.500,450,200,180C.180,500,200,450 D.180,200,500,4507、已知关键字序列5,8,12,19,28,20,15,22是小根堆(最小堆),插入关键字3,调整后的小根堆是()。
A.3,5,12,8,28,20,15,22,19B.3,5,12,19,20,15,22,8,28C.3,8,12,5,20,15,22,28,19D.3,12,5,8,28,20,15,22,198、已知一棵二叉树的前序遍历结果为ABCDEF,中序遍历结果为CBAEDF,则后序遍历结果为()。
A.CBEFDAB.FEDCBAC.CBEDFAD.不定9、一棵非空的二叉树的前序序列和后序序列正好相反,则该二叉树一定满足()。
A.其中任意一个结点均无左孩子B.其中任意一个结点均无右孩子C.其中只有一个叶结点D.其中度为2的结点最多为一个10、下列二叉排序树中查找效率最高的是()。
A.平衡二叉树B.二叉查找树C.没有左子树的二叉排序树D.没有右子树的二叉排序树二、填空题11、对单链表中元素按插入方法排序的C语言描述算法如下,其中L为链表头结点指针。
2002级非计算机专业上机考试题目
2002级非计算机专业上机考试题目【1.1】输入n值,输出如图所示矩形。
* * * * * ** * * * * ** * * * * ** * * * * ** * * * * ** * * * * *n=6时的矩形【1.2】输入n值,输出如图所示平行四边形。
* * * * * ** * * * * ** * * * * ** * * * * ** * * * * ** * * * * *n=6时的平行四边形【1.3】输入n值,输出如图所示高为n的等腰三角形。
** * ** * * * ** * * * * * ** * * * * * * * ** * * * * * * * * * *n=6时的等腰三角形【1.4】输入n值,输出如图所示高为n的等腰三角形。
* * * * * * * * * * ** * * * * * * * ** * * * * * ** * * * ** * **n=6时的倒等腰三角形【1.5】输入n值,输出如图所示高和上底均为n的等腰梯形。
* * * * ** * * * * * ** * * * * * * * ** * * * * * * * * * ** * * * * * * * * * * * *n=5时的等腰梯形【1.6】输入n值,输出如图所示高和上底均为n的等腰空心梯形。
* * * * ** ** ** ** * * * * * * * * * * * *n=5时的空心等腰梯形【1.7】输入n值,输出如图所示边长为n的空心正六边型。
* * * * ** ** ** ** ** ** ** ** * * * *n=5时的空心正六边型【1.8】输入n值,输出如图所示图形。
* ** ** ** *** ** ** ** *n=5时的X形【1.9】输入n值,输出如图所示图形。
* * * * ***** * * * *n=5时的Z形【1.10】输入n值,输出如图所示图形。
4.3非数值计算 练习题-高中信息技术同步备课系列(教科版2019 必修1)
4.2非数值计算练习题1.以下选项中,对于递归程序的描述错误的是()A.递归程序都可以有非递归编写方法B.执行效率高C.一定要有基例D.书写简单2.下列能用二分查找解决问题的序列是()A. 1,2,5,9,19,28,73B. 9,8,5,3,2,14,33C. 1,3,5,7,9,11,13D. 98,65,44,23,47,23.重复调用自身的函数是()A. 迭代B. 递归C. 二分查找D. 均不是4.关于递归函数的描述,以下选项中正确的是()A.函数比较复杂B.包含一个循环结构C.函数名称作为返回值D.函数内部包含对本函数的再次调用5.根据题目不补全下列代码。
题目:某路公共汽车,总共有八站,从一号站发轩时车上已有n位乘客,到了第二站先下一半乘客,再上来了六位乘客;到了第三站也先下一半乘客,再上来了五位乘客,以后每到一站都先下车上已有的一半乘客,再上来了乘客比前一站少一个……,到了终点站车上还有乘客六人,问发车时车上的乘客有多少?def num(i):if i == ① : # 终点站return ②else:return (num(i+1)-8+i)*2i = eval(input())print(num(i))6.根据题目不补全下列代码。
题目:有一群猴子摘来了一批桃子,猴王规定每天只准吃一半加一只(即第二天吃剩下的一半加一只,以此类推),第九天正好吃完,问猴子们摘来了多少桃子?def peach(n):if ① :return 0elif n == 9:return 2 # 第九天还有两个桃子,都被吃了else:return (peach(n+1)+1)*2print("猴子们摘来了:{}个桃子".format(peach(1)))s = peach(1)for i in range( ② , ③ ):print("第{}天吃了{}个桃子,剩余桃子数为{}". format(i, s-peach(i+1), peach(i+1)))s = peach(i+1)7.迭代和递归的相同点与不同点。
非参数统计十道题
非参数统计----十道题09统计学 王若曦114一、 Wilcoxon 符号秩检验下面是10个欧洲城镇每人每年平均消费的酒类相当于纯酒精数,数据已经按升序排列: 4.12 5.81 7.63 9.74 10.39 11.92 12.32 12.89 13.54 14.45 人们普遍认为欧洲各国人均年消费酒量的中位数相当于纯酒精8升,试用上述数据检验这种看法。
数据来源:《非参数统计(第二版)》 吴喜之手算:建立假设组:01H :M=8H :M>8T 2467891046T 5319n=10+-=++++++==++=查表得P=0.032<α=0.05,因此拒绝原假设,即认为欧洲各国人均年消费酒量的中位数多于8升。
SPSS :操作:Analyze ——Nonparametric Tests ——2-Related Sample TestRanksNMean RankSum of Ranksc - xNegative Ranks 7a 6.57 46.00 Positive Ranks 3b 3.009.00Ties 0c Total10由输出结果可知,单侧精确显著性概率P=0.032<=0.05,因此拒绝原假设,即认为欧洲各国人均年消费酒量的中位数多于8升。
与手算结果相同。
R语言:> x=c(4.12,5.81,7.63,9.74,10.39,11.92,12.32,12.89,13.54,14.45)> wilcox.test(x-8,alt="greater")Wilcoxon signed rank testdata: x - 8V = 46, p-value = 0.03223alternative hypothesis: true location is greater than 0由输出结果可知,P=0.03223<α=0.05,因此拒绝原假设,即认为欧洲各国人均年消费酒量的中位数多于8升。
非参数统计期末九道题(手算+机算)
非参数统计—期末九题汇总目录1.单样本Wilcoxon符号秩检验〔SAS〕 (2)2.Wald-Wolfowitz游程检验法 (4)3.两样本的Kolmogorov-Smirnov检验 (5)4.两个独立样本的M-W-W检验〔SAS〕 (6)5.k个样本的2 检验 (9)6.k个独立样本的Kruskal-Wallis检验(R) (10)7.k个相关样本的Friedman检验〔R〕 (11)8.k个相关样本的Cochran Q检验 (12)9.完全秩评定的Kendall协和系数〔R〕 (14)1.单样本Wilcoxon 符号秩检验〔SAS 〕设5.0ε是对称的连续型分布的中位数,现随机抽查了10名普通男子的血压如下: 98 160 136 128 130 114 123 134 129 107试用Wilcoxon 符号检验法检验假设0H :5.0ε=130,1H :5.0ε≠130,显著性水平为α=0.05。
解 手算:i)秩次和计算表ii)根据表中D 的符号和D 的秩,可以计算得到-T =9+2+6+5+1+7=30 +T =8+4+3=15根据n=9,+T =15,-T =30,查表得-T 的右尾概率为0.213,P=0.213⨯2=0.426,P 值相对于显著性水平α=0.05已足够大,因此抽查数据不拒绝0H ,即认为5.0ε=130。
机算:SPSS 输出结果表2Test Statistics by – xZ -.889aAsymp. Sig. (2-tailed) .374Exact Sig. (2-tailed) .426Exact Sig. (1-tailed) .213Point Probability .033a. Based on positive ranks.b. Wilcoxon Signed Ranks Test表1显示:y-x的负秩即满足y<x的为6,而y-x的正秩即满足y-x>3的为3,同分的既满足x=y的为1,总共10。
非参数统计(R软件)参考答案
非参数统计(R软件)参考答案本页仅作为文档封面,使用时可以删除This document is for reference only-rar21year.March内容:, ,上机实践:将MASS数据包用命令library(MASS)加载到R中,调用自带“老忠实”喷泉数据集geyer,它有两个变量:等待时间waiting和喷涌时间duration,其中…(1) 将等待时间70min以下的数据挑选出来;(2) 将等待时间70min以下,且等待时间不等于57min的数据挑选出来;(3) 将等待时间70min以下喷泉的喷涌时间挑选出来;(4) 将喷涌时间大于70min喷泉的等待时间挑选出来。
解:读取数据的R命令:library(MASS);#加载MASS包data(geyser);#加载数据集geyserattach(geyser);#将数据集geyser的变量置为内存变量(1) 依题意编定R程序如下:sub1geyser=geyser[which(waiting<70),1];#提取满足条件(waiting<70)的数据,which(),读取下标sub1geyser[1:5];#显示子数据集sub1geyser的前5行[1] 57 60 56 50 54(2) 依题意编定R程序如下:Sub2geyser=geyser[which((waiting<70)&(waiting!=57)),1];#提取满足条件(waiting<70& (waiting!=57)的数据.Sub2geyser[1:5];#显示子数据集sub1geyser的前5行[1] 60 56 50 54 60 ……原数据集的第1列为waiting喷涌时间,所以用[which(waiting<70),2](3)Sub3geyser=geyser[which(waiting<70),2];#提取满足条件(waiting<70)的数据,which(),读取下标Sub3geyser[1:5];#显示子数据集sub1geyser的前5行[1] ……原数据集的第2列为喷涌时间,所以用[which(waiting<70),2](4)Sub4geyser=geyser[which(waiting>70),1];#提取满足条件(waiting<70)的数据,which(),读取下标Sub4geyser[1:5];#显示子数据集sub1geyser的前5行[1] 80 71 80 75 77…….如光盘文件中的数据,一个班有30名学生,每名学生有5门课程的成绩,编写函数实现下述要求:(1) 以的格式保存上述数据;(2) 计算每个学生各科平均分,并将该数据加入(1)数据集的最后一列;(3) 找出各科平均分的最高分所对应的学生和他所修课程的成绩;(4) 找出至少两门课程不及格的学生,输出他们的全部成绩和平均成绩;(5) 比较具有(4)特点学生的各科平均分与其余学生平均分之间是否存在差异。
非参数统计题目及答案
1.人们在研究肺病患者的生理性质时发现,患者的肺活量与他早在儿童时期是否接受过某种治疗有关,观察3组病人,第一组早在儿童时期接受过肺部辐射,第二组接受过胸外科手术,第三组没有治疗过,现观察到其肺活量占其正常值的百分比如下:这一经验是否可靠。
解:H 0:θ2≤θ1≤θ3 H 1:至少有一个不等式成立可得到 N=15由统计量H=)112+N N (∑=Ki i N R 1i 2-3(N+1)=)(1151512+(32×6.4+29×5.8+59×11.8)-3×(15+1)=5.46查表(5,5,5)在P(H ≥4.56)=0.100 P(H ≥5.66)=0.0509 即P (H ≥5.46)﹥0.05 故取α=0.05, P ﹥α ,故接受零假设即这一检验可靠。
2.关于生产计算机公司在一年中的生产力的改进(度量为从0到100)与它们在过去三年中在智力投资(度量为:低,中等,高)之间的关系的研究结果列在下表中:值等等及你的结果。
(利用Jonkheere-Terpstra 检验) 解:H 0:M 低=M 中=M 高 H 1:M 低﹤M 中﹤M 高U 12=0+9+2+8+10+9+10+2+10+10+8+0.5+3=82.5 U 13=10×8=80U 23=12+9+12+12+12+11+12+11=89 J=∑≤jijUi =82.5+80+89=251.5大样本近似 Z=[]72)32()324121i 222∑∑==+-+--ki i i ki n n N N n N J ()(~N (0,1)求得 Z=3.956 Ф(3.956)=0.9451取α=0.05 , P >α,故接受原假设,认为智力投资对改进生产力有帮助。
2022年中央民族大学计算机科学与技术专业《数据结构与算法》科目期末试卷A(有答案)
2022年中央民族大学计算机科学与技术专业《数据结构与算法》科目期末试卷A(有答案)一、选择题1、有一个100*90的稀疏矩阵,非0元素有10个,设每个整型数占2字节,则用三元组表示该矩阵时,所需的字节数是()。
A.60B.66C.18000D.332、下列排序算法中,占用辅助空间最多的是()。
A.归并排序B.快速排序C.希尔排序D.堆排序3、静态链表中指针表示的是()。
A.下一元素的地址B.内存储器的地址C.下一元素在数组中的位置D.左链或右链指向的元素的地址4、已知有向图G=(V,E),其中V={V1,V2,V3,V4,V5,V6,V7}, E={<V1,V2>,<V1,V3>,<V1,V4>,<V2,V5>,<V3,V5>, <V3,V6>,<V4,V6>,<V5,V7>,<V6,V7>},G的拓扑序列是()。
A.V1,V3,V4,V6,V2,V5,V7B.V1,V3,V2,V6,V4,V5,V7C.V1,V3,V5,V2,V6,V7D.V1,V2,V5,V3,V4,V6,V75、用不带头结点的单链表存储队列,其队头指针指向队头结点,队尾指针指向队尾结点,则在进行出队操作时()。
A.仅修改队头指针B.仅修改队尾指针C.队头、队尾指针都可能要修改D.队头、队尾指针都要修改6、已知字符串S为“abaabaabacacaabaabcc”,模式串t为“abaabc”,采用KMP算法进行匹配,第一次出现“失配”(s!=t)时,i=j=5,则下次开始匹配时,i和j的值分别()。
A.i=1,j=0 B.i=5,j=0 C.i=5,j=2 D.i=6,j=27、下列叙述中,不符合m阶B树定义要求的是()。
A.根结点最多有m棵子树 B.所有叶结点都在同一层上C.各结点内关键字均升序或降序排列 D.叶结点之间通过指针链接8、有关二叉树下列说法正确的是()。
统计建模期末考试题(附答案)
第一部分 基本理论和应用1、计算题(满分10分)设电路供电网内有10000盏灯,夜间每一盏灯开着的概率为0.7,假设各灯的开关是相互独立的,利用中心极限定理计算同时开着的灯数在6900与7100之间的概率.2、计算题(满分10分)设某种电子元件的使用寿命服从正态分布) ,(2σμN ,现随机抽取了10个元件进行检测, 得到样本均值(h)1500=x ,样本标准差(h)14=S . 求总体均值μ的置信概率为99%的置信区间3、计算题(满分10分)从正态总体)6 ,4.3(~2N X 中抽取容量为n 的样本,如果要求样本均值位于区间 (1.4,5.4) 内的概率不小于0.95,问样本容量n 至少应取多大?4、计算题(满分10分) 设总体X 的概率密度为:⎩⎨⎧<<+=其他,,0,10,)1();(x x x f θθθ )1(->θn X X X ,,,21 是来自总体X 的简单随机样本,求参数θ的矩估计量和极大似然估计量.5.(15分)设总体X 服从区间[0,θ]上的均匀分布,θ>0未知,12,,,n X X X 是来自X的样本,(1)求θ的矩估计和极大似然估计;(2)上述两个估计量是否为无偏估计量,若不是请修正为无偏估计量;(3)试问(2)中的两个无偏估计量哪一个更有效?6. (15分)设),(~2σμN X ,n X X X ,,,21 是取自总体的简单随机样本,X 为样本均值,2nS 为样本二阶中心矩,2S 为样本方差,问下列统计量:(1)22σnnS ,(2)1/--n S X n μ,(3)212)(σμ∑=-ni iX各服从什么分布?7. (10分)一个小班有8位学生,其中有5人能正确回答老师的一个问题.老师随意地逐个请学生回答,直到得到正确的回答为止,求在得到正确的回答以前不能正确回答问题的学生个数的概率分布.8.(10分)设某人有100位朋友都会向他发送电子邮件,在一天中每位朋友向他发出电子邮件的概率都是0.04,问一天中他至少收到4位朋友的电子邮件的概率是多少?试用二项分布公式和泊松近似律分别计算.9. (10分)某商品的每包重量2~(200,)X N σ.若要求{195205}0.98P X <<≥,则需要把σ控制在什么范围内.10. (15分)设系统L 由两个相互独立的子系统12,L L 联接而成,联接的方式分别为串联,并联和备用(当系统1L 损坏时,系统2L 开始工作),如图7.1所示.1L 和2L 的寿命为X 和Y ,分别有密度(0,)()()x X p x e I x αα-+∞=和(0,)()()y Y p y e I y ββ-+∞=,其中0,0αβ>>且αβ≠.请就这三种联接方式分别写出系统L 的寿命Z 的密度.答案第一部分 基本理论和应用 1、计算题(满分10分)设电路供电网内有10000盏灯,夜间每一盏灯开着的概率为0.7,假设各灯的开关是相互独立的,利用中心极限定理计算同时开着的灯数在6900与7100之间的概率. 解:设同时开着的灯数为X ,(10000,0.7)Xb ……………2分(0,1)N (近似) ……………3分 {69007100}210.971P X ≤≤=Φ-= …………5分 2、计算题(满分10分)设某种电子元件的使用寿命服从正态分布) ,(2σμN ,现随机抽取了10个元件进行检测,得到样本均值(h)1500=x ,样本标准差(h)14=S . 求总体均值μ的置信概率为99%的置信区间. 解: T =(1)X t n - 0.005{(1)}0.99P T t n <-= ………4分0.0050.005{(1)(1)}0.99P X n X X n -<<+-= ………………4分 所求为(1485.61,1514.39) …………2分3、计算题(满分10分)从正态总体)6 ,4.3(~2N X 中抽取容量为n 的样本,如果要求样本均值位于区间 (1.4,5.4) 内的概率不小于0.95,问样本容量n 至少应取多大? 解:(0,1)X N ………………3分{1.4 5.4}21P X P <<=<=Φ- ……………4分解210.95Φ-≥ 得34.6n ≥ n 至少取35 ……………3分4、计算题(满分10分) 设总体X 的概率密度为:⎩⎨⎧<<+=其他,,0,10,)1();(x x x f θθθ )1(->θn X X X ,,,21 是来自总体X 的简单随机样本,求参数θ的矩估计量和极大似然估计量.解: 1101()(2E X dx θθθθ++==+⎰+1)x ……………3分 解12X θθ+=+,得θ的矩估计量为211X X -- ……………2分 1()1()ni i L x θθθ=+∏n=() 1ln ln 1ln nii L n x θθ==+∑()+ ……………2分令1ln ln 01ni i d L nx d θθ==+=+∑ 得θ的极大似然估计量为11ln nii nX=--∑ …………3分5.(15分)设总体X 服从区间[0,θ]上的均匀分布,θ>0未知,12,,,n X X X 是来自X的样本,(1)求θ的矩估计和极大似然估计;(2)上述两个估计量是否为无偏估计量,若不是请修正为无偏估计量;(3)试问(2)中的两个无偏估计量哪一个更有效? 解:(1)2EX θ=,令2X θ=,得θ的矩估计量1ˆ2X θ=; ……………5分 似然函数为:()12121,0,,,(,,,;)0n n n x x x L x x x θθθ⎧<<⎪=⎨⎪⎩,其它其为θ的单调递减函数,因此θ的极大似然估计为{}212()ˆmax ,,,n n X X X X θ==。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
非参数统计—期末九题汇总目录1.单样本Wilcoxon符号秩检验(SAS) (2)2.Wald-Wolfowitz游程检验法 (4)3.两样本的Kolmogorov-Smirnov检验 (5)4.两个独立样本的M-W-W检验(SAS) (6)5.k个样本的2 检验 (9)6.k个独立样本的Kruskal-Wallis检验(R) (10)7.k个相关样本的Friedman检验(R) (11)8.k个相关样本的Cochran Q检验 (12)9.完全秩评定的Kendall协和系数(R) (14)1.单样本Wilcoxon 符号秩检验(SAS )设5.0ε是对称的连续型分布的中位数,现随机抽查了10名普通男子的血压如下: 98 160 136 128 130 114 123 134 129 107试用Wilcoxon 符号检验法检验假设0H :5.0ε=130,1H :5.0ε≠130,显著性水平为α=0.05。
解 手算:i)秩次和计算表ii)根据表中D 的符号和D 的秩,可以计算得到-T =9+2+6+5+1+7=30 +T =8+4+3=15根据n=9,+T =15,-T =30,查表得-T 的右尾概率为0.213,P=0.213⨯2=0.426,P 值相对于显著性水平α=0.05已足够大,因此抽查数据不拒绝0H ,即认为5.0ε=130。
机算:SPSS 输出结果表1显示:y-x的负秩即满足y<x的为6,而y-x的正秩即满足y-x>3的为3,同分的既满足x=y的为1,总共10。
并且负秩和30,正秩和15。
表2显示:Z=-0.889,是以负秩为基础计算的结果,其相应的双侧渐进显著性概率为0.426>0.05,因此在α=0.05的显著性水平下没有理由拒绝原假设,即认为5.0ε=130。
SAS:结果:机算结果与手算结果一致。
2. Wald-Wolfowitz 游程检验法有低蛋白和高蛋白两种料喂养大白鼠,以比较它们对大白鼠体重的增加是否有显著不同的影响,为此对m=10,n=10只大白鼠分别喂养低蛋白和高蛋白两种饲料,得增重量X ,Y (单位:g )的表如下: 饲料 增重量低蛋白X 64 71 72 75 82 83 84 90 91 96高蛋白Y42 52 61 65 69 75 78 78 78 81给定显著性水平α=0.05,试用游程检验法检验两种饲料的影响有无显著差异。
解手算:设喂养低蛋白、高蛋白的大白鼠体重增加量为X ,Y ,其分布函数为F(x),G(x),若饲料对增加重量无影响,即F(x)与G(x)应一致,故 i)提出假设0H :F(x)=G(x),1H : F(x)≠G(x);ii) α=0.05,m=10,n=10;iii)将X,Y 的数据按从小到大混合排列,得X,Y 的混合样本序列: Y Y Y X Y Y X X X Y Y Y Y Y X X X X X X故得游程总数U=3+3=6,查表,m=10,n=10,U=6的概率为0.019,这对于显著性水平0.025(给定显著性水平α=0.05,该问题为双侧检验,故取2α=0.025比较)已足够大,因此数据不拒绝0H ,认为两种饲料的影响无显著差异。
机算: 步骤:1)选项为Analyze -Nonparametric Tests -2 Independent Samples 。
2)把变量(x )选入Test Variable List ;再把用1和2分类的变量y 输入到Grouping Variable ,在Define Groups 输入1和2。
3)在Test Type 选中Wald-Wolfowitz runs 。
在点Exact 时打开的对话框中可以选择ASYMTOTIC ONLY ,最后OK 即可。
输出结果:机算得出的P 值与手算结果一致。
3.两样本的Kolmogorov-Smirnov 检验甲乙两台机床加工相同规格的主轴,从这两台机床所加工的主轴中分别随机的抽取7个,然后测量他们的外径(单位:mm )得数据如下: 机床 主轴外径尺寸 甲(X )20.519.819.720.420.120.019.0乙(Y ) 19.7 20.8 20.5 19.8 19.4 20.6 19.2 试用Kolmogorov-Smirnov 检验法来判断两台机床加工的主轴外径是否有显著差异。
解手算:假设组为:0H :F(x)=G(x),1H :F(x)≠G(x),F(x),G(x)分别为甲,乙两台机床加工的主轴外径尺寸X 与Y 的分布函数。
检验统计量D 的计算表检验统计量D=max ()()x S x S 21-。
m=7,n=7,0H 的拒绝域为D>α,,n m D =05.0,7,7D =0.7269,由表知D=2/7=0.286<0.7269,所以不拒绝0H ,认为两台机床加工的主轴外径无显著差异。
机算:步骤:1)选项为Analyze-Nonparametric Tests-2 Independent Samples。
2)把变量(x)选入Test Variable List;再把用1和2分类的变量y输入到Grouping Variable,在Define Groups输入1和2。
3)在Test Type选中Kolmogorov-Smirnov。
在点Exact时打开的对话框中可以选择精确方法(Exact),Monte Carlo抽样方法(Monte Carlo)或用于大样本的渐近方法(Asymptotic only)。
最后OK即可。
输出结果:4.两个独立样本的M-W-W检验(SAS)某航空公司的CEO注意到飞离亚特兰大的飞机放弃预定座位的旅客人数在增加,他特别有兴趣想知道,是否从亚特兰大起飞的飞机比从芝加哥起飞的飞机有更多的放弃预定座位的旅客。
获得一个从亚特兰大起飞的9次航班和从芝加哥起飞的8次航班上放弃预定座位的旅客人数样本,见表中的第2列和第4列所示。
( =0.05)次数放弃人数秩放弃人数秩1 51 13 40 42 42 6 47 113 45 9 36 14 48 12 39 35 52 14 37 26 44 8 46 107 58 16 43 78 41 5 55 159 61 17 秩和y W 100x W53解 手算如果假定放弃预定座位旅客人数的总体是正态分布且有相等的方差,我们可以采用两样本比较的t 检验。
但航空公司的CEO 认为这两个假设条件不能满足,因此采用非参数的Wilcoxon 秩和检验。
0H :两组放弃预定座位旅客人数的分布是相同的。
m=8,n=9, x W =53,y W =100;查表知P=0.037 给定显著性水平α=0.05,由于是双边检验,P=0.037>2α=0.025,所以不能拒绝原假设。
机算(SPSS):机算结果与手算一致。
程序说明:建立输入数据集temp,先输入本组数据的总数,然后输入组中每个数据。
分组变量为group,共有两组取值为1和2。
输入变量为x,存放每组中的数据。
过程步调用npar1way 过程,后面用选择项wilcoxon要求进行wilcoxon秩和检验。
如果两组样本是配对样本,应该使用配对t检验或wilcoxon符号检验,因为使用wilcoxon秩和方法,将损失配对信息。
class语句后给出分组变量名group,var语句后给出要分析的变量x。
主要结果见下表。
用npar1way过程进行Wilcoxon秩和检验的输出结果结果说明: Wilcoxon两样本秩和统计量(较小的秩和)S=53.0000,正态近似检验统计量Z=-1.7802(连续性修正因子为0.5,加在分子上),正态分布的单尾p值之和为0.0375,不能拒绝原假设。
5.k个样本的2 检验观察三种药物A,B,C 治疗心绞痛的效果,得下表数据:试根据所得资料说明三种药物的疗效有无显著差异?(给定显著性水平=0.05) 解手算:i)提出假设0H :三种药物疗效相同,1H : 至少有两种药物疗效显著不同; ii) α=0.05,r=3,k=3,;iii) 0H 的拒绝域:2n χ>()4205.0χ=9.488;iv)先求出数据相应的理论期望函数,ji j i ijP n nn n E ˆˆ⋅⋅⋅=,标记在上表()中,如 11ˆE =11ˆp n ⋅=59,同理可得12ˆE (33)ˆE 则Q=3.813<()4205.0χ=9.488故不拒绝0H ,即从已有资料看不出三种药物的疗效有显著差异。
机算: 输出结果6.k 个独立样本的Kruskal-Wallis 检验(R )有3个不同的减肥饮食疗法(A,B,C ),人们希望知道这三种方法之间有没有效果上的区别。
为此,把7个人分成3组,每组试一种方法。
一个疗程后减去的重量列在下表中。
A B C10 6 4 3 15 520解手算:减去的重量的等级AB C 5 4 2 1 6 37 合计(j R ) 6175建立的假设组为0H :321M M M ==,1H :()3,2,1=j M j 中至少有两个不等;()()179.3173253172617712222=+⨯-⎪⎪⎭⎫⎝⎛+++⨯=H 显著性水平α=0.05,df=k-1=2,临界值205.0χ=5.99,显然H=3.179<205.0χ=5.99,数据在5%的显著性水平上不能拒绝0H ,表明3种减肥疗法没有显著差异。
机算:结果表明,Kruskal-Wallis H 统计量的渐进分布2 =3.179,相应的p 值大于给定的显著性水平0.05,没有理由拒绝零假设,与手算结果一致。
机算结果与手算结果一致。
7.K 个相关样本的Friedman 检验(R )下表是美国三大汽车公司(A :通用,B :福特,C :克莱斯勒,作为三个处理)的五种不同尺寸的车(I :超小型,II :小型,III :中型,IV :大型,V :运动型,作为五个区组)某年产品的油耗及在相应区组中的秩(括号中)为 I II III IV V合计(j R ) A 20.3(1) 21.2(1) 18.2(1) 18.6(1) 18.5(1) 5 B25.6(3) 24.7(3) 19.3(2) 19.3(2) 20.7(2) 12C 24.0(2) 23.1(2) 20.6(3) 19.8(3) 21.4(3) 13检测三个公司的汽车油耗是否有显著差异。
解手算:假设组为0H :321M M M ==,1H :()3,2,1=j M j 中至少有两个不等;()()()6.71353131251335122222=+⨯⨯-+++⨯⨯=r χ给定显著性水平0.05,自由度df=3-1=2,查表得临界值205.0χ=5.99。