统计计算方法复习题
统计 考试复习题 简答、计算

(三)简答题1.某年级甲班、乙班各有男生50人。
从两个班各抽取10人测量身高,并求其平均身高。
如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班?为什麽?2.正态分布、标准正态分布的联系与区别。
3.假设检验时,当P 0.05,则拒绝H0,理论依据是什么?4.t检验和方差分析的应用条件?5.常用的相对数指标有哪些?它们的意义和计算上有何不同?6.为什么不能以构成比代率?请联系实际加以说明。
7.应用相对数时应注意哪些问题?(四)计算题1.尸检中测得北方成年女子80人的肾上腺重量(g)如下,试(1)编制频数表,(2)求中位数、均数和标准差。
19.0 12.0 14.0 14.0 8.2 13.0 6.5 12.0 15.0 17.212.0 12.7 25.0 8.5 20.0 17.0 8.4 8.0 13.0 15.020.0 13.0 13.0 14.0 15.0 7.9 10.5 9.5 10.0 12.06.5 11.0 12.57.5 14.5 17.5 12.0 10.0 11.0 11.516.0 13.0 10.5 11.0 14.0 7.5 14.0 11.4 9.0 11.110.0 10.5 8.0 12.0 11.5 19.0 10.0 9.0 19.0 10.022.0 9.0 12.0 8.0 14.0 10.0 11.5 11.0 15.0 16.08.0 15.0 9.9 8.5 12.5 9.6 18.5 11.0 12.0 12.02.下表为10例垂体催乳素微腺瘤经蝶手术前后的血催乳素浓度,试分别求术前、术后的均数,标准差及变异系数。
应以何指标比较手术前后数据的变异情况?手术前后患者血催乳素浓度(mg/ml)例号血催乳素浓度例号血催乳素浓度术前术后术前术后1 276 41 6 266 432 880 110 7 500 253 1600 280 8 1700 3004 324 61 9 500 2155 398 105 10 220 923.某地微丝蚴血症者42例治疗后7年用间接荧光抗体试验测得抗体滴度如下。
统计学计算题复习(学生版)

统计学计算题复习(学生版)统计学复习提纲一、期末考卷题型1. 单项选择题;2. 多项选择题;3. 简答题4. 计算题二、知识点复习1. 统计学分类、指标、变量、参数、统计量等概念,以及各种统计图形;2.统计数据的相关内容,以及测量数据分布的测度的描述;平均数、中位数和众数的计算公式。
3. 调查的各种方式; 4. 组距数列的相关概念。
5. 置信区间的相关概念,以及单个总体均值、比例、方差的区间估计;6. 估计单个总体均值、比例时的样本容量的计算公式;7. 单个总体均值、比例、方差的假设检验;8. 相关系数和回归系数的相关知识;9. 一元、二元回归模型的EXCEL操作结果的解释以及模型的建立和检验;10. 时间序列的各种分类;平均速度等指标、移动平均法的概念等;平均发展水平的计算和季节指数的计算; 11.统计指数的相关概念,制作综合指数要点和原则,综合指数、平均指数的计算。
1统计学计算题复习一.平均数、中位数和众数的计算和三者之间的关系1.算术平均数。
也叫均值,是全部数据的算术平均,是集中趋势的最主要测度值。
主要适用于定距数据和定比数据,但不适用于定类数据和定序数据。
2.众数。
众数是一组数据中出现次数最多的变量值,用Mo表示。
主要用于测度定类数据的集中趋势。
组距式数列确定众数,是先根据出现次数确定众数所在组,然后利用下列公式计算众数的近似值:M?L?0f?f?1?i (f?f?1)?(f?f?1) 3.中位数。
中位数是一组数据按从小到大排序后,处于中间位置上的变量值,用Me表示。
主要用于测度定序数据的集中趋势。
分组数据计算中位数时,先根据公式N确定中位数所在的组,然后用下列公式计算2N?Sm?1中位数的近似值: M?L?2?i efm4.众数、中位数和算术平均数的关系 x?Me?Mo,数据是对称分布; x<Me<Mo,数据是左偏分布; x>Me>Mo,数据是右偏分布。
例题1:某地区有下列资料:人均月收入400以下400~500 500~600 600~700 700~800 800~900 900以上合计要求计算算术平均数、众数、中位数。
统计学期末复习资料_计算题

五、计算题(要求写出公式、列出计算步骤) 1. 某产品资料如下:要求按以下三种方法计算产品的平均收购价格:(1) 不加权的平均数;(2)加权算术平均数;(3)调和平均数 解:不加权05.139.005.12.1=++=x (元/斤)加权02.140003000200040009.0300005.120002.1=++⨯+⨯+⨯==∑∑fxf x (元/斤)加权调和02.19.0360005.131502.1240036000315024001=++++==∑∑m xm x (元/斤)2. 某公司所属三个企业生产同种产品,2004年实际产量、计划完成情况及产品优质品率资料如下:要求计算:(1)该公司产量计划完成百分比; (2)该公司的实际优质品率。
解:1)以实际产值为m,完成计划百分比为x,该公司产量计划完成百分比:%95.9320.5325008.02501.11502.1100250150100==++++==∑∑x m m x2)以实际优质品率为x,以实际产量为f,该公司的实际优质品率:%8.9650048425015010098.025096.015095.0100==++⨯+⨯+⨯==∑∑fxfx3. 某企业有50名工人,其月产值(万元)如下:要求:(1)根据上述资料将50名工人按产值分7组编制组距为10万元的等组距数列;(2)按上述分组编制向上累计的累计频数和累计频率数列;(3)并以第三组为例说明累计频数和累计频率的含义。
解:(1)根据上述资料将50名工人按产值分7组编制组距为10万元的等组距数列;(2)按上述分组编制向上累计的累计频数和累计频率数列;(3)并以第三组为例说明累计频数和累计频率的含义。
第三组数据说明在50名工人中,月产值在105以下的有30人,占总数的60%4. 南宁化工厂2008年现有生产工人600人。
现用不重复抽样抽出40人调查其年产值(万元)如下:(1)将40个工人按产值分组,编制组距为10万元的等组距数列,并列出向上累计频数和累计频率。
(完整版)统计计算方法复习考试题

二、选择题:
6、能产生等可能取值为 中一个数的MATLAB程序是( )
(A)ceil(5*rand)(B)ceil(4*rand)(C)floor(4*rand)(D)randperm(4)
7、在MATLAB中,表示负二项分布的概率密度函数的是( )
(A) binopdf (B)binocdf (C)nbinpdf (D)nbincdf
一、填空题:
1、若随机变量 的概率密度为 ,则 的方差为。
2、若 服从二项分布B(5000,0.001),则由泊松定理知 。
3、若 服从均值为5的指数分布,则 。
4、设 服从参数为2的泊松过程,则 。
5、设 的概率密度为 ,则其分布函数的逆函数为。
二、选择题:
6、能产生等可能取值为 中一个数的MATLAB程序是( )
(2) 某一时段的状态为0,定义为初始状态,即 ,所求概率为:
17、首先由C-K方程得两步转移矩阵为:
一、填空题:
1、若随机变量 的概率密度为 ,则 的方差为。
2、若 服从二项分布B(500,0.01),则由泊松定理知 。
3、若 服从失效率为0.05的指数分布,则 。
4、设 服从参数为0.5的泊松过程,则 。
MATLAB程序:
alpha=5;beta=3; U=rand;
X=(-log(U)/alpha)^(1/beta
因 ,计算得
,
由P值为0.8931,说明不能拒绝原假设,即不认为发生事故与星期几有关。
16、(1)一步转移概率可用频率近似地表示为:
所以一步转移矩阵为: ;
(A)ceil(5*rand)(B)floor(5*rand)(C)floor(6*rand)(D)randperm(5)
统计学原理计算题复习(六种题型重点)

第三章:编制次数分配数列1.根据所给资料分组并计算出各组的频数和频率,编制次数分布表;根据整理表计算算术平均数。
例题:某单位40名职工业务考核成绩分别为: 68 89 88 84 86 87 75 73 72 68 75 82 97 58 81 54 79 76 95 76 71 60 90 65 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 81单位规定:60分以下为不及格,60─70分为及格,70─80分为中,80─90分为良,90─100分为优。
要求:(1)将参加考试的职工按考核成绩分为不及格、及格、中、良、优五组并编制一张考核成绩次数分配表;(2)指出分组标志及类型及采用的分组方法;(3)根据考核成绩次数分配表计算本单位职工业务考核平均成绩; (4)分析本单位职工业务考核情况。
解答:(1)该企业职工考核成绩次数分配表:成 绩(分) 职工人数(人) 频率(%)不及格(60以下) 3 7.5 及格 (60-70) 6 15 中 (70-80) 15 37.5 良 (80-90) 12 30 优 (90-100) 4 10 合 计 40100(2)此题分组标志是按“成绩”分组,其标志类型是“数量标志”; 分组方法是“变量分组中的组距式分组的等距分组,而且是开口式分组”;(3)根据考核成绩次数分配表计算本单位职工业务考核平均成绩。
(4)分析本单位职工考核情况。
本单位的考核成绩的分布呈两头小,中间大的“钟形分布”(即正态分布),不及格和优秀的职工人数较少,分别占总数的7.5%和10%,本单位大部分职工的考核成绩集中在70-90分之间,占了本单位的为67.5%,说明该单位的考核成绩总体良好。
)(774095485127515656553分=⨯+⨯+⨯+⨯+⨯==∑∑f xf x第四章:计算加权算术平均数、加权调和平均数(已知某年某月甲、乙两农贸市场A 、B 、C 三种农产品价格和成交量、成交额资料,试比较哪一个市场农产品的平均价格 较高?并说明原因。
实验统计方法复习题(有部分答案)

一、选择题1、算术平均数的重要特性之一是离均差的总和(C )。
A、最小B、最大C、等于零D、接近零2、对某鱼塘不同年龄鱼的尾数进行统计分析时,可做成()图来表示。
A、条形图B、直方图C、多边形图D、折线图3、当p<q时,二项式分布曲线应该是( B )。
A、左偏B、右偏C、对称D、不对称4 A )。
A、正态分布B C、F分布D5、如测验k()个样本方否来源于方差相等的总体,这种测验在统计上称为( A )。
A. 方差的同质性测验B. 独立性测验C. 适合性测验D. F测验6)。
A B C D7、在简单线性回归分析中,剩余平方和反映了()。
A BC D8、对于常用次数分布图,下列说确的是()A、条形图只适用于计数资料B、坐标轴都必须加箭头以示数值增大的方向C、多边形图主要用于表示计量资料的次数分布D、方形图可以将多组资料绘制在同一幅图上比较9、具有一定原因引起观察值与试验处理真值之间的偏差称为( C )。
A、试验误差B、随机误差C、系统误差D、混合误差10、从N(10, 10)的正态总体中以样本容量10抽取样本,其样本平均数差数服从( C )分布。
A、N(10, 10)B、N(0, 10)C、N(0, 2)D、N(0, 20)11、A、B两个事件不可能同时发生,则称为A和B事件是( C )。
A、和事件B、积事件C、互斥事件D、对立事件12、当样本容量增加时,样本平均数的分布趋于( A )。
A、正态分布B、t分布C、u分布D、F分布13、对比法和间比法试验结果的统计分析一般采用( D )。
A、假设测验法B、方差分析法C、回归分析法D、百分数法14、在5×5拉丁方试验的方差分析中总变异的平方和与自由度可以细分成( C )部分。
A、2 部分B、3 部分C、4 部分D、5 部分15、从N(10, 80)( B )。
A、0.10B、0.05C、0.025D、0.0116、算术平均数的重要特性之一是离均差的平方和( C )。
统计学期末复习计算题汇总

3—5
5—7 7—9 合计
30
40 30 100
4
6 8 -
120
0 120 240
3—5
5—7 7—9 合计
40
40 20 100
4
6 8 -
1.024
0.064 1.152 2.24
σ
甲
=
(x - x) f f
2
2
=
240 = 1.55 100
f σ乙 = (x - x) Σf = 2.24 = 1.5
年份 2008 2009 2010 2011
工业总产值(万元)
增长量(万元) 发展速度(%)
(
─ ─
)
(
5000 (
) (
( ) 106
) (
) ( (
)
) )
增长速度(%)
增长1%的绝对值(万元)
─
─
(
800
) (
(
)
) (
4
)
2.某企业历年工业总产值资料如下表,试填上表中所缺 的各种动态分析指标,并计算该企业工业总产值平均每 年的发展速度。 年 份 2008 2009 2010 ( 2011
9.某企业两个生产班组,各有100名工人,它们生产某 种产品的日产量资料如下表,计算有关指标,比较哪 个班组平均日产量的代表性强。
甲班组 日产量 工人数 (件) f 3—5 5—7 7—9 合计 30 40 30 100 组中值 xf x 4 6 8 — 120 240 240 600 日产量 (件) 3—5 5—7 7—9 合计 乙班组 x 生产工人 f
比重% Σf
x
f Σf
4 6 8 —
统计学复习题题目——计算题

第三章 统计资料的整理 五.练习题试按计划完成程度作如下的分组表:2.今有某车间40名工人日产量资料如下(单位:件);80,90,63,97,105,52,69,78,109,98,92,83,83,70,76,75,94,81,85,100,70,88,73,78,64,88,61,81,98,89,96,64,75,88,108,82,67,85,95,58(1) 试编制等距数列,并计算各组频率(提示:以50-60件为第一组) (2)绘制次数分布直方图和折线图。
第四章总量指标和相对指标 五、计算题1.某企业今年计划产值比去年增长5%,实际计划完成108%,问今年产值比去年增长多少?2.我国2001年高校招生及在校生资料如下:(2)计算普通高校与成人高校招生人数比;(3)计算成人高校在校生数量占所有高校在校生数量的重。
(2)计算2001年进出口总额比例相对数及出口总额增长速度; (3)分析我国进出口贸易状况。
4.根据下列资料,计算强度相对数的正指标和逆指标,并根据正指标数值分析该地区5.某公司下属三个企业有关资料如下表,试根据指标之间的关系计算并填写表中所缺数第六章 动态数列习题五、计算题1.某公司某年9月末有职工250人,10月上旬的人数变动情况是:10月4日新招聘12名大学生上岗,6日有4名老职工退休离岗,8日有3名青年工人应征入伍,同日又有3名职工辞职离岗,9日招聘7名营销人员上岗。
试计算该公司10月上旬的平均在岗人数。
(2)分别计算该银行2005年第一季度、第二季度和上半年的平均现金库存额。
(2)计算该地区2001—2005年间的平均国民生产总值。
(3)计算2002—2005年间国民生产总值的平均发展速度和平均增长速度。
(2)计算该企业第四季度劳动生产率。
(2)应用最小平方法配合趋势直线,并计算各年的趋势值。
第七章统计指数习题五、计算题1.某市1999年第一季度社会商品零售额为36200万元,第四季度为35650万元,零售物价下跌0.5%,试计算该市社会商品零售额指数、零售价格指数和零售量指数,以及由于零售物价下跌居民少支出的金额。
统计复习题及答案

1.样本均数的标准误越小说明A.观察个体的变异越小 B.观察个体的变异越大 C.抽样误差越大D.由样本均数估计总体均数的可靠性越大E.由样本均数估计总体均数的可靠性越小2.某医生开展一项科研工作,按统计工作步骤进行,不属于搜集资料的内容是A.实验 B.录入计算机 C.专题调查 D.统计报表 E.医疗卫生工作记录3.某医生开展一项科研工作,按统计工作步骤进行,分析资料包括A.对照、重复 B.随机、均衡 C.描述、推断D.计算、讨论 E.归纳、整理4.两组呈正态分布的数值变量资料,但均数相差悬殊,若比较离散趋势,最好选用的指标为A.全距B.四分位数间距 C.方差D.标准差E.变异系数5.平均数表示一组性质相同的变量值的A.集中趋势 B.精密水平 C.分布情况 D.离散趋势E.离散程度6.下列观测结果属于等级资料的是A.收缩压测量值B.脉搏数C.病情程度D.住院天数 E.四种血型7.统计工作的步骤不包括A.整理资料 B.统计设计 C.分析资料D.搜集资料 E.得出结论8.从一个数值变量资料的总体中抽样,产生抽样误差的主要原因是A.总体中的个体值存在差别 B.总体均数不等于零C.样本中的个体值存在差别 D.样本均数不等于零 E.样本只包含总体的一部分9.变异系数主要用于A.比较不同计量指标的变异度 B.衡量正态分布的变异程度 C.衡量测量的准确度D.衡量正态分布的变异程度 E.衡量抽样误差的大小10.抽样误差产生的原因是A.样本不是随机抽样 B.测量不准确 C.资料不是正态分布D.统计指标选择不当 E.个体差异11.不属于变异指标的是A.标准差 B.中位数 C.全距 D.四分位间距E.变异系数12.若计算某疫苗接种后的平均滴度应选用的指标是A.均数 B.几何均数 C.中位数 D.百分位数 E.倒数的均数13.进行假设检验时,若两组资料间差异有统计学意义,其p值为A. p<0.05B. p<0.5C. P>0.05D. p>0.5 E. p<0.114.资料为大样本时,总体均数的99%可信区间的t值为A. 2.58B. 2.326C. 1.96D.3.84 E. 6.3615.从一个呈正态分布的总体中随机抽样,x≠μ,该差别被称为A.系统误差 B.个体差异C.过失误差 D.抽样误差 E.测量误差16.“算术均数”适合的资料是:A.正态或近似正态分布的资料B.对数正态分布资料 C.偏态分布资料 D.分布类型不清的资料 E.开口资料17. 欲比较同年龄、同性别身高与体重的变异度,宜选择A.全距 B.方差 C.标准差 D.变异系数 E.标准误18. µ±1.96σ范围内的面积占正态曲线下总面积的 A. 68.27% B. 95% C .99% D.100%E.47.5%19.可以表示抽样误差大小的指标是A.全距B.方差C.标准差D.变异系数E.标准误20.两样本均数比较,自由度大小等于A.n1-1B.n2-1C.n1+n2–1D.n1+n2-2E. n1+n221.四个样本率比较,若χ2>χ20.01(3),可认为A.各总体率不同或不全相同B.各总体率均不相同 C.各样本率均不相同 D.各样本率不同或不全相同 E.各总体率相同22.χ2检验的自由度是A.n﹣1B.n﹣2C.n1﹢n2﹣1D.n1﹢n2﹣2E.(R﹣1)(C﹣1)23.两样本均数比较,经t检验,差别有显著性时,P越小,说明,A.两样本均数差别越大B.两总体均数差别越大C. 越有理由认为两样本均数不同D.越有理由认为两总体均数不同E. 以上均不对24.表示某事物因时间而变化的趋势宜选择A.百分条图B.圆图C.线图D.直条图E.直方图25.行×列表χ2检验的条件是A.不宜有1/10以上的格子的理论频数小于5B.不宜有1/8以上的格子的理论频数小于5C.不宜有1/6以上的格子的理论频数小于5D.不宜有1/5以上的格子的理论频数小于5E.不宜有1/3以上的格子的理论频数小于526.百分条图适合的资料是A.相互独立无连续关联的资料B.构成比资料C.两事物相关关系资料D.连续性资料的频数分布E.某现象随另一现象变迁的资料27.四格表中四个基本数字是A.两个样本率的分子和分母B.两个构成比的分子和分母C.两个实测阳性绝对数和阴性绝对数D.两个实测数和理论数E.以上均不对28.反映事物发生的频率和强度宜选择A.均数B.标准差C.率D.构成比E.相对比29.使用相对数时,容易犯的错误是A.把构成比做率看待B.把率作构成比看待C.把构成比做相对比看待D.把率作相对比看待E.以上均不对30.观察单位在100~400个时,频数分布表的组数一般为A.越多越好B.越少越好C.5~10组D.8~15组E.10~20组31.估计正常值范围时,样本含量一般为A.20以上B.30以上C.50以上D.100以上E.1000以上32.下列资料属于有序分类变量资料的是A.血红蛋白B.血糖C.血压D.体重E.疗效某医生随机抽取某工厂40名苯作业男工检查,其白细胞均数为5.1×109个/L,问苯作业男工白细胞均数是否与正常成人有差别?33.进行假设检验时应作A.均数u检验B.t检验C.χ2检验D. 率的u检验E.F检验34.假设检验的步骤A.建立假设B.确定检验水准C.计算统计量D.确定p值和做出统计推断结论E.以上都是35.本例的自由度为A.40B.38C.39D.30E.41 36.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。
统计学计算题复习

市场个数(fi)
4 9 16 27 20 17 10 8 4 5
∑fi= 120
Mi fi
580 1395 2640 4725 3700 3315 2050 1720
900 1175
∑Mi fi =22200
k
X
Mi fi
i 1
22 200 185(台)
n
120
样本方差和标准差
(Sample Variance and Standard Deviation)
适用于总体资料经过分组整理形成变量数列的情况
• 总体均值
• 样本均值 (未分组)
K
x1 f1 x2 f2 xK f1 f2 fK
fK
xi fi
i1 K
fi
k i1
x
x1 f1 x2 f2 xk fk f1 f2 fk
xi fi
i1 n
fi
i 1
• 公X式中: 为均值; f为相应频数;Xi为第i个单位的变量值。
解 : 已 知 X ~N( , 102) , n=25, 1- = 95% ,
z/2=1.96。根据样本数据计算得:x 105.36。由
于是正态总体,且方差已知。总体均值在1-置
信水平下的置信区间为
10
x z 2
105.36 1.96 n
25
105.36 3.92
101.44,109.28
频数 5 7 12 18 22 16 10 8
Frequency
Koala Sightings 25
Line 1
20
Line 2
15
10
5
0 10 – 14 15 – 19 20 – 24 25 – 29 30 – 34 35 – 39 40 – 44 45 – 49 Number of koalas se2 fi
统计复习题-最终版

简答题1.简述标志变异指标的意义和作用。
2. 完整的统计调查方案包括哪些内容?3. 简述我国统计调查方式体系4.什么是统计分组?它有何作用?5. 时期数列与时点数列有何特点?或时期和时点指标有什么不同?6. 简述相对指标的种类及公式?7. 什么是平均指标?其特点有哪些?8.强度指标与平均指标有什么区别?9. 对统计数据的分布特征,主要从哪几个方面进行描述?10. 什么是变异指标?它有何作用?11.变异指标是衡量算术平均数代表性大小和生产过程均衡性的重要指标,其中常用的是标准差( ),但为什么我们有时还要计算标准差系数呢?12.时间数列的编制原则是什么?13. 序时平均数和一般平均数有什么相同点和不同点?14.平均发展速度的水平法和累计法有何不同?各适用于哪些现象?15. 简述综合指数的编制原则与方法?16. 什么是同度量因素?有什么作用?17.简要说明指数的概念及作用18.综合指数与平均数指数有何联系及区别?19.什么是指数体系?简述其作用。
20.简述综合指数体系的基本形式。
21.相关关系与函数关系的区别是什么?22.相关分析与回归分析的区别与联系是什么?23.简述抽样推断的特征。
24.简述什么是抽样误差?影响抽样误差的因素有哪些?25.影响样本容量的因素有哪些?26.区间估计有哪三要素?27.抽样估计的优良标准28.阐述最小二乘法的原理。
答案——1简述标志变异指标的意义和作用。
1、测定算术平均数代表性2、反映变量的均衡性或稳定性3、是判别统计推断前提条件是否成立的重要依据,也是衡量推断效果的重要尺度。
2完整的统计调查方案包括哪些内容?1、确定调查目的2、确定调查对象和单位3、确定调查项目4、设计调查问卷和调查表5、确定调查时间和调查期限6、确定调查的组织实施计划7、调查报告的撰写3简述我国统计调查方式体系建立以必要的周期性的普查为基础,经常性的抽样调查为主体,同时辅之以重点调查、科学推算和少量的全面报表综合运用的统计调查方法体系。
统计复习题

名词解释1.总体和样本:根据研究目的所确定的研究对象的全体称为总体,按照随机化原则从总体中抽取一部分个体组成的集合称为样本。
2.统计量:根据样本的资料计算出来,用来描述样本的特征的量或指标。
3.全距:最大值与最小值的差4.I 类错误:拒绝实际上存在的H 0,所犯的错误,犯I 类错误的概率为α。
5. 回归系数:在回归模型中,y=a+bx, b 就是回归系数,表示当x 没改变一个单位,因变量y 平均变动1.标准误:统计量的标准差称为标准误,是描述抽样误差大小的指标。
2.变异系数:公式:%100⨯=xscv ,用于度量衡单位不同或均数相差比较悬殊时几组资料变异程度的比较。
3.数值变量:用定量方法对每个观察单位的某项指标测得的对应数据,有度量单位,如身高等。
4.方差: 是描述对称分布,特别是正态分布离散程度的指标,总体方差,22()x Nμσ-=∑,样本方差22()1x x s n -=-∑5. 医学参考值范围: 也称正常值范围,是指包括绝大多数正常人的某指标范围。
填空题1. 实验设计中的基本原则为:(1)对照原则 (2)均衡性原则(3)随机化原则(4重复原则 。
2. 统计分析工作包括两方面内容:统计描述与统计推断;统计推断包括_参数估计和假设检验_。
3.当自由度逐渐增大时,t分布逐渐逼近于标准正态分布。
4. 由样本均数推断总体均数属于统计推断,总体均数的估计包括点估计和区间估计。
5.变量的类型包括: 计数资料 、 计量资料 。
()6.实验设计的基本要素有: 实验对象 、 处理因素 、 实验效应 () 7.正态分布的参数为总体均数和_总体标准差。
8.对于标准正态分布,正态曲线下(1.96, 2.58)范围内的面积为__0.02_. 9.(1)当样本例数固定时,α增大时,β_减小______。
(2)要想同时减小α 和β错误,唯一的办法是____增加样本含量___.()10.实验设计中的基本要素为:(1)受试对象(2) 处理因素(3)实验效应。
统计复习题(最终,有答案)

1.甲、乙两种不同水稻品种,分别在5个田块上试种,其中乙品种平均亩产量是520公斤,标准差是40.6公斤。
甲品种产量情况如下:甲品种要求:试研究两个品种的平均亩产量,以及确定哪一个品种具有较大稳定性,更有推广价值? (1)(公斤)506.355.2531甲===∑∑fxf x(公斤)44.6558.0)3.506420(....2.1)3.506600()(222甲=⨯-++⨯-=-=∑∑ffx x σ (2)%93.123.50644.65V 甲===x σσ %81.75206.40V 乙===x σσ 因为7。
81%<12。
93%,所以乙品种具有较大稳定性,更有推广价值2.已知甲、乙两个班级,乙班学生《统计学》考试平均成绩为76.50分,标准差为10。
30分,而甲的成绩如下所示:甲班要求:计算有关指标比较两个班级学生平均成绩的代表性。
(计算结果保留2位小数)(分)17.37604390甲===∑∑fxfx(分)96.13606)17.7395(....5)17.7354()(222甲=⨯-++⨯-=-=∑∑ffx x σ (2)%08.1917.7396.13V 甲===x σσ %46.1376.53.10V 乙===x σσ 因为13。
46%<19.08%,所以乙班学生平均成绩的代表性好于甲班的 3.已知甲厂职工工资资料如下:又已知乙厂职工的月平均工资为600元,标准差为120元,试比较甲乙两厂职工月平均工资的代表性大小。
(元)66010066000甲===∑∑fxf x(元)24.23310010)6601100(....15)660300()(222甲=⨯-++⨯-=-=∑∑ffx x σ (2)%34.3566024.233V 甲===x σσ %20600120V 乙===x σσ 因为20%〈35.34%,所以乙厂平均工资的代表性好于甲厂4.现已知甲企业在2007年前10个月的月平均产值为400万元,标准差为16 万元,而乙企业在2007年前10个月的各月产值如下表所示:请计算乙企业的月平均产值及标准差,并根据产值比较2007年前10个月甲乙两企业的生产稳定性。
统计学复习题计算题4

统计学四、计算题1.某企业的工人人数及工资资料如下表所示:(1)计算工人人数结构相对指标:(2)分析各工种工人的月工资额2006年比2005年均有提高,但全厂工人的月工资额却下降了,其原因是什么?(2)技术工人和辅助工人的月工资额2006年比2005年相比有所提高,但全厂全体工人平均工资却下降20元,其原因是工人工种结构发生了变化。
月工资额较高的技术工人的人数比重减少了,从2005年的60%下降为2006年的40%;而月工资额比较低的辅助工人的人数比重增加了,由2005年的40%提高到60%。
2.某企业所属三个分厂2005年下半年的利润额资料如下表所示:要求:(1)计算空格指标数值,并指出(1)~(7)是何种统计指标?(2)如果未完成计划的分厂能完成计划,则该企业的利润将增加多少?超额完成计划多少?(1):表中(1)(2)(4)为总量指标,(3)(5)(6)(7)为相对指标。
其中(3)(5)为结构相对指标,(6)为计划完成情况相对指标,(7)为动态相对指标。
(2)B分厂计划利润1724万元,实际只完成1637.8万元。
如果B分厂能完成计划,则该企业的利润将增加86.2万元(1724-1637.8=86.2),超额完成计划178.29万元,[(4135.8+86.2)-4043.71=178.29],超额4.41%.(178.29/4043.71=4.41%) 3.某地区商业局下属20个零售商店,某月按零售计划完成百分比资料分组如下:要求:计算该局平均计划完成程度。
该局平均计划完成程度4.某企业1999年某月份按工人劳动生产率高低分组的有关资料如下:试计算该企业工人平均劳动生产率。
工人平均劳动生产率(件/人)5.1999年某月甲、乙两市场某商品价格、销售量和销售额资料如下:试分别计算该商品在两个市场上的平均价格。
该商品在甲市场的平均价格为:(元/件)该商品在乙市场的平均价格(元/件)6.有甲、乙两个品种的粮食作物,经播种实验后得知甲品种的平均产量为998斤,标准差为162.7斤;乙品种实验的资料如下:试研究两个品种的平均亩产量,以确定哪一品种具有较大稳定性,更有推广价值?(斤)(斤)因为0.163 〉0.072,所以乙品种平均亩产量具有较好的稳定性,较有推广价值。
统计学原理计算题

统计学原理计算题
1. 样本均值的计算
假设有一组数据:7, 8, 9, 10, 11
要计算这组数据的样本均值,首先将数据相加,得到总和:7
+ 8 + 9 + 10 + 11 = 45
然后,将总和除以数据个数得到样本均值:45 / 5 = 9
所以,这组数据的样本均值为9。
2. 方差的计算
假设有一组数据:12, 14, 16, 18, 20
要计算这组数据的方差,首先计算每个数据与样本均值的差值。
样本均值为(12 + 14 + 16 + 18 + 20) / 5 = 16
差值为:12-16 = -4, 14-16 = -2, 16-16 = 0, 18-16 = 2, 20-16 = 4
然后,将差值平方得到如下结果:(-4)^2 = 16, (-2)^2 = 4, 0^2 = 0, 2^2 = 4, 4^2 = 16
计算这些平方结果的和:16 + 4 + 0 + 4 + 16 = 40
最后,将和除以数据个数得到方差:40 / 5 = 8
所以,这组数据的方差为8。
3. 标准差的计算
标准差是方差的平方根。
前面的例子中,方差为8,所以标准差为√8 ≈ 2.828。
因此,这组数据的标准差为约2.828。
统计学复习题六

统计指数一、填空题1、统计指数按研究对象的X围不同,可分为个体指数和总指数.2、总指数按计算方法不同,可分为综合指数和平均指数.3、综合指数按其所反映现象的性质不同,可分为数量指标指数和质量指标指数.4、编制综合指数时有两个要点:一是选择同度量因素;二是把同度量因素固定下来.5、同度量因素在综合指数的计算中,既起过渡作用,又起权数作用.6、一般地讲,在编制质量指标指数时,通常是以报告期的数量指标做为同度量因素;在编制数量指标指数时,通常是以基期的质量指标作为同度量因素.7、平均数指数是从个体指数出发编制的总指数,通常作为综合指数的变形来使用,按其计算形式不同可分为加权算术平均数指数和加权调和平均数指数.8、加权算术平均数指数是以综合指数的基期总量作权数,通常用来编制数量指标总指数;加权调和平均数指数是以综合指数的报告期总量作权数,通常用来编制质量指标总指数.9、在目前条件下,我国编制零售物价指数的方法是固定权数加权算术平均数指数,公式为.10、产品产量增长15%,单位产品成本上升5%,则生产费用增长20.755%.11、物价上涨后,同样多的人民币少购商品15%,则物价上涨了17.6%.12、在指数体系中,总指数等于各因素指数的乘积,总量指标的绝对增长额等于各因素指数所引起的绝对增长额的和.13、因素分析法的特点是:假定其他因素不变,来测定某一因素的变动.14、总量指标指数体系的数量关系表现为总量指标指数等于各因素指数的乘积;平均指标指数体系的数量关系表现为平均指标指数等于固定组成指数乘以结构影响指数.15、平均指标指数是同一经济现象两个不同时期条件下数量的平均指标值对比计算的相对数,它又称为;固定组成指数的公式是;结构影响指数的公式是.二、是非题1、广义指数就是各种相对数. T2、总指数就是加权指数. F3、编制综合指数的关键问题是同度量因素与其时期的选择. T4、编制平均数指数,实质上就是计算个体指数的平均数. T5、如果物价上涨10%,则现在100元钱只值原来的90元了. F6、总指数可分为质量指标指数和数量指标指数,而个体指数不能这样分. F7、在我国统计实践中,零售物价指数的编制是采用固定加权平均法. T8、总指数能说明不可相加现象总变动的情况. T9、综合指数中同度量元素的时期是可以选择的. T10、质量指标指数是反映总体内涵变动情况的相对数. T11、因素分析的目的就是要测定现象总变动中各因素的影响方向和影响程度. T12、对于多因素分析要使用连锁替代法. T13、工资总额增长10%,平均工资下降5%,则职工人数应增长15%. F14、平均指标指数实际上就是综合指数的变形. F15、综合指数可以同时研究几个因素的变动方向和变动程度. F16、综合指数是根据全面资料计算的,平均数指数是根据非全面资料计算的. T三、单项选择题1、总指数的基本形式是〔B〕A、个体指数B、综合指数C、算术平均数指数D、调和平均数指数2、统计指数按其所反映的指标性质不同可分为〔B〕A、个体指数和总指数B、数量指标指数和质量指标指数C、综合指数和平均数指数D、算术平均数指数和调和平均数指数3、数量指标指数的同度量因素一般是〔A〕A、基期质量指标B、报告期质量指标C、基期数量指标D、报告期数量指标4、质量指标指数的同度量因素一般是〔B〕A、基期质量指标B、报告期质量指标C、基期数量指标D、报告期数量指标5、统计指数是一种反映现象变动的〔B〕A、绝对数B、相对数C、平均数D、序时平均数6、副食品类商品价格上涨10%,销售量增长20%,则副食品类商品销售总额增长〔D〕A、30%B、32%C、2%D、10%7、如果物价上升10%,则现在的1元钱〔D〕A、只是原来的0.09元B、与原来的1元钱等价C、无法与过去进行比较D、只是原来的0.91元8、某企业20##比20##产量增长了10%,产值增长了20%,则产品的价格提高了〔A〕A、10%B、30%C、100%D、9.09%9、某厂20##产品单位成本比去年提高了6%,产品产量指数为96%,则该厂总成本〔D〕A、提高了1.76%B、提高了1.9%C、下降了4%D、下降了6.8%10、反映多个项目或变量的综合变动的相对数是〔A〕A、数量指数B、质量指数C、个体指数D、综合指数11、反映物量变动水平的指数是〔A〕A、数量指标指数B、综合指数C、个体指数D、质量指标指数12、下列是数量指标指数的有〔C〕A、产品产量指数B、商品销售额指数C、价格指数D、产品成本指数13、商品销售额的增加额为400元,由于销售量增加使销售额增加410元,由于价格〔B〕A、增长使销售额增加10元B、增长使销售额增加205元C、降低使销售额减少10元D、降低使销售额减少205元14、某城市商业银行贷款增加25%,利率提高20%,则利息额增加〔B〕A、45%B、50%C、5%D、12.5%15、狭义的指数是指〔C〕A、动态指数B、总指数C、定基指数D、个体指数16、根据个体指数和报告期总量指标计算的总指数是〔B〕A、综合指数B、加权算术平均数指数C、加权调和平均数指数D、可变构成指数17、编制质量指标指数时,同度量因素一般固定在〔D〕A、基期B、报告期C、都可以D、视具体情况而定18、我国零售物价指数的编制是采用〔C〕方法A、个体指数B、综合指数C、平均数指数D、固定权数平均数指数19、为了反映职工工资水平的变动程度,应计算平均工资〔C〕A、可变构成指数B、结构影响指数C、固定组成指数D、都不是20、平均指标指数是〔A〕A、平均数指数B、个体指数的平均数C、由两个平均指标对比形成的指数D、两个总量指标对比形成的指数21、算术平均数指数是〔A〕A、对个体数量指标指数进行平均B、对个体质量指标指数进行平均C、对个体数量指标进行平均D、对个体质量指标进行平均四、多项选择题1、下列属于数量指标指数的是〔ADE〕A、产品产量指数B、商品销售额指数C、价格指数D、产品成本指数E、职工人数指数2、下列属于质量指标指数的是〔CD〕A、产品产量指数B、商品销售额指数C、价格指数D、产品成本指数E、职工人数指数3、某商品基期售出50公斤,报告期售出60公斤,指数为120%,该指数为〔ADE〕A、数量指标指数B、综合指数C、总指数D、销售量指数E、个体指数4、统计中通常所讲的指数〔ADE〕A、是一种特殊的动态相对数B、具有平均数的性质C、是一种综合性的代表值D、可用来分析现象变动的原因E、可用来反映现象在长时间内的变动趋势5、同度量因素在综合指数中的作用有〔CE〕A、比较作用B、平衡作用C、权数作用D、推算作用E、媒介作用6、综合指数〔ABCDE〕A、是两个总量指标对比的动态相对指标B、分子分母分别是两个或两个以上因素的乘积之和C、分子、分母有一个是假定的总量指标D、综合反映多种现象的变动程度E、固定一个或一个以上的因素观察另一个因素的变动7、平均数指数〔ABDE〕A、是综合指数的变形B、是各个个体指数的平均数C、其权数可以是总量指标也可以是相对指标D、是我国目前编制物价指数的常用方法E、有算术平均数指数和调和平均数指数之分8、编制总指数的方法有〔AB〕A、综合指数B、平均数指数C、算术平均数指数和调和平均数指数D、平均指标指数E、可变构成指数9、某种产品的生产总费用20##为50万元,比20##多2万元,而单位产品成本20##比20##降低5%,则〔ACDE〕A、生产费用总指数为104.17%B、生产费用指数为108.56%C、单位成本指数为95%D、产量指数为109.65%E、由于成本降低而节约的生产费用为2.63万元10、三个地区同一种商品的价格报告期为基期的108%,这个指数是〔BE〕A、个体指数B、总指数C、综合指数D、平均数指数E、质量指标指数11、平均指标指数包括〔BCE〕A、固定权数算术平均数指数B、固定构成指数C、可变构成指数D、算术平均数指数E、结构影响指数。
统计指数复习计算题

10.6.1某商店四种主要商品的销售价格、销售量资料如下:及变动原因;解:1计算价格总指数2计算销售量总指数3利用指数体系分析分析销售额变动方向及变动原因有,267842678422672228602267222860=⨯%=%×%3924元= 4112元-188元结果表明,由于价格报告期比基期平均上涨了%,使销售额增加了4112元;又由于销售量报告期比基期平均减少了%使销售额减少了188元,价格与销售量两个因素综合作用的结果,使企业的销售额报告期比基期增加了3924元;10.6.2 已知某车间各小组生产同一种产品,有关资料如下表所示:要求:计算全车间总产量指数和全车间职工人数指数;解:各小组基期实际产量计算表全车间总产量指数=报告期实际产量÷基期的实际产量=796÷690=%全车间职工人数指数=全车间总产量指数÷全车间职工劳动生产率指数=%÷120%=%2用基期加权综合法计算产品产量总指数;解:单位产品成本指数及产品产量指数计算表1用报告期加权综合法计算单位产品成本总指数:2用基期加权综合法计算产品产量总指数:解:产量指数计算表产品产量总指数:数;解:价格总指数与销售量总指数计算表1 商品价格总指数:2商品销售量总指数:商品销售量总指数=商品销售额指数÷商品价格指数=2930÷2700÷%=%10.6.6 三种产品的出口价格及其出口数量资料如下:;解:有,16010016010096000 792009600079200=⨯%=%×%80900美元= 64100美元+16800美元结果表明:由于出口价格报告期比基期平均上涨了%,使出口额增加了64100美元;又由于出口量报告期比基期平均增加了%使出口额增加了16800美元,出口价格与出口量两个因素综合作用的结果,使企业的出口额报告期比基期增加了80900美元;要求:运用因素分析法从相对数和绝对数两方面分析单位成本和产品产量的变动对总成本的影响;解:单位成本指数及产量指数计算表单位成本指数产品产量指数总成本指数有,%=%×%-68000元= -188000元+120000元结果表明,由于单位成本报告期比基期平均下降了%,使总成本节约了万元;又由于产量报告期比基期平均增加了%使总成本增加了12万元,两个因素综合作用的结果,使企业的总成本报告期比基期减少了万元;解:工资水平指数及工人结构影响指数计算表依据公式,=∑∑∑ff x f x 0111⨯∑∑∑∑ff x f f x 11111∑∑∑∑f f x f f x 000110 有,185600018560001830000105010501050 664600183000066460036510503651767.6191767.6191742.857 1820.8221742.8571820.822=⨯=⨯即有, %=%×%-元/人=元/人-元/人结果表明,由于工人工资水平提高%,使企业平均工资水平增加元;又由于工人结构的变动使企业平均工资下降了元,两个因素综合作用的结果,使企业总平均工资报告期比基期下降了%,使总平均工资绝对额减少了元;10.6.9 某企业的甲、乙、丙三种商品最近两年的销售资料如下:解:价格指数、销售量指数计算表价格指数: 销售量指数: 销售额指数:有,125%=%×%2900元= -220元+3120元结果表明,由于产品价格报告期比基期平均下降了%,使销售额减少了220元;又由于产品销售量报告期比基期平均增加了%使销售额增加了3120元,两个因素综合作用的结果,使产品销售额增加了2900元;。
统计学-复习试题(含答案)

一. 单项选择题(每小题2分,共20分)1. 对于未分组的原始数据,描述其分布特征的图形主要有( )A. 直方图和折线图B. 直方图和茎叶图C. 茎叶图和箱线图D. 茎叶图和雷达图 2. 在对几组数据的离散程度进行比较时使用的统计量通常是( )A. 异众比率B. 平均差C. 标准差D. 离散系数3. 从均值为100、标准差为10的总体中,抽出一个50=n 的简单随机样本,样本均值的数学期望和方差分别为( )A. 100和2 B. 100和0.2 C. 10和1.4 D. 10和2 4. 在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量标准之一是使它与总体参数的离差越小越好。
这种评价标准称为( )A. 无偏性 B. 有效性 C. 一致性 D. 充分性5. 根据一个具体的样本求出的总体均值95%的置信区间( )A. 以95%的概率包含总体均值B. 有5%的可能性包含总体均值C. 一定包含总体均值D. 可能包含也可能不包含总体均值 6. 在方差分析中,检验统计量F 是( )A. 组间平方和除以组内平方和B. 组间均方和除以组内均方C. 组间平方和除以总平方和D. 组间均方和除以组内均方 7. 在回归模型εββ++=x y 10中,ε反映的是( )A. 由于x 的变化引起的y 的线性变化部分B 由于y 的变化引起的x 的线性变化部分C. 除x 和y 的线性关系之外的随机因素对y 的影响D 由于x 和y 的线性关系对y 的影响8. 在多元回归分析中,多重共线性是指模型中( )A. 两个或两个以上的自变量彼此相关B 两个或两个以上的自变量彼此无关 C 因变量与一个自变量相关D 因变量与两个或两个以上的自变量相关9. 若某一现象在初期增长迅速,随后增长率逐渐降低,最终则以K 为增长极限。
描述该类现象所采用的趋势线应为( )A. 趋势直线 B. 指数曲线 C. 修正指数曲线 D. Gompertz 曲线10. 消费价格指数反映了( )A. 商品零售价格的变动趋势和程度B 居民购买生活消费品价格的变动趋势和程度C 居民购买服务项目价格的变动趋势和程度D 居民购买生活消费品和服务项目价格的变动趋势和程度二. 简要回答下列问题(每小题5分,共20分)1. 解释总体与样本、参数和统计量的含义。
统计学原理复习

统计学原理计算题练习第 1 页 共 6 页统计学原理计算题练习1.某生产车间30名工人日加工零件数(件)如下:(学习指导P300—1,下同)30 26 42 41 36 44 40 37 37 25 45 29 43 31 36 36 49 34 47 33 43 38 42 32 34 38 46 43 39 35要求:(1)根据以上资料分成如下向组:25—30,30—35,35—40,40—45,45—50,计算出各组频数和频率,编制次数分布表。
(2)根据整理表计算工人平均日产零件数。
2.某公司下属50个企业,生产同种产品,某月对产品质量进行调查,得资料;要求计算该产品的平均合格率。
(P279—1345. 1990试问哪一个市场农产品的平均价格较高?并说明原因。
6.7(P168—21(P166—18(P165—13(P164—10)8.某企业甲、乙两个车间,甲车间平均每个工人日加工零件数65件,标准差11件;乙车间工人日加工零件数资料:计算乙车间工人加工零件的平均数和标准差,并比较甲、乙两车间哪个车间的平均日加工零9.某工厂有2000个工人,用简单随机不重复方法抽出100个工人作为样本,计算出平均工资560元,标准差32.45元。
要求:(1)计算抽样平均误差; (2)以95.45%(t=2)的可靠性估计该厂工人的月平均工资区间。
(P295—5)10.某乡有5000农户,按随机原则重复抽取100户调查,得平均每户年纯收入12000元,标准差2000元。
要求:(1)以95%的概率(t=1.96)估计全乡平均每户年纯收入的区间。
(2)以同样概率估计全乡农户所纯收入总额的区间范围(P179—14)11.为了解某城市分体式空调的零售价格,随机抽取若干个商场中的40台空调,平均价格为3800元,样本标准差400元。
要求:(1)计算抽样平均误差;(2)以99.73%(t=3)的可靠性估计该城市分体式空调的价格区间。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计计算方法复习题统计计算方法复习题一、填空题:x1、若随机变量的概率密度为,则的方差为。
XXfxcex(),,,,,01PX(),,12、若服从二项分布B(5000,0.001),则由泊松定理知。
XPXX(|),,,833、若服从均值为5的指数分布,则。
XN(t)PN(())20,,4、设服从参数为2的泊松过程,则。
,10x5、设的概率密度为,则其分布函数的逆函数为。
Xfxex()10,0,,二、选择题:1,2,3,4,56、能产生等可能取值为中一个数的MATLAB程序是( ) floor(5*rand) (C)floor(6*rand) (D)randperm(5) (A) ceil(5*rand)(B)7、在MATLAB中,表示二项分布的分布函数的是( ) (A) binopdf(B) binocdf(C) nbinpdf (D) nbincdf8、能产生均值为5的指数随机数的MATLAB程序是( ) (A) -5*ln(rand) (B) -log(rand)/5 (C) -5*log(rand) (D) 5*log(rand)9、在MATLAB中,表示正态分布的分位数的是( ) (A) normcdf (B) norminv(C) normpdf (D) normrndZN~(,)01||Z10、, 则的方差为( )222(A) 1 (B) (C) , (D) , 11,,,三、计算题:,xUU~(,)01,log()U11、设,X的分布函数为证明:的Fxex(),.,,,10 Fx().分布函数也是,2,xIedx,12、积分,(1) 利用数值方法给出积分的计算结果; ,,,(2) 利用Monte Carlo方法编程计算积分。
13、设的概率分布为 XPXPXPX().,().,().,,,,,,103205302写出利用舍选抽样法产生随机数的算法步骤和MATLAB程序。
14、设的概率分布函数为 X, F(x),1,exp(,,x),x,0第1页共10页写出逆变换法产生随机数的算法步骤和MATLAB程序。
15、某工厂近5年来发生了63次事故,按星期几分类如下星期一二三四五六次数() 9 10 11 8 13 12 Ni,,0.10问:事故的发生是否与星期几有关,(注意不用编程,显著性水平)22,(附表:其中表示自由度为的随机变量在点的分布函数值,,(y)ynn22,(.).,1666701069,) ,(1.6667),0.05236516、某计算机机房的一台计算机经常出故障,研究者每隔15分钟观察一次计算机的运行状态,收集了24个小时的数(共作97次观察),用1表示正常状态,用0表示不正常状态,所得的数据序列如下: 1110010011111110011110111111001111111110001101101 1110110110101111011 10111101111110011011111100111设Xn为第n(n=1,2,…,97)个时段的计算机状态,可以认为它是一个齐次马氏链,从上数据序列中得到:96次状态转移情况是: 0?0:8次; 0?1:18次;1?0:18次; 1?1:52次。
求(1)一步转移概率矩阵;(2)已知计算机在某一时段(15分钟)的状态为0,问在此条件下,从此时段起,该计算机能连续正常工作45分钟(3个时段)的条件概率.,,17、设是具有三个状态0,1,2的时齐马氏链,一步转移矩阵为: X,n,0)n 3/41/40,,,,1,初始分布为P,1/41/21/4P(X,i),,i,0,1,2,,03,,03/41/4,, 求:;;(1)P(X,0,X,1,X,1)(2)P(X,1,X,1|X,0)024240. (3)P(X,0,X,0,X,0,X,0|X,0)12340答案:一、填空题:2ee,,311,1,5,4e1、U 2、 3、 4、 5、 6ee,,,,ln(1),01yy2(1)e,10二、选择题:6、A7、B8、C9、B 10、C第2页共10页三、计算题:,log()U,,log()1UU1,U11、解:注意到与同分布,从而与同分布,,,log()1U设的分布为,于是 Fu()1,uFuPUuPUe()(log())(),,,,,,,11 1u,0显然当时,有 Fu(),,01,,uuu,0FuPUee()(),,,,,11当时,有 1,x,log()U从而的分布函数也是 Fxe().,,1yx,12、(1) 解:令,则222yy,,,,11122 Iedyedy,,,,,2,,,,,,222,,dx12dyydx,,,(2) 令,则,于是 y,21,x()1,x,1211,x2Iedxdy,,,,exp(())221 ,,200yyMATLAB程序如下:N=5000; y=rand(N,1);(或y=unifrnd(0,1,N,1))for i=1:NInt(i)=2*exp(-(1/y(i)-1)^2)/y(i)^2;endI=mean(Int);13、解:令为取值为1、2、3的离散均匀分布,则概率分布为Y 1则c=0.5/(1/3)=1.5 PYkk(),,,.,,,1233的随机数产生的舍选抽样法算法步骤如下: XSTEP1:产生的随机数和均匀随机数U; Y,P(X,Y)/0.5STEP2:若U,则令XY,;否则返回STEP1。
MATLAB程序如下:p=(0.3,0.5,0.2);Y=floor(3*rand+1); U=rand;while (U>p(Y)/0.5)Y= floor(3*rand+1); U=rand;第3页共10页endX=Y;1,,xU,,,(log(1)/),14、解:令可解得 Ux,,,1exp(),,1,xU,,(log()/),U1,U因为与同分布,则。
算法步骤为: STEP1:产生均匀随机数U;11,,XU,,(log()/)(log(1)/),,U,,STEP2:令或,则得到的随机数。
XMATLAB程序:alpha=5;beta=3; U=rand;X=(-log(U)/alpha)^(1/beta);115、解:检验假设为 HPXipi,,,,?:(),1,2,,60i6n,63, 使用卡方检验统计量n2()N,266i(),Nnp26ii,,,,1.6667 ,,nnpii,,11i622因, 计算得 ,,~(5)22, PP(1.6667)1(1.6667)10.10690.8931,,,,,,,,,由P值为0.8931,说明不能拒绝原假设,即不认为发生事故与星期几有关。
16、(1) 一步转移概率可用频率近似地表示为:第4页共10页88PPXX,,,,,0|0, ,,001nn,,818261818PPXX,,,,,0|1,,011nn,,818261818PPXX,,,,,1|0,,,101nn,,1852705252PPXX,,,,,1|1,,111nn,,185270818,,,,2626,,所以一步转移矩阵为:P,; 1852,,,,7070,,(2) 某一时段的状态为0,定义为初始状态,即,所求概率为: X,00P(X,1,X,1,X,1|X,0)1230,P(X,1|X,0)P(X,1|X,0,X,1)P(X,1|X,0,X,1,X,1) 102013012,PPP,0.38201111117、首先由C-K方程得两步转移矩阵为: 551,, 81616,,(2) 2531PP,,16216,,391,, ,,16164022,,,,,,5511 1 0,1,1PXXXpPP,,,,,,,,,,,,02400111316296 22,,,,5512 1,1|0PXXXPP,,,,,,,,,,, 2400111162323 0,0,0,0|0PXXXXX,,,,,,,,,12340371111111,,,,,,,,,,,PPPPPPPP0111111001122110 42244444256 第5页共10页一、填空题:,5x1、若随机变量的概率密度为,则的方差为。
XXfxcex(),,,0PX(),,12、若服从二项分布B(500,0.01),则由泊松定理知。
XPXX(|),,,2001003、若服从失效率为0.05的指数分布,则。
XN(t)PN(())20,,4、设服从参数为0.5的泊松过程,则。
1f(x),,x,R5、设的概率密度为,则其分布函数的逆函数X2,(1,x)为。
二、选择题:1,2,3,46、能产生等可能取值为中一个数的MATLAB程序是( ) (A) ceil(5*rand) (B) ceil(4*rand) (C)floor(4*rand) (D)randperm(4)7、在MATLAB中,表示负二项分布的概率密度函数的是( ) (A) binopdf (B) binocdf (C) nbinpdf (D) nbincdf8、能产生失效率为5的指数分布随机数的MATLAB程序是( )(B) -log(rand)/5 (C) -5*log(rand) (D) 5*log(rand) (A) -5*ln(rand)U(0,1)9、在MATLAB中,不可能产生一个均匀分布随机数的是哪个,( ) (A) unifrnd(0,1) (B) unidrnd(1,1,1) (C) unifrnd(0,1,1) (D) rand(1) 12,,110、设时齐Markov链, 其一步转移概率矩阵为, {X,n,1,2,?}P,n,,213,,则该过程的5步转移概率矩阵为( )1111,,,,1111,,,,,,,,555511,,,,1112113333,,,,(A) (B) (C)(D) ,,,,11112223,,,,1121,,,,1111,,,,,,,,55553333,,,,三、计算题:,,x,,X11、设X的分布函数为证明:服从区Fxex(),.,,,10FXe(),,1间(0,1)上的均匀分布。
22xy,,,,,212、 (1) 计算概率积分; Iexy,dd,,,,,,第6页共10页(2) 利用Monte Carlo方法编程计算积分的MATLAB程序。
I23x13、利用逆变换方法产生概率密度函数的随机数, 写出推fxx(),11,,,,2 导过程和MATLAB程序。
14、利用舍选抽样法产生概率分布为1 2 3 4 5 6 X0.15 0.1 0.2 0.15 0.3 0.1 P的随机数的算法步骤和MATLAB程序。
15、考虑随机变量,其可能取值为1,2,3,4,5,我们检验假设随机变量是等可能取这些值,如果样本大小为50,观测分别为12,5,19,7,7,利用检验方法说明该数据22,是否来自离散均匀分布。