统计学基于R第版习题答案(第二章)
《统计学基础(第2版)》参考答案
《统计学基础(第2版)》参考答案【习题与实践训练】答案第一章判断题1.×2.×3.×4.×5.×6.×7.√8.×9.× 10.√ 单项选择题1.B2.D3.D4.D5.A6.C7.D8.B9.A 10.C 多项选择题1.BCDE2.ABCD3.ACD4.ADE5.ABC6.ABCDE7.ADE8.BCE9.ABCDE10.BCD 填空题1.工作过程与结果理论与实践2.统计设计、统计调查、统计整理和统计分析3.大量观察法、统计分组法、综合指标法4. 变动的数量标志5.总体单位数量标志品质标志统计总体数量指标质量指标 6.指标条件指标名称、指标数值、指标单位7.一系列相互联系的统计指标所组成的有机整体基本专题 8. 定性数据定量数据9.母体子样 10.连续型变量离散型变量应用能力训练题 1.略 2.略3. ⑴总体:持有该公司信用卡的所有顾客;总体单位:持有该公司信用卡的每一位顾客;样本:300名顾客;样本量:300名;品质标志:过去六个月是否购买产品;数量标志:每位顾客购买金额;数量指标:300名顾客购买总额;质量指标:平均购买额为1782.67元;统计量:300名顾客平均购买额为1782.67元;参数:持有该公司信用卡的所有顾客购买总额。
⑵本案例采用的统计方法属推断统计。
4.轿车生产总量,旅游收入是数量指标;经济发展速度,人口出生率,安置再就业人数,城镇居民人均可支配收入,恩格尔系数是质量指标。
区分数量指标与质量指标的方法是:数量指标用绝对数表示,质量指标用相对数和平均数表示。
5.总体:中国农民;样本:全国31个省(区、市)6.8万户农村住户的农民;变量:现金收入、工资性收入、出售农产品的收入、家庭二、三产业生产经营收入、财产性收入、转移性收入。
6.略。
第二章判断题1.×2.×3.×4. √5.×6.×7. ×8. √9.× 10. × 单项选择题1.C2.A3.A4.C5.B6.D7.A8.C9.B 10.D 多项选择题1.BDE2.ACD3.BCD4.ADE5.BCE6.ABCE7.ABCE8.BDE9.BDE 10.ABC 填空题1.单一表一览表2.普查抽样调查重点调查典型调查3.全面调查非全面调查4.直接观察法5.有意识随机6.统计调查方案7.表头表体表脚8. 访问法(采访法、询问法)9. 开放式问题封闭式问题 10.网上直接调查网上间接调查1应用能力训练题 1.略 2.略3. ⑴全面调查一次性调查直接调查统计报表⑵全面调查一次性调查直接调查普查⑶非全面调查经常性调查直接调查抽样调查⑷非全面调查经常性调查直接调查重点调查⑸非全面调查经常性调查直接调查典型调查4. ⑴直接观察法直接调查⑵实验法直接调查⑶访问法直接调查⑷网上调查直接调查 5.略6.略第三章一、判断题1.× 2. × 3. × 4. × 5. √ 6. √ 7. × 8. × 9. √ 10. √ 二、选择题1.B 2. B 3. C 4.A 5. D 6.A 7.D 8.B 9.D 10.A 三、多项选择题1.ACD 2.BCD 3.ABDE 4.CD 5.ACE 6.BCE 7.BCD 8.ABE 9.BCDE 10.BC 四、填空题1.选择分组标志和划分各组界限 2.类型分组、结构分组和分析分组 3.品质分配数列变量分配数列4.组限每个组的最大值每个组的最小值组中值 5.反比6.上组限不在内7.等距分组异距分组8.按某标志分的组各组相应的分配次数或频率或标志值频数频率 9.钟型分布、U型分布和J型分布。
数理统计教程第二章课后习题答案
数理统计第二章习题解答1.设n ξξ,,1 是来自二点分布的一个子样,试求成功概率p 的矩法估计量.解: p E =ξ ξ=∴pˆ 2. 已知母体ξ均匀分布于()βα,之间,试求βα,的矩法估计量.解: 2βαξ+=E ,()122αβξ-=D 。
令()⎪⎪⎩⎪⎪⎨⎧=-=+22122n S αβξβα得 n S 3ˆ-=ξα,.3ˆnS +=ξβ 3. 对容量为n 的子样,求密度函数 ()()⎪⎩⎪⎨⎧<<-=其它,00,2;2ax x a a a x f 中参数a 的矩法估计量.解: ()322adx x a a x E a=-=⎰ξ 令ξ=3a 得ξ3ˆ=a . 4. 在密度函数 ()()10,1<<+=x x a x f a 中参数a 的极大似然估计量是什么? 矩法估计量是什么? 解: (1) ()()()∏∏==+=+=ni i ni nni x x L 111ααααα ()i ix∀<<1∴()().ln 1ln ln 1⎪⎪⎭⎫ ⎝⎛⋅++=∏=n i i x n L ααα 令()0ln 1ln 1=++=∂∂∑=i ni x nL ααα,得 ∑=--=ni iL xn1ln 1ˆα。
由于 ()01ln 222<+-=∂∂ααnL 故∑=--=ni iL xn1ln 1ˆα是α极大似然估计.(2) 由211+-=αξE 令ξα=+-211 得 .112ˆξξα--=5.用极大似然法估计几何分布 ()(),2,1,11=-==-k p p k P k ξ中的未知参数p .解:()()n x ni p p p L -∑-=1,令 ()01ln =---=∂∂∑pn x p n p p L i 得x p1ˆ=而01ln 2ˆ2<--=∂∂=x x n p Lpp ξ1ˆ=∴p是P 的极大似然估计. 6. 设随机变量ξ的密度函数为()0,,21>∞<<-∞=-σσσx e x f x,n ξξ,,1 是ξ的容量为n 的子样,试求σ的极大似然值. 解: ()()∑=--ix neL σσσ12,()01ln 2=+-=∂∂∑i x n L σσσσ。
统计学(第二版)课件及习题答案《统计学》参考答案
《统计学》(教育部教材)习题参考答案第一章统计概述一、填空题1.数量方面定量认识2.统计总体同质性差异性大量性3.总体单位数量标志品质标志不变标志可变标志4.总体指标名称指标数值5.总量指标相对指标平均指标数量指标质量指标静态指标动态指标二、单项选择题1.B 2.C 3.A 4.B 5.B三、多项选择题1.ABDE 2.ABC 3.ABCD 4.ABD 5.ABD四、问答题1.什么是指标?指标和标志有何区别和联系?①统计指标简称指标,是指综合反映现象总体数量特征的概念(及其数值)。
②指标与标志有两点区别:一是说明的对象范围不同,即指标是说明总体特征的,标志是说明总体单位特征的;二是具体表现的表示方式不同,即指标的具体表现都用数值表示,标志的具体表现只有数量标志用数值表示,品质标志则用文字表示。
③指标与标志有密切联系:一是标志表现是计算指标数值的基础;二是两者随研究目的不同具有转化关系。
2.指标有哪些具体分类?指标按表现形式分为总量指标、相对指标和平均指标;按性质或内容分为数量指标和质量指标;按时间状况分为静态指标和动态指标。
3.什么是指标体系?设置指标体系有何意义?指标体系是指一系列相互联系的指标组成的整体。
单项指标的局限性和社会经济现象的复杂性,决定了在统计中必须科学地设置指标体系,以便从不同角度、不同侧面来反映现象的全貌和事物间的联系。
4. 统计工作过程分哪几个阶段?如何理解统计“质—量—质”的认识过程?统计工作过程大致分为统计设计、统计调查、统计整理和统计分析四个相对独立、相互衔接的阶段。
四个阶段基本体现了统计“质—量—质”的认识过程。
统计首先要对现象进行初步的定性(质的)认识,作出统计设计;然后根据设计要求去进行量的调查和整理;最后通过统计分析,揭示现象的本质特征及其变化规律性,达到高一级的质的认识,实现统计之目的。
第二章统计调查一、填空题1.准确及时全面(系统或经济)2.调查项目3.全部工业生产设备每台工业生产设备每个工业企业4.单一表一览表表头表体表脚5.调查得到的统计数字客观现象实际数量表现登记性代表性二、单项选择题1.A 2.C 3.C 4.C 5.B三、多项选择题1.BCDE 2.BCDE 3.ABD 4.ABCDE 5.ACE四、问答题1.什么是统计调查?统计调查有哪些种类?统计调查是根据统计设计的要求,采用科学的方式和方法,有计划、有组织地向总体单位登记其有关标志表现,以获取统计研究所需要的原始资料的工作过程。
人大版时间序列分析基于R(第2版)习题答案
第一章习题答案略第二章习题答案2.1答案:(1)非平稳,有典型线性趋势(2)延迟1-6阶自相关系数如下:(3)典型的具有单调趋势的时间序列样本自相关图2.2(1)非平稳,时序图如下(2)1-24阶自相关系数如下(3)自相关图呈现典型的长期趋势与周期并存的特征2.3R命令答案(1)1-24阶自相关系数(2)平稳序列(3)非白噪声序列Box-Pierce testdata: rainX-squared = 0.2709, df = 3, p-value = 0.9654X-squared = 7.7505, df = 6, p-value = 0.257X-squared = 8.4681, df = 9, p-value = 0.4877X-squared = 19.914, df = 12, p-value = 0.06873X-squared = 21.803, df = 15, p-value = 0.1131X-squared = 29.445, df = 18, p-value = 0.04322.4答案:我们自定义函数,计算该序列各阶延迟的Q统计量及相应P值。
由于延迟1-12阶Q统计量的P值均显著大于0.05,所以该序列为纯随机序列。
2.5答案(1)绘制时序图与自相关图(2)序列时序图显示出典型的周期特征,该序列非平稳(3)该序列为非白噪声序列Box-Pierce testdata: xX-squared = 36.592, df = 3, p-value = 5.612e-08X-squared = 84.84, df = 6, p-value = 3.331e-162.6答案(1)如果是进行平稳性图识别,该序列自相关图呈现一定的趋势序列特征,可以视为非平稳非白噪声序列。
如果通过adf检验进行序列平稳性识别,该序列带漂移项的0阶滞后P值小于0.05,可以视为平稳非白噪声序列Box-Pierce testdata: xX-squared = 47.99, df = 3, p-value = 2.14e-10X-squared = 60.084, df = 6, p-value = 4.327e-11(2)差分序列平稳,非白噪声序列Box-Pierce testdata: yX-squared = 22.412, df = 3, p-value = 5.355e-05X-squared = 27.755, df = 6, p-value = 0.00010452.7答案(1)时序图和自相关图显示该序列有趋势特征,所以图识别为非平稳序列。
统计学第二章课后题及答案解析
第二章一、单项选择题1•对一批商品进行质量检查,最适合采用的调查方法是()A.全面调查B.抽样调查C.典型调査D.重点调查2.对某市全部商业企业职工的生活状况进行调查,调查对象是0A.该市全部商业企业B.该市全部商业企业职工C.该市每一个商业企业D.该市商业企业的每一名职工3.调查单位数LI不多,但其标志值占总体标志总量比重较大,此种调查属于()A.抽样调查B.重点调查C.典型调查D.全面调查4.需要不断对全国各铁路交通枢纽的货运量、货物种类等进行调查,以了解全国铁路货运情况。
这种调查属于()A.连续性典型调查B.连续性全面调查C.连续性重点调查D.—次性抽样调查5.非抽样误差()A仅在抽样调查中存在B仅在全面调查中存在C在抽样调查和全面调查中都存在D在抽样调查和全面调査中都不经常出现二、多项选择题1.统计调查按搜集资料的方法有0A.采访法B.抽样调查法C.直接观察法D.典型调查法E.报告法2.下列惜况的调查单位与填报单位不一致的是()A.工业企业生产设备调查B.人口普查C.工业企业现状调査D.农作物亩产量调查E.城市零售商丿占惜况调查3.抽样调查的优越性表现在()A.经济性B.时效性C.准确性D.全面性E.灵活性4.全国工业企业普查中()A.全国工业企业数是调查对象B.全国每个工业企业是调查单位C.全国每个工业企业是填报单位D.工业企业的所有制关系是变量E.每个工业企业的职工人数是调查项H5.以下属于非抽样误差的有()A调查员的调查误差B被调查者的回答误差C无回答误差D随机误差E抽样框误差三、填空题1.统计调查按其组织形式,可分为__________ 和__________ 两种。
统计调查按其调查对象的范围不同,可分为__________ 和_________ 两种。
统计调查按其调查登记的时间是否连续,可分为_________ 和________ O2.调查人员亲临现场对调查单位直接进行清点和汁量,这种调查方法称为________ 23. ___________________________________________ 对调查对象的所有单位都进行调查,这是____________________________________________ 调查。
人大版时间序列分析基于R(第2版)习题答案
第一章习题答案略第二章习题答案2.1答案:(1)非平稳,有典型线性趋势(2)延迟1-6阶自相关系数如下:(3)典型的具有单调趋势的时间序列样本自相关图2.2(1)非平稳,时序图如下(2)1-24阶自相关系数如下(3)自相关图呈现典型的长期趋势与周期并存的特征2.3R命令答案(1)1-24阶自相关系数(2)平稳序列(3)非白噪声序列Box-Pierce testdata: rainX-squared = 0.2709, df = 3, p-value = 0.9654X-squared = 7.7505, df = 6, p-value = 0.257X-squared = 8.4681, df = 9, p-value = 0.4877X-squared = 19.914, df = 12, p-value = 0.06873X-squared = 21.803, df = 15, p-value = 0.1131X-squared = 29.445, df = 18, p-value = 0.04322.4答案:我们自定义函数,计算该序列各阶延迟的Q统计量及相应P值。
由于延迟1-12阶Q统计量的P值均显著大于0.05,所以该序列为纯随机序列。
2.5答案(1)绘制时序图与自相关图(2)序列时序图显示出典型的周期特征,该序列非平稳(3)该序列为非白噪声序列Box-Pierce testdata: xX-squared = 36.592, df = 3, p-value = 5.612e-08X-squared = 84.84, df = 6, p-value = 3.331e-162.6答案(1)如果是进行平稳性图识别,该序列自相关图呈现一定的趋势序列特征,可以视为非平稳非白噪声序列。
如果通过adf检验进行序列平稳性识别,该序列带漂移项的0阶滞后P值小于0.05,可以视为平稳非白噪声序列Box-Pierce testdata: xX-squared = 47.99, df = 3, p-value = 2.14e-10X-squared = 60.084, df = 6, p-value = 4.327e-11(2)差分序列平稳,非白噪声序列Box-Pierce testdata: yX-squared = 22.412, df = 3, p-value = 5.355e-05X-squared = 27.755, df = 6, p-value = 0.00010452.7答案(1)时序图和自相关图显示该序列有趋势特征,所以图识别为非平稳序列。
《统计学》课后答案(第二版 - 贾俊平版)
《统计学》课后答案(第二版 - 贾俊平版)第1章统计与统计数据一、学习指导统计学是处理和分析数据的方法和技术,它几乎被应用到所有的学科检验领域。
本章首先介绍统计学的含义和应用领域,然后介绍统计数据的类型及其来源,最后介绍统计中常用的一些基本概念。
本章各节的主要内容和学习要点如下表所示。
章节 1.1 统计及其应用领域主要内容什么是统计学统计的应用领域分类数据、顺序数据、数值型数据观测数据和实验数据截面数据和时间序列数据数据的间接来源学习要点 ? 概念:统计学,描述统计,推断统计。
? 统计在工商管理中的应用。
? 统计的其他应用领域。
? 概念:分类数据,顺序数据,数值型数据。
? 不同数据的特点。
? 概念:观测数据,实验数据。
? 概念:截面数据,时间序列数据。
? 统计数据的间接来源。
? 二手数据的特点。
? 概念:抽样调查,普查。
? 数据的间接来源。
? 数据的收集方法。
? 调查方案的内容。
? 概念。
抽样误差,非抽样误差。
? 统计数据的质量。
? 概念:总体,样本。
? 概念:参数,统计量。
? 概念:变量,分类变量,顺序变量,数值型变量,连续型变量,离散型变量。
1.2 数据的类型 1.3 数据来源数据的直接来源调查方案设计数据质量总体和样本 1.4 统计中的参数和统计量几个基本概念变量二、主要术语1. 2. 3. 4. 5. 6. 7. 8. 9. 10.统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。
描述统计:研究数据收集、处理和描述的统计学分支。
推断统计:研究如何利用样本数据来推断总体特征的统计学分支。
分类数据:只能归于某一类别的非数字型数据。
顺序数据:只能归于某一有序类别的非数字型数据。
数值型数据:按数字尺度测量的观察值。
观测数据:通过调查或观测而收集到的数据。
实验数据:在实验中控制实验对象而收集到的数据。
截面数据:在相同或近似相同的时间点上收集的数据。
时间序列数据:在不同时间上收集到的数据。
概率论与数理统计(茆诗松)第二版课后第二章习题参考答案_百度讲解
(2)正态分布N (µ, σ 2 ;(3)对数正态分布LN (µ, σ 2 .解:(1)因 X 服从区间 (a, b上的均匀分布,则0.5 = P{ X ≤ x0.5 } = P{a < X ≤ x0.5 } = 故中位数x0.5 = a + 0.5(b − a = (2)因 X 服从正态分布N (µ, σ 2 ,x0.5 − a ,b−a a+b ; 2 x −µ⎛x −µ⎞ =0,则 0.5 = P{ X ≤ x0.5 } = F ( x0.5 = Φ⎜ 0.5 ⎟,即0.5 σ ⎝ σ ⎠故中位数 x0.5 = µ;(3)因 X 服从对数正态分布LN (µ, σ 2 ,有 ln X 服从正态分布 N (µ, σ 2 ,ln x0.5 − µ ⎛ ln x0.5 − µ ⎞ =0,则0.5 = P{ X ≤ x0.5 } = P{ln X ≤ ln x0.5 } = F (ln x0.5 = Φ⎜⎟,即σ σ ⎝⎠故中位数 x0.5 = e µ. 4.设 X ~ Ga (α , λ ,对 k = 1, 2, 3,求µ k = E (X k 与ν k = E [X − E (X ] k.解:因Ga (α , λ 的密度函数为⎧λα α −1 − λ x ⎪ x e , x ≥ 0, p X ( x = ⎨ Γ(α ⎪ x < 0. ⎩0, 由正则性知∫ +∞ +∞ +∞ Γ(α λα α −1 − λ x x e dx = 1 ,可得∫ x α −1 e −λ x dx = α ,0 Γ(α λ 0 故µ1 = ∫ 0 x⋅ λα α −1 − λ x λα+ ∞ α −λ x λα Γ(α + 1 α x e dx = x e dx = ⋅ = ;λ Γ(α Γ(α ∫0 Γ(α λα +1 λα α −1 −λ x λα + ∞ α +1 − λ x λα Γ(α + 2 α (α + 1 e = ⋅ = x e dx = x dx ;Γ(α Γ(α ∫0 Γ(α λα + 2 λ2 λα α −1 − λ x λα + ∞ α + 2 −λ x λα Γ(α + 3 α (α + 1(α + 2 e = ⋅ = x e dx = x dx ;Γ(α Γ(α ∫0 Γ(α λα + 3 λ3 µ2 = ∫ µ3 = ∫ +∞ 0 x2 ⋅ +∞ 0 x3 ⋅ ν 1 = E [X − E (X ] = 0;α (α + 1 α 2 α − 2 = 2 ;λ2 λ λ α (α + 1(α + 2 α (α + 1 α α 3 2α .3 2 − ⋅ + = ν 3 =E[ X − E ( X ]3 = µ 3 − 3µ 2 µ1 + 2µ13 = λ λ3 λ2 λ3 λ3 5.设X ~ Exp(λ,对 k = 1, 2, 3, 4,求µ k = E (X k 与ν k = E [X − E (X ] k ,进一步求此分布的变异系数、偏ν 2 = E[ X − E ( X ] 2 = µ 2 − µ12 = 度系数和峰度系数.解:因 X 的密度函数为⎧λ e − λ x , x ≥ 0, p X ( x = ⎨ x < 0. ⎩0, 41且 k 为正整数时,∫ 故µ1 = ∫ +∞ 0 +∞ 0 x k −1 e − λ x dx = +∞ Γ(k λ k = (k − 1! λk 1 ,; x ⋅ λ e −λ x dx = λ ∫ 0 x e −λ x dx = λ ⋅ λ 2 = 2! 1 λ = = = µ 2 = ∫ x 2 ⋅ λ e −λ x dx = λ ∫ x 2 e −λ x dx = λ ⋅ 0 0 +∞ +∞ 2 λ λ 3 λ2 6 ;;;µ 3 = ∫ x 3 ⋅ λ e − λ x dx = λ ∫ x 3 e − λ x dx = λ ⋅ 0 0 +∞ +∞ 3! 4 λ3 24 µ 4 = ∫ x 4 ⋅ λ e −λ x dx = λ ∫ x 4 e −λ x dx = λ ⋅ 0 0 +∞ +∞ 4! λ 1 5 λ4 ν 1 = E [X − E (X ] = 0;ν 2 = E[ X − E ( X ] 2 = µ 2 −µ12 = 2 λ 2 − 1 λ 2 = λ2 6 3 ;ν 3 = E[ X − E ( X ]3 = µ 3 − 3µ 2 µ1 + 2µ13 = λ −3 2 λ 2 ⋅ 1 λ 4 +2 −4 1 λ 6 3 = ⋅ 1 2 λ3 ;ν 4 = E[ X − E ( X ] 4 = µ 4 − 4 µ 3 µ1 + 6µ 2µ12 − 3µ14 = 变异系数C v ( X = 24 λ λ 3 λ +6 2 λ 2 ⋅ 1 λ 2 −3 1 λ 4 = 9 λ3 ; Var( X E( X =2;= ν2 =1; µ1 偏度系数β 1 = ν3 (ν 2 3 / 2 峰度系数β 2 = ν4 −3=9−3=6.(ν 2 2 6.设随机变量 X 服从正态分布 N (10, 9,试求 x0.1 和 x0.9.x − 10 ⎛ x − 10 ⎞解:因F ( x 0.1 = Φ⎜ 0.1 = 1.2816 ,故 x0.1 = 6.1552;⎟ = 0.1 ,得− 0.1 3 3 ⎝⎠ x − 10 ⎛ x − 10 ⎞又因F ( x 0.9 = Φ⎜ 0.9 = 1.2816 ,故 x0.9 = 13.8448.⎟ = 0.9 ,得0.9 3 3 ⎝⎠ x − 10 x 0.1 − 10 = 1.28 ,故 x0.1 = 6.16; 0.9 = 1.28 ,故 x0.9 = 13.84)3 3 7.设随机变量 X 服从双参数韦布尔分布,其分布函数为(或查表可得− m ⎧⎪⎪⎛ x⎞⎫⎟⎜ F ( x = 1 − exp ⎨− ⎜⎟⎬, η ⎭⎪⎩⎝⎠⎪ x>0,其中η > 0, m > 0.试写出该分布的 p 分位数 xp 的表达式,且求出当m = 1.5, η = 1000 时的 x0.1 , x0.5 , x0.8 的值.⎧⎪⎛ xp 解:因F ( x p = 1 − exp⎨− ⎜⎜η ⎪⎩⎝故x p = η[−ln(1 − p ] m ; 1 ⎞⎟⎟⎠ m ⎫⎪⎬= p,⎪⎭ 42当m = 1.5, η = 1000 时, x 0.1 = 1000(− ln 0.9 1 1.5 1 = 223.0755 ; x 0.5 = 1000(− ln 0.5 1 1.5 = 783.2198 ;x 0.8 = 1000(− ln 0.2 1.5 = 1373.3550 . 8.自由度为 2 的χ 2 分布的密度函数为p ( x = 1 −2 e , 2 x x>0,试求出其分布函数及分位数x0.1 , x0.5 , x0.8 .解:设 X 服从自由度为 2 的χ 2 分布,当 x < 0 时,F (x = P{X ≤ x} = P (∅ = 0,当x ≥ 0 时,F ( x = P{ X ≤ x} = ∫ 故 X 的分布函数为 x ⎧ − ⎪1 − e2 , x ≥ 0, F ( x = ⎨⎪ x < 0. ⎩0, x − − 1 −2 e du = (− e 2 = 1 − e 2 ; 2 0 u u x x 0 因 F (x p = 1 − e − xp 2 = p ,有xp = −2 ln (1 − p,故x0.1 = −2 ln 0.9 = 0.2107;x0.5 = −2 ln 0.5 = 1.3863;x0.8 = −2 ln 0.2 = 3.2189. 9.设随机变量 X 的分布密度函数 p(x 关于 c 点是对称的,且 E (X 存在,试证(1)这个对称点 c 既是均值又是中位数,即 E (X = x0..5 = c;(2)如果 c = 0,则xp = −x1 − p .证:设 f (x = p (x + c,因 p (x 关于 c 点对称,有 f (x 为偶函数,(1)E ( X = ∫ xp( xdx = ∫ ( x − c p ( xdx + ∫ cp( xdx = ∫ up (u + cdu + c = ∫ uf (u du + c −∞ −∞ −∞ −∞ −∞ +∞ +∞ +∞ +∞ +∞ = 0 + c = c;因 f (x 为偶函数,有∫ 则F (c = ∫ c −∞ 0 −∞ 0 f ( xdx = 1 +∞ f ( xdx = 0.5 ,2 ∫− ∞ 0 p( x dx = ∫ p (u + cdu = ∫ −∞ −∞ f (u du = 0.5 ,可得 x0..5 = c;故 E (X = x0..5 = c;(2)如果 c = 0,有 p (x 为偶函数,则 F (x p = ∫ xp −∞ p ( xdx = ∫ −xp +∞ p(−u ⋅ (−du = ∫ +∞ −xp p(u du = 1 − ∫ −xp −∞ p(u du = 1 − F (− x p = p ,可得 F (−xp = 1 − p,故−xp = x1 − p ,即xp = −x1 − p . 10.试证随机变量 X 的偏度系数与峰度系数对位移和改变比例尺是不变的,即对任意的实数a, b (b ≠ 0, Y = a + b X 与 X 有相同的偏度系数与峰度系数.证:因 Y = a + bX,有 E (Y = E (a + bX = a + bE (X ,可得Y − E (Y = a + b X − a − bE (X = b[X − E (X ],则ν 2 (Y = E [Y − E (Y ]2 = E{b2[X − E (X ]2} = b2 E [X − E (X ]2 = b2ν 2 (X ,ν 3 (Y = E [Y − E (Y ]3 = E{b3[X − E (X ]3} = b3 E [X − E (X ]3 = b3ν 3 (X ,ν 4 (Y = E [Y − E (Y ]4 =E{b4[X − E (X ]4} = b4 E [X − E (X ]4 = b4ν 4 (X ,故偏度系数β 1 (Y = ν 3 (Y [ν 2 (Y ] 3/ 2 = b 3ν 3 ( X [b ν 2 ( X ] 2 3/ 2 = b 3ν 3 ( X b [ν 2 ( X ] 3 3/ 2 = ν 3 (X [ν 2 ( X ]3 / 2 = β1 ( X ; 43峰度系数β 2 (Y = b 4ν 4 ( X b 4ν 4 ( X ν 4 (Y ν (X−3 = − 3 = −3= 4 − 3 = β2(X .2 2 2 4 2 [ν 2 (Y ] [b ν 2 ( X ] b [ν 2 ( X ] [ν 2 ( X ] 2 11.设某项维修时间 T(单位:分)服从对数正态分布LN (µ, σ 2 .(1)求 p 分位数 tp;(2)若µ =4.127,求该分布的中位数;(3)若µ = 4.127,σ = 1.0364,求完成 95%维修任务的时间.解:(1)因 T 服从对数正态分布LN (µ, σ 2 ,有 ln T 服从正态分布 N (µ, σ 2 ,ln t p − µ ⎛ ln t p − µ ⎞⎟则p = P{T ≤ t p } = P{ln T ≤ ln t p } = Φ⎜ = up ,ln tp = µ + σ ⋅ up,⎜σ ⎟,即σ ⎝⎠故tp = e µ +σ ⋅u p ;(2)中位数 t0.5 = e µ +σ ⋅u0.5 = e 4.1271+0 = 61.9979 ;(3)t0.95 = e µ +σ ⋅u0.95 = e4.1271+1.0364×1.6449 = 340.9972 . 12.某种绝缘材料的使用寿命 T(单位:小时)服从对数正态分布LN (µ, σ 2 .若已知分位数 t0.2 = 5000 小时,t0.8 = 65000 小时,求µ和σ.解:因 T 服从对数正态分布LN (µ, σ 2 ,有 ln T 服从正态分布N (µ, σ 2 ,由第 11 题可知t p = e µ +σ ⋅u p ,则t0.2 = e µ +σ ⋅u0.2 = e µ−0.8416σ = 5000 ,t0.8 = e µ +σ ⋅u0.8 = e µ +0.8416σ = 65000 ,可得µ − 0.8416σ = ln 5000 = 8.5172,µ + 0.8416σ = ln 65000 = 11.0821,故µ = 9.7997,σ =1.5239. 13.某厂决定按过去生产状况对月生产额最高的 5%的工人发放高产奖.已知过去每人每月生产额 X(单位:千克)服从正态分布 N (4000, 602 ,试问高产奖发放标准应把生产额定为多少?解:因 X 服从正态分布 N (4000, 602 ,x − 4000 ⎛ x − 4000 ⎞ = u0.95 = 1.6449 ,则0.95 = P{ X ≤ x0.95 } = F ( x0.95 = Φ⎜0.95 ⎟,即 0.95 60 60 ⎝⎠故高产奖发放标准应把生产额定为 x0.95 = 4000 + 60 ×1.6449 = 498.6940 千克. 44。
数理统计课后习题答案第二章
30.解:由题意用U统计量
计算得置信区间为
把
代入计算得置信区间
31.解:由题意, 未知,则
则
经计算得
解得 的置信区间为
查表:
带入计算得 的置信区间为: 。
32.
解: 未知,则 即:
有: 则单侧置信下限为:
将 带入计算得
即钢索所能承受平均张力在概率为 的置信度下的置信下限为 。
33.解:总体服从(0,1)分布且样本容量n=100为大子样。
令 为样本均值,由中心极限定理
又因为 所以
则相应的单侧置信区间为 ,
将 =0.06
代入计算得所求置信上限为0.0991
即为这批货物次品率在置信概率为95%情况下置信上限为0.0991。
34.解:由题意:
解得 的单侧置信上限为
其中n=10, =45,查表 3.325
。一元回归的线性模型为 试求 , 的最小二乘估计。
8.对于自变量和因变量都分组的情形,经验回归直线的配置方法如下:对 和 作 次试验得 对试验值,把自变量的试验值分成 组,组中值记为 ,各组以组中值为代表;把因变量的试验值分为 组,组中值记为 ,同样地各组以组中值为代表。如果 取 有 对, , ;而 。用最小二乘法配直线 ,试求 的估计量23
77
7
9.4
44
46
81
8
10.1
31
117
93
9
11.6
29
173
93
10
12.6
58
112
51
11
10.9
37
111
76
12
统计学教程答案第二章
∑ X 7 + 9 + 10 + 14 + 15 = = 11.00 n 5
∑ (X − X ) =0.00
∑X = 666.40mg/ml n
2
X =
S=
∑ (X − X ) =551.99mg/ml n −1 S CV = × 100% =82.83% X
X = ∑X = 127.20 mg/ml n
(2)求中位数,均数和标准差。 ①求中位数
M = Lx +
②求均数
ix n 2. 0 (80・50%-38)=12.24g − ∑ f L =12.0+ fM 2 17
X =
③求标准差
∑ fX =12.78 ∑f
2
S=
3.答案:
2 ∑ (X − X ) ∑ fX − ((∑ fX ) ∑ f ) = =3.77g n −1 ∑ f −1 2
统计学教程
第二章 计量资料的统计描述
五、习题答案要点
(一)名词解释 1.答案:频数表(frequency table)用来表示一批数据各观察值或在不同取值区间的 出现的频繁程度(频数) 。对于离散数据,每一个观察值即对应一个频数,如某医院某年度一 日内死亡 0,1,2…20 个病人的天数。对于散布区间很大的离散数据和连续型数据,数据散 布区间由若干组段组成,每个组段对应一个频数。 2.答案:算术均数(arithmetic mean)描述一组数据在数量上的平均水平。总体均数 用μ表示,样本均数用 X 表示。 3.答案:几何均数(geometric mean)用以描述对数正态分布或数据呈倍数变化资料的 水平。记为 G。 4.答案:中位数(median)将一组观察值由小到大排列,n 为奇数时取位次居中的变量 值;为偶数时,取位次居中的两个变量的平均值。 5.答案:极差(range)亦称全距,即最大值与最小值之差,用于资料的粗略分析,其 计算简便但稳定性较差。 6.答案:百分位数(percentile)是将 n 个观察值从小到大依次排列,再把它们的位次 依次转化为百分位。百分位数的另一个重要用途是确定医学参考值范围。
统计学导论基于r语言课后答案
统计学导论基于r语言课后答案1. In Table 3.4, the null hypothesis for "TV" is that in the presence of radio ads and newspaper ads, TV ads have no effect on sales. Similarly, the null hypothesis for "radio" is that in the presence of TV and newspaper ads, radio ads have no effect on sales. (And there is a similar null hypothesis for "newspaper".) The low p-values of TV and radio suggest that the null hypotheses are false for TV and radio. The high p-value of newspaper suggests that the null hypothesis is true for newspaper.2. KNN classifier and KNN regression methods are closely related in formula. However, the final result of KNN classifier is the classification output for Y (qualitative), where as the output for a KNN regression predicts the quantitative value for f(X).3. Y = 50 + 20(gpa) + 0.07(iq) + 35(gender) + 0.01(gpa * iq) - 10 (gpa * gender)(a) Y = 50 + 20 k_1 + 0.07 k_2 + 35 gender + 0.01(k_1 * k_2) - 10 (k_1 * gender) male: (gender = 0) 50 + 20 k_1 + 0.07 k_2 + 0.01(k_1 * k_2) female: (gender = 1) 50 + 20 k_1 + 0.07 k_2 + 35 + 0.01(k_1 * k_2) - 10 (k_1)Once the GPA is high enough, males earn more on average. => iii.(b) Y(Gender = 1, IQ = 110, GPA = 4.0) = 50 + 20 * 4 + 0.07 * 110 +35 + 0.01 (4 * 110) - 10 * 4 = 137.1(c) False. We must examine the p-value of the regression coefficient to determine if the interaction term is statistically significant or not.1. (a) better - a more flexible approach will fit the data closer and with the large sample size a better fit than an inflexible approach would be obtained(b) worse - a flexible method would overfit the small number of observations(c) better - with more degrees of freedom, a flexible model would obtain a better fit(d) worse - flexible methods fit to the noise in the error terms and increase variance2. (a) regression. inference. quantitative output of CEO salary based on CEO firm's features. n - 500 firms in the US p - profit, number of employees, industry(b) classification. prediction. predicting new product's success or failure. n - 20 similar products previously launched p - price charged, marketing budget, comp. price, ten other variables(c) regression. prediction. quantitative output of % change n - 52 weeks of 2012 weekly data p - % change in US market, % change in British market, % change in German market3. (a) See 3a.jpg.(b) all 5 lines >= 0i. (squared) bias - decreases monotonically because increases in flexibility yield a closer fitii. variance - increases monotonically because increases in flexibility yield overfitiii. training error - decreases monotonically because increases in flexibility yield a closer fitiv. test error - concave up curve because increase in flexibility yields a closer fit before it overfitsv. Bayes (irreducible) error - defines the lower limit, the test error is bounded below by the irreducible error due to variance in the error (epsilon) in the output values (0 <= value). When the training error is lower than the irreducible error, overfitting has taken place. The Bayes error rate is defined for classification problems and is determined by the ratio of data points which lie at the 'wrong' side of the decision boundary,。
统计学课后第二章习题答案
第2章练习题1、二手数据的特点是()A。
采集数据的成本低,但搜集比较困难 B. 采集数据的成本低,但搜集比较容易C。
数据缺乏可靠性 D.不适合自己研究的需要2、从含有N个元素的总体中,抽取n个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中,这样的抽样方式称为()A。
简单随机抽样 B.分层抽样 C.系统抽样 D。
整群抽样3、从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取n个元素为止,这样的抽样方法称为()A。
重复抽样 B.不重复抽样 C.分层抽样 D.整群抽样4、一个元素被抽中后不再放回总体,然后从所剩下的元素中抽取第二个元素,直至抽取n个元素为止,这样的抽样方法称为()A.不重复抽样B。
重复抽样C.系统抽样D。
多阶段抽样5、在抽样之前先将总体的元素划分为若干类,然后从各个类中抽取一定数量的元素组成一个样本,这样的抽样方式称为()A。
简单随机抽样B。
系统抽样C.分层抽样D.整群抽样6、先将总体各元素按某种顺序排列,并按某种规则确定一个随机起点,然后每隔一定的间隔抽取一个元素,直至抽取n个元素形成一个样本。
这样的抽样方式称为()A. 分层抽样B. 简单随机抽样C。
系统抽样D。
整群抽样7、先将总体划分为若干群,然后以群作为抽样单位从中抽取部分群,再对抽中的各个群中所包含的所有元素进行观察,这样的抽样方式称为()A. 系统抽样B。
多阶段抽样C。
分层抽样D。
整群抽样8、为了调查某校学生的购书费用支出,从男生中抽取60名学生调查,从女生中抽取40名学生调查,这种调查方是() A。
简单随机抽样B. 整群抽样C.系统抽样D。
分层抽样9、为了调查某校学生的购书费用支出,从全校抽取4个班级的学生进行调查,这种调查方法是()A. 系统抽样B. 简单随机抽样C.分层抽样D。
整群抽样10、为了调查某校学生的购书费用支出,将全校学生的名单按拼音顺序排列后,每隔50名学生抽取一名学生进行调查,这种调查方法是?()A。
统计学基于R第版习题答案(第二章)
统计学基于R第版习题答案(第⼆章)习题2、1(1)简单频数分布表:> load("D:\\⼯作总结\\⼈⼤\\R语⾔\\《统计学—基于R》(第3版)—例题与习题数据(公开资源)\\exercise\\ ch2\\exercise2_1、RData")> summary(exercise2_1)⾏业性别满意度电信业:38 男:58 不满意:75航空业:19 ⼥:62 满意 :45⾦融业:26旅游业:37⼆维列联表:> mytable1<-table(exercise2_1$⾏业,exercise2_1$满意度)> addmargins(mytable1) # 增加边界与不满意满意 Sum电信业 25 13 38航空业 12 7 19⾦融业 11 15 26旅游业 27 10 37Sum 75 45 120三维列联表:> mytable1<-ftable(exercise2_1, row、vars = c("性别","满意度"), col、var="⾏业");mytable1 ⾏业电信业航空业⾦融业旅游业性别满意度男不满意 11 7 7 11满意 6 3 7 6⼥不满意 14 5 4 16满意 7 4 8 4(2)条形图:> count1<-table(exercise2_1$⾏业)> count2<-table(exercise2_1$性别)> count3<-table(exercise2_1$满意度)> par(mfrow=c(1,3),mai=c(0、7,0、7,0、6,0、1),cex=0、7,cex、main=0、8)> barplot(count1,xlab="⾏业",ylab="频数")> barplot(count2,xlab="性别",ylab="频数")> barplot(count3,xlab="满意度",ylab="频数")帕累托图:> count1<-table(exercise2_1$⾏业)> par(mai=c(0、7,0、7,0、1,0、8),cex=0、8)> x<-sort(count1,decreasing = T)> bar<-barplot(x,xlab="⾏业",ylab="频数",ylim=c(0,1、2*max(count1)),col=2:5) > text(bar,x,labels = x,pos=3) # 条形图增加数值> y<-cumsum(x)/sum(x) # cumsum累计求与> par(new=T)> plot(y,type="b",lwd=1、5,pch=15,axes=F)> axis(4) # 右Y轴> mtext("累积频率",side=4,line=3)> mtext("累积分布曲线",line=-2、5,cex=0、8,adj=0、75)复式条形图:> mytable1<-table(exercise2_1$满意度,exercise2_1$⾏业)> barplot(mytable1,xlab="⾏业",ylab="频数",legend=rownames(mytable1),args、legend=list(x= 13), beside = T)脊形图:> library(vcd)马赛克图:> mosaicplot(~性别+⾏业+满意度,data=exercise2_1,col=2:3)(3)饼图:> count1<-table(exercise2_1$⾏业)> name<-names(count1)> label1<-paste(name," ",percent,"%",sep="")> par(pin=c(3,3),mai=c(0、1,0、4,0、1,0、4),cex=0、8) # 圆得⼤⼩> pie(count1,labels=label1,init、angle = 90)扇形图:> count1<-table(exercise2_1$⾏业)> name<-names(count1)> percent<-count1/sum(count1)*100> labs<-paste(name," ",percent,"%",sep="") > library(plotrix)> fan、plot(count1,labels=labs,ticks=200)2、2(1)分10组,绘制频数分布表> load("D:\\⼯作总结\\⼈⼤\\R语⾔\\《统计学—基于R》(第3版)—例题与习题数据(公开资源)\\exercise\\ ch2\\exercise2_2、RData")> library(actuar)> v<-as、vector(exercise2_2$灯泡寿命)> gd1<-grouped、data(v, breaks = 10, right = FALSE)> table1<-data、frame(gd1);table1Var、1 v1 [2600, 2800) 12 [2800, 3000) 43 [3000, 3200) 124 [3200, 3400) 135 [3400, 3600) 276 [3600, 3800) 207 [3800, 4000) 198 [4000, 4200) 4(2)直⽅图> d<-exercise2_2$灯泡寿命> hist(d,breaks=10,xlab="寿命",ylab="频数")茎叶图:> stem(exercise2_2$灯泡寿命)The decimal point is 2 digit(s) to the right of the |26 | 028 | 96830 | 9932 | 788899013456934 | 11222334445555936 | 444556778838 | 2245556667005566940 | 0010172、3(1)箱线图:> load("D:\\⼯作总结\\⼈⼤\\R语⾔\\《统计学—基于R》(第3版)—例题与习题数据(公开资源)\\exercise\\ ch2\\exercise2_3、RData")> boxplot(exercise2_3[,-1],xlab="城市",ylab="⽓温",cex、lab=0、8,cex、axis=0、6) # 从第⼆列开始,到最后⼩提琴图:> library(vioplot)> x1<-exercise2_3$北京> x2<-exercise2_3$沈阳> x3<-exercise2_3$上海> x4<-exercise2_3$南昌> vioplot(x1,x2,x3,x4,names=c("北京","沈阳","上海","南昌"))> table1_1<-melt(exercise2_3,id、vars=c("⽉份"),variable_name="城市") > table1_1<-rename(table1_1,c(value="温度")) > dotchart(table1_1$温度,groups=table1_1$城市,xlab="温度",pch=20)> library(lattice)> dotplot(温度~城市,data=table1_1,pch=19)> dp1<-densityplot(~温度,group=城市,data=table1_1,auto、key=list(columns=1,x=0、01,y=0、9 5,cex=0、6),cex=0、5) > plot(dp1)> library(sm)> sm、density、pare(table1_1$温度,table1_1$城市,lty=1:6,col=1:6)> legend("topleft",legend = levels(table1_1$城市),lty=1:6,col=1:6)(3)轮廓图> matplot(t(exercise2_3[,-1]),type="b",xlab="城市",ylab="温度",pch=1,xaxt="n")> axis(side=1,at=1:10,labels = c("北京","沈阳","上海","南昌","郑州","武汉","⼴州","海⼝","重庆","昆明")) > legend("bottomright",legend=names(exercise2_3[,-1])) # 取列名雷达图:> table1<-data、frame(t(exercise2_3[,2:11])) #⾏列进⾏转换,并数据框> radarchart(table1,axistype=0,seg=4,maxmin=F,vlabels=exercise2_3[,1])> legend(x="topleft",legend=names(exercise2_3[,2:11]), col=1:10, lty=1:10) #lty图例(4)星图:> matrix1<-as、matrix(exercise2_3[,2:11])> rownames(matrix1)<-exercise2_3[,1]> stars(matrix1,key、loc=c(7,2,5),cex=0、8)脸谱图:> library(aplpack)> faces(t(matrix1),nrow、plot = 5,ncol、plot = 2,face、type = 0) effect of variables: modified item Var"height of face " "1⽉""width of face " "2⽉""structure of face" "3⽉""height of mouth " "4⽉""width of mouth " "5⽉""smiling " "6⽉""height of eyes " "7⽉""width of eyes " "8⽉""height of hair " "9⽉""width of hair " "10⽉""style of hair " "11⽉""height of nose " "12⽉""width of nose " "1⽉""width of ear " "2⽉""height of ear " "3⽉"2、4(1)散点图:> plot(地区⽣产总值,最终消费⽀出,xlab="",ylab='最终消费⽀出')> abline(lm(最终消费⽀出~地区⽣产总值,data=exercise2_4))> abline(lm(最终消费⽀出~固定资产投资,data=exercise2_4),col="blue")⽓泡图:> r<-sqrt(最终消费⽀出/pi)> symbols(最终消费⽀出,地区⽣产总值,circles=r, inches=0、3, fg="white",bg="lightblue",ylab="最终消费⽀出",xlab="地区⽣产总值")> text(最终消费⽀出,地区⽣产总值,rownames(exercise2_4))> mtext("⽓泡⼤⼩=最终消费⽀出",line=-2、5,adj=0、1)(2)星图:> matrix1<-as、matrix(exercise2_4[,2:4])> rownames(matrix1)<-exercise2_4[,1]> stars(matrix1,key、loc=c(7,2,5),cex=0、8)脸谱图:> library(aplpack)> faces(matrix1,nrow、plot = 6,ncol、plot = 6,face、type = 0)2、5时序图:> load("D:\\⼯作总结\\⼈⼤\\R语⾔\\《统计学—基于R》(第3版)—例题与习题数据(公开资源)\\exercise\\ ch2\\exercise2_5、RData")> table1<-ts(exercise2_5,start=2004)> plot(table1[,2],xlab="年份",ylab="价格指数",type="n")> points(table1[,2],type="o",xlab="年份",ylab="城镇价格指数")> lines(table1[,3],type="b")2、6洛伦茨曲线:> load("D:\\⼯作总结\\⼈⼤\\R语⾔\\《统计学—基于R》(第3版)—例题与习题数据(公开资源)\\exercise\\ ch2\\exercise2_6、RData")> library(DescTools)> Lc(exercise2_6$不同阶层⼈⼝数得收⼊额*10000/exercise2_6$不同收⼊阶层得⼈⼝数,exercise2_6$不同收⼊阶层得⼈⼝数) # 标红为组中值,收⼊/⼈数$p[1] 0、0000000 0、3478261 0、6086957 0、8260870 0、9565217 1、0000000$L[1] 0、00000000 0、06060606 0、15151515 0、33333333 0、63636364 1、00000000$L、general[1] 0 20000 50000 110000 210000 330000$Gini[1] 0、6232632[1] 1250、00 2500、00 6000、00 16666、67 60000、00$n[1] 80 60 50 30 10attr(,"class")[1] "Lc"> plot(Lc(exercise2_6$不同阶层⼈⼝数得收⼊额*10000/exercise2_6$不同收⼊阶层得⼈⼝数,exercise2_ 6$不同收⼊阶层得⼈⼝数),xlab="⼈数⽐例",ylab="收⼊⽐例",col=4,panel、first=grid(10,10,col="gr ay70"))结论:>0、4, 收⼊差距巨⼤。
时间序列分析基于R__习题答案及解析
略第二章习题答案2.1〔1非平稳〔20.0173 0.700 0.412 0.148 -0.079 -0.258 -0.376〔3典型的具有单调趋势的时间序列样本自相关图2.2〔1非平稳,时序图如下〔2-〔3样本自相关系数及自相关图如下:典型的同时具有周期和趋势序列的样本自相关图2.3〔1自相关系数为:0.2023 0.013 0.042 -0.043 -0.179 -0.251 -0.0940.0248 -0.068 -0.072 0.014 0.109 0.217 0.316 0.0070 -0.025 0.075 -0.141 -0.204 -0.245 0.0660.0062 -0.139 -0.034 0.206 -0.010 0.080 0.118〔2平稳序列〔3白噪声序列2.4,序列不能LB=4.83,LB统计量对应的分位点为0.9634,P值为0.0363。
显著性水平=0.05视为纯随机序列。
2.5〔2 非平稳〔3非纯随机2.6〔1平稳,非纯随机序列〔拟合模型参考:ARMA<1,2>〔2差分序列平稳,非纯随机3.1()0t E x =,21() 1.9610.7t Var x ==-,220.70.49ρ==,220φ= 3.2 1715φ=,2115φ= 3.3 ()0t E x =,10.15() 1.98(10.15)(10.80.15)(10.80.15)t Var x +==--+++ 10.80.7010.15ρ==+,210.80.150.41ρρ=-=,3210.80.150.22ρρρ=-= 1110.70φρ==,2220.15φφ==-,330φ=3.4 10c -<<, 1121,1,2k k k c c k ρρρρ--⎧=⎪-⎨⎪=+≥⎩ 3.5 证明:该序列的特征方程为:32--c 0c λλλ+=,解该特征方程得三个特征根:11λ=,2λ=3λ=无论c 取什么值,该方程都有一个特征根在单位圆上,所以该序列一定是非平稳序列。
统计学-基于R第3版习题答案(第二章)
习题2.1(1)简单频数分布表:工作总结人大\\R语言《统计学—基于R》(第3版)—例题和习题数据(公开资源)\\exercis e\\ch2\\exercise2_1.RData")> summary(exercise2_1)行业性别满意度电信业:38 男:58 不满意:75航空业:19 女:62 满意 :45金融业:26旅游业:37二维列联表:> mytable1<-table(exercise2_1$行业,exercise2_1$满意度)> addmargins(mytable1) # 增加边界和不满意满意 Sum电信业 25 13 38航空业 12 7 19金融业 11 15 26旅游业 27 10 37Sum 75 45 120三维列联表:> mytable1<-ftable(exercise2_1, row.vars = c("性别","满意度"), col.var="行业");mytable1 行业电信业航空业金融业旅游业性别满意度男不满意 11 7 7 11满意 6 3 7 6女不满意 14 5 4 16满意 7 4 8 4(2)条形图:> count1<-table(exercise2_1$行业)> count2<-table(exercise2_1$性别)> count3<-table(exercise2_1$满意度)> par(mfrow=c(1,3),mai=c(0.7,0.7,0.6,0.1),cex=0.7,cex.main=0.8)> barplot(count1,xlab="行业",ylab="频数")> barplot(count2,xlab="性别",ylab="频数")> barplot(count3,xlab="满意度",ylab="频数")帕累托图:> count1<-table(exercise2_1$行业)> par(mai=c(0.7,0.7,0.1,0.8),cex=0.8)> x<-sort(count1,decreasing = T)> bar<-barplot(x,xlab="行业",ylab="频数",ylim=c(0,1.2*max(count1)),col=2:5) > text(bar,x,labels = x,pos=3) # 条形图增加数值> y<-cumsum(x)/sum(x) # cumsum累计求和> par(new=T)> plot(y,type="b",lwd=1.5,pch=15,axes=F)> axis(4) # 右Y轴> mtext("累积频率",side=4,line=3)> mtext("累积分布曲线",line=-2.5,cex=0.8,adj=0.75)复式条形图:> mytable1<-table(exercise2_1$满意度,exercise2_1$行业)> barplot(mytable1,xlab="行业",ylab="频数",legend=rownames(mytable1),args.legend=list(x= 13), beside = T)脊形图:> library(vcd)> spine(行业~满意度,data=exercise2_1,xlab="满意度", ylab="行业",margins=c(4,3.5,1,2.5))马赛克图:> mosaicplot(~性别+行业+满意度,data=exercise2_1,col=2:3)(3)饼图:> count1<-table(exercise2_1$行业)> name<-names(count1)> percent<-prop.table(count1)*100> label1<-paste(name," ",percent,"%",sep="")> par(pin=c(3,3),mai=c(0.1,0.4,0.1,0.4),cex=0.8) # 圆的大小> pie(count1,labels=label1,init.angle = 90)扇形图:> count1<-table(exercise2_1$行业)> name<-names(count1)> percent<-count1/sum(count1)*100> labs<-paste(name," ",percent,"%",sep="")> library(plotrix)> fan.plot(count1,labels=labs,ticks=200)2.2(1)分10组,绘制频数分布表工作总结人大\\R语言《统计学—基于R》(第3版)—例题和习题数据(公开资源)\\exercis e\\ch2\\exercise2_2.RData")> library(actuar)> v<-as.vector(exercise2_2$灯泡寿命)> gd1<-grouped.data(v, breaks = 10, right = FALSE)> table1<-data.frame(gd1);table1Var.1 v1 [2600, 2800) 12 [2800, 3000) 43 [3000, 3200) 124 [3200, 3400) 135 [3400, 3600) 276 [3600, 3800) 207 [3800, 4000) 198 [4000, 4200) 4(2)直方图> d<-exercise2_2$灯泡寿命> hist(d,breaks=10,xlab="寿命",ylab="频数")茎叶图:> stem(exercise2_2$灯泡寿命)The decimal point is 2 digit(s) to the right of the |26 | 028 | 96830 | 055788235679932 | 788899013456934 | 1133566779911222334445555936 | 03356660002444556778838 | 2245556667005566940 | 0010172.3(1)箱线图:工作总结人大\\R语言《统计学—基于R》(第3版)—例题和习题数据(公开资源)\\exercis e\\ch2\\exercise2_3.RData")> boxplot(exercise2_3[,-1],xlab="城市",ylab="气温",b=0.8,cex.axis=0.6) # 从第二列开始,到最后小提琴图:> library(vioplot)> x1<-exercise2_3$北京> x2<-exercise2_3$沈阳> x3<-exercise2_3$上海> x4<-exercise2_3$南昌> vioplot(x1,x2,x3,x4,names=c("北京","沈阳","上海","南昌"))(2)点图:> library(reshape)> table1_1<-melt(exercise2_3,id.vars=c("月份"),variable_name="城市") > table1_1<-rename(table1_1,c(value="温度"))> dotchart(table1_1$温度,groups=table1_1$城市,xlab="温度",pch=20)> library(lattice)> dotplot(温度~城市,data=table1_1,pch=19)核密度图:> library(lattice)> dp1<-densityplot(~温度,group=城市,data=table1_1,auto.key=list(columns=1,x=0.01,y=0.95, cex=0.6),cex=0.5)> plot(dp1)> library(sm)> pare(table1_1$温度,table1_1$城市,lty=1:6,col=1:6)> legend("topleft",legend = levels(table1_1$城市),lty=1:6,col=1:6)(3)轮廓图> matplot(t(exercise2_3[,-1]),type="b",xlab="城市",ylab="温度",pch=1,xaxt="n")> axis(side=1,at=1:10,labels = c("北京","沈阳","上海","南昌","郑州","武汉","广州","海口","重庆","昆明"))> legend("bottomright",legend=names(exercise2_3[,-1])) # 取列名雷达图:> library(fmsb)> table1<-data.frame(t(exercise2_3[,2:11])) #行列进行转换,并数据框> radarchart(table1,axistype=0,seg=4,maxmin=F,vlabels=exercise2_3[,1])> legend(x="topleft",legend=names(exercise2_3[,2:11]), col=1:10, lty=1:10) #lty图例(4)星图:> matrix1<-as.matrix(exercise2_3[,2:11])> rownames(matrix1)<-exercise2_3[,1]> stars(matrix1,key.loc=c(7,2,5),cex=0.8)脸谱图:> library(aplpack)> faces(t(matrix1),nrow.plot = 5,ncol.plot = 2,face.type = 0) effect of variables:modified item Var"height of face " "1月""width of face " "2月""structure of face" "3月""height of mouth " "4月""width of mouth " "5月""smiling " "6月""height of eyes " "7月""width of eyes " "8月""height of hair " "9月""width of hair " "10月""style of hair " "11月""height of nose " "12月""width of nose " "1月""width of ear " "2月""height of ear " "3月"2.4(1)散点图:> plot(地区生产总值,最终消费支出,xlab="",ylab='最终消费支出')> abline(lm(最终消费支出~地区生产总值,data=exercise2_4))> points(固定资产投资,最终消费支出,ylab='最终消费支出',pch=2,col="blue") > abline(lm(最终消费支出~固定资产投资,data=exercise2_4),col="blue")气泡图:> r<-sqrt(最终消费支出/pi)> symbols(最终消费支出,地区生产总值,circles=r, inches=0.3, fg="white",bg="lightblue",ylab="最终消费支出",xlab="地区生产总值")> text(最终消费支出,地区生产总值,rownames(exercise2_4))> mtext("气泡大小=最终消费支出",line=-2.5,adj=0.1)(2)星图:> matrix1<-as.matrix(exercise2_4[,2:4])> rownames(matrix1)<-exercise2_4[,1]> stars(matrix1,key.loc=c(7,2,5),cex=0.8)脸谱图:> library(aplpack)> faces(matrix1,nrow.plot = 6,ncol.plot = 6,face.type = 0)2.5时序图:工作总结人大\\R语言《统计学—基于R》(第3版)—例题和习题数据(公开资源)\\exercise\\ch2\\exercise2_5.RData")> table1<-ts(exercise2_5,start=2004)> plot(table1[,2],xlab="年份",ylab="价格指数",type="n")> points(table1[,2],type="o",xlab="年份",ylab="城镇价格指数")> lines(table1[,3],type="b")2.6洛伦茨曲线:工作总结人大\\R语言《统计学—基于R》(第3版)—例题和习题数据(公开资源)\\exercise\\ch2\\exercise2_6.RData")> library(DescTools)> Lc(exercise2_6$不同阶层人口数的收入额*10000/exercise2_6$不同收入阶层的人口数,exercise2_6$不同收入阶层的人口数) # 标红为组中值,收入/人数$p[1] 0.0000000 0.3478261 0.6086957 0.8260870 0.9565217 1.0000000$L[1] 0.00000000 0.06060606 0.15151515 0.33333333 0.63636364 1.00000000$L.general[1] 0 20000 50000 110000 210000 330000$Gini[1] 0.6232632$x[1] 1250.00 2500.00 6000.00 16666.67 60000.00$n[1] 80 60 50 30 10attr(,"class")[1] "Lc"> plot(Lc(exercise2_6$不同阶层人口数的收入额*10000/exercise2_6$不同收入阶层的人口数,exercise2_ 6$不同收入阶层的人口数),xlab="人数比例",ylab="收入比例",col=4,panel.first=grid(10,10,col="gray70"))结论:>0.4,收入差距巨大。
统计学(第二版)课后答案
附录1:各章练习题答案第1章绪论(略)第2章统计数据的描述2.1 (1)属于顺序数据。
(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频率)频率%A1414B2121C3232D1818E1515合计100100(3)条形图(略)2.2 (1)频数分布表如下:(2)某管理局下属40个企分组表按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40 100.0 2.3 频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)25~30 30~35 4610.015.035~40 40~45 45~50 159637.522.515.0合计40 100.0 直方图(略)。
2.4 (1)排序略。
(2)频数分布表如下:100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2660~670 5 5670~680 6 6680~690 14 14690~700 26 26700~710 18 18710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100 直方图(略)。
2.5 (1)属于数值型数据。
(2)分组结果如下:分组天数(天)-25~-20 6-20~-15 8-15~-10 10-10~-5 13-5~0 120~5 45~10 7合计60(3)直方图(略)。
2.6 (1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
(2)A 班考试成绩的分布比较集中,且平均分数较高;B 班考试成绩的分布比A 班分散,且平均成绩较A 班低。
2.82.9 (1)x =274.1(万元);Me=272.5 ;Q L =260.25;Q U =291.25。
(2)17.21=s (万元)。
2.10 (1)甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
《统计学基础(第2版)》参考答案
统计学基础(第2版)参考答案引言《统计学基础(第2版)》是一本经典的统计学教材,为学习统计学的学生提供了基本的概念、理论和方法。
本文档是针对该教材的参考答案,旨在帮助学生更好地理解和应用统计学知识。
第一章统计学概述本章主要介绍了统计学的基本概念和应用领域。
统计学是研究如何收集、整理、分析和解释数据的科学,广泛应用于社会科学、自然科学、医学等领域。
统计学可以帮助我们了解数据的特征和规律,做出准确的推断和决策。
第二章数据描述本章主要介绍了描述统计学的基本概念和方法。
描述统计学是通过统计指标和图表来对数据进行描述和总结的方法。
常用的统计指标包括平均数、中位数、众数、标准差等。
图表可以直观地展示数据的分布和变化趋势,包括条形图、折线图、散点图等。
第三章概率与概率分布本章主要介绍了概率论的基本概念和概率分布。
概率是指事件发生的可能性,可以用数值来表示。
概率分布是描述随机变量可能取值和概率的函数。
常见的概率分布包括离散型分布和连续型分布,如二项分布、正态分布等。
第四章统计推断基础本章主要介绍了统计推断的基本原理和方法。
统计推断是利用样本数据对总体参数进行估计和假设检验的过程。
估计是根据样本数据推断总体参数的值,假设检验是根据样本数据判断总体参数是否符合某个假设。
第五章参数估计本章主要介绍了参数估计的方法和技巧。
参数估计是根据样本数据推断总体参数的值,主要包括点估计和区间估计。
点估计是用一个数值估计总体参数的值,区间估计是用一个区间估计总体参数的范围。
第六章假设检验本章主要介绍了假设检验的原理和步骤。
假设检验是根据样本数据判断总体参数是否符合某个假设,可以帮助我们做出准确的决策。
常用的假设检验方法包括单样本检验、两样本检验、方差分析等。
结语通过学习《统计学基础(第2版)》参考答案,我们可以更好地掌握统计学的基本概念、理论和方法。
统计学是一门重要的学科,对于理解数据和做出科学决策具有重要意义。
希望本文档能够给学生们提供帮助,更好地应用统计学知识。
R语言 第二章课后习题答案
#探索题1rm(list=ls(all=TRUE))x<-1:5;y<-2*1:5;x%o%youter(x,y)outer(x,y,fun='*')outer(x,y,fun='/')outer(x,y,fun='+')outer(x,y,fun='-') #结果一样#探索题2rm(list=ls(all=TRUE))A<-t(array(c(1:12),dim=c(4,3)))b<-c(1,1,1)x<-solve(A,b);x #有错误出现,提示必须为正方形,超定方程不可解#探索题3rm(list=ls(all=TRUE))lst<-list(name="Fred",wife="Mary",no.children=3,child.ages=c(4,7,9));lstlst[[2]]lst[[4]][2]lst[[4]][1:2]lst[["child.ages"]][1:2] #lst[[4]][1:2]或者lst[["child.ages"]][1:2]可以运行#探索题4rm(list=ls(all=TRUE))lst1<-list(name="Fred",wife="Mary",no.children=3,child.ages=c(4,7,9));lst1 lst2<-list(name="Mark",wife="Nacy",no.children=4,child.ages=c(2,5,10));lst2 lst.12<-c(lst1,lst2);lst.12 #实现列表捆绑lst.12<-list(lst1,lst2);lst.12 #也可实现列表捆绑,但是结果。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
习题2、1(1)简单频数分布表:> load("D:\\工作总结\\人大\\R语言\\《统计学—基于R》(第3版)—例题与习题数据(公开资源)\\exercise\\ ch2\\exercise2_1、RData")> summary(exercise2_1)行业性别满意度电信业:38 男:58 不满意:75航空业:19 女:62 满意 :45金融业:26旅游业:37二维列联表:> mytable1<-table(exercise2_1$行业,exercise2_1$满意度)> addmargins(mytable1) # 增加边界与不满意满意 Sum电信业 25 13 38航空业 12 7 19金融业 11 15 26旅游业 27 10 37Sum 75 45 120三维列联表:> mytable1<-ftable(exercise2_1, row、vars = c("性别","满意度"), col、var="行业");mytable1 行业电信业航空业金融业旅游业性别满意度男不满意 11 7 7 11满意 6 3 7 6女不满意 14 5 4 16满意 7 4 8 4(2)条形图:> count1<-table(exercise2_1$行业)> count2<-table(exercise2_1$性别)> count3<-table(exercise2_1$满意度)> par(mfrow=c(1,3),mai=c(0、7,0、7,0、6,0、1),cex=0、7,cex、main=0、8)> barplot(count1,xlab="行业",ylab="频数")> barplot(count2,xlab="性别",ylab="频数")> barplot(count3,xlab="满意度",ylab="频数")帕累托图:> count1<-table(exercise2_1$行业)> par(mai=c(0、7,0、7,0、1,0、8),cex=0、8)> x<-sort(count1,decreasing = T)> bar<-barplot(x,xlab="行业",ylab="频数",ylim=c(0,1、2*max(count1)),col=2:5) > text(bar,x,labels = x,pos=3) # 条形图增加数值> y<-cumsum(x)/sum(x) # cumsum累计求与> par(new=T)> plot(y,type="b",lwd=1、5,pch=15,axes=F)> axis(4) # 右Y轴> mtext("累积频率",side=4,line=3)> mtext("累积分布曲线",line=-2、5,cex=0、8,adj=0、75)复式条形图:> mytable1<-table(exercise2_1$满意度,exercise2_1$行业)> barplot(mytable1,xlab="行业",ylab="频数",legend=rownames(mytable1),args、legend=list(x= 13), beside = T)脊形图:> library(vcd)马赛克图:> mosaicplot(~性别+行业+满意度,data=exercise2_1,col=2:3)(3)饼图:> count1<-table(exercise2_1$行业)> name<-names(count1)> label1<-paste(name," ",percent,"%",sep="")> par(pin=c(3,3),mai=c(0、1,0、4,0、1,0、4),cex=0、8) # 圆得大小> pie(count1,labels=label1,init、angle = 90)扇形图:> count1<-table(exercise2_1$行业)> name<-names(count1)> percent<-count1/sum(count1)*100> labs<-paste(name," ",percent,"%",sep="")> library(plotrix)> fan、plot(count1,labels=labs,ticks=200)2、2(1)分10组,绘制频数分布表> load("D:\\工作总结\\人大\\R语言\\《统计学—基于R》(第3版)—例题与习题数据(公开资源)\\exercise\\ ch2\\exercise2_2、RData")> library(actuar)> v<-as、vector(exercise2_2$灯泡寿命)> gd1<-grouped、data(v, breaks = 10, right = FALSE)> table1<-data、frame(gd1);table1Var、1 v1 [2600, 2800) 12 [2800, 3000) 43 [3000, 3200) 124 [3200, 3400) 135 [3400, 3600) 276 [3600, 3800) 207 [3800, 4000) 198 [4000, 4200) 4(2)直方图> d<-exercise2_2$灯泡寿命> hist(d,breaks=10,xlab="寿命",ylab="频数")茎叶图:> stem(exercise2_2$灯泡寿命)The decimal point is 2 digit(s) to the right of the |26 | 028 | 96830 | 9932 | 788899013456934 | 11222334445555936 | 444556778838 | 2245556667005566940 | 0010172、3(1)箱线图:> load("D:\\工作总结\\人大\\R语言\\《统计学—基于R》(第3版)—例题与习题数据(公开资源)\\exercise\\ ch2\\exercise2_3、RData")> boxplot(exercise2_3[,-1],xlab="城市",ylab="气温",cex、lab=0、8,cex、axis=0、6) # 从第二列开始,到最后小提琴图:> library(vioplot)> x1<-exercise2_3$北京> x2<-exercise2_3$沈阳> x3<-exercise2_3$上海> x4<-exercise2_3$南昌> vioplot(x1,x2,x3,x4,names=c("北京","沈阳","上海","南昌"))> table1_1<-melt(exercise2_3,id、vars=c("月份"),variable_name="城市") > table1_1<-rename(table1_1,c(value="温度"))> dotchart(table1_1$温度,groups=table1_1$城市,xlab="温度",pch=20)> library(lattice)> dotplot(温度~城市,data=table1_1,pch=19)> dp1<-densityplot(~温度,group=城市,data=table1_1,auto、key=list(columns=1,x=0、01,y=0、9 5,cex=0、6),cex=0、5)> plot(dp1)> library(sm)> sm、density、pare(table1_1$温度,table1_1$城市,lty=1:6,col=1:6)> legend("topleft",legend = levels(table1_1$城市),lty=1:6,col=1:6)(3)轮廓图> matplot(t(exercise2_3[,-1]),type="b",xlab="城市",ylab="温度",pch=1,xaxt="n")> axis(side=1,at=1:10,labels = c("北京","沈阳","上海","南昌","郑州","武汉","广州","海口","重庆","昆明"))> legend("bottomright",legend=names(exercise2_3[,-1])) # 取列名雷达图:> table1<-data、frame(t(exercise2_3[,2:11])) #行列进行转换,并数据框> radarchart(table1,axistype=0,seg=4,maxmin=F,vlabels=exercise2_3[,1])> legend(x="topleft",legend=names(exercise2_3[,2:11]), col=1:10, lty=1:10) #lty图例(4)星图:> matrix1<-as、matrix(exercise2_3[,2:11])> rownames(matrix1)<-exercise2_3[,1]> stars(matrix1,key、loc=c(7,2,5),cex=0、8)脸谱图:> library(aplpack)> faces(t(matrix1),nrow、plot = 5,ncol、plot = 2,face、type = 0) effect of variables:modified item Var"height of face " "1月""width of face " "2月""structure of face" "3月""height of mouth " "4月""width of mouth " "5月""smiling " "6月""height of eyes " "7月""width of eyes " "8月""height of hair " "9月""width of hair " "10月""style of hair " "11月""height of nose " "12月""width of nose " "1月""width of ear " "2月""height of ear " "3月"2、4(1)散点图:> plot(地区生产总值,最终消费支出,xlab="",ylab='最终消费支出')> abline(lm(最终消费支出~地区生产总值,data=exercise2_4))> abline(lm(最终消费支出~固定资产投资,data=exercise2_4),col="blue")气泡图:> r<-sqrt(最终消费支出/pi)> symbols(最终消费支出,地区生产总值,circles=r, inches=0、3, fg="white",bg="lightblue",ylab="最终消费支出",xlab="地区生产总值")> text(最终消费支出,地区生产总值,rownames(exercise2_4))> mtext("气泡大小=最终消费支出",line=-2、5,adj=0、1)(2)星图:> matrix1<-as、matrix(exercise2_4[,2:4])> rownames(matrix1)<-exercise2_4[,1]> stars(matrix1,key、loc=c(7,2,5),cex=0、8)脸谱图:> library(aplpack)> faces(matrix1,nrow、plot = 6,ncol、plot = 6,face、type = 0)2、5时序图:> load("D:\\工作总结\\人大\\R语言\\《统计学—基于R》(第3版)—例题与习题数据(公开资源)\\exercise\\ ch2\\exercise2_5、RData")> table1<-ts(exercise2_5,start=2004)> plot(table1[,2],xlab="年份",ylab="价格指数",type="n")> points(table1[,2],type="o",xlab="年份",ylab="城镇价格指数")> lines(table1[,3],type="b")2、6洛伦茨曲线:> load("D:\\工作总结\\人大\\R语言\\《统计学—基于R》(第3版)—例题与习题数据(公开资源)\\exercise\\ ch2\\exercise2_6、RData")> library(DescTools)> Lc(exercise2_6$不同阶层人口数得收入额*10000/exercise2_6$不同收入阶层得人口数,exercise2_6$不同收入阶层得人口数) # 标红为组中值,收入/人数$p[1] 0、0000000 0、3478261 0、6086957 0、8260870 0、9565217 1、0000000$L[1] 0、00000000 0、06060606 0、15151515 0、33333333 0、63636364 1、00000000$L、general[1] 0 20000 50000 110000 210000 330000$Gini[1] 0、6232632[1] 1250、00 2500、00 6000、00 16666、67 60000、00$n[1] 80 60 50 30 10attr(,"class")[1] "Lc"> plot(Lc(exercise2_6$不同阶层人口数得收入额*10000/exercise2_6$不同收入阶层得人口数,exercise2_ 6$不同收入阶层得人口数),xlab="人数比例",ylab="收入比例",col=4,panel、first=grid(10,10,col="gr ay70"))结论:>0、4, 收入差距巨大。