第一章、数据与统计学
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章、 数据与统计学 1.统计数据的来源:
(1)直接获取的数据:普查、抽样调查
(2)间接获取的数据:报纸、杂志、统计年鉴、网络渠道 2.统计学的基本概念:
(1)总体:人们研究的基本单位的总和。
(2)变量:总体单位的特征或属性,分为4大类:定类变量、定序变量、定距变量、定比变量。
(3)样本:总体的一部分单位
3.人口普查10年一次,第六次全国人口普查在2010年
第二章、 统计数据的整理 1.分组的原则:不重不漏
2.常见的四种曲线:正态分布曲线、偏态曲线、J 形曲线、U 形曲线
3.基尼系数:衡量收入分配平均程度的指标。基尼系数等于0,收入绝对平均。基尼系数等于1,收入绝对不平均,基尼系数在0.2~0.4之间是比较适当的。
4.众数:将数据按大小顺序排队形成次数分配后,在统计分布中具有明显集中趋势点的数值。
5.中位数:数据排序后,位置在最中间的数。
6.切尾均值:去掉大小两端的若干数值后计算中间数据的均值。α表示切尾系数,0≤α<1/2
7.众数、中位数和均值的关系:正态分布:M 0=M e =X 右偏分布:M 0 8.方差:离差平方的平均数 公式:s 2= 2 1 ()n i i X X =-∑/n-1 9.偏态系数SK:SK>0,正偏或右偏 SK<0,负偏或左偏 SK=0,正态分布 10.统计表的构成:表头、行标题、列标题、数字资料 第三章、概率、概率分布和抽样分布 1.基本事件:不能被分解成其他事件组合的最简单的事件 2.古典概率:事件A 中包含的基本事件数/样本空间中基本事件总数=m/n 3.互斥事件:一项实验中,若两个事件中有一个发生,另一个就不可能发生 互斥事件的加法法则:P (A 或B )=P(A)+P(B) 4.广义的加法法则:P(A U B)=P(A)+P(B)-P(A I B) 5.条件概率:已知事件B 发生的条件下事件A 发生的事件,称为已知B 时A 的条件概率,或称为给定B 下A 的概率,记为P(A ∣B ) 计算公式:P(A ∣B )=P (AB )/P(B) P70例题3.7 、3.8 乘法公式:P (AB )=P(B)·P(A ∣B )=P(A)·P(B ∣A) 例题3.9 6.独立事件:事件A 的概率不会因为事件B 的发生而有所改变。 计算公式:P(AB)=P(A)·P(B) 7.正态曲线的性质:(1)图形是关于x=μ的对称钟形曲线,且峰值在x=μ处;(2)μ和σ一旦确定,正态分布的具体形式就唯一确定;(3)标准差σ相同而均值不同的正态曲线在坐标轴上表现为水平位移;(4)σ>0,σ越大正态曲线越扁平;σ越小,正态曲线越陡峭。 (5)当X 的取值向横轴左右两个方向无限延伸时,正态曲线的左右两个尾端也无限接近横轴,但理论上永远不会与之相交;(6)其曲线下的总面积等于1。 正态随机变量落入其均值左右各1个标准差内的概率是68.27%,正态随机变量落入其均值左右各2个标准差内的概率是95.45%,正态随机变量落入其均值左右各3个标准差内的概率是99.73% 8. 概率的性质: (1)非负性:对于任意事件A ,P(A) ≥0 (2)规范性:0 ≤P ≤1 (3)必然事件的概率为1,不可能事件的概率为0 (4)若两个事件A 与B 互斥,A 发生或者B 的概率等于两个事件各自的概率之和,即P(A 或B)=P(A)+P(B) 标准正态分布的概率密度是ϕ(x )= 212 x -,-∞ 第四章、参数估计 1.参数估计,就是用样本量去估计总体的参数。参数估计的方法有点估计和区间估计两种。 2.置信区间:在区间估计中,由样本量所构造的总体参数的估计区间 置信系数(置信水平):置信区间中所包含的总体参数真值的次数所占的比率 常用的置信水平值:置信水平90%,/2z α=1.645;置信水平95%,/2z α=1.96;置信水平99%, /2z α=2.58. 注:置信系数越大,置信区间越大。 3.评价估计量的标准:(1)无偏性:指估计量抽样分布的数学期望等于被估计的总体参数 (2)有效性:对同一个总体参数的两个无偏点估计量,有更小标准差的估计量更有效 (3)一致性:随着样本量的增大,点估计量的值越来越接近被估总体的参数。 4.大样本的估计方法: z= ~(0,1)X N ,总体均值μ在(1—α )置信水平下的区间为 /2 X z α± /2 X z α- /2 X z α+ 6.估计总体均值时样本量的确定:E= /2z α⇒n=22 /22 ()z E ασ 第五章、假设检验 1.原假设:研究者想收集证据予以反对的假设,也称零假设,用H 0 表示。 备择假设:通常是研究者想收集证据予以支持的假设,也称研究假设,用H 1表示。例题5.2、5.3 2.假设检验的基本形式 3.P 值进行决策的准则是:如果P 值<α,拒绝H 0 ;如果P 值>0,不拒绝H 0 4.总体均值的检验:X ,当总体方差2 σ未知时,X 例题5.4、5.6 5.大样本情况下一个总体均值的检验方法 第六章、方差分析与实验设计 1.方差分析:是检验多个总体均值是否相等的统计方法。它是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。 2:所要检验的对象称为因素或因子,这一因素的具体表现,称为水平或处理。在单因素方差分析中涉及两个变量,一个是分类型自变量,一个是数值型因变量。 3.方差分析的基本思想和原理