第9章 描述性统计

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2013/10/22
©
谢中华, MATLAB应用培训.
描述性统计
%% 求最大值和最小值 score_max = max(score) score_min = min(score) %% 求极差 score_range = range(score) %% 求中位数 score_median = median(score) %% 求分位数 score_m1 = quantile(score,[0.25,0.5,0.75]) score_m2 = prctile(score,[25, 50, 75]) %% 求众数 score_mode = mode(score) ©
©
谢中华, MATLAB应用培训.
描述性统计
主要内容:
案例背景 描述性统计量 统计图 频数和频率分布表
2013/10/22
©
谢中华, MATLAB应用培训.
描述性统计
第一节 案例背景
2013/10/22
©
谢中华, MATLAB应用培训.
描述性统计
从一封情书开始说起
亲爱的莲: 我们的感情,Fra Baidu bibliotek组织的亲切关怀下、在领导的亲自过 问下,一年来正沿着健康的道路蓬勃发展。这主要表现在: (一)我们共通信121封,平均3.01天一封。其中你给 我的信51封,占42.1%;我给你的信70封,占57.9%。每封 信平均1502字,最长的达5215字,最短的也有624字。 (二)约会共98次,平均3.7天一次。其中你主动约我 38次,占38.7%;我主动约你60次,占61.3%。每次约会平 均3.8小时,最长达6.4小时,最短的也有1.6小时。 (三)我到你家看望你父母38次,平均每 9.4天一次; 你到我家看望我父母36次,平均10天一次。以上充分证明 一年来的交往我们已形成了恋爱的共识,我们爱情的主流 是互相了解、互相关心、互相帮助,是平等互利的。
2013/10/22
©
谢中华, MATLAB应用培训.
描述性统计
【例9.2-1续】根据表中数据计算描述性统计量。
%% 求均值 score = xlsread('examp9_1_1.xls','Sheet1','G2:G52'); score = score(score > 0); score_mean = mean(score) %% 求方差和标准差 SS1 = var(score) SS1 = var(score,0) SS2 = var(score,1) s1 = std(score) s1 = std(score,0) s2 = std(score,1)
©
谢中华, MATLAB应用培训.
描述性统计
统计学家当奶爸
有个从未管过自己孩子的统计学家,在一个星期六下午 妻子要外出买东西时,勉强答应照看一下四个年幼好动的 孩子。当妻子回家时,他交给妻子一张纸条,上面写着: “擦眼泪11次;系鞋带15次;给每个孩子吹玩具气球各5次; 每个气球的平均寿命10秒钟;警告孩子不要横穿马路26次; 孩子坚持要穿马路26次;我还要再过这样的星期六0次。”
十一、偏度
n ( X i − X )3 B3 n bs = = ∑ 1.5 B2 S3 (n − 1)(n − 2) i =1
十二、峰度
B4 = bk −3 2 B2
©
2013/10/22
谢中华, MATLAB应用培训.
描述性统计
十三、第一四分位数: Q1 = m0.25 样本数据中小于等于此数的数据占整个数据集的25% 十四、第三四分位数: Q3 = m0.75 样本数据中小于等于此数的数据占整个数据集的75% 最稳健 十五、四分位间距:
半年天津城市居民人均可支配收入12861元,北京17068 元、上海18382元、重庆11134元。
2013/10/22
©
谢中华, MATLAB应用培训.
描述性统计
二、方差和标准差
n 1 2 方差: ( ) = S2 X − X ∑ i n − 1 i =1
最常用
S = 标准差:
1 n 2 ( ) X X − ∑ i n − 1 i =1
n →+∞ −∞< x <+∞
{
}
此定理表明:当样本容量n相当大时,经验分布函 数是总体分布函数的一个良好的近似。
©
谢中华, MATLAB应用培训.
描述性统计
3. MATLAB实现 cdfplot和ecdf函数函数 功能:绘制经验分布函数图 调用方式:
1 Empirical CDF 0.9 0.8 0.7 0.6 经验分布函数 理论正态分布
七、众数:样本数据中出现最频繁的数
2013/10/22
©
谢中华, MATLAB应用培训.
描述性统计
八、变异系数
covar = S X
1 n k 九、k阶原点矩 Ak = X i , k 1, 2, = ∑ n i =1
十、k阶中心矩
1 n k ( ) , k = 2, 3, Bk = X − X ∑ i n i =1
三、最大值和最小值 最大值: X ( n ) = max { X 1 , X 2 , , X n } 最小值: X (1) = min { X 1 , X 2 , , X n }
2013/10/22
©
谢中华, MATLAB应用培训.
描述性统计
四、极差
= X ( n ) − X (1) 极差:Range
2013/10/22
©
谢中华, MATLAB应用培训.
描述性统计
当然,任何事物都是一分为二的,缺点的存在是不可避免 的。我们二人虽然都是积极的,但从以上的数据看,发展还不 太平衡,积极性还存在一定的差距,这是前进中的缺点。 相信在新的一年里,我们一定会发扬成绩、克服缺点、携手前 进,开创我们爱情的新局面。因此,我提出三点意见供你参考: (一)要围绕一个“爱”字, (二)要狠抓一个“亲”字, (三)要落实一个“合”字。 让我们弘扬团结拼搏的精神,共同振兴我们的爱情,争取 达到一个新高度,登上一个新台阶。本着“我们的婚事我们办, 办好婚事为我们”的精神,共创辉煌。 你的憨哥
五、中位数
n为奇数 X (( n +1) / 2) , = X 1 ( X ( n / 2) + X (1+ n / 2) ), n为偶数 2
若np不是整数 X ([ np +1]) , m = 六、p分位数 1 p X ( np ) + X ( np +1) ), 若np是整数 ( 2
cdfplot(X) [f,x] = ecdf(y)
F(x)
0.5 0.4 0.3 0.2 0.1 0 40 50 60 70 x 80 90 100
©
谢中华, MATLAB应用培训.
描述性统计
【例9.3-1】根据例9.2-1中数据,绘制经验分布函数图。
%% 经验分布函数图 score = xlsread('examp9_1_1.xls','Sheet1','G2:G52'); score = score(score > 0); figure; [h,stats] = cdfplot(score) set(h,'color','k','LineWidth',2); x = 40:0.5:100; y = normcdf(x,stats.mean,stats.std); hold on plot(x,y,':k','LineWidth',2); legend('经验分布函数','理论正态分布','Location','NorthWest');
n
x(l) nl n fl = l
总计 n
n
n

1
©
谢中华, MATLAB应用培训.
描述性统计
二、样本经验分布函数图 1. 定义 称函数
0 i = F ∑ f k n ( x) k =1 1 x < x(1) x(i ) ≤ x < x(i += i 1, 2, , l − 1 1) x ≥ x(l )
描述性统计
描述性统计
谢中华
E-mail: xiezhh@tust.edu.cn MATLAB统计分析与应用:40个案例分析 MATLAB从零到进阶 http://www.matlabsky.com http://www.ilovematlab.cn/forum-181-1.html
2013/10/22
2013/10/22
©
谢中华, MATLAB应用培训.
描述性统计
第二节 描述性统计量
一、均值 定义:
1 n X = ∑ Xi n i =1
☺ 一首打油诗:张村有个张千万,隔壁9个穷光蛋,平均
起来算一算,人人都是张百万。
☺报纸上报道有个人在一条河中淹死了,这条河的平均深
度仅10cm,你信吗?
☺来自国家统计局天津调查总队最新的数据显示,今年上
谢中华, MATLAB应用培训.
描述性统计
%% 求变异系数 score_cvar = std(score)/mean(score) %% 求原点矩 A2 = mean(score.^2) %% 求中心矩 B1 = moment(score,1) B2 = moment(score,2) %% 求偏度 score_skewness = skewness(score) %% 求峰度 score_kurtosis = kurtosis(score)
为样本分布函数(或经验分布函数)。它满足分 布函数所具有的性质。
©
谢中华, MATLAB应用培训.
描述性统计
2. 格里汶科定理 设总体X 的分布函数为F(x),样本 X 1 , X 2 , , X n 的经验分布函数为Fn(x),则有
P lim sup | Fn ( x) − F ( x) |= 0 = 1
IQR = Q3 − Q1
2013/10/22
©
谢中华, MATLAB应用培训.
描述性统计
【例9.2-1】 现有某两个班的某门课程的考试成绩,如下表所 示。试对成绩数据进行统计分析(计算描述性统计量,绘制 统计图),分析成绩是否服从正态分布。
序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 学号 6010101 6010102 6010103 6010104 6010105 6010106 6010107 6010108 6010109 6010110 6010111 6010112 6010113 6010114 6010115 6010116 6010117 姓名 陈亮 李旭 刘鹏飞 任时迁 苏宏宇 王海涛 王洋 徐靖磊 阎世杰 姚前树 张金铭 朱星宇 韩宏洁 刘菲 苗艳红 宋佳艺 王峥瑶 成绩 63 73 * 82 80 70 88 80 92 84 95 82 75 71 70 80 78 序号 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 学号 6010118 6010119 6010120 6010121 6010122 6010123 6010124 6010201 6010202 6010203 6010204 6010205 6010206 6010207 6010208 6010209 6010210 姓名 肖君扬 徐欣露 杨姗姗 姚丽娜 张萌 张婷婷 褚子贞 曹不凡 付程远 李林森 李强 林志远 盛世 宋天清 王润泽 吴鹏辉 徐佳 成绩 80 69 81 49 91 76 76 72 89 77 64 94 74 98 89 49 80 序号 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 学号 6010211 6010212 6010213 6010214 6010215 6010216 6010217 6010218 6010219 6010220 6010221 6010222 6010223 6010224 6010225 6010226 6010227 姓名 尹浩天 曾松涛 张小兵 奚才 郭以纯 黄惠雯 刘丽 聂茜茜 苏红妹 唐芸 王飞燕 徐思漫 许佳慧 杨雨婷 曾亦可 张阳 张梓涵 成绩 90 80 80 73 73 72 79 80 81 82 73 83 87 * 90 85 92
©
谢中华, MATLAB应用培训.
描述性统计
第三节 统计图
一、 样本的频数分布与频率分布 将样本观测值 x1 , x2 , , xn 从小到大排列得:
x(1) < x(2) < < x(l ) ,列出样本频率分布表如下
观测值 频数 频率 x(1) n1 n f1 = 1 x(2) n2 n f2 = 2 … …
相关文档
最新文档