统计分析基础
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
資料大概落在哪裡?
平均產量,平均厚度。
資料的分散程度?
品質(變異)是高或低?
資料是否對稱?
2018/11/9
基本統計
13
如何以一些量數描述一組數據
代表資料特性的一些統計量數
集中趨勢量數 : (central tendency)
代表大部份資料集中的位置所在,通常利 用此數作為資料的代表值 代表資料的分散程度 代表資料偏離對稱的程度
2018/11/9
基本統計
8
莖葉圖
若覺得stem太少,或每一stem的資料太 多,可以再分細一點。
Leaf Freq. 35 2 023346689 9 028 3 0589 4 11235 5 34 2 11 2 Cum. Freq. 27 25 16 13 9 4 2
Stem 6 6 5 5 4 4 3 3 2 2 1 1 0 0 Leaf 5 3 6689 02334 8 02 589 0 5 1123 34 11 Freq 1 1 4 5 1 2 3 1 1 4 0 2 0 2
Stem 6 5 4 3 2 1 0
你還可以看出什麼?
基本統計 9
2018/11/9
莖葉圖
你還可以看出什麼?
Q2=X(14)=40
Q1= X(7)=22
Stem 6 5 4 3 2 1 0
DAYS 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Leaf 35 023346689 028 0589 11235 34 11
2018/11/9
wenku.baidu.com
Stem 6 6 5 5 4
Leaf Count 5 1 3 1 6689 4 02334 基本統計 5 8 1
Stem 6 5 4 3 2 1 0
Leaf 35 023346689 028 0589 11235 34 11
7
莖葉圖
你看出了什麼?
平均產量約為(大部分資料落在)40-60左 右。 資料大概分散在20-50之間。 資料的分佈不對稱,偏向數字大的那一邊。
每天的產量, 連續27天。
2018/11/9
基本統計
Stem 6 6
Leaf 5 6 3
莖葉圖
The Stem-and-Leaf Plot
將十位數視為莖,個位數視為葉
DAYS 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 LOTS 65 58 63 21 14 23 53 59 48 50 56 53 56 54 52 DAYS 16 17 18 19 20 21 22 23 24 25 26 27 LOTS 40 22 1 21 38 30 42 39 35 25 13 1
基本統計課程大綱
敘述統計(Descriptive Statistcs) 機率分配及抽樣機率分配概念 參數的估計 (Point Estimation & Interval Estimation)
2018/11/9
基本統計
1
什麼是統計學?
Statistics
源自印歐語系字根 status(狀態);understand(了解)
LOTS 65 58 63 21 14 23 53 59 48 50 56 53 56 54 52
Freq. 2 9 3 4 5 2 2
DAYS 16 17 18 19 20 21 22 23 24 25 26 27
Cum. Freq. 27 25 16 13 9 4 2
LOTS 40 22 1 21 38 30 42 39 35 25 13 1
推估
分析
從數據分析中有效掌握數據間 的規律性及差異性
2018/11/9 基本統計
敍 述 統 計
3
統計資料的種類
屬性資料 依資料的性質而劃分類別,無法按大小排列 例:產品區分為「合格」、「不合格」兩類 or 作業員、班別。 屬量資料 計數值資料(離散型資料,Discrete Data) 零或正整數
蒐集、整理、陳述、解釋統計資料特性
敘述統計學
利用已知樣本(sample)所蒐集的資料, 推論未知母(群)體(population)的特性
推論統計學
使在不確定情況下作成決策的科學方法
基本統計 2
2018/11/9
敘述統計與推論統計之比較
母體(欲分析的對象) 抽樣 樣本(母體的代表)
統計
推論 統計
6 5 4 3 2 1 0 0 5 10 15 20 25 30 35 40 45 50 55 60 65 Lots
2018/11/9
基本統計
11
直方圖與莖葉圖的補同
直方圖的分組可較細緻,莖葉圖的分組 較粗略。 直方圖無原始數據,莖葉圖有原始數據。
2018/11/9
基本統計
12
如何觀察一組數據
基本統計 14
差異量數 : (variation , dispersion)
偏態量數 : (shape)
2018/11/9
各種統計量數
連續資料特性 的描述方式
集中趨勢量數
平均數 Mean 中位數 Median 眾數 Mode
差異量數
全距 Range
偏態量數
偏態 Skew
四分位距 Interquartile Range 變異數 Variance
計量值資料(連續型資料,Continuous Data) 可帶有小數點的資料
2018/11/9
基本統計
4
敘述統計
如何觀察一組數據
莖葉圖 直方圖 統計量數 箱型圖
2018/11/9
基本統計
5
你對資料瞭解多少?
收集某廠某月
DAYS 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 LOTS 65 58 63 21 14 23 53 59 48 50 56 53 56 54 52 DAYS 16 17 18 19 20 21 22 23 24 25 26 27 LOTS 40 22 1 21 38 30 42 39 35 25 13 1
Q3= X(21)=54
IQR=Q3-Q1=32 P10= (X(2)+X(3))/2=7 P90= (X(25)+X(26))/2=61
2018/11/9
基本統計
10
Stem 6 6 5
L 5 3 6
直方圖
Stem 6 6 5 5 4 4 3 3 2 2 1 1 0 0 Leaf 5 3 6689 02334 8 02 589 0 5 1123 34 11 Freq 1 1 4 5 1 2 3 1 1 4 0 2 0 2