商业智慧:SSAS分析服务.pptx
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
25
25
與
:4
銷售數量 台北
硬體 100
軟體 150
高雄
:4 :5
250
100
為了加快終端決策者取得資料的反應時間 ,必須利用儲存空間將資料事先算好並儲 存起來。
銷售數量 台北 高雄 台灣
硬體 100 250 350
軟體 150 100 250
電腦產品 250 350 600
26
26
範例
27
27
R ()
關聯式線上即時分析系統, 藉由維度 () 直接的串聯關係 存及存放於關聯式資料庫() ,或說資料倉儲的資料庫中 ,提供有效的資料存放,不 再另外建一。
H ()
優
缺
查詢快速
浪費空間 靈活性低 不易擴充 建置時間 長
省空間 靈活性大 沒有擴充 的問題
速度較慢 ,每次查 詢皆從資 料庫中重 新抓資料
2
傳統資料庫與資料倉儲資料的不同
傳統資料庫
關聯式資料 正規化的資料,資料正確性高 著重在交易最佳化 可擷取即時資訊 常用動作:新增、刪除、修改
資料倉儲
資料庫中某個時間的資料 著重在資料總和,查詢速度要快 常用動作:“清空-載入”與”刪除-附加 ”
3
商業智慧市場概況
1998: 7 2000: 2000 2002年擊敗成為多維度分析霸主 市佔率由14.3%(2001) 20% (2004) 迫使收購 (2000),並且與維持關係 2003: 收購 (原微軟夥伴) 2003 : 併購 (報表與專家) 動搖了與的合作基礎 2005: 併購並且與分手 2005: 2005
22
22
多維度模型的設計步驟(二)
的選擇 應與時間的階層相符 應符合所有的條件的分割資料 設計時以最低來回應使用者查詢時非預期的需求
四種常見的 : 交易次數 : 某一特定時間的特殊狀況 :與企業相關的個別項目的所有條件 : 只觀察事情發生與否
23
23
多維度模型的設計步驟(三)
• 的建立:要建立一個完整的維度模型,應該考慮三個構面:維度的共同 特性、維度階層、維度資料異動。
18
18
的多階層
• 類似正規化,將所有類別以獨立的來儲存資料,再用及來維持彼 此的關係。
產品的
產品編號
產品名稱 產品細類編號(FK)
產品細類編號
產品細類名稱 產品類別編號(FK)
產品類別編號
產品類別名稱 產品總類編號(FK)
產品總類編號 產品總類名稱
特色: 節省硬碟儲存空間,做過正規化,資料不重複存在 查詢較複雜
書店 文具 禮品 雜誌 書籍
產品總類
產品類別
產品細項分類
產品名稱
書籍類別
電腦類 商業類 小說類
小說類別
文藝小說 科幻小說 武俠小說
武俠小說
天龍八部 神雕俠侶 倚天屠龍記
17
17
的
將不同 的 完成合併於同一個中。
產品的
產品編號
產品名稱 產品總類 產品類別 產品細類
產品類別分類
特色: 查詢簡單、速度快 需要較多的硬碟儲存空間
29
29
()
()
30
30
*: : , , & , 5 , &
31
31
()
()
32
32
*: : , , & , 5 , &
33
33
1
7.0
“”
微軟商業智慧
2000
64
2 2000
,&
3
2005
Cross-release Reliability and Security
範例( 銷售分析架構)
台北 台中 高雄
Meansure
銷售數量
高雄地區第四季HP的銷售量
IBM HP Bell Acer Compaq
一 二 三四 時間(季)
Dimensions
28
28
儲存模式
M ()
是將多維度資料及彙總資料 直接存放在特定的資料結構 中如:,藉由事先運算及彙 總存放於中使的儲存可提供 最快速的查詢回應時間
維度的共同特性:維度存在於關連式的中,因此包含了及支援的屬性。 屬性與相關密切。 簡單及有用的文字資訊。 解析過的時間、名字、或地址元素。 (代理鍵),另外新增一個額外的唯一鍵欄位。 (退化維度):存在中,與實際並無關連 (如訂單編號) 特性: 包含代理鍵的主鍵 跟 有一對多的關係 至少包含一個決策因子 包含的維度階層欄位 包含隨時間變化的資料記錄欄
Clustering
Time Series
Naïve Bayes
Sequence Clustering
Association
Neural Net
Logistic Regression
40
40
a . , a a.
a . , ' .
.,
a.
.,
.
41
41
參考資料
商業智慧及資料倉儲運作架構 2005 , 慧 盟資訊
。2020年6月24日星期三下午1时38分14秒13:38:1420.6.24
• •
T H E E N D 15、会当凌绝顶,一览众山小。2020年6月下午1时38分20.6.2413:38June 24, 2020
16、如果一个人不知道他要驶向哪头,那么任何风都不是顺风。2020年6月24日星期三1时38分14秒13:38:1424 June 2020
9
9
•
•
•
•
•
•
Source Database
(, ….)
架構
•
•
•
•
•
•
•
•
Data Mart
• • • • •
10
10
是提供進行查詢分析, 最受歡迎的資料結構, 也是建置 的基礎. ( 是一種高效率的維度模型)
通常具備 一個 一套 和 組成 “ ” 通常事實資料表資料量很大,維度資料表資料量
• 17、一个人如果不到最高峰,他就没有片刻的安宁,他也就不会感到生命的恬静和光荣。下午1时38分14秒下午1时38分13:38:1420.6.24
谢谢观看
Lowest TCO
objectives Integrated Business Intelligence Automatic Tuning
34
34
硬體配置圖
1
2
3
Oracle
SQL
NCR
35
35
特色
…
2000
Time Series
ï
Sequence Clustering
Association
Neural Net
36
36
特色
不需轉成星狀架構,直接由資料對應 簡化資料整合工作 多維度物件擴充 改用屬性作為為杜物件的底層架構 多國語言轉換 同一個報表可以用多國語言呈現 提升商業智慧分析能力 提供不同等級的快取模式 ( ) 多種資料探勘演算法支援
37
2005
,,
38
38
24
24
多維度模型的設計步驟(四)
的設計
利用預先計算好的加總來提高分析的速度。因為可以在提 交查詢前,就先準備好以改善查詢的反應時間,因此可 以降低擷取資料時,系統動態計算結果所造成的效能負 荷。但是必須注意:
動態建立 或在資料載入階段時建立 可以儲存在資料倉儲中以便重複使用,或是在做每一次查
詢時動態的建立起來。 以儲存空間與處理時間為考慮因素
4
2005商業智慧市場概況
關聯式資料庫市場 (34.2%) (33.9%) (20.0%) (3.0%) (8.9%)
市場 (28%) (19%) (14%) (7%) (7%) (6%)
5
市場概況
6
6
.
資料倉儲之父 一個整合的全公司資料倉儲 資料整合性高 成本較高
屬性 (): 每個維度表都包含了屬性, 維度經由其屬性提供了關於事實 的描述性特質.
屬性階層 ( ):屬性階層提供了由上而下的資料組織, 它被用於聚集與 資料鑽研()/向上捲算().
13
13
維度資料模型與模型比較
維度資料表(4 ) . 資料表 (11)
14
模型轉換成維度模型
步驟一、找出需要匯總的資料成為事實資料表 資料表中的(數量)與(價格) 步驟二、根據分析的維度,把其他資料表反正規
• 10、人的志向通常和他们的能力成正比例。13:38:1413:38:1413:386/24/2020 1:38:14 PM
• 11、夫学须志也,才须学也,非学无以广才,非志无以成学。20.6.2413:38:1413:38Jun-2024-Jun-20
• 12、越是无能的人,越喜欢挑剔别人的错儿。13:38:1413:38:1413:38Wednesday, June 24, 2020
很小
11
11
*: : , , & , 5 , &
12
12
事實 (): 是數值上的衡量(值), 代表了特定的商業部份或活動. 通常存 在於事實資料表, 事實表包含了經由其維度加以連結的實實.
維度 (): 資料幾乎都會以與其他資料關聯的角度來查看, 維度是一般 認可的分類, 對給定的事實提供了額外的觀點.
商業智慧之父 創立 、 、 每個部門各自維持自己的資料超市( ) 資料分散 成本較低 查詢效率高
7
資料超市架構
1981-1992 1984-1992 ()
1990-1991
1984-1989 8
8
建立架構
來源一
來源二
資料倉儲
來源三
銷售
員工
財務
資料來源固定、確保資料完整性 資料格式與單位一致,確保跨不同 分析的正確性 可以共享欄位 須花費較多時間來設計
Relative Business Value
Easy
8 , 10 12
Business Knowledge
2005
Data Mining
OLAP
Reports (Adhoc) Reports (Static)
Usability
2005 ,,
Difficult
39
39
Decision Trees 2000
• 13、志不立,天下无可成之事。20.6.2420.6.2413:38:1413:38:14June 24, 2020
• 14、Thank you very much for taking me with you on that splendid outing to London. It was the first time that I had seen the Tower or any of the other famous sights. If I'd gone alone, I couldn't have seen nearly as much, because I wouldn't have known my way about.
2005 線上即時分析,亞洲資採 尹相志
42
43
20.6.2413:38:1413:3 813:3820.6.2420.6.2 413:38
谢谢
13:38 20.6.2 413:3
2020年6月24日星期三1时38分14秒
• 9、春去春又回,新桃换旧符。在那桃花盛开的地方,在这醉人芬芳的季节,愿你生活像春天一样阳光,心情像桃花一样美丽,日子像桃子一样甜蜜。20. 6.2420.6.24Wednesday, June 24, 2020
化 : 維度表 : 維度表 維度表 步驟三、把各維度表的主鍵加入事實資料表
15
資料立方體 ( )
*: : , , & , 5 , &
16
16
通常做決策支援分析時,為了利於統計分析,常常將一個基本的 分類成數個 。也就是 間存在著一對多的邏輯關係,即 。 的維度分類方式又可以分成兩種 方式( 及 )
2005 分析服務
:
1
商業資料的特性
決策支援的需求 比較特定期間內, 各部門生產力成長的相
對比率? 依所選擇的產品線定義相關的市場佔有率 定義廣告類型和銷售程度之間的關聯. 而
這個關聯可以運用於預測 營運前台的資料龐大到無法人為解毒細節 需要適度的彙總(),把明細資料轉成有意
義的資訊,透過報表呈現
19
19
與 比較
整體資料列()數 所佔硬碟空間大小 設計難易度 數量 查詢複雜度 維度搜尋 支援索引
較少 較大 較容易 較少 較簡單 較快 是
較多 較小 較困難 較多 較複雜 較慢 否
20
20
多維度模型的設計步驟
定義的 的選擇 的建立 的設計
21
21
多維度模型的設計步驟(一)
定義的 著重於企業的單一商業行為( ) 決定單元資料的精細程度( ) 決定使用 或 決定資料的時間需求
25
與
:4
銷售數量 台北
硬體 100
軟體 150
高雄
:4 :5
250
100
為了加快終端決策者取得資料的反應時間 ,必須利用儲存空間將資料事先算好並儲 存起來。
銷售數量 台北 高雄 台灣
硬體 100 250 350
軟體 150 100 250
電腦產品 250 350 600
26
26
範例
27
27
R ()
關聯式線上即時分析系統, 藉由維度 () 直接的串聯關係 存及存放於關聯式資料庫() ,或說資料倉儲的資料庫中 ,提供有效的資料存放,不 再另外建一。
H ()
優
缺
查詢快速
浪費空間 靈活性低 不易擴充 建置時間 長
省空間 靈活性大 沒有擴充 的問題
速度較慢 ,每次查 詢皆從資 料庫中重 新抓資料
2
傳統資料庫與資料倉儲資料的不同
傳統資料庫
關聯式資料 正規化的資料,資料正確性高 著重在交易最佳化 可擷取即時資訊 常用動作:新增、刪除、修改
資料倉儲
資料庫中某個時間的資料 著重在資料總和,查詢速度要快 常用動作:“清空-載入”與”刪除-附加 ”
3
商業智慧市場概況
1998: 7 2000: 2000 2002年擊敗成為多維度分析霸主 市佔率由14.3%(2001) 20% (2004) 迫使收購 (2000),並且與維持關係 2003: 收購 (原微軟夥伴) 2003 : 併購 (報表與專家) 動搖了與的合作基礎 2005: 併購並且與分手 2005: 2005
22
22
多維度模型的設計步驟(二)
的選擇 應與時間的階層相符 應符合所有的條件的分割資料 設計時以最低來回應使用者查詢時非預期的需求
四種常見的 : 交易次數 : 某一特定時間的特殊狀況 :與企業相關的個別項目的所有條件 : 只觀察事情發生與否
23
23
多維度模型的設計步驟(三)
• 的建立:要建立一個完整的維度模型,應該考慮三個構面:維度的共同 特性、維度階層、維度資料異動。
18
18
的多階層
• 類似正規化,將所有類別以獨立的來儲存資料,再用及來維持彼 此的關係。
產品的
產品編號
產品名稱 產品細類編號(FK)
產品細類編號
產品細類名稱 產品類別編號(FK)
產品類別編號
產品類別名稱 產品總類編號(FK)
產品總類編號 產品總類名稱
特色: 節省硬碟儲存空間,做過正規化,資料不重複存在 查詢較複雜
書店 文具 禮品 雜誌 書籍
產品總類
產品類別
產品細項分類
產品名稱
書籍類別
電腦類 商業類 小說類
小說類別
文藝小說 科幻小說 武俠小說
武俠小說
天龍八部 神雕俠侶 倚天屠龍記
17
17
的
將不同 的 完成合併於同一個中。
產品的
產品編號
產品名稱 產品總類 產品類別 產品細類
產品類別分類
特色: 查詢簡單、速度快 需要較多的硬碟儲存空間
29
29
()
()
30
30
*: : , , & , 5 , &
31
31
()
()
32
32
*: : , , & , 5 , &
33
33
1
7.0
“”
微軟商業智慧
2000
64
2 2000
,&
3
2005
Cross-release Reliability and Security
範例( 銷售分析架構)
台北 台中 高雄
Meansure
銷售數量
高雄地區第四季HP的銷售量
IBM HP Bell Acer Compaq
一 二 三四 時間(季)
Dimensions
28
28
儲存模式
M ()
是將多維度資料及彙總資料 直接存放在特定的資料結構 中如:,藉由事先運算及彙 總存放於中使的儲存可提供 最快速的查詢回應時間
維度的共同特性:維度存在於關連式的中,因此包含了及支援的屬性。 屬性與相關密切。 簡單及有用的文字資訊。 解析過的時間、名字、或地址元素。 (代理鍵),另外新增一個額外的唯一鍵欄位。 (退化維度):存在中,與實際並無關連 (如訂單編號) 特性: 包含代理鍵的主鍵 跟 有一對多的關係 至少包含一個決策因子 包含的維度階層欄位 包含隨時間變化的資料記錄欄
Clustering
Time Series
Naïve Bayes
Sequence Clustering
Association
Neural Net
Logistic Regression
40
40
a . , a a.
a . , ' .
.,
a.
.,
.
41
41
參考資料
商業智慧及資料倉儲運作架構 2005 , 慧 盟資訊
。2020年6月24日星期三下午1时38分14秒13:38:1420.6.24
• •
T H E E N D 15、会当凌绝顶,一览众山小。2020年6月下午1时38分20.6.2413:38June 24, 2020
16、如果一个人不知道他要驶向哪头,那么任何风都不是顺风。2020年6月24日星期三1时38分14秒13:38:1424 June 2020
9
9
•
•
•
•
•
•
Source Database
(, ….)
架構
•
•
•
•
•
•
•
•
Data Mart
• • • • •
10
10
是提供進行查詢分析, 最受歡迎的資料結構, 也是建置 的基礎. ( 是一種高效率的維度模型)
通常具備 一個 一套 和 組成 “ ” 通常事實資料表資料量很大,維度資料表資料量
• 17、一个人如果不到最高峰,他就没有片刻的安宁,他也就不会感到生命的恬静和光荣。下午1时38分14秒下午1时38分13:38:1420.6.24
谢谢观看
Lowest TCO
objectives Integrated Business Intelligence Automatic Tuning
34
34
硬體配置圖
1
2
3
Oracle
SQL
NCR
35
35
特色
…
2000
Time Series
ï
Sequence Clustering
Association
Neural Net
36
36
特色
不需轉成星狀架構,直接由資料對應 簡化資料整合工作 多維度物件擴充 改用屬性作為為杜物件的底層架構 多國語言轉換 同一個報表可以用多國語言呈現 提升商業智慧分析能力 提供不同等級的快取模式 ( ) 多種資料探勘演算法支援
37
2005
,,
38
38
24
24
多維度模型的設計步驟(四)
的設計
利用預先計算好的加總來提高分析的速度。因為可以在提 交查詢前,就先準備好以改善查詢的反應時間,因此可 以降低擷取資料時,系統動態計算結果所造成的效能負 荷。但是必須注意:
動態建立 或在資料載入階段時建立 可以儲存在資料倉儲中以便重複使用,或是在做每一次查
詢時動態的建立起來。 以儲存空間與處理時間為考慮因素
4
2005商業智慧市場概況
關聯式資料庫市場 (34.2%) (33.9%) (20.0%) (3.0%) (8.9%)
市場 (28%) (19%) (14%) (7%) (7%) (6%)
5
市場概況
6
6
.
資料倉儲之父 一個整合的全公司資料倉儲 資料整合性高 成本較高
屬性 (): 每個維度表都包含了屬性, 維度經由其屬性提供了關於事實 的描述性特質.
屬性階層 ( ):屬性階層提供了由上而下的資料組織, 它被用於聚集與 資料鑽研()/向上捲算().
13
13
維度資料模型與模型比較
維度資料表(4 ) . 資料表 (11)
14
模型轉換成維度模型
步驟一、找出需要匯總的資料成為事實資料表 資料表中的(數量)與(價格) 步驟二、根據分析的維度,把其他資料表反正規
• 10、人的志向通常和他们的能力成正比例。13:38:1413:38:1413:386/24/2020 1:38:14 PM
• 11、夫学须志也,才须学也,非学无以广才,非志无以成学。20.6.2413:38:1413:38Jun-2024-Jun-20
• 12、越是无能的人,越喜欢挑剔别人的错儿。13:38:1413:38:1413:38Wednesday, June 24, 2020
很小
11
11
*: : , , & , 5 , &
12
12
事實 (): 是數值上的衡量(值), 代表了特定的商業部份或活動. 通常存 在於事實資料表, 事實表包含了經由其維度加以連結的實實.
維度 (): 資料幾乎都會以與其他資料關聯的角度來查看, 維度是一般 認可的分類, 對給定的事實提供了額外的觀點.
商業智慧之父 創立 、 、 每個部門各自維持自己的資料超市( ) 資料分散 成本較低 查詢效率高
7
資料超市架構
1981-1992 1984-1992 ()
1990-1991
1984-1989 8
8
建立架構
來源一
來源二
資料倉儲
來源三
銷售
員工
財務
資料來源固定、確保資料完整性 資料格式與單位一致,確保跨不同 分析的正確性 可以共享欄位 須花費較多時間來設計
Relative Business Value
Easy
8 , 10 12
Business Knowledge
2005
Data Mining
OLAP
Reports (Adhoc) Reports (Static)
Usability
2005 ,,
Difficult
39
39
Decision Trees 2000
• 13、志不立,天下无可成之事。20.6.2420.6.2413:38:1413:38:14June 24, 2020
• 14、Thank you very much for taking me with you on that splendid outing to London. It was the first time that I had seen the Tower or any of the other famous sights. If I'd gone alone, I couldn't have seen nearly as much, because I wouldn't have known my way about.
2005 線上即時分析,亞洲資採 尹相志
42
43
20.6.2413:38:1413:3 813:3820.6.2420.6.2 413:38
谢谢
13:38 20.6.2 413:3
2020年6月24日星期三1时38分14秒
• 9、春去春又回,新桃换旧符。在那桃花盛开的地方,在这醉人芬芳的季节,愿你生活像春天一样阳光,心情像桃花一样美丽,日子像桃子一样甜蜜。20. 6.2420.6.24Wednesday, June 24, 2020
化 : 維度表 : 維度表 維度表 步驟三、把各維度表的主鍵加入事實資料表
15
資料立方體 ( )
*: : , , & , 5 , &
16
16
通常做決策支援分析時,為了利於統計分析,常常將一個基本的 分類成數個 。也就是 間存在著一對多的邏輯關係,即 。 的維度分類方式又可以分成兩種 方式( 及 )
2005 分析服務
:
1
商業資料的特性
決策支援的需求 比較特定期間內, 各部門生產力成長的相
對比率? 依所選擇的產品線定義相關的市場佔有率 定義廣告類型和銷售程度之間的關聯. 而
這個關聯可以運用於預測 營運前台的資料龐大到無法人為解毒細節 需要適度的彙總(),把明細資料轉成有意
義的資訊,透過報表呈現
19
19
與 比較
整體資料列()數 所佔硬碟空間大小 設計難易度 數量 查詢複雜度 維度搜尋 支援索引
較少 較大 較容易 較少 較簡單 較快 是
較多 較小 較困難 較多 較複雜 較慢 否
20
20
多維度模型的設計步驟
定義的 的選擇 的建立 的設計
21
21
多維度模型的設計步驟(一)
定義的 著重於企業的單一商業行為( ) 決定單元資料的精細程度( ) 決定使用 或 決定資料的時間需求