Course0课程介绍Introduction.
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
析技術、工具,如報表(Reporting)、線上即時分析 (OLAP)、資料探勘 (Data mining)、統計分析來獲得 可用的資訊,以應用於銷售、行銷、財務、人力資源、 生產、研發等各個層面的決策支援。
國立聯合大學 資訊管理學系
資料探勘課程 (陳士杰)
15
國立聯合大學 資訊管理學系
資料探勘課程 (陳士杰)
Kamel與Samia(2002)認為商業智慧是系統追蹤、蒐尋、連繫並 轉化各種微量訊息的一種策略性方法。
Kanzler(2002)認為商業智慧的定義是因人而異,其內容包含了
國立聯合大學 資訊管理學系
資料探勘課程 (陳士杰)
13
商業智慧主要透過企業內部資料整合來進行各種 層面的資料分析,其主要涵蓋範圍可以包括資料 收集與儲存,以及資料分析兩大部份。
16
(資料來源: 漢康科技)来自國立聯合大學 資訊管理學系
資料探勘課程 (陳士杰)
17
商業智慧已成為今天企業提升其產業競爭力及獲利的解決方案。如 何結合資訊技術與專業知識將資源轉變成具決策價值的商業智慧, 成為每個企業最關心的議題。 而客戶是企業最重要的資源。因此,如何獲取最佳的客戶、了解他 們的需要、提供他們最個人化的產品與服務、及防止既有客戶的流 失,便成為企業努力的目標,也因而產生了Data Mining之技術及 應用。 盡管BI強調資料探勘技術的應用,然而使用者不應該視資料探勘為神 奇的水晶球,期望它告訴使用者寶藏的資訊,而正視它只是其中一 項分析工具。 面對二十一世紀的新知識經濟時代,商業智慧是提高企業競爭力的 最終解決方案。而Data Mining是商業智慧的核心。如何將Data Mining的技術結合企業領域的知識,真正達到提高利潤、提昇競爭 力,將是未來企業努力的目標。
國立聯合大學 資訊管理學系
資料探勘課程 (陳士杰)
3
教材
上課用書:
王派洲
譯,資料探勘:概念與方法(第二版),滄海書局,
2008
Jiawei
Han and Micheline Kamber, Data Mining: Concepts and Techniques, 2nd, 2006.
範例
國立聯合大學 資訊管理學系
資料探勘課程 (陳士杰)
26
Prediction Phase
Name: Susan, Debt: Low, Income: High,Married: Yes then Risk?
Decision Tree Income =High Income =Low
Married =Yes
“60% 的顧客買尿布也會買啤酒,發生機率佔所有交易的 3% 60%: 信賴度 3%: 支持度
國立聯合大學 資訊管理學系
資料探勘課程 (陳士杰)
30
Sequence 序向規則
以超市為例
顧客 John John 交易時間 6/21/99 5:30 pm 6/22/99 10:20 pm 購買商品 啤酒 白蘭地酒
Frank Frank Frank
Mitchell Mary Mary Mary
6/20/99 10:15 am 6/20/99 11:50 am 6/21/99 9:25 am
6/21/99 3:20 pm
果汁, 可口可樂 啤酒 葡萄酒, 礦泉水, 蘋果汁
關人員追蹤並了解到整體企業的營運狀況,以知道距離 目標還有多少差距,以及要採取怎樣的行動方案。
但是據CFO Magazine調查,75%的企業高階主管在面
臨擬定策略時,通常無法獲得即時且完整的決策參考資 料。
國立聯合大學 資訊管理學系
資料探勘課程 (陳士杰)
10
國立聯合大學 資訊管理學系
資料探勘課程 (陳士杰)
Section 8.3 Section 8.4, 11.1.4
行銷與交易相關:
生物資訊相關:
多媒體相關:
Section 10.3
Section 10.4, 10.5 Section 11.3.1, 11.3.2, 11.3.4
文件與網頁探勘相關:
其它方法論相關的議題:
國立聯合大學 資訊管理學系
11
於是潛藏在各部門、各營運流程中之大量資料,什麼樣 的資料、要透過什麼樣的方法,才能轉變成為可提供決 策參考的有用資訊,而且要符合快速、即時的要求?
以ERP而言,由於使用者多屬於執行階層員工,其功能主要強調 記錄原始資料、產出報表與基礎資料查詢,相較於中高階主管對 決策前需對領先指標分析的需求,定期的制式報表往往不能滿足。 尤其繁瑣的細節往往限制其取得相關動態資訊的能力,讓決策者 在面臨決策時,無法從茫茫的資料汪洋中取得各種內外部有用資 訊。
Course 0
課程介紹
Introduction
國立聯合大學 資訊管理學系 陳士杰老師
Data Mining
資料探勘
國立聯合大學 資訊管理學系
資料探勘課程 (陳士杰)
2
大綱
了解本課程授課重點、目標及課程設計, 了解本課程報告進行方式, 了解本課程評分標準, 先踏入一隻腳: Business Intelligence & Data Mining
國立聯合大學 資訊管理學系
資料探勘課程 (陳士杰)
4
參考用書:
Pang-Ning
Tan, Michael Steinbach, Vipin Kumar, Introduction to Data Mining, Pearson Education Asia LTD, 2006. 施雅月,賴錦慧,資料探勘,歐亞出版社,2007。
資料探勘課程 (陳士杰)
8
Business Intelligence
&
Data Mining
國立聯合大學 資訊管理學系
資料探勘課程 (陳士杰)
9
企業要於競爭激烈的市場中勝出,決策速度與反應效率 的重要性已是無庸置疑的。 對於各部門主管所急欲知道的種種資訊,身為資訊部門
人員,也常需要整理報表或透過企業內的資訊系統讓相
國立聯合大學 資訊管理學系
資料探勘課程 (陳士杰)
5
課程重點
資料探勘概念與資料預處理
Introduction:簡介 (Ch. 1) Data Preprocessing:資料前處理 (Ch. 2) Mining Association Rules:探勘關聯規則 (Ch. 5) Classification and Prediction:分類與預測 (Ch. 6) Cluster Analysis:集群分析 (Ch. 7) Data Warehouse and OLAP Technology for Data Mining: 資料倉儲與即時分析處理方法 (Ch. 3)
國立聯合大學 資訊管理學系
資料探勘課程 (陳士杰)
23
Data Mining進行歩驟
理解資料與進行的工作 獲取相關知識與技術 融合與查核資料
去除錯誤或不一致的資料
發展模式與假設 實際執行挖掘工作 測試與檢核所挖掘的模式 解釋與使用模式
國立聯合大學 資訊管理學系
資料探勘課程 (陳士杰)
國立聯合大學 資訊管理學系
資料探勘課程 (陳士杰)
18
你不能不知的十大創新技術
機器與人腦的介面
塑膠電晶體
資料探勘(Data mining) 數字權利管理 生物測定學(Biometrics) 語言識別處理 微光學技術(Microphotonics) 解開程式碼(Untangling code) 機器人設計 微應用流體學(Microfluidics)
D1
Married D2 =No
D1b Poor
Good D1a
So Risk is Good!
國立聯合大學 資訊管理學系
資料探勘課程 (陳士杰)
27
Clustering 分群
主要功能
族群聚類
(同類相聚,異類相離)
顧客個人資料
Name
John Tom
Age
50 25
Income
80,000 90,000
國立聯合大學 資訊管理學系
資料探勘課程 (陳士杰)
12
強化決策速度與品質之關鍵-商業智慧
何謂商業智慧?
White(1999) 提出商業智慧是以一組技術及產品來提供使用者解 決商業問題所需的資訊,以支援戰略性和策略性之商業決策。這 些技術包含 資料倉儲(Data Warehouse) ,資料探勘(Data Mining),線上分析(Online Analytical Processing,OLAP)等。 其目的是為了能使使用者能在決策的時候,盡可能地得到更好的 協助。 Guin、Michael與Timothy(2001)認為商業智慧為系統化的分析 程序,以蒐尋並了解外在訊息所代表的意涵。 Hoelscher(2002)認為商業智慧結合了資料挖掘的技術與各種分 析方法,以提供商業各種及時且精確的資訊。
It’s hot!!!
國立聯合大學 資訊管理學系
資料探勘課程 (陳士杰)
20
瞎子摸象? 找 Pattern? Trend? Relationship?
林共進 教授 提供
國立聯合大學 資訊管理學系
資料探勘課程 (陳士杰)
21
It is New
資源與資訊共享Information Delivery 多半的人,並不知道它能做甚麼。 但是不能太晚上車。 (中研院 趙民德)
國立聯合大學 資訊管理學系
資料探勘課程 (陳士杰)
14
商業智慧的建置
BI最首要的課題:
將企業內的相關資料,含括CRM、ERP、SCM或是其
他資訊系統所產生異質資料,透過擷取資料、轉換資
料、傳送資料(Extract、Transform、Load)到資料倉
儲。
完成資料的收集及儲存,才有能力利用各類的資料分
cluster 3 $150,000
國立聯合大學 資訊管理學系
資料探勘課程 (陳士杰)
29
Association 關聯規則
以超市為例
交易代號 1 2 3 … 購買商品 奶油, 麵包, 牛奶, 啤酒,尿布 麵包, 牛奶, 啤酒, 雞蛋 可口可樂, 膠捲, 麵包, 奶油, 牛奶 ………
關聯規則如下:
Search
Engine Yahoo Excite
Avg. Stay
10 min 30 min
Mary Paul
30 48
60,000 55,000
Yahoo Excite
12 min 25 min
國立聯合大學 資訊管理學系
資料探勘課程 (陳士杰)
28
100
cluster 1
cluster 2
A g e Income
24
資料探勘可以建立六種模式:
Classification Clustering Association Sequence Regression Time
Series
國立聯合大學 資訊管理學系
資料探勘課程 (陳士杰)
25
Classification 分類
目的
依據已知類別建立預測性模型,以解釋該類別之特性
Technology Review雜誌 (麻省理工學院2002年1月出刊)
國立聯合大學 資訊管理學系
資料探勘課程 (陳士杰)
19
何謂Data Mining (探勘、採礦、挖掘)?
找尋隱藏在資料中的訊息,如趨勢(Trend)、 特徵(Pattern)及相關性(Relationship)。 運用電腦儲存運算能力及使用統計方法工具。
資料探勘核心議題
簡介資料倉儲, OLAP, 資料一般化
Data Cube Computation and Data Generalization:資料方 塊計算與資料產生 (Ch. 4)
國立聯合大學 資訊管理學系
資料探勘課程 (陳士杰)
6
財務金融相關:
Section 8.2, 11.1.1
國立聯合大學 資訊管理學系
資料探勘課程 (陳士杰)
22
資料探勘是利用資料來建立一些模擬真實世界的 模式(Model),利用這些模式來描述資料中的特徵 (Patterns)以及關係(Relations)。 這些模式有兩種用處:
瞭解資料的特徵與關係可以提供你做決策所需要的資
訊。
資料的特徵可以幫助你做預測。
資料探勘課程 (陳士杰)
7
課程設計與評分標準
分為“課程講授”和“論文報告”兩部分。
理論講授:
課堂講授Data Mining的相關理論 (約3/4學期),
論文報告:
請於期中考後兩週內將題目繳交 (逾期不侯)。
評分:
期中考:40% 期末報告:50% 平時成績:10%
國立聯合大學 資訊管理學系