Apriori算法描述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
在Apriori算法中,尋找最大項目集的基本思想是:算法需要對數據集進行多步處理.第一步,簡單統計所有含一個元素項目集出現的頻率,並找出那些不小於最小支持度的項目集,即一維最大項目集.從第二步開始循環處理直到再沒有最大項目集生成.循環過程是:第k步中,根據第k-1步生成的(k-1)維最大項目集產生k維候選項目集,然後對資料庫進行搜索,得到候選項目集的項集支持度,與最小支持度比較,從而找到k維最大項目集.
假設有一個資料庫D,其中有4個事務記錄,分別表示為:
這裡預定最小支持度minSupport=2,下面用圖例說明算法運行的過程:
掃描D,對每個候選項進行支持度計數得到表C1:
比較候選項支持度計數與最小支持度minSupport,產生1維最大項目集L1:
由L1產生候選項集C2:
掃描D,對每個候選項集進行支持度計數:
比較候選項支持度計數與最小支持度minSupport,產生2維最大項目集L2:
由L2產生候選項集C3:
掃描D,對每個候選項集進行支持度計數:
比較候選項支持度計數與最小支持度minSupport,產生3維最大項目集L3:
算法終止。