Apriori算法描述

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

在Apriori算法中,尋找最大項目集的基本思想是:算法需要對數據集進行多步處理.第一步,簡單統計所有含一個元素項目集出現的頻率,並找出那些不小於最小支持度的項目集,即一維最大項目集.從第二步開始循環處理直到再沒有最大項目集生成.循環過程是:第k步中,根據第k-1步生成的(k-1)維最大項目集產生k維候選項目集,然後對資料庫進行搜索,得到候選項目集的項集支持度,與最小支持度比較,從而找到k維最大項目集.

假設有一個資料庫D,其中有4個事務記錄,分別表示為:

這裡預定最小支持度minSupport=2,下面用圖例說明算法運行的過程:

掃描D,對每個候選項進行支持度計數得到表C1:

比較候選項支持度計數與最小支持度minSupport,產生1維最大項目集L1:

由L1產生候選項集C2:

掃描D,對每個候選項集進行支持度計數:

比較候選項支持度計數與最小支持度minSupport,產生2維最大項目集L2:

由L2產生候選項集C3:

掃描D,對每個候選項集進行支持度計數:

比較候選項支持度計數與最小支持度minSupport,產生3維最大項目集L3:

算法終止。

相关文档
最新文档