下表所示的相依表匯總了超級(jí)市場(chǎng)的事務(wù)數(shù)據(jù)。其中hot dogs指包含熱狗的事務(wù),指不包含熱狗的事務(wù)。hamburgers指包含漢堡的事務(wù),
指不包含漢堡的事務(wù)。
假設(shè)挖掘出的關(guān)聯(lián)規(guī)則是“hot dogs=>hamburgers”。給定最小支持度閾值25%和最小置信度閾值50%,這個(gè)關(guān)聯(lián)規(guī)則是強(qiáng)規(guī)則嗎?
計(jì)算關(guān)聯(lián)規(guī)則“hot dogs=>hamburgers”的提升度,能夠說(shuō)明什么問(wèn)題?購(gòu)買熱狗和購(gòu)買漢堡是獨(dú)立的嗎?如果不是,兩者間存在哪種相關(guān)關(guān)系?
一個(gè)數(shù)據(jù)庫(kù)有5個(gè)事務(wù),如表所示。設(shè)min_sup=60%,min_conf=80%。
(a)分別用Apriori算法和FP-growth算法找出所有頻繁項(xiàng)集。比較兩種挖掘方法的效率。
(b)比較窮舉法和Apriori算法生成的候選項(xiàng)集的數(shù)量。
(c)利用(1)所找出的頻繁項(xiàng)集,生成所有的強(qiáng)關(guān)聯(lián)規(guī)則和對(duì)應(yīng)的支持度和置信度。