一個數(shù)據(jù)庫有5個事務(wù),如表所示。設(shè)min_sup=60%,min_conf=80%。
(a)分別用Apriori算法和FP-growth算法找出所有頻繁項集。比較兩種挖掘方法的效率。
(b)比較窮舉法和Apriori算法生成的候選項集的數(shù)量。
(c)利用(1)所找出的頻繁項集,生成所有的強(qiáng)關(guān)聯(lián)規(guī)則和對應(yīng)的支持度和置信度。
您可能感興趣的試卷
最新試題
隨機(jī)梯度下降每次更新執(zhí)行的計算量少于批梯度下降。
數(shù)據(jù)復(fù)制或者備份均是為了從提高數(shù)據(jù)并發(fā)這個角度來設(shè)計和實(shí)現(xiàn)的。
當(dāng)MAP中使用的先驗(yàn)是參數(shù)空間上的統(tǒng)一先驗(yàn)時,MAP估計等于ML估計。
支持向量機(jī)不適合大規(guī)模數(shù)據(jù)。
管理員不需要驗(yàn)證就可以訪問數(shù)據(jù)存儲系統(tǒng)中的任何數(shù)據(jù),這符合數(shù)據(jù)安全的要求。
對于文本數(shù)據(jù)和多媒體數(shù)據(jù)進(jìn)行特征提取是為了方便對于這類數(shù)據(jù)的觀察和理解。
如果P(A B)= P(A),則P(A∩B)= P(A)P(B)。
完整性,一致性,時效性,唯一性,有效性,準(zhǔn)確性是衡量數(shù)據(jù)質(zhì)量的六個維度指標(biāo)。
假設(shè)屬性的數(shù)量固定,則可以在時間上以線性方式學(xué)習(xí)基于高斯的貝葉斯最優(yōu)分類器,而該數(shù)量是數(shù)據(jù)集中記錄的數(shù)量。
數(shù)據(jù)壓縮與解壓縮可以使得數(shù)據(jù)處理的速度加快。