(1)定義在一個數(shù)據(jù)集中什么數(shù)據(jù)是不一致或者離群的數(shù)據(jù)。
(2)找出所定義的離群點(diǎn)的有效挖掘方法。
下表所示的相依表匯總了超級市場的事務(wù)數(shù)據(jù)。其中hot dogs指包含熱狗的事務(wù),指不包含熱狗的事務(wù)。hamburgers指包含漢堡的事務(wù),
指不包含漢堡的事務(wù)。
假設(shè)挖掘出的關(guān)聯(lián)規(guī)則是“hot dogs=>hamburgers”。給定最小支持度閾值25%和最小置信度閾值50%,這個關(guān)聯(lián)規(guī)則是強(qiáng)規(guī)則嗎?
計算關(guān)聯(lián)規(guī)則“hot dogs=>hamburgers”的提升度,能夠說明什么問題?購買熱狗和購買漢堡是獨(dú)立的嗎?如果不是,兩者間存在哪種相關(guān)關(guān)系?