考慮下表數(shù)據(jù)集,請(qǐng)完成以下問題:
(1)估計(jì)條件概率。
(2)根據(jù)(1)中的條件概率,使用樸素貝葉斯方法預(yù)測(cè)測(cè)試樣本(A=0,B=1,C=0)的類標(biāo)號(hào);
(3)使用Laplace估計(jì)方法,其中p=1/2,l=4,估計(jì)條件概率。
(4)同(2),使用(3)中的條件概率。
(5)比較估計(jì)概率的兩種方法,哪一種更好,為什么?
(5)當(dāng)條件概率為0的時(shí)候,條件概率的預(yù)測(cè)用Laplace估計(jì)方法比較好,因?yàn)槲覀儾幌胝麄€(gè)條件概率計(jì)算結(jié)果為0。
考慮下表所示二元分類問題的數(shù)據(jù)集。
(1)計(jì)算按照屬性A和B劃分時(shí)的信息增益。決策樹歸納算法將會(huì)選擇哪個(gè)屬性?
(2)計(jì)算按照屬性A和B劃分時(shí)Gini系數(shù)。決策樹歸納算法將會(huì)選擇哪個(gè)屬性?