A.Ω(nlogn)B.O(nlogn)C.o(nlogn)D.θ(nlogn)
A.三個算法都能給出最優(yōu)解,差別在于效率B.三個算法效率差不多,差別在于給出的解的質(zhì)量C.枚舉法是精確算法,遺傳算法是近似算法D.遺傳算法和基于最小生成樹的算法都是近似算法,不同在于后者能保證近似的精度在一定范圍內(nèi),前者則不能保證
?如下圖所示,樣本中有三個類別C1、C2、C3,采用KNN分類算法,圖中給出了被測數(shù)據(jù)對象X和Y在特征空間中的映射點,以X、Y為中心的圓表示對應(yīng)K個與X、Y最相近點的分布情況。依據(jù)KNN的多數(shù)表決規(guī)則,X歸為C3類,Y歸為C2類,但感覺這個分類結(jié)果與圖示有些偏差,直觀上X和Y都比較接近C1。你覺得可以采取哪些措施來改進(jìn)算法以避免這種情況發(fā)生?()
A.X的問題是K值選擇太小,可以適當(dāng)增大K值,Y的問題是K值過大,可以適當(dāng)減小K值B.Y的分類問題可能是由于樣本數(shù)不平衡造成,可以考慮壓縮C2類別的樣本數(shù)量C.Y的問題可以考慮用加權(quán)多數(shù)表決法解決D.X的問題可能是C3類含比較異常的樣本,去除異常樣本數(shù)據(jù)可以提高分類準(zhǔn)確度