k-means法で分類したクラスタを評価します。
(1) silhouette関数の利用
シルエット関数を使っていきます。シルエット値は、他のクラスターの点と比べて、その点が自身のクラスター内の他の点にどれくらい相似しているかを示す尺度です。
http://jp.mathworks.com/help/stats/silhouette.html
前回のk-meansで3個に分けたものを利用します。
silhouette(stats,grp);
クラスタ3はだいぶ値が高いのですが、クラスタ2の値が低くなってしまっています。
正規化された値でもやってみます。
silhouette(statsNorm,grp);
(2) クラスタ評価関数evalclustersの利用
clustEv = evalclusters(statsNorm,'kmeans','silhouette','KList',2:5)
これから最適なクラスタ数は2ということがわかります。
0 件のコメント:
コメントを投稿