kmeansで分類した後で、主成分分析により次元圧縮したデータをグループごとに色分けするということを繰り返し行い、表示した結果です。 順に1回目、2回目以降です。 1回目のグラフと2回目以降のグラフが異なるのはなぜでしょうか。以下コードです。 from sklearn.cluster import KMeans bath_data_copy = bath_data.copy() classes = 4 km = KMeans(n_clusters=classes,random_state=10, max_iter=100000) kmh = km.fit_predict(bath_data_copy[bath_data_copy.columns[1:]]) bath_data['kmh'] = kmh color_codes = {0:'b', 1:'g', 2:'r', 3:'y', 4:'w',5:'c'} # サンプル毎に色を与える。 colors = [color_codes[x] for x in kmh] from sklearn.decomposition import PCA #主成分分析器 #主成分分析の実行 pca = PCA() pca.fit(bath_data_copy) PCA(copy=True, n_components=None, whiten=False) feature = pca.transform(bath_data_copy) fig = plt.figure(figsize = (8, 8)) ax= fig.add_subplot(111, projection='3d') ax.scatter(feature[:, 0], feature[:, 1],feature[:, 2], alpha=0.8, s = 20, color=colors) ax.set_title("Principal Component Analysis") ax.set_xlabel("The first principal component score") ax.set_ylabel("The second principal component score") ax.set_zlabel("The third principal component score") ax.view_init(elev=30, azim=60) plt.show()
数学