AI画像処理で、色の違いを重要な判別パラメータとして扱う人が多いが、実は色の違いって重要ではないんだよ。
実際にCNNの学習アルゴリズムで支配的となる特徴は、
・エッジ
・テクスチャ
・濃淡
・勾配
であって、色の違いは「揺らぎ」でしかない。
これは感覚論でも経験則でもなく、勾配降下法という最適化アルゴリズムの必然的な帰結。
CNNが学習でやっていることは一つだけ。
「損失関数 L を最小化するように重み w を更新する」
つまり、勾配が安定して出る特徴だけが残る。
画像データは確かに入力はRGBだが、最初の畳み込みで行われるのは
wR・R + wG・G + wB・B
という線形結合。
この時点で「黒」「白」「青」といった色相の概念は存在せず、CNNが見ているのは「画素値の空間的な変化(勾配)」だけになる。
色を特徴にしたがるのは分かるけど、色の違いは揺らぎ程度の特徴でしかないんだな。