floatの値が0から1の範囲内ならA、範囲外ならBを返す処理が欲しかった。
通常であればこのようにif文で作ることができます。
しかし、シェーダにおいてはif文を使ってしまうとGPUの並列処理を阻害することになり、パフォーマンスが大きく落ちます。
そこでif文を使わない方法を考えることにしました。
結論だけ見たい方はこちら
目次 [表示]
方針
最初に思いついたのはこれです。
abs(x – 0.5)のところで絶対値が0.5に満たない場合は、+0.5しても1にならないので、int型にキャストすることで0か1に分けることができます。
最後に書きますが0か1に分けることでlerpを使用して目的の値を取得できます。
ただ、組み込み関数って中で何やってるかわからないんですよね…Cgはドキュメントに書いてありますがGLSLやHLSLは不明だし、バージョンによって違うこともありそうです。
内部がこんな感じだったら意味ないので、組み込み関数も使わない方針にしました。
Cgのドキュメントを見るとabsの内部ではmaxを使用、maxは三項演算子を使っています。
各所でシェーダの最適化資料を漁ってみたところ、absは軽量な組み込み関数であるという事が書かれていることが多かったので、absを使用するやり方でも問題ないかもしれません。
たどりついたもの
マイナス方向とプラス方向に分けてチェックして、掛け合わせればなんとかなりました。
以下のパターンは対応できないのですが、今回は必要なかったので考えないことにしました。
- x <= -1
- x >= 2
教えてもらったもの
結局こういうのは強いエンジニアに聞けということで、数学が得意な人に聞いたら先ほどの対応できなかったパターンも対応できる方法を教えてもらえました。
εはイプシロン定数(CのFLT_MIN、Unityのfloat.Epsilonなど)で限りなく小さい値です。
シェーダ言語には用意されていなかったりするので、自前で用意する必要はあります。
0.000…00001とか適当に定義すればOKです。
厳密に0 or 1になるわけではないのですが、次に書くようにlerpで使用するので誤差は気にしなくていいレベルです。
目的の値を取得
あとは線形補間(lerp)で目的の値を取得するだけ!
lerpも組み込み関数ですが、内部的にはこんな感じになっているはずなので問題ないと判断しました。