このようなぎざぎざの時系列を平滑化する方法の1つに移動平均を計算する方法がある。
np.convolve を利用する。
ぎざぎざのデータがあるとする。
[0.25, 0.25, 0.25, 0.25] という列(カーネル関数)を時系列データに畳み込み(コンボリューション)計算をする。
kernel = np.ones(4)/4
で array([ 0.25, 0.25, 0.25, 0.25]) を作成できる。
畳み込み計算は
smoothed = np.convolve(dataarray, kernel, mode='same')
とする。
plt.plot(smoothed)
plt.show()
ぎざぎざがましになっている。
mode = 'same' を指定したので、convolve 前後の時系列データの長さは等しくなるようにたたみ込みを行う。
このとき、時系列データの両端でたたみ込みが完全に行えない部分生じるためバイアスが係っていることに注意する。
mode = 'valid' とすると、カーネルが時系列データに完全にオーバーラップできる部分から畳み込みがはじまるため、結果の時系列データは元よりも短くなる。が端点のバイアスない。
mode = 'full' も 'same' 同様端点にバイアスがかかる。この場合は、結果の時系列データは元よりも長くなる。
このとき、時系列データの両端でたたみ込みが完全に行えない部分生じるためバイアスが係っていることに注意する。
mode = 'valid' とすると、カーネルが時系列データに完全にオーバーラップできる部分から畳み込みがはじまるため、結果の時系列データは元よりも短くなる。が端点のバイアスない。
mode = 'full' も 'same' 同様端点にバイアスがかかる。この場合は、結果の時系列データは元よりも長くなる。