人力ボカロを見様見真似でやろうとすると1文字1文字切り出して音程合わせればいいじゃん!と最初は思うと思います。ですが実際にやってみると音程を変更していく度にフォルマントが壊れ何と言ってるかわからない音になってしまうのです。
これが初心者の壁です。ピッチシフトをすると±5辺りが限界じゃないでしょうか。
もちろん大量に素材を切り出してとにかく素材元が歌わせるとこの音程に近いやつを使うってのをすればいいのですが果てしなく時間がかかります。
そこでよく使われるのがUTAUやなめうぇーぶ,Vocalshifterですね。
これらはある程度フォルマントを維持したままピッチ変更をするので素材の味が残せます。
が、もちろん限界があります。個人的な体感ですが数値で表すと
・UTAU±6で限界 以降は激しい機械音と化す
・なめうぇーぶ±8で限界 以降はUTAU同様機械音になる
・Vocalshifter ±8で限界 以降はただのシンセ音となる
もちろん素材にもよりますけどねだいたいこんな感じ
んで本題、自分も初投稿の2018,2月~3月はVocalshifterで人力やセリフの音程合わせをしていましたが4月以降は違うやり方にしています。
REAPERのフォルマント補正です。(有料版でしか使えない)
正直これを知ったとき世界変わりましたね。マジかよって。
このREAPERのフォルマント補正ですが(波形右クリからアイテムプロパティのピッチ操作モード)いろんな種類あるんですよね。(いつか後に詳しく解説)
その中でも素材の味をとにかく残すのがsoloist。こいつを使えば±12までは余裕ですし素材にもよりますけど+14あたりまでならなんて言ってるかわかることもあります。
自分の人力のやり方はVocalshifterで音程を均一にした50音を作っておき それをREAPERで並べてフォルマント補正使って音程合わせるって感じです。