ろてじん

友人にOpalを教えてたんだが、初期テンプレとして置いてあった「Learning with YouTube」が喜ばれた。改変は最終出力を日本語にしただけ。副産物としてわかったのは、動画も全てGemini 2.5 Flashで文字起こしされるのだが、YouTube標準「文字起こしを表示」より断然クオリティ高いのね。

54K

ろてじん

@rotejin

Apr 24, 2025

AIに自動で完成度の高い楽曲を作成させた後、それをステム分解、さらにはMIDIデータとして取り出すことができるとの事。 SunoやUdioの弱点・課題を解決する画期的AI音源解析ツール、Hit’n’Mix RipX DAWの破壊力

SunoやUdioの弱点・課題を解決する画期的AI音源解析ツール、Hit’n’Mix RipX DAWの破壊力

なんか喋る可愛いAIキャラがPC上に居れば一気にAI活用が広がる気がするんだけどな。特に日本人はキャラクター大好きだし。チャット型にキャラが居て口がパクパクしてるだけでも良いんよ。

MiniMaxって前からこんな自然な感じで日本語のTTSって出来たっけか。艶っぽい声でいい感じ。調整は話速だけ1.2にしただけです。

0:02 / 0:50

これやっぱりAIプログラミングはステージ変わったと思う。Claude 3.5 Sonnet は意図を汲み取る能力が高すぎて想像以上の機能まで提案してくるんだが。明らかに自分の実力は上がって無いが作れるプログラムのグレードが上がってる。1週間くらいかかる予定だったのに1日で出来た。ナニコレ。

画像生成→音楽生成→動画生成（リップシンク）でこんな自然に歌ってくれるんだ。前にリップシンクさせた時は全然な感じだったのに。

試したい人用に何のツールを使ったかメモφ(｀д´)ﾒﾓﾒﾓ... ImageFXで画像生成、Sunoで音楽生成（ボーカルを分離しておく）Hedra Studioに画像と分離したボーカル音源をアップロード（プロンプトはShe's singing sadly.）出来た動画とオケ入り音源を合わせて完成。

Quote

ろてじん

@rotejin

Apr 29, 2025

画像生成→音楽生成→動画生成（リップシンク）でこんな自然に歌ってくれるんだ。前にリップシンクさせた時は全然な感じだったのに。

「生成AIはズルだ」と言う視点が自分の中に全く無かったので、そう言う感覚の人も居るのかと目から鱗だった。

GPT-4oのAPIでマイAIキャラを30分ずっと話をさせてこれくらいの値段でした。速度重視でGPT-3.5turboを使っていたのですが今後はGPT-4oの一択。もうGPT-3.5を使う事は無いかもしれん。

AIが3人で色々とお話を進めてくれる。可愛くてずっと見てしまう（音声合成は調整中なのでこの動画は音は無し）プログラム部分は Claude 3.5 Sonnet にやって欲しい事を指示すれば実装してくれる。夏休みの工作として皆にも作って欲しいなぁと思う。私はコード書けないのでコピペしかしてないし。

Quote

ろてじん

@rotejin

Jul 6, 2024

AIキャラ1人でのリアルタイム配信は一般的。2人は対談や解説動画ならありえる。なら3人以上で…と言う発想で今日は3人まで。明日は6人まで挑戦してみる。もしAITuber48人が集まったらAIT48になるのかAGI48なのか…LLM48とか？

AITuberを人間っぽく自然に動くように設定する【キャラクターモーション制作】備忘録｜ろてじん #note #AIとやってみた note.com/gpt_x/n/n659e4

Suno v5 これまた凄い進化したなあ。殆どハズレの出ないガチャと言う感じになってる。折角なので現代的なロックが出力されるプロンプトを置いておきます。 Starts with staccato, overdriven guitar riffs interlocking with a nimble, complex bassline. Drums are crisp, weaving abrupt time

ちなみに今日のライブ配信のAPI料金はこんなものでした。めちゃ安い。Gemini 1.5 Flash は GPT-4-mini の更に半額らしいので試してみる予定。今は安くて速いモデルを多段掛けするのがアツいです。

お絵描きAIキャラの進捗。Python+OpenCVの顔検出でイラストの顔の周辺から描画が出来るようになった。イラストの内容をLLMに投げて、描いている時間はそれに関連する内容をAIキャラにお話してもらうテスト。

一言、言っておくと…私は仕事依頼として個人や企業のボイスモデルも作っていますが、どのモデルも当たり前に声優さんと契約して、許諾を頂きキャラに沿ったコーパス収録をして作ってます。それが普通よ。

臨場感あるポージングをベースに画像生成AIにイラストを作成させることが出来るとの事。無料で3Dキャラクターを使って簡単にいろいろなポーズを作ってお絵かきの参考にできる「JustSketchMe」 - GIGAZINE

gigazine.net

無料で3Dキャラクターを使って簡単にいろいろなポーズを作ってお絵かきの参考にできる「JustSketchMe」

お絵描きをする際、ついつい自分の好きなものばかり描いてしまうというのはあるあるです。そのため「顔は上手く描けるのに、躍動感のあるポージングが苦手」という絵描きさんは少なくありません。そんな人向けのツールが「JustSketchMe」で、生き生きとしたポージングを3Dキャラクターで手軽に再現できます。

3/22の配信時のシステムプロンプトをnoteに載せましたので、こんな感じなんだ～と見てもらえると嬉しいです。 AIキャラの人格形成～AITuberのシステムプロンプト公開 note.com/rotejin/n/ne47

Quote

ろてじん

@rotejin

Mar 22, 2025

30分くらいAITuberのコメント部分のシステムテストしてます。よろしければコメントしてみて下さい。 youtube.com/live/Jx6zzEpYI

AIキャラをより“自然に”感じさせるために考えていること～AITuberの課題～｜ろてじん #note

AIキャラをより“自然に”感じさせるために考えていること～AITuberの課題～｜ろてじん

知識のない人でもプロンプトを入れるだけでアプリを作れるAI「Replit Agent」をReplitがリリース - GIGAZINE

gigazine.net

知識のない人でもプロンプトを入れるだけでアプリを作れるAI「Replit Agent」をReplitがリリース

開発環境をセットアップし、パッケージをインストールし、DBを構成するなど、アプリケーションに開発に必要なセットアップをAIに代行させることができる「Replit Agent」がリリースされました。プロンプトを入れるだけで、アプリケーションをゼロから作成することが可能になります。

8秒の音声からAITuber用オリジナルキャラボイスを作る【モデルデータ制作】備忘録（2025年3月）GPT-SoVITS操作方法｜ろてじん #note

8秒の音声からAITuber用オリジナルキャラボイスを作る【モデルデータ制作】備忘録（2025年3月）GPT-SoVITS操作方法｜ろてじん

AivisSpeechで使うためStyle-Bert-VITS2モデルをONNXに変換したく（SBV2 のdevブランチが必要らしい）convert_onnx.pyで変換との事。何となく雰囲気で進めて行ったら出来た。AIに聞けば何とかなるもんだ。私の長老風に演技したボイスモデルをどうぞ（笑）

8秒の音声からAITuber用オリジナルキャラボイスを作る【モデルデータ制作】備忘録｜ろてじん #note #AIとやってみた note.com/gpt_x/n/n51fac

SunoにAPIってあったのね。API使わなくても空いてるPCなんかでPyAutoGUIで歌詞やジャンルを自動生成。自動ブラウザ操作させておけばSunoをずっとポチポチと自分好みのオリジナル曲をずっと作ってくれるのよね。たまにカッコ良い曲があったらメモしておく感じ。

Style-Bert-VITS2の質を更に上げるために録音・学習・改善と何度も試行錯誤していたのだが一先ずの最適解が見つかった感じ。工夫した点などnoteにまとめる予定。YouTubeでイケボの出し方を見て発声したので3割増しでイケボになった気がする。マージ無し。自分の声のみ。結論：最初の録り音が全て。

10K