見出し画像

コードを1行も書かず本格的な”音声SNS”を10日間で作った話

こんにちは、noteをしっかり書くのは4年前の「YouTubeチャンネルを急成長させる7つの分析&考察【決定版】」以来で、最近、久々に私の拙い人生の中でも「アドレナリンが全開になる衝撃的な体験」をしてしまったので、備忘録として”あますことなく”書き留めておきます。

何が起こったのか?

一言で言えば、「1人では絶対にできないと思っていた本格的なアプリ開発が、AIを活用することで魔法のように10日間で実現してしまった」ということです。10日間で実現した本格的な”音声SNS”アプリを触っていただければわかりますが、機能満載なこともあり、開発費用で数千万円規模の見積もりが出てきても違和感のないレベル。

それが、たった1人、10日間で、コードを1行も書かずに、本格的なSNSアプリを開発できてしまった。しかもスマホ1台で。

─── それは昨年あたりから米国シリコンバレーを中心にバズワードになりつつあるAI活用の開発手法、”Vibe Cording=バイブ・コーディング”を手探りで実践していたことが始まりでした。バイブス、つまり、なんとなくの雰囲気で開発が行える事象を捉えた手法のことで、「チャットで会話をするだけで1行もコードを書かずに開発ができる」のです。

百聞は一見にしかず、まずはこちらの動画の冒頭30秒をご覧ください。

プログラミングの開発コードも、デザイン制作も、データベース操作も、ストレージ管理も、ファイル管理も、利用規約やプライバシーポリシーといったドキュメンテーション作業も、AIに「これやっておいて」でアプリやWebサービスの開発が進んでいく世界線。少し開発に携わった人からすると耳を疑う話であることは百も承知です。が、いま現実で起こっているのです。

劇的に変化が訪れたのは2025年5月、最新AIモデルのコーディング性能向上と、アプリやWebサービスを開発するときに必要な周辺のサービスとの連動が断然スムーズになり、まさにいま、バイブスによるシステム開発の「カンブリア紀大爆発」に突入しています。

ここから全力で書いていくのは(1万字を超える長文となってしまった…)、私が2025年6月に体験した実話です。タイトルにある、コードを1行も書かず、ガチな機能満載の本格的な”音声SNS”を10日間で作り出すことができてしまったのです。しかも、スマホ1台で。

1. スマホ1台で本格的な「音声SNS」を10日間で開発

私がコードを1行も書かずスマホ1台で"音声SNS"を10日間で作り出した音声SNS『Mugen♾️Radio』は、完全招待制で習作アプリとして先日ローンチしたところです。

『Mugen∞Radio』は、AIと一緒に「声の作品」を作って聴けるプラットフォーム。みんなに伝えたいコトを、AIが台本からナレーションまで自動生成、誰でもかんたんに”声のクリエイター”になれちゃいます。作品はすぐにみんなにシェアされ、バックグラウンドで【無限】に連続再生、AI時代の新しい音声体験とコミュケーションのカタチを実現します

下記は音声SNS『Mugen♾️Radio』の実際の画面です。

画像

実際のアプリや開発の様子はこちらをご覧ください。

実装したおもな機能は以下の通りです。

①ユーザー向け再生プレイヤー
音声再生プレイヤー:再生位置を視覚的に把握できるスライダーと進捗バー
ミニ再生プレイヤー:常駐プレイヤー。ドラッグで好きな位置に配置可能
スライド式サイドメニュー:画面端からスワイプ開閉できるメニュー
検索機能&サジェストラベル:入力に応じて候補を即時表示するラベル機能

②課金・会員管理機能
月額課金(サブスクリプション):Stripe連携で定期課金モデルを実装
会員管理機能:ID/パスワードログイン、ダッシュボード、データ編集機能
独自ドメイン/SSL対応:独自ドメインの設定、HTTPS化

③データ保存・外部連携
データベース構築&SQL操作:クラウドDB連携、AIが自動でクエリ生成
外部ストレージ連携:S3アップロードや情報取得を実装&操作
音声コンテンツ情報:再生数/いいね数/閲覧数などのデータ管理

④ソーシャル機能・コンテンツ管理・ユーザーコミュニケーション
フォロー/フォロワー機能:ユーザー同士のフォロー関係を構築
プレイリスト機能:音声を好みの順にまとめるプレイリスト作成・管理機能
招待機能&クローズド:ユニーク招待コードを用いたクローズド公開を実現
通知トースト/通知件数表示:新着情報ポップアップ、未読バッジ可視化
問い合わせフォーム:ユーザーのフォーム入力から運営メールへの橋渡し

⑤バックグラウンド処理・PWA対応
バックグラウンド生成処理:ページを離れても音声生成を継続、完了後通知
動的プログレスバー:バックグラウンド処理進行状況をリアルタイム表示
PWAプッシュ通知:アプリ的インストール機能とプッシュ通知サポート

⑥AI機能
テキスト&音声AI生成:ユーザー入力に応じて台本/音声をその場で生成
ファクトチェック:生成された台本の事実確認とフィードバック内容を反映
AIチャットボット:FAQ対応や対話型サポートをリアルタイムで提供

⑦その他
利用規約/プライバシーポリシー:アプリ公開に必要なドキュメント生成
特定商取引法:有料サービス展開に必要なドキュメントを自動生成
クッキーポリシー同意:初回クッキー保存の同意取得をモーダル表示
アイコンデザイン/OGP設定:SVG形式でデザイン全素材をAIが制作

ここから、これらの機能実装=アプリ開発を通じて得られた具体的な体験を網羅的に紹介します。

AI時代の「ラジオアプリ」という着想

AIが”無限”にコンテンツを生成し続けるAIの時代ならではの新しい音声体験とはなにか。AIをフル活用することで、ユーザーは双方向に音声によるコミュニケーションを図れるとしたら新しい人と人との繋がりの形が始まる気がする、そんな疑問と期待。

ここ最近のAIの劇的進化により、”AIが音声コンテンツの台本を作成”し、”AIが音声に変換”し、”AIがファクトチェックまで行う”という新しいアプローチによって、「AIの力を借りながらAIを介した新しい人と人とのコミュニケーション」の可能性を探ることができないかと思いたったのが、このアプリを作ろうと思ったきっかけでした。
そしてなにより、バイブコーディングの可能性を探る意味でも、実際のところを実体験して学習するにうってつけのタイミングであったことも大きな理由のひとつでした。

画像

スマホとAIによる対話、10日間の開発プロセス

私は10日間で、このAI時代の「ラジオアプリ」というアイデアを、コードを1行も書かずにスマホ1台だけを用いて形にしました。本当に(!)

この10日間、私はスマホを片手に、AIとひたすらにチャットで会話していました。例えば、移動中の電車で、「ユーザー投稿機能を追加して」と指示を出せば、次の駅に着く頃には完成している。カフェで休憩しながら「デザインをもっと上品かつモダンに」と伝えれば、コーヒーを飲み終わる前には新しいUIが出来あがっている。未来にありそうだったSF的展開が、まさに2025年6月のこの10日間に起こったのです。

もちろん、すべてが順調に進んだわけではありません。いくつもの課題にも直面しましたが、それらを乗り越えるたびに、AI活用によるバイブコーディングのポテンシャルを再認識することになりました。

2. AIバイブコーディングで実現した専門性の高い機能

今回開発したアプリに実装されている機能は、従来であればPM/フロント/サーバーサイド/インフラなど専門性の高いメンバーが複数必要とされるレベルのものばかりでした。スタートアップ経営者の”端くれ”である私の感覚では、シリーズA時点で必要とされるようなレベル感の機能と品質。工数でいうとざっくり1年以上掛かるだろうプロダクトが、わずか10日で、1人で実現してしまった感じです。しかもスマホ1台で。

ちなみに、執筆者である私(パジ)は10年以上前に、個人開発者としてWebサービスを複数作ってきたことがある元エンジニアですが、より高度な開発スキルを磨くことなく経営にシフトしていった経緯があるので、非エンジニアとエンジニアの中間くらいの中途半端な開発の知識量と経験があるくらいの感じと捉えて、以降を読み進めていただければと思います

月額課金とユーザーデータベース

バイブコーディングは、まさにバイブス=雰囲気で開発できるAI時代の新しい開発手法。少し触ってみるだけで、手軽なミニアプリやインスタントな自分専用アプリが開発でてしまうイメージはすぐに掴むことができると思います。

今回、バイブコーディングのポテンシャルを最大限試すためにも、課金機能は外せない重要な試金石でした。課金モデルを持つアプリやサービスを組み立てることができれば、スケーリングするマネタイズが可能となり、いわゆる米国シリコンバレー型のスタートアップベンチャーのアプリやWebサービスを生み出す最低限の基盤が整うからです。

画像
※習作アプリのため本番確認は内部で行いつつ、現在はテストコードによる無料版になっています

結論から言えば、月額課金の仕組みは、あっけないほどにすぐに実装が完了しました。さまざま実装してきた機能の中でも比較的かんたんな方に分類されるくらいの短時間(全部で1時間以内)で。Stripeのような決済プラットフォームの登録手続きを済ませ、AIに連携の指示を出すだけで、必要な設定は自動で進められました。Stripeが有能というのもありますが、バイブコーティングでチャットの「会話」によって短時間で実現できたという事実は、開発した私さえも驚いてしまいました。

課金情報を持つためには、会員情報やコンテンツ情報など、本格的なデータベースの利用がマストです。利用したツール(一体型開発ツール「Replit」)にはデフォルトでデータベースが内蔵されており、AIがテーブル定義からSQL操作まで自動で行います。専門知識がなくてもデータ管理&操作が可能となっていたのは、まさにバイブスを感じる劇的な体験でした。

画像

AIチャットボットを自作

ユーザーサポートのために、AIチャットボットをアプリ内に実装しました。GoogleのAI=GeminiのAPIを活用し、サイト内の情報に基づきAIが自動で回答します。問い合わせフォームの前にAIチャットボットを配置する設計も容易に実現できました。

画像
※習作アプリのためプレミアム会員機能は現在はテストコードによる無料版になっています

外部ストレージ連携

音声ファイルや画像ファイルなど、大量のメディアを高速で配信するには、Amazon S3のような外部ストレージサービスとの連携が不可欠です。AIに依頼することで基本的な連携はサクッと実装できたのですが、サービス契約や細かな権限設定は手動で行う必要があり(経験者はよくご存知かと思いますが、最近のS3は設定が細かくかなり難解に感じました)、この点では「雰囲気でできる」という感覚ではさすがに難しく、バイブス感は薄れる部分でした。とはいえ、AIとの質問を繰り返す「会話」によって数時間ほどで突破できました。

ログイン周りと管理機能

ユーザー登録、ログイン、パスワード管理など、基本的な会員システムも会話を通じてコードを書かずともAIが自動で構築してくれました。Googleログインなどのソーシャルログイン連携も容易で、慣れれば非エンジニアでも10分もあれば設定可能です。

画像

ID・パスワードで管理者だけが入室できる管理機能もAIが自動生成しました。ユーザー情報やコンテンツの管理が行えます。セキュリティを確保しつつ、会員情報や音声データの確認がかんたんに行えます。

画像

PWAとプッシュ通知の実装

Webサービスでありながら、スマートフォンアプリのように動作するPWA(プログレッシブウェブアプリ)の機能は、”唯一”といってもいいかもしれないほどの苦労をしながら実装した機能でした。

画像

Reactによる静的配信方式を採用していますが、これはAIとの会話の中で推奨された方式でした。ただ、正常に動いていたと思っていても頻繁にビルドに失敗したり、想定していないキャッシュが残っていたりと、PWAが組み込まれたあとの開発は一時的にかなり難航しました。

まだブラウザ毎のクセによるデザイン面の崩れがあるので、積極的な公開&誘導はしていませんが、基本的な機能は実装済みです。プッシュ通知も可能で、これはAIに指示するだけで、ほとんど手間なく実現できました。

画像

本番公開と独自ドメイン

本番公開にあたり、独自ドメインの設定や、安全な通信のためのSSL設定も、チャットで指示するだけで瞬時に完了し、複雑なサーバー設定は不要でした。これは、このあと詳しく書く、バイブコーティングを行うための一体型開発ツール「Replit」が有用だったことも大きな要因です。

画像

ここに挙げたのはほんの一例ですが、これらすべての機能が、私が会話による指示のみで、AIがコードを生成し、本番へデプロイすることで実現したものです。

3. デザインも言葉で生まれる

機能面だけでなく、デザイン面でもバイブコーディングは有効です。むしろエンジニアにとっては、AIによってデザインスキルが急に備わる無敵状態になった人も続出していそうです。

今回開発したアプリでは、初めて利用したユーザーを迷わせないデザインを重視し、モダンで洗練されたシンプルな画面を目指しました。開発を進めていく途中でデザインの統一性を失ったときでも、「他のページも統一感を持たせて」という具合で、難なくモダンデザインを維持することができます。これらもすべて、私がデザインツールを直接操作することなく、AIとの会話のみで実現しちゃうのです。デザイナーでもない私が、ここまでのUI&UXを作り出せてしまった点に、私自身もビックリです。(シンプルな見た目なので分かりづらいかもしれませんが、先行招待者でUI/UXで迷う人がいなかったことは、この短期間に作られたアプリとしては特筆に値すると思います)。

画像

直感的なユーザーインターフェース

音声SNSにとってメイン機能のひとつである音声再生の進捗を示すシークバーは、直感的で使いやすいデザインに仕上がりました。実際のところ、特に具体的指示を出すことなく「音声再生プレイヤーを作って」で一発出力でした。一般的な再生プレイヤーと同じく、再生位置の調整もスムーズに行えます。

画像

YouTubeアプリなどでも実装されていて使い勝手の良い機能である、再生中の音声を画面下部に表示する”ミニ再生プレイヤー”は、おそらく私がバイブコーティングで開発していなければ、真っ先に諦めていたような、難易度高めの機能のひとつです。

音声を流しながら、他のページに移動しても再生が途切れないようにできると、ユーザー体験は格段に増しますが、AI活用なしだった場合、私が実装できた自信はありません。さらに、このミニプレイヤーを画面上の任意の場所にドラッグして移動できる機能も、AIへの簡単な指示のみの一発出力だったのにはとくに感激しました。

画像

音声の読み込みやAI生成の進捗を示すプログレスバーは、定番中の定番ですが、ミニマムで必要な情報のみがきれいに詰め込まれたシンプル・イズ・ベストなデザインとなっています。

画面の左端からスライドして表示されるサイドメニューは、多くのWebサービスで採用されている、使い勝手の良いデザインです。AIと会話するだけで、コンテンツに合わせた柔軟な表示が可能なものが生成されました。

画像

アプリやWebサービスを開発するときに、避けては通れないけども、地味に煩雑なタスクとして誰もが消極的になりがちな部分ですが、ここはまさにバイブスでかんたんに突破できたことを強調しておきたいです。

画像

ユーザーが音声を投稿する際の、長時間のAI音声生成やデータ処理など、ユーザーが待つことなく裏側で処理を進めるバックグラウンド処理も実現できました。

リアルタイムなインタラクション

検索窓にキーワードを入力すると、リアルタイムで関連性の高い検索候補がサジェスト表示される機能、最近では当たり前のような体験ですが、これを非エンジニアが実装しようと思うとまったくの手探り状態になりそうですが、そういった心配は杞憂に終わりました。

画像

ログインや会員登録の際に、画面の中央にポップアップ表示されるモーダルウィンドウは、デザインの一貫性を保ちつつ、ユーザーに集中を促すもので、ユーザーの利便性を高める上で有効です。当たり前のスマートな体験をチャットを通じたAIとの「会話」でさくさく制作できてしまうのです。

画像

操作完了時やエラー発生時に、画面の上部に短時間表示される通知メッセージ(トースト)も、AIが自ら考え、特に指示を与えないケースでも、必要な場面において、適切なタイミングで、勝手に備わっていたことも多々ありました。しかも、特に指示することもなく、周りのテイストにあわせた洗練されたデザインで実装することができました。

画像

さらに、XなどSNSでつい癖になってしまう、Notifications。新着通知がある場合に、アイコンの上に数字で通知件数が表示される機能も実装。AIが最適な表示方法を提案してくれたので、私は選択肢で「1と3を実装して」と伝えるだけでした。

画像
画像

機能面でも触れたAIチャットボットは、デザイン面でもアプリに自然に溶け込んでいます。ユーザーがストレスなくAIと対話できるよう、チャットUIも洗練されたものが生成されました。

これらのデザイン要素は、私がチャットでAIに指示を出すだけで実現しました。細かな色指定や配置、動きについても、AIは的確に私の意図を理解し、具現化してくれました。

4. バイブコーディングの便利ツール「Replit」とは

バイブコーディングによって、スマホ1台で、1人で、10日間で本格的な”音声SNS”を可能にした理由のひとつが、一体型開発ツール「Replit」です。私のお気に入りの理由はスマホアプリの完成度です。移動が多い私にとってデスクトップだけでなくスマホ環境での「バイブス」は重要だったのです。3年前ほどから私が毎朝・毎夕1日2回配信している『裏・パジちゃんねる』という音声配信(SpotifyVoicy)で2025年3月に初めて紹介して以来、このツールはかなりの進化を遂げています。

「Replit」の便利なところ

Replit」は、クラウドを通じて利用できるAIバイブコーディングが備わった開発環境です。直感的に使える操作性の良さから、プログラミング学習から本格的なアプリ開発まで幅広く使われています。その最大の特長は、AIによるコード生成・修正機能が非常に強力なこと、最初からデータベースやバージョン管理の仕組みが組み込まれ、そしてスマホアプリだけで開発環境から本番公開へのデプロイまでこのツール内で完結できると”一体型”な利便性です。

画像

Replit」は、ChatGPTやClaudeなどの最新AIを内蔵しています。ユーザーはチャット形式でAIに指示を出すだけで、複雑なプログラミング、データベース操作、デザイン調整まですべてAIに任せられます。メニュー全般が英語である点を差し引いても、直感的で操作性の良いアプリとなっていて、移動中やカフェで、スマホを片手にチャットを打ち込むだけで、常に開発を停滞することなく進み続けるのです。(ときには横断歩道の待ち時間やトイレの中でも...。)

数ヶ月前はClaude 3.7 Sonnetを内蔵していましたが、現在のClaude 4.0が実装された「Replit」は、その性能が大きく向上。以前は難易度が高いと感じていた中規模レベルのアプリ開発も、かなりスムーズに進められるようになりました。仮に非エンジニアであっても、開発するアプリやWebサービスによっては、2025年6月現在では、プロフェッショナルと遜色ないかたちで、進められると確信するレベルです。

「Replit」が提供する一体型の開発環境

Replit」がAIバイブコーディングを効率的に行うための具体的な機能は多岐にわたります。パソコンがなくても、スマホアプリだけで本格的な開発からアプリ公開まで完結します。場所を選ばずにアイデアを形にできる柔軟性があります。

プロジェクトを開始すると、自動的にデータベース(デフォルトはPostgreSQL)がセットアップされ、初期設定の手間なくデータの保存や管理を始められます。データベースのルール設定やデータ操作も、チャットでAIに指示するだけで実行できます。データベースを操作するための言語=SQLなど専門知識がなくても、自然な言葉だけでデータベースを操作できます。

画像

開発の変更履歴が自動的に記録されるため、複雑な操作なしに、いつどんな変更をしたかを確認できます。AIが適切なタイミングで自動的に変更を記録するため、もし問題が発生しても、すぐに過去の状態に戻す=ロールバックすることができます。チャットの履歴と連動しているので、このロールバックの活用は非エンジニアにとって最初のつまづきポイントとなるところをスマートなUX/UXで解決しています。

画像
画面中央の「Rollback」でその時点のファイルやデータベース状態にすぐに元に戻せる

Replit」は開発中の作業が、実際に公開しているアプリに影響を与えないように、環境がきちんと分かれています。開発が完了したら、チャットでAIに「公開して」と指示するだけで、サービスを世に出すことができます。開発中に疑問や問題が発生した場合、ツール内のエージェントAIがすぐに回答してくれます。

自分だけのアドレス(独自ドメイン)の設定も、「Replit」内からチャットで瞬時に完了します。(私はまだ試せていないのですが)「Expo」というツールを使うことで、Webサービスだけでなく、ネイティブのスマホアプリ(iOS / Android)としても出力できるため、幅広いユーザーに届けられます。

APIキーなどの重要な情報は、「Replit」の安全なシステム内で管理されます。これにより、情報漏えいのリスクが低減されます。開発中のコードに対して、AIが自動的にセキュリティチェックを行います。潜在的な脆弱性を早期に発見し、安全なアプリ構築に役立ちます。

画像

1億ドル突破が示すAI開発ツールの価値

Replit」の技術的な進化は事業成長にも表れています。先日、「Replit」のARR(年間経常収益)が1億ドル(約158億円)を突破したというニュースがありました。これは、AIが開発支援を行ってくれる開発プラットフォームが、市場で急速に受け入れられていることを示しています。

多くの企業や個人開発者が、「Replit」などのバイブコーディングの力を借りて、これまでにないスピードと効率でプロダクトを開発しています。

GoogleのGeminiやOpenAIのChatGPT、AnthropicのClaudeなども「Replit」のような一体型の開発ツールの方向性に発展してきており、おそらくは大手プラットフォームが今後さらに進化し、使いやすくなっていくことで、AIによるバイブコーディングの可能性を広げてくれるでしょう。

5. 実際にやってみてわかった”光と影”

AIバイブコーディングは、アプリ開発において大きな可能性を秘めています。しかし、現段階では開発におけるすべての課題を解決できるわけではありません。私が今回の開発を通じて感じた、またもうひとつの真実です。バイブコーディングの「得意なこと」と「まだ難しいこと」を実体験ベースで率直にお伝えします。

AIバイブコーディングの圧倒的な強み

まずは、AIバイブコーディングの強みとなる点からです。これは非エンジニアを含むアプリやWebサービスを作る人たちにとって大きなパラダイムシフトが起こってしまったと断定してもいいと思います。ここまで見てきたように、「(私も含む)この難易度の高いアプリやWebサービスは実現できない」人でも、「AIとチャットをしているだけで魔法のように実現できてしまう」ようになってしまっているからです。

少し前、2025年3月くらいのAIモデルでは、指示の仕方が重要で、曖昧だと期待通りの結果にならないことが多く、まだ実用的と言い切れない状態でした。しかし、そう思っていたのもつかの間、最新のAIモデル、特にClaude 4.0の登場により、AIの指示理解能力は大きく向上しました。今ではファジーな言葉で「こうしたい」と伝えるだけで、(たいていの人間よりも)意図を正確に理解し、反映してくれるようになりました(この進化のスピードがこの先も続いていくとしたら。誰もがかんたんに、もっと高難易度のアプリやWebサービスが作れていくかもしれない、ここ最近めざましいAIの発展は、私たちにそんな現実を突きつけているのだと思います)。

ニュアンスを理解する洗練されたコミュニケーション

さらに、プロンプトの「言葉のニュアンス」まで理解するようになりました。「もう少し洗練されたデザインに」「よりシンプルな動きに」といった抽象的な指示にも、AIは応えてくれます。イメージさえ湧いて、それを言語化できれば、より理想に近いプロダクトを生成できるようになりました。

ただ、「コードを一切書かない」からといって、開発に必要な知識が不要になるわけではありません。むしろ、サービスの「最終的なイメージ」や「ユーザーの利用体験」といった、プログラミング以外の知識や経験が、本格的なアプリやWebサービスを作っていく途中段階では重要になっていく感覚がありました。AIはツールであり、その使い方を左右するのは人間の知見や経験、もっと言えば”センス”です。

開発効率と柔軟性

開発途中で要件が追加されたり、変更になったりすることはよくあります。AIバイブコーディングでは、チャットで「これに加えて、この機能も追加して」「この部分を変更して」と指示するだけで、AIが柔軟に対応します。これにより、従来の開発で発生しがちだった手戻りが減り、開発全体の効率が向上しました。

「作りたいもの」の完成イメージが明確であればあるほど、AIバイブコーディングは強力なツールとなります。AIは、そのイメージを実現するための最適なコードやデザインを生成する「手段」を提供してくれるだけの存在です(いまのところは...)。

開発した音声SNS『Mugen♾️Radio』では、当初、私が実装したいと考えた機能は、ほとんどすべてが実現できてしまいました。月額課金から高度なユーザーインターフェース、PWA=Webアプリとしての通知機能まで、少し前までなら非エンジニアではほぼ不可能、キャリアを積んだ専門性の高いメンバーたちでも、全体の工数は1年以上掛かりそうな難しい機能群が、チャットでの指示だけで10日間で形になったのです。

まだ人間の専門性が必要な領域

ここまで読んで、まだ”眉唾な方”は、おそらくこのパートが一番気になるところではないでしょうか。AIバイブコーディングの「影」の部分、つまり私が実際に直面した「課題」についてお伝えします。これらは現時点におけるAIバイブコーディングの限界点とも言えるでしょう。

外部ストレージの権限や管理

本格的なアプリやWebサービスを運用しようとすると、例えばたいていは大量のデータを扱う必要があり、Amazon S3などの外部ストレージサービスとの連携が不可欠です。AIによるサポートで連携自体は可能ですが、実際のサービス契約の手続きや、細かな権限設定などは、(いまのところ当たり前ですが)人間が手動で行う必要があります。この点では、AIに「やっておいて」で済むという感覚が薄れる部分でした(ただ、この手続きもおそらく「AIブラウザ」のようなAIエージェントが自由に別サービスにログインして操作をするような世界線にもうすぐ突入すると、人間が行わなくてはいけない煩雑なタスクはまたひとつ解消されそうです)。

データベース設計・管理の専門性

また、今回開発したような本格的なSNSでは、会員データベースの構築や操作がマストとなります。AIはデータベースの管理や操作を助けてくれますが、より高度なデータ構造の設計や、外部の本格的なデータベースとの連携となると、さらに難易度が上がってきます。特に本番データベースの安全な保全だったり、開発環境・ステージング環境とのデータの整合性や、複数の操作を同時に行う際の管理など、概念や機能面についての深い理解がなければAIの出力だけでは対応しきれない場面もあり、10日間の中の短期間ではありましたが、一定の学習を余儀なくされました。

運用体制とメンテナンスの課題

開発においてソースコードの変更履歴を管理することは重要です。私が利用した一体型の開発ツールにはもともとバージョン管理機能が備わっていましたが、定番のGitHubのような外部サービスと連携しようとすると、非エンジニアにとっては概念理解から始まり、適切なタイミングで一定の操作が必要となり、バイブス感が失われることになります。

開発環境と公開環境の分離も開発に慣れていない場合に、初手から運用を見据えた開発できるケースは稀です。サービス公開後に発生するデータの問題や、予期せぬ不具合への対応は、どんどん作っていけるノリノリのバイブコーディングだけでは困難な場面が多くありました。特に、システム全体を安定稼働するための保守作業は、今のところは、まだ人間の専門知識と経験が不可欠のように感じます。

データベース保全とバックアップ戦略

本格的なアプリを運用していく場合、データベースの本番データをいかに安全に維持するかは極めて重要です。バックアップや複製、災害対策など、データベースの維持には専門的な知識と設定が必要で、これも現時点では、AIの指示だけでは対応しきれない領域と考えます。アプリを長期的に安定運用するためには、この概念の理解と、適切な専門サービスの活用が重要だと感じました。

セキュリティ面の可能性と限界

一方でセキュリティ面は、備え付けのセキュリティスキャン機能なども充実してきており、一定のレベル感までのサービスでは、非エンジニアであっても自分で開発を行うよりはAIの手を借りたほうが安全になるのではと考えるようになりました。

画像

ただ、よりサービスに経済的価値が紐づいてくると、よりセキュアな設計や開発が求められてくるはずで、ここにも限界を感じる場面が多々出てくると予想します。

現状、AIは「何をどう作るか」という指示に対しては非常に高い能力を発揮しますが、「作ったものをどう運用し、どう維持していくか」という領域に関しては、まだ人間の経験と知見が欲しくなるフェーズにあると考えます。しかし、これらの課題も、AIの進化とともに解決されていく可能性を秘めていると、私は考えています。

バイブコーティングの具体例

ここまで書いてきたように、今後のアプリやWebサービスの開発は、AIの発展とともに、人と人とがチャットで会話する自然言語でのやり取りで、十分に社会的価値のあるサービスやプロダクトが作れるようになる可能性が広がってきており、この進化はまだ始まったばかりと考えます。

音声SNS『Mugen♾️Radio』で、具体的にどのようなAIバイブコーディングで、こうした機能を実現してきたかの具体例を動画で紹介します。動画をご覧になれば、「これなら私でもできそう」と思えるくらい、(モックアップレベルだけでなく)本格的なアプリを作ること自体も、会話の流れでできあがっていくので、映画のワンシーンでよくある黒い画面に難しい顔をしながら”にらめっこ”は、今後は機会が減っていくのではないでしょうか。

『Mugen♾️Radio』のシステム構成

『Mugen♾️Radio』におけるシステム構成(外部サービス利用やAPI連携状況)を以下にまとめました。このあたりのサービス選定や手続きなども積極的にAIにアドバイスを受けることでスムーズに進みました。

Google Gemini API
用途: AI音声コンテンツ生成・ファクトチェック
モデル: gemini-1.5-pro, gemini-2.0-flash
機能: 台本生成、ファクトチェック、カテゴリ自動分類、台本の再生成・改善、AIチャットボットなど

Google OAuth 2.0
用途: ユーザー認証システム
機能: Googleアカウントログイン、セッション管理、プロフィール情報取得

Google Cloud Text-to-Speech
用途: 音声生成(Gemini経由)、対談形式の音声ファイル作成、複数話者対応、自然な日本語音声合成

Stripe API
用途: 決済処理・プレミアム機能
機能:サブスクリプション管理、決済処理、プレミアムユーザー管理

AWS S3
用途: ファイルストレージ
機能: 音声ファイル保存、メディアファイル管理、ストリーミング配信

Web Push API(VAPID)
用途: プッシュ通知システム
機能: リアルタイム通知配信、デバイス間同期、PWA通知対応

SMTP(Gmail統合)
用途: メール通知
機能: ユーザー通知、システム通知、問い合わせ連携

PostgreSQL
用途: メインデータベース
機能: ユーザーデータ管理、音声コンテンツ管理、セッション管理

API設定状況
現在のモード: テスト環境(Stripe: テストモード)
認証方式: OAuth 2.0, セッションベース
ファイル保存: S3統合済み
PWA対応: 全API対応済み

6. バイブコーディングが描く未来

今回の経験から、AIが社会に与える影響についていくつかの展望が見えてきました。これは、私たちの仕事のあり方や、ビジネスの進め方、そして社会そのものを変える”新たな息吹”を感じています。

開発の民主化がもたらす変革

プログラミング知識がない人でも、アプリやWebサービスを開発できるようになることで、市場にはこれまでになかったような新しいサービスが増えていくでしょう。アイデアさえあれば誰でも形にできる時代が到来し、新しいものが生まれるスピードも加速します。

経験を多く積んだエンジニアは、バイブコーディングを活用することで、デザインスキルの獲得も含めて、その生産性を大きく高めています。この潮流は昨年、2024年からますます加速してきています。AIに定型的な作業やコーディングを任せ、彼らはより複雑なシステム設計や、AIではまだ解決が難しい高度な課題に集中できるようになります。経験豊かなエンジニアがAIを活用することで、特に上流工程におけるその能力はさらに発揮されるでしょう。

AIがコードだけでなく、デザインや文章、音声コンテンツまで生成できるようになることで、高品質なコンテンツが豊富に提供されるようになります。今回開発したアプリが目指す世界のように、多様なジャンルで、専門的な質のコンテンツが自動で生まれ、ユーザーはこれまで以上の情報の渦の中で、常に真新しい情報やエンターテイメントに触れられる時代がやってきます。

価値の再定義が始まる

誰もがかんたんにサービスを開発できるようになるため、機能や品質だけでは差別化が難しくなります。そこで重要になるのが、「そのサービスならではの独自性」や「ブランド力」です。どのような体験を提供し、どのような価値観を伝えるかが、ユーザーに選ばれる決定的な要因となることは明白です。

将来的には、人間が直接指示しなくても、AI自身が市場のニーズを分析し、自律的にサービスを開発・改善し、人気を博すケースも増えるかもしれません。AIが創造的な発想力やビジネス戦略を持つようになれば、新しい形の「AI起業家」が生まれる可能性も考えられます。

かんたんに作れるようになったからこそ、「あえて手間をかけて作り込む」「時間と情熱を注ぎ込む」という行為自体が、真の価値を持つようになります。AIが大量生産するコンテンツの中で、人間が丹念に作り上げたものは、より”特別なもの”として評価されるかもしれません(少なくともビフォアAI時代が長い人々にとっては...)。

AIが大量のコードを生成し、サービスが乱立する中で、「安心安全」なプラットフォームの重要性はこれまで以上に高まります。セキュリティ、プライバシー保護、そして倫理的な基準の遵守など、ユーザーが安心してサービスを利用できる環境を提供するプラットフォームが、ますます加速的に集権的な世界経済を牽引していくことは確定的な未来です。

「ひとりユニコーン」の誕生は時間の問題

実践から得られた経験から、バイブコーディングは、まるで「積み木」を少しずつ積み上げていくような感覚に近いものでした。

数ヶ月前は3つの「積み木」を組み上げたら、4つ目を乗せようとすると、なぜか3つの「積み木」が崩れてしまうことが頻発していました。ところが、いまでは音声SNS『Mugen♾️Radio』の実践でも書いてきたように、20以上の「積み木」を組み上げても、まだまだ安定感がある状態です。

こうした変化は、プログラミングの壁に阻まれていた非エンジニアでも、コードを一切書かずに、より社会的な価値のあるサービスを迅速に実現できるようになることでしょう。

この進化発展の速度は、AI自身がより高度なAIを開発するためのコーディングや学習データを作成しているためで、今後ますます指数関数的にAIが発展していく可能性をおおいに秘めています。こうした技術革新のビッグウエーブに波乗りすることで、かねてから囁かれている「ひとりユニコーン」の前人未踏のスタートアップが登場するのも時間の問題に思えます。

こうした事象はまだ多くの人に認識されていません。しかし、だからこそ今、バイブコーディングを学ぶことは、10年に一度にあるかないかビックバン、そのアービトラージを回収する大きなチャンスの時期ともいえます。

最後に

「コードを1行も書かずに、スマホ1台で、本格的なWebサービスやアプリが数日で形になる」。

電車の中でふと思いついたアイデアが、次の駅に着く前にプロトタイプとして動いている。飲み屋で友人と話していた「こんなサービスがあったらいいね」という何気ない会話が、お店を出る頃には実際のアプリとして形になっている。そんな体験は、もう現実となっているのです。

さらに近い未来には、このバイブコーディングの指示さえも、AIが自ら行えるようになり、SNSで何かを呟けば、たちまちその問題を解決するようなアプリが本番にデプロイされてしまう、そんなSF的な劇的展開が待っているかもしれません、AGI到来が近いと囁かれ、期待を常に上回る速度で指数関数的な発展し続けるAIに、今夜もワクワクして8時間しか眠れません。

おまけ:この記事を見て、私が作ったAI時代の音声SNS『Mugen♾️Radio』に触ってみたい方がいたら、ぜひXで「 #MugenRadio 」のハッシュタグをつけてこの記事をシェアをください。私のXアカウントから招待コードをDMでお届けします

AI時代の音声SNS『Mugen♾️Radio』
https://mugen.bar/
※2025年6月現在、参加は招待制となっています

この記事の執筆者はだれ?

安宅基(Hajime Ataka) Tokyo Otaku Mode共同創業者・取締役副社長
ゲームの攻略本ライターとして働いたのち、フリーのエンジニアなどで20〜30ほどのWebサービスの企画・開発を行う。2009年11月にTwitterを活用したリアルタイムQ&Aサービスを開発。2011年11月に同サービスを法人化し、12月にバイアウト。その後、Tokyo Otaku Mode創業に参画し、EC事業など新規事業開発及び事業全般の統括を行う。2017年年末より複数のブロックチェーン・プロジェクトの立ち上げやグロースに携わり、近年はAI活用などの実践を通じて、日本が世界に誇るコンテンツとAIやブロックチェーンなど先端テクノロジーの融合を目指す

いいなと思ったら応援しよう!

この記事が参加している募集

ピックアップされています

AI活用事例 記事まとめ

  • 1,209本

コメント

ログイン または 会員登録 するとコメントできます。
note会員1000万人突破記念 1000万ポイントみんなで山分け祭 エントリー7/8(火)まで
コードを1行も書かず本格的な”音声SNS”を10日間で作った話|パジ
word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word

mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1