(cache)Xユーザーの🦙🦙藤原＠かみら🦙(アルパカ社長)さん: 「昼間話してた、まあまあ大きなプロジェクトのひとつ、もうちょっとで完成するよ！(｀･ω･´) 色味とかはまだ変えるけど仕様から実装まで半年以上掛かった... どっかのスペースの音声解析を続けた結果(笑)、誰でも簡単に使える音声録音メモ(AI自動文字起こし) & 自動要約 https://t.co/6Ienutgdcj」 / X

昼間話してた、まあまあ大きなプロジェクトのひとつ、もうちょっとで完成するよ！(｀･ω･´) 色味とかはまだ変えるけど仕様から実装まで半年以上掛かった... どっかのスペースの音声解析を続けた結果(笑)、誰でも簡単に使える音声録音メモ(AI自動文字起こし) & 自動要約機能付きのメモ帳アプリにしてみましたサーバは全部自社で持ってるんで、AWSやGCP等の外資企業の影響は受けないっす(単純に向こうは単価が高い) まだブラウザ実装だけど、その内にReact NativeとかXamarinでアプリ化する予定。録音データはスマホorPCに残るんでバックアップは自由度を高くしました。欠点は、煩い場所で使うと文字起こしの精度がマイク性能に依存する事。滑舌悪い場合(例 : ｲｯﾃﾒﾛﾝ → 言ってメロン)になる事、かな有料課金はなるべく抑えるつもり。ただ、どうしても一部外部のLLMに頼らざるを得ないのと、音声データはトラフィック的に重い部類なので、そこに課金要素がでちゃうのです(´・ω・`) ウチに100億とかあれば自社で借りてるデータセンタに大量にGPUぶち込んだノードを組むんですけれどねぇ... nvidia.com/ja-jp/data-cen NVIDIA GB200 NVL72 例えばコレなんて単純に4.5億って言われてます

最終更新編集履歴を開きます午前1:41 · 2024年10月11日

2.8万

件の表示

会話