昼間話してた、まあまあ大きなプロジェクトのひとつ、もうちょっとで完成するよ!(`・ω・´)
色味とかはまだ変えるけど仕様から実装まで半年以上掛かった...
どっかのスペースの音声解析を続けた結果(笑)、誰でも簡単に使える音声録音メモ(AI自動文字起こし) & 自動要約 機能付きのメモ帳アプリにしてみました
サーバは全部自社で持ってるんで、AWSやGCP等の外資企業の影響は受けないっす(単純に向こうは単価が高い)
まだブラウザ実装だけど、その内にReact NativeとかXamarinでアプリ化する予定。録音データはスマホorPCに残るんでバックアップは自由度を高くしました。
欠点は、煩い場所で使うと文字起こしの精度がマイク性能に依存する事。滑舌悪い場合(例 : イッテメロン → 言ってメロン)になる事、かな
有料課金はなるべく抑えるつもり。ただ、どうしても一部外部のLLMに頼らざるを得ないのと、音声データはトラフィック的に重い部類なので、そこに課金要素がでちゃうのです(´・ω・`)
ウチに100億とかあれば自社で借りてるデータセンタに大量にGPUぶち込んだノードを組むんですけれどねぇ...
nvidia.com/ja-jp/data-cen
NVIDIA GB200 NVL72
例えばコレなんて単純に4.5億って言われてます
2.8万
件の表示