goto

Metaが公開した巨大言語モデルであるLLaMAベースのモデルをChatGPTと同じRLHFでより効率的に学習できる「ChatLLaMA」のが早くもgithubで公開されてる...！！(しかも超簡単) 性能はさておき、誰でも簡単に自分だけのChatGPTを作れる！！ github.com/nebuly-ai/nebu

194K

goto

@goto_yuta_

Jan 19, 2023

昨日発表された世界最高レベルの高精度日本語音声認識モデル、ReazonSpeechのデモサイトで、コッテコテの方言話してみたけど完璧な解答が来た...！！ワンセグ放送の録画データを学習に使用してるらしいけど、ワンセグなんかガラケー時代以来初めて聞いた。 research.reazon.jp/projects/Reazo

2023年最も学ぶべき領域と言われているプロンプトエンジニアリングのまとめがGithubにあった。普段ノリで入れてるプロンプトを体系立てて難易度別に学べるようになってて中々の神資料な気がする。 github.com/dair-ai/Prompt

日本だとエンジニアになりたい人は多くても、作りたいものがある人は少ないらしい。考えさせられる話。

goto

@goto_yuta_

Feb 25, 2023

Metaが巨大言語モデルLLaMAをオープンソースで公開したらしく、Githubを見に行ってみると実行まで簡単すぎてビビった。ありがたいwww github.com/facebookresear

どうやら自分の声を10秒くらい録音するだけで複製できるやばい時代が来てしまったらしい。家で試そう。

GitHub - serp-ai/bark-with-voice-clone:

Text-prompted Generative Audio Model - With the ability...

ChatGPTがPythonで使えるようになってる...！！ morioh.com/p/337c1ffce36f

AI様の学習能力ヤバすぎてビッグデータ食い尽くすとか言われ始めてるの流石に予想斜め上

Quote

bioshok（INFJ）

@bioshok3

Dec 1, 2022

arxiv.org/abs/2211.04325 言語や画像データが世界中でどれくらいあり、いつ使い果たすのかを調査した論文。現状、言語は7.4*10^14(words:成長率7.15%、2040枯渇)、高品質に限定すると9*10^12words（2024年枯渇）画像は4.36*10^12(images:成長率8.4%、2038年枯渇) 過去トレンドと計算機制約補正で推定

goto

@goto_yuta_

Jan 10, 2023

自分が学生の頃のAIの研究はブルーオーシャンで夢に溢れていたけど、最近はStable DiffusionとかChatGPTとか、勝てるわけがないのが自明すぎて夢がなさそう

GAFA、openAI、MSとかが凄まじいAI開発戦争を繰り広げる中、NVIDIAがひたすらに裏方でチャリンチャリン儲けている構図、羨ましすぎるが、NVIDIAの事業ってそんなに真似できないものなのだろうか...

AI業界で「札束で殴る」ってフレーズ、少し前は自分も勇気を振り絞ってお金出して8GPUとかで学習したりしてたけど、最近はGoogleが300億投資とか言い始めてて完全な他人事になった

Microsoftが10億トークン処理できるLongNetを発表。何がやばいって、10億トークンなら人間の記憶以上のトークンを処理してるんじゃね？って感じで、ChatGPTよりも更に人間みたいなAI出来てしまう気がする。コア技術の「dilated attention」の計算量がO(N)で上手くいくのもすごい。