ツイート

新しいツイートを表示

会話

返信をさらに表示

もっと見つける

Twitterから
ブレインフォグ、考えてみたら頭脳労働職の人間にとってこの後遺障害が出ている旨を公言すること自体が職業的な能力の低下をアピールすることになるため隠した方が得をするインセンティブが働くので、道理で周囲でも「ブレインフォグで悩んでいる」という話を聞かなかったのだと得心がいった。構造だ
1
620
PagedAttentionというアルゴリズムがTransformerモデルを~24倍高速化。仮想メモリとページングの考え方に基づいて、文脈中のkeyとvalueのペアをブロックに分割・管理することで、GPUをほぼ100%利用できる “エンジニアリング”だ
画像
引用ツイート
Zhuohan Li
@zhuohan123
🌟 Thrilled to introduce vLLM with @woosuk_k! 🚀 vLLM is an open-source LLM inference and serving library that accelerates HuggingFace Transformers by 24x and powers @lmsysorg Vicuna and Chatbot Arena. Github: github.com/vllm-project/v Blog: vllm.ai
このスレッドを表示
1
313
このスレッドを表示
GPT-4に関する特大のリーク情報 MetaのPyTorchの開発リーダーも認めている&似た話が一部で共有されていた,ということで結構確度は高いです 曰く, "GPT-4は220Bパラメータのモデル8つ(2200億x8 = 1.76兆パラメータ)からなる混合モデルで,各モデルは別のデータ/タスクで学習している" とのこと…さらに表示
引用ツイート
Soumith Chintala
@soumithchintala
i might have heard the same 😃 -- I guess info like this is passed around but no one wants to say it out loud. GPT-4: 8 x 220B experts trained with different data/task distributions and 16-iter inference. Glad that Geohot said it out loud. Though, at this point, GPT-4 is… twitter.com/pommedeterre33… さらに表示
3
1,553
このスレッドを表示

Twitterを使ってみよう

今すぐ登録して、タイムラインをカスタマイズしましょう。
Appleのアカウントで登録
アカウントを作成
アカウントを登録することにより、利用規約プライバシーポリシーCookieの使用を含む)に同意したとみなされます。

トレンド

いまどうしてる?

音楽 · トレンド
#庭ラジ
6,665件のツイート
ゲームのジャンル · トレンド
ガンギマリオ
トレンドトピック: マリオ新作ニンダイ
ゲーム · トレンド
郡道先生
7,440件のツイート
ゲーム · トレンド
FF16
117,695件のツイート
食べ物 · トレンド
歯磨き粉
3,875件のツイート