Tsukasa #01@a4lgこれは vLLM の高効率の並列処理が発揮された結果なので、単一リクエストに対してだと 50 tok/s 前後になるんじゃないかと思います。Translate post12:35 AM · Jan 20, 2026·156 Views1