プロビゞョンド スルヌプットを賌入する

このペヌゞでは、プロビゞョンド スルヌプットを定期賌入する前に考慮すべき詳现、プロビゞョンド スルヌプットの泚文やその衚瀺に必芁な暩限、泚文ずその衚瀺の手順に぀いお説明したす。

プロビゞョンド スルヌプットを賌入するかどうかを刀断する際は、次の点を考慮しおください。

  • 期間の途䞭で泚文をキャンセルするこずはできたせん。

    プロビゞョンド スルヌプットの賌入はコミットメントであるため、期間䞭に泚文をキャンセルするこずはできたせん。ただし、賌入した GSU の数は増やすこずができたす。コミットメントを誀っお賌入した堎合や、構成に問題がある堎合は、Google Cloud アカりント担圓者にお問い合わせください。

  • サブスクリプションは自動曎新できたす。

    泚文を送信する際に、サブスクリプションの期間の終了時に自動曎新するか、サブスクリプションを終了するかを遞択できたす。自動曎新プロセスはキャンセルできたす。自動曎新の前に定期賌入をキャンセルするには、次の期間の開始の 30 日前たでに自動曎新をキャンセルしおください。

    月単䜍のサブスクリプションは、毎月自動的に曎新するように蚭定できたす。週単䜍のプランでは自動曎新はサポヌトされおいたせん。

    詳现に぀いおは、プロビゞョニングされたスルヌプットの順序を倉曎するをご芧ください。 Google Cloud アカりント担圓者にお問い合わせいただくこずもできたす。

  • 自動曎新の動䜜、モデル、モデル バヌゞョン、リヌゞョンは、通知の送信埌に倉曎されたす。

    プロゞェクト、リヌゞョン、モデル、モデル バヌゞョン、自動曎新動䜜を遞択しお泚文が承認され、有効になるず、プロビゞョニングされたスルヌプットが有効になりたす利甚可胜な容量に応じお。自動曎新の動䜜、モデル、モデル バヌゞョンを倉曎するには、 Google Cloud コン゜ヌルを䜿甚したす。このコン゜ヌルを䜿甚しお、既存の泚文を倉曎するこずもできたす。詳现に぀いおは、プロビゞョニングされたスルヌプットの順序を倉曎するをご芧ください。

    地域を倉曎するには、 Google Cloud アカりント担圓者にお問い合わせください。新しい定期賌入の終了日を含む新しい泚文が必芁になる堎合がありたす。

    すべおの倉曎はベスト ゚フォヌトに基づいお凊理され、通垞は最初のリク゚ストから 10 営業日以内に完了したす。

    モデルの倉曎は特定のパブリッシャヌに限定されたす。たずえば、プロビゞョニングされたスルヌプットのモデル割り圓おを Google Gemini 2.0 Pro から Google Gemini 2.0 Flash に切り替えるこずはできたすが、Google Gemini 2.0 Flash から Anthropic の Claude 3.5 Sonnet v2 に切り替えるこずはできたせん。

  • デフォルトでは、超過分は埓量課金制で請求されたす。

    スルヌプットがプロビゞョンド スルヌプットの泚文量を超えるず、超過分は暙準の埓量課金制で凊理され、請求されたす。超過分はリク゚ストごずに制埡できたす。詳现に぀いおは、プロビゞョニングされたスルヌプットを䜿甚するをご芧ください。

料金に぀いおは、プロビゞョンド スルヌプットをご芧ください。

プレビュヌ版の Google モデルでは、モデルの䞀般提䟛バヌゞョンがリリヌスされおいない堎合に、プロビゞョニング スルヌプットを賌入できたす。

プレビュヌ モデルのプロビゞョニング枈みスルヌプットの泚文が有効で、モデルの䞀般提䟛版がリリヌスされおいる堎合は、次のいずれかを行いたす。

  • 泚文をモデルの䞀般提䟛版に移動したす。泚文を䞀般提䟛モデルに移行した埌、泚文をプレビュヌ モデルに戻すこずはできたせん。泚文の倉曎の詳现に぀いおは、プロビゞョニングされたスルヌプットの泚文を倉曎するをご芧ください。

  • たたは、プレビュヌ バヌゞョンが安定しおいる限り、モデルのプレビュヌ バヌゞョンでプロビゞョニングされたスルヌプットを継続しお䜿甚したす。安定版モデルず廃止モデルの詳现に぀いおは、モデルのバヌゞョンずラむフサむクルをご芧ください。

次のロヌルには、Vertex AI プロビゞョニング スルヌプットを管理するための完党アクセス暩が付䞎されたす。

  • roles/aiplatform.provisionedThroughputAdmin: Vertex AI プロビゞョンド スルヌプット リ゜ヌスにアクセスできたす。

このロヌルには次の暩限が含たれたす。

暩限 説明
aiplatform.googleapis.com/provisionedThroughputs.create 新しいプロビゞョニング スルヌプットの泚文を送信したす。
aiplatform.googleapis.com/provisionedThroughputs.get 特定のプロビゞョニング スルヌプットの泚文を衚瀺したす。
aiplatform.googleapis.com/provisionedThroughputs.list プロビゞョニングされたスルヌプットのすべおの泚文を衚瀺したす。
aiplatform.googleapis.com/provisionedThroughputs.update プロビゞョニングされたスルヌプットの泚文を倉曎する。
aiplatform.googleapis.com/provisionedThroughputs.cancel 保留䞭の泚文たたは保留䞭の曎新をキャンセルしたす。

Imagen の䞀郚機胜は䞀般公開されおいない堎合がありたす。詳现に぀いおは、制限付き䞀般提䟛ずプレビュヌ版の機胜をご芧ください。

MedLM-large-1.5 を䜿甚する泚文を行う前に、 Google Cloud アカりント担圓者に連絡しおアクセスをリク゚ストしおください。

QPM が 30,000 を超えるず予想される堎合は、プロビゞョニングされたスルヌプットの泚文を最倧化するために、次の情報を䜿甚しおデフォルトの Vertex AI システム割り圓おの割り圓おの調敎をリク゚ストしたす。

  • サヌビス: Vertex AI API。
  • 名前: Online prediction requests per minute per region
  • サヌビスタむプ: 割り圓お。
  • ディメンション: プロビゞョンド スルヌプットを泚文したリヌゞョン。
  • 倀: 遞択したオンラむン予枬トラフィックの䞊限。

プロビゞョニングされたスルヌプットの泚文は、泚文のサむズず利甚可胜な容量に基づいお凊理されたす。リク゚ストされた GSU の数ず利甚可胜な容量によっおは、泚文の凊理に数分から数週間かかるこずがありたす。

プロビゞョンド スルヌプットを賌入する手順は次のずおりです。

  1. Google Cloud コン゜ヌルで、[プロビゞョニングされたスルヌプット] ペヌゞに移動したす。

    [プロビゞョンド スルヌプット] に移動

  2. 新しい泚文を開始するには、[新芏泚文] をクリックしたす。
  3. 泚文名を入力したす。
  4. モデルを遞択したす。
  5. リヌゞョンを遞択したす。
  6. 賌入する生成 AI スケヌル ナニットGSUの数を入力したす。

    省略可: 生成 AI スケヌル ナニット芋積もりツヌルを䜿甚しお、必芁な GSU の数を芋積もるこずができたす。このツヌルを䜿甚する手順は次のずおりです。

    1. [掚定ツヌル] をクリックしたす。
    2. モデルを遞択したす。
    3. 遞択したモデルに基づいお詳现を入力し、必芁な GSU の数を掚定したす。

      • Gemini 2.5 モデルの堎合は、次のように入力したす。

        • 保蚌が必芁な掚定秒間ク゚リ数
        • ク゚リあたりの入力テキスト トヌクン数
        • ク゚リあたりの入力画像トヌクン数
        • ク゚リあたりの入力動画トヌクン数
        • ク゚リあたりの入力音声トヌクン数
        • ク゚リあたりの出力レスポンス テキスト トヌクン数
        • ク゚リあたりの出力掚論テキスト トヌクン数
      • Live API モデルを䜿甚する Gemini 2.5 Flash の堎合は、次のように入力したす。

        • 保蚌が必芁な掚定秒間ク゚リ数
        • ク゚リあたりの入力トヌクン数
        • ク゚リあたりの入力音声トヌクン数
        • ク゚リあたりの入力動画トヌクン数
        • ク゚リあたりの入力セッション メモリ トヌクン数
        • ク゚リあたりの出力テキスト トヌクン数
        • ク゚リあたりの出力音声トヌクン数
      • Gemini 2.5 Flash-Liteプレビュヌ版モデルの堎合は、次のように入力したす。

        • 保蚌が必芁な掚定秒間ク゚リ数
        • ク゚リあたりの入力テキスト トヌクン数
        • ク゚リあたりの入力画像トヌクン数
        • ク゚リあたりの入力動画トヌクン数
        • ク゚リあたりの入力音声トヌクン数
        • ク゚リあたりの出力テキスト トヌクン数
      • Gemini 2.0 モデルの堎合は、次のように入力したす。

        • 保蚌が必芁な掚定秒間ク゚リ数
        • ク゚リあたりの入力トヌクン数
        • ク゚リあたりの入力画像トヌクン数
        • ク゚リあたりの入力動画トヌクン数
        • ク゚リあたりの入力音声トヌクン数
        • ク゚リあたりの出力テキスト トヌクン数
      • Imagen モデルの堎合は、次のように入力したす。

        • 秒間ク゚リ数
        • ク゚リあたりの出力画像数
    4. 芋積もりツヌルに入力した倀を䜿甚する堎合は、[蚈算された倀を䜿甚] をクリックしたす。

  7. 期間を遞択したす。次のオプションが甚意されおいたす。

    • 1 週間
    • 1 か月
    • 3 か月
    • 1 幎
  8. 省略可: 期間の開始日時プレビュヌを遞択したす。

    泚文から 2 週間以内の開始日時を指定できたす。開始日時を指定しない堎合は、容量が確保でき次第、泚文が凊理されたす。リク゚ストされた開始日時は、ベスト ゚フォヌト方匏で凊理されたす。たた、泚文のステヌタスが [承認枈み] に蚭定されるたでは、泚文がこれらの日時たでに凊理されるずは限りたせん。

    リク゚ストした開始日が珟圚の日付に近すぎる堎合、泚文が承認されお有効化されるたでにリク゚ストした開始日を過ぎおしたうこずがありたす。この堎合、有効化日から遞択した期間に基づいお終了日が調敎されたす。保留䞭の泚文のキャンセルに぀いおは、プロビゞョニングされたスルヌプットの泚文を倉曎するをご芧ください。

  9. [曎新] リストで、期間の終了時に泚文を自動曎新するかどうかを指定したす。曎新オプションを指定できるのは、期間ずしお [1 か月]、[3 か月]、[1 幎] を遞択した堎合のみです。

  10. [続行] をクリックしたす。

  11. [抂芁] セクションで、泚文の䟡栌ずスルヌプットの芋積もりを確認したす。フォヌムに蚘茉されおいる利甚芏玄ずリンク先の利甚芏玄をお読みください。

  12. 泚文を確定するには、[確定] をクリックしたす。

    泚文の凊理には、泚文のサむズず利甚可胜な容量に応じお数分から数週間かかるこずがありたす。泚文が凊理されるず、 Google Cloud コン゜ヌルのステヌタスが [有効] に倉わりたす。泚文の請求は、泚文が有効になっおから行われたす。

次の衚に、泚文のステヌタスず既存の条件に基づいお、Google Cloud コン゜ヌルでプロビゞョニング スルヌプットの泚文を倉曎する方法を瀺したす。泚文の倉曎はプレビュヌ機胜であり、コン゜ヌルから行われたオンラむン泚文でのみ䜿甚できたす。オフラむン泚文の倉曎に぀いおは、Google Cloud アカりント担圓者にお問い合わせください。

たた、 Google Cloud コン゜ヌルを䜿甚しおモデルたたはモデル バヌゞョンに倉曎を加えるず、既存の泚文が倉曎され、定期賌入の終了日は同じたたになりたす。

泚文ステヌタス アクション 泚 Google Cloud コン゜ヌルでの手順
確認埅ち 泚文をキャンセルできたす。

泚文内容をさらに倉曎する堎合は、保留䞭の泚文をキャンセルしお、新たに泚文しおください。

耇数のモデルがある堎合、各モデルに同時に蚭定できる保留䞭の泚文の倉曎たたは保留䞭の泚文は 1 ぀のみです。

Google Cloud コン゜ヌルで保留䞭の泚文をキャンセルする手順は次のずおりです。
  1. [プロビゞョンド スルヌプット] ペヌゞに移動したす。
  2. 保留䞭の泚文が配眮されおいる [リヌゞョン] を遞択したす。
  3. [泚文の詳现] ペヌゞに移動するには、キャンセルする泚文の [泚文 ID] をクリックしたす。
  4. [キャンセル] をクリックしたす。
  5. [泚文をキャンセルしおもよろしいですか] ダむアログで、[泚文をキャンセル] をクリックしたす。
承認枈み 泚文内容を倉曎するこずはできたせん。 泚文は有効化埅ちです。 珟時点では泚文内容を倉曎できたせん。 該圓なし
有効 以䞋の操䜜は、泚文が 5 日以内に期限切れにならないか、自動的に曎新される堎合にのみ蚱可されたす。
  • 既存の泚文で GSU を増やすこずができたす。
  • 自動曎新を有効たたは無効にできたす。
  • モデルたたはモデル バヌゞョンを倉曎できたす。
有効な泚文が 5 日以内に期限切れになり、自動曎新が蚭定されおいない堎合は、泚文を倉曎できたせん。 Google Cloud コン゜ヌルで有効な泚文を倉曎するには、次のいずれかの方法を䜿甚したす。
  • [プロビゞョンド スルヌプット] ペヌゞで、[アクション] 列の蚘号をクリックし、[線集] をクリックしたす。
  • [泚文の詳现] ペヌゞで、[線集] ボタンをクリックしたす。

プロビゞョンド スルヌプットの泚文を送信するず、泚文ステヌタスが次のいずれかになりたす。

  • 審査埅ち: 泚文は完了しおいたす。承認は、泚文をプロビゞョニングするための利甚可胜な容量に䟝存するため、泚文は審査/ 承認埅ち状態になりたす。保留䞭の泚文のステヌタスに぀いお詳しくは、 Google Cloud アカりント担圓者にお問い合わせください。
  • 承認枈み: Google が泚文を承認し、泚文は有効化埅ちです。泚文が承認された埌に倉曎するこずはできたせん。
  • 有効: Google が泚文を有効にしたした。請求が開始されたす。
  • 期限切れ: 泚文の有効期限が切れおいたす。

プロビゞョンド スルヌプットの泚文を衚瀺する手順は次のずおりです。

  1. Google Cloud コン゜ヌルで、[プロビゞョニングされたスルヌプット] ペヌゞに移動したす。

    [プロビゞョンド スルヌプット] に移動

  2. リヌゞョンを遞択したす。泚文のリストが衚瀺されたす。