必要に応じて適切な量のリソースを使える - 対障害性に優れ、コストパフォーマンスの高いアプリケーションの開発を望むときこそ、Google Cloud Platform の能力は最大限に活かされます。Google 検索や Gmail などに利用されているインフラストラクチャーを設計したチームが、Google Compute Engine に待ち望まれていた機能、オートスケールを追加しました。現在、ベータ版となっており、皆様にご使用頂けます。

Compute Engine のオートスケールを使うことで、常にアプリケーションの稼働状況にあわせて正確に適切な量の Compute Engine インスタンスが稼働している環境を構築できます。これによって、アプリケーションの稼働率が高いときには確実な応答性能を、アプリケーションの稼働率が低いときは費用の削減を実現できます。

Compute Engine Autoscaler は Compute Engine インスタンス グループの最適な利用レベルを定義することで、異なる負荷状況に対するレスポンスの中で、効率的に動的なスケールを可能にしています。Autoscaler は、サービス利用状況の変動の変化を検出し、稼働するインスタンスの数を最適な量に調整します。その指標として HTTPロードバランサー上のCPU使用率、 QPS、およびCloud Monitoring サービスにより定義されたメトリクスなどの多様な指標を利用できます。

Compute Engine Autoscaler を初期の頃から利用していた企業の 1 つに人気のウェブサイト構築サービスを手がける Wix.com があります。Wix.com のインフラストラクチャーチームのリードである、Golan Parashi 氏は Google がヒューリスティックを使い、要求に応じて 1 度にいくつのインスタンスを追加するかを判断していることについてコメントをしています。「Google はスパイクの発生したときでさえ、マシンの数を適切に管理し、我々に安心と信頼を与えてくれるとともに、費用の削減にもなっている。」

Autoscaler は必要数のインスタンスを選ぶだけのものではなく、現在の状況が平常時からどれだけ離れているのかを基準に自動的に数を調整し、例えば突然のトラフィック スパイクのような予期できない状況でさえ適切に処理します。Google Cloud Platform Live では、 Autoscaler を使いアプリケーションがリクエストのない状況から 150 万/秒以上のリクエストを処理できるまでにスケールするところを実演しました。

Compute Engine Autoscaler の詳細について、以下ご覧下さい:

  • Google Cloud Platform Live での、ステージで Autoscaler について話しながら秒間 100 万クエリーにまで自動スケールアップした動画を見る
  • Google Compute Engine での Autoscale について詳しく知る
  • HTTP Load Balancing について詳しく知る 


私たちは、このプラットフォームであなたが何を作るのか、そしてスケールさせるのか楽しみで待ちきれません。