メインコンテンツまでスキップ

オートスケーリング

オートスケーリングは、定められたルールに従ってインスタンスの数を増減させることを意味します。例えば、APIで1時間の間に1,000件以上のリクエストがあった場合、インスタンスを2つ増やすことができます。

オートスケール条件追加

スケール条件追加を選択して、新しいオートスケール条件を作成することができます。

スケール条件

選択できる条件について説明します。

  • メトリック (Metric)
    • インスタンスの増減の基準となるメトリックを選択します。
    • 総リクエスト数(total_requests)、秒間リクエスト数(requests_per_sec)、またはリクエスト遅延時間(latency_ms)などを選択できます。
  • 目標値、演算子
    • 目標値と演算子を使用してメトリック値を比較します。
    • 例えば、総リクエスト数(total_requests)メトリックに対して目標値「50」に対し「以上」の場合に動作するよう選択できます。
  • 測定周期
    • 値を取得する周期(期間)です。
    • 例えば、総リクエスト数(total_requests)メトリックに対して測定周期が「10」分の場合、最近10分間のすべてのリクエスト数を集計します。
  • クールダウン (Cooldown)
    • オートスケーリングが動作した後に一定時間追加で動作しない時間です。
    • この値を設定してオートスケーリングがあまり頻繁に発生しないように制限できます。
  • アクション
    • インスタンスを増加または減少させるなど、希望する動作を選択できます。
    • 例えば、「インスタンス減少」を実行し、インスタンス数「1」を選択した場合、指定したメトリックに対する条件が満たされると、インスタンスが1つ減少します。

オートスケーリング記録

指定したオートスケーリング条件が実行された時の記録です。これにより、いつ条件が実行されたのかを確認することができます。