オンプレミスゲートウェイによって保護されるプライベート生成AIサービスのために、レート制限ルールを作成します。
レート制限ルールにより、保護されたプライベート生成AIサービスへのエンドポイントからのリクエスト数を制御し、サービス拒否攻撃を防ぐことができます。レート制限ルールは、リバースプロキシモードで動作し、保護された生成AIサービスの前に配置されたオンプレミスゲートウェイによってのみ強制されます。
手順
- [Internet Access and AI Service Access Configuration] で [Manage Rate Limiting Rules] をクリックします。
- 新しいレート制限ルールを作成するには、[ルールを作成]をクリックします。
- ルールの名前と任意の説明を指定してください。
- 作成後にルールを有効にするかどうかを選択します。
- ルールの対象とするプライベートIPアドレスグループを選択してください。
- [All private IP address groups]: すべての利用可能なプライベートIPアドレスグループは、プライベート生成AIサービスへのリクエスト時にレート制限の対象となります
- [Any selected private IP address groups]: プライベートIPアドレスグループを選択すると、プライベート生成AIサービスへのリクエストがレート制限の対象となります
ヒント
特定のルールから除外するために、プライベートIPアドレスグループを選択することもできます。 - ルールを適用するオンプレミスゲートウェイを選択してください。
- [すべてのオンプレミスゲートウェイ]: すべてのサポートされているオンプレミスゲートウェイがルールを適用します
- [選択したオンプレミスゲートウェイ]: 選択したサポートされているオンプレミスゲートウェイがルールを適用します
重要
接続されているオンプレミスゲートウェイは、リバースプロキシモードが有効で、プライベート生成AIサービスを保護している場合にのみサポートされます。インターネットアクセスオンプレミスゲートウェイサービスおよび対応するService Gatewayは、最新バージョンに更新する必要があります。 - ルールのレート制限しきい値を指定します。
- [Unlimited requests]: 指定されたプライベートIPアドレスグループは、指定されたオンプレミスゲートウェイを通じて無制限のサービスリクエストを行うことが許可されています
- [No requests]: 指定されたプライベートIPアドレスグループは、指定されたオンプレミスゲートウェイを通じてサービスリクエストを行うことは許可されていません
- [Specified request rate]: 指定されたプライベートIPアドレスグループは、指定されたオンプレミスゲートウェイを通じて、1分あたり指定された数のサービスリクエストのみを行うことが許可されています。1から2048の範囲で数値を指定できます。
- [作成] をクリックします。新しく作成されたルールは[Rate Limiting Rules]画面に表示されます。
- 特定のルールを検索するには、検索フィールドにルール名を入力するか、ドロップダウンメニューを使用してターゲットまたはオンプレミスゲートウェイでルールをフィルタリングします。
- 既存のルールを有効または無効にするには、[ステータス] 列の対応するトグルをクリックします。
- ルールを複製するには、コピーアイコン () をクリックします。
- ルールを削除するには、削除アイコン () をクリックするか、複数のルールを選択して [削除] をクリックします。