パターンは特定の構造を持つデータです。たとえば、クレジットカード番号の多くは16桁の「nnnn-nnnn-nnnn-nnnn」という形式で表現されるため、パターンによる検出に適しています。
トレンドマイクロ製品には、一連の事前定義されたパターンがあります。情報漏えい対策は、パターンマッチングと数学的方程式を使用してこれらのパターンを検証します。機密と考えられるデータがパターンに一致すると、そのデータに対してさらに検証チェックが実行されることもあります。事前定義されたパターンを変更または削除することはできません。
事前定義されたパターンが要件を満たさない場合は、カスタムパターンを作成します。パターンは強力な文字列照合ツールです。パターンを作成する前に、パターン構文に精通しておく必要があります。パターンの善し悪しが性能に大きく影響する場合があります。
パターンを作成する際の注意:
有効なパターンを定義するための参考として事前定義のパターンを参照してください。たとえば、日付を含むパターンを作成する場合は、「日付」に事前定義されたパターンを参照できます。
情報漏えい対策は、Perl互換正規表現 (PCRE) で定義されたパターン形式に準拠しています。PCREの詳細については、次のWebサイトを参照してください。http://www.pcre.org/
単純なパターンから始めてください。不必要な警告が発生する場合や、検出結果を向上させるために調整する場合は、パターンを修正します。
一連のパターン要素をサブパターンにグループ化して文字列を一致させるには、(\d+) や ([A-Z]+) のようにカッコで囲みます。
(\d+)([a-z]+)(\d+) など、カッコでグループ化したサブパターンが複数存在する場合は、最初のパターンのみが有効になります。
条件 |
ルール |
例 |
---|---|---|
なし |
なし |
米国勢調査局発行の名前
|
特定の文字 |
パターンには、指定した文字が含まれている必要があります。 さらに、パターン内の文字数は下限値と上限値の範囲に収める必要があります。 |
米国 - ABA銀行ルーティング番号
|
サフィックス |
サフィックスはパターンの最終セグメントを意味します。サフィックスには、指定された文字と特定の文字数が含まれている必要があります。 さらに、パターン内の文字数は下限値と上限値の範囲に収める必要があります。 |
自宅住所
|
単一の区切り文字 |
パターンは2つのセグメントで構成し、1つの文字で区切る必要があります。文字は1バイト長にする必要があります。 さらに、区切り文字の左側の文字数は下限値と上限値の範囲に収める必要があります。区切り文字の右側の文字数は上限値を超えないようにする必要があります。 |
メールアドレス
|
事前定義されたパターンが要件を満たさない場合は、カスタムパターンを追加します。
オプション | 説明 |
---|---|
基本プロパティ |
|
テスト領域 |
パターンをテストするための実際のデータを指定します。 たとえば、国民識別番号のパターンの場合は、[データのテスト] テキストボックスに有効な識別番号を入力し、[テスト] をクリックして結果を確認します。 注:
テストが成功した場合にのみ設定を保存します。データを検出できないパターンは、システムリソースを浪費し、性能に影響を与える可能性があります。 |
カスタムパターンのインポートには、パターンを含む適切な形式の.xmlファイルが必要です。
各パターンには一意のID値があります。同じIDを持つパターンが存在する場合は、Cloud App Securityによって既存のパターンが上書きされます。同じ表示名を持つパターンが存在する場合は、Cloud App Securityによって新しいパターンにタイムスタンプサフィックスが追加され、その後リストに追加されます。