カスタマイズされたキーワードリストの条件

表 1. キーワードリストの条件

条件

ルール

任意のキーワード

キーワードリストの1つ以上のキーワードをファイルに含める必要があります。

すべてのキーワード

キーワードリストのすべてのキーワードをファイルに含める必要があります。

<x>文字以内のすべてのキーワード

キーワードリストのすべてのキーワードをファイルに含める必要があります。さらに、各キーワードのペアは互いに <X> 文字以内である必要があります。

たとえば、キーワードがWEB、DISK、およびUSBの3つで、指定した文字数が20であるとします。

本製品ですべてのキーワードをDISK、WEB、USBの順に検出した場合、DISKの「D」からWEBの「W」、「W」からUSBの「U」、および「D」から「U」の文字数は20文字以下である必要があります。

次のデータがこの条件に一致します。

DISK####WEB#########USB

次のデータはこの条件に一致しません。

DISK####WEB############USB (「D」と「U」の間が23文字)

DISK*******************WEB****USB (「D」と「W」の間が23文字)

文字数を決定する際、10などの小さな数は通常、検索時間の短縮につながるのですが、対象範囲が比較的狭くなることに注意してください。これにより、特に大きなファイルでは、機密データを検出する可能性が低下する場合があります。数字が大きくなるにつれて、対象範囲も広がりますが、検索時間が長くなる可能性があります。

合計スコアがしきい値を超えるキーワード

キーワードリストの1つ以上のキーワードをファイルに含める必要があります。キーワードが1つだけ検出された場合は、そのスコアがしきい値を超える必要があります。キーワードが複数ある場合は、その合計スコアがしきい値を超える必要があります。

各キーワードに、1~10のスコアを割り当てます。機密性の高い単語や語句、たとえば総務部で「昇給」などは、比較的高いスコアにします。単独ではあまり重要性が高くない単語や語句のスコアは低くしてもかまいません。

しきい値を考える場合は、キーワードに割り当てるスコアを考慮します。たとえば、キーワードが5つあり、そのうち3つの優先度が高い場合、しきい値は優先度の高い3つのキーワードの合計スコア以下にすることができます。これは、この3つのキーワードさえ検出されれば、そのファイルは脆弱だと十分に判断できるということです。