사용자 정의 키워드 목록 기준 상위 항목

키워드 목록에 대한 기준

기준
규칙
임의의 키워드
키워드 목록에 있는 키워드 중 하나 이상이 파일에 포함되어야 합니다.
모든 키워드
키워드 목록에 있는 모든 키워드가 파일에 포함되어야 합니다.
<x>자 이내의 모든 키워드
키워드 목록에 있는 모든 키워드가 파일에 포함되어야 합니다. 또한 각 키워드 쌍이 서로 최대 <x>자 이내에 있어야 합니다.
예를 들어 세 개의 키워드가 WEB, DISK 및 USB이고 지정한 문자 수가 20자라고 가정해 보겠습니다.
OfficeScan에서 DISK, WEB, USB 순으로 모든 키워드를 발견한 경우 "D"(DISK)부터 "W"(WEB)까지 그리고 "W"부터 "U"(USB)까지의 문자 수가 최대 20자여야 합니다.
  • 기준과 일치하는 데이터: DISK####WEB############USB
  • 기준과 일치하지 않는 데이터: DISK*******************WEB****USB("D"와 "W" 사이가 23자)
문자 수를 결정할 때 10과 같은 작은 수는 검색 시간이 단축되지만 비교적 작은 영역만 포함하게 된다는 점에 주의하십시오. 이 경우 특히 큰 파일에서 중요한 데이터를 발견할 가능성이 줄어들 수 있습니다. 숫자가 클수록 포함되는 영역도 증가하지만 검색 시간이 느려질 수 있습니다.
임계값을 초과하는 키워드 점수 합계
키워드 목록에 있는 키워드 중 하나 이상이 파일에 포함되어야 합니다. 하나의 키워드만 발견된 경우 해당 점수가 임계값보다 높아야 합니다. 여러 키워드가 발견된 경우 해당 점수 합계가 임계값보다 높아야 합니다.
각 키워드에 1에서 10 사이의 점수를 할당합니다. 매우 기밀한 단어나 구(예: HR 부서의 경우 "급여 인상")는 상대적으로 점수가 높아야 합니다. 자체로는 가중치가 크지 않은 단어나 구는 점수가 낮을 수 있습니다.
임계값을 구성할 때 키워드에 할당한 점수를 고려하십시오. 예를 들어 5개의 키워드가 있고 그 중 3개의 우선 순위가 높은 경우 임계값은 이 세 키워드의 점수 합계보다 낮거나 같을 수 있습니다. 이는 이 세 키워드가 발견된 것만으로도 파일을 중요한 파일로 간주할 수 있음을 의미합니다.