주요 콘텐츠로 건너뛰기

단어 검색 & 비식별화

Glasswall Embedded Engine는 다음 파일 형식에서 패턴 매칭 기능을 제공합니다:

  • Microsoft Binary Office
  • Office Open XML
  • ASCII and UTF-8 plain text (when enable_text_support is specified true under sysConfig)

검색 문자열은 policy 파일을 통해 구성되며, 여기서 text 항목 또는 regex 항목으로 지정할 수 있습니다:

  • Text - 고유한 단어 또는 숫자만 일치시킵니다. 단어와 숫자는 일치 항목의 바로 앞이나 뒤에 오는 문자가 각각 문자 또는 숫자가 아닌 경우 고유한 것으로 간주되므로, or는 "ore", "word" 또는 "door"에서 발견되더라도 일치를 생성하지 않습니다.
  • Regex - Match anywhere the regular expression pattern is found. This includes matches within distinct words or numbers, e.g. a regular expression of r[aeiou]+ will match the "re" in "regular", "expression" and "anywhere".
    • Word Search는 정규식 assertion을 지원하지 않습니다. ^ 또는 $를 포함하는 정규식은 파일 내 어디에서든 발견된 일치를 반환하며, lookaround를 포함하는 정규식은 어떤 일치도 반환하지 않습니다.

일치하는 각 패턴에 대해 다음 작업(textSetting)을 수행할 수 있습니다:

  • Allow - 파일 내 일치하는 문자열의 수와 해당 위치를 지정하는 XML 분석 보고서를 생성합니다.
  • Disallow - 모든 일치를 보고하고, 하나라도 발견되면 입력 파일을 재생성하지 않습니다.
  • Redact - 일치를 보고하고, policy 파일에서 replacementChar로 지정된 문자로 모든 인스턴스를 대체하여 입력 파일을 재생성합니다. 이 작업은 Microsoft Binary Office 및 Office Open XML 파일에서만 사용할 수 있습니다.
  • Require - 모든 일치를 보고하고, 최소 하나의 일치가 발견되지 않으면 입력 파일을 재생성하지 않습니다. 이 작업은 일반 텍스트 파일에서만 사용할 수 있으며, 최소 하나는 지정되어야 합니다.

Word Search용 API는 string, character based, regular expression 매칭을 지원합니다. Word Search API 문서는 Word Search Library를 참조하세요.