メイン コンテンツにスキップ

単語検索と墨消し

Glasswall Embedded Engine は、次のファイル形式でパターンマッチング機能を提供します:

  • Microsoft Binary Office
  • Office Open XML
  • ASCII and UTF-8 plain text (when enable_text_support is specified true under sysConfig)

検索文字列は policy ファイルで設定され、text 項目または regex 項目のいずれかとして指定できます:

  • Text - 個別の単語または数字にのみ一致します。単語および数字は、一致箇所の直前または直後の文字がそれぞれ文字または数字でない場合に個別と見なされます。つまり、or は "ore"、"word"、"door" に含まれていても一致しません。
  • Regex - Match anywhere the regular expression pattern is found. This includes matches within distinct words or numbers, e.g. a regular expression of r[aeiou]+ will match the "re" in "regular", "expression" and "anywhere".
    • Word Search は正規表現のアサーションをサポートしていません。^ または $ を含む正規表現は、ファイル内の任意の場所で見つかった一致を返し、lookaround を含む正規表現は一致を返しません。

一致した各パターンに対して、次のアクション(textSetting)を実行できます:

  • Allow - ファイル内の一致した文字列の数とその位置を指定する XML 分析レポートを生成します
  • Disallow - すべての一致を報告し、1 つでも見つかった場合は入力ファイルを再生成しません
  • Redact - 一致を報告し、すべての該当箇所を policy ファイルで replacementChar に指定された文字に置き換えて入力ファイルを再生成します。このアクションは Microsoft Binary Office ファイルおよび Office Open XML ファイルでのみ使用できます。
  • Require - すべての一致を報告し、少なくとも 1 件の一致が見つからない限り入力ファイルを再生成しません。このアクションはプレーンテキストファイルでのみ使用でき、少なくとも 1 つ指定する必要があります。

Word Search 用の API は、文字列文字ベース、および 正規表現 のマッチングをサポートしています。Word Search API のドキュメントについては、Word Search Library を参照してください。