Lewati ke konten utama

Pencarian Kata & Redaksi

Glasswall Embedded Engine menyediakan kemampuan pencocokan pola dalam format file berikut:

  • Microsoft Binary Office
  • Office Open XML
  • Teks biasa ASCII dan UTF-8 (saat enable_text_support ditetapkan ke true di bawah sysConfig)

String pencarian dikonfigurasi melalui file policy, yang dapat ditentukan sebagai item text atau item regex:

  • Text - Hanya mencocokkan kata atau angka yang berdiri sendiri. Kata dan angka dianggap berdiri sendiri jika karakter tepat sebelum atau sesudah kecocokan masing-masing bukan huruf atau digit, yang berarti or tidak akan menghasilkan kecocokan saat ditemukan dalam "ore", "word" atau "door".
  • Regex - Match anywhere the regular expression pattern is found. This includes matches within distinct words or numbers, e.g. a regular expression of r[aeiou]+ will match the "re" in "regular", "expression" and "anywhere".
    • Word Search tidak mendukung assertion regular expression. Regular expression yang mengandung ^ atau $ akan mengembalikan kecocokan yang ditemukan di mana saja dalam file dan regular expression yang mengandung lookaround tidak akan mengembalikan kecocokan apa pun.

Untuk setiap pola yang cocok, tindakan berikut (textSetting) dapat dilakukan:

  • Allow - Menghasilkan laporan analisis XML yang menyebutkan jumlah string yang cocok dalam file dan lokasinya
  • Disallow - Laporkan semua kecocokan dan jangan regenerasi file input jika ada yang ditemukan
  • Redact - Laporkan kecocokan dan regenerasi file input dengan semua kemunculan diganti dengan karakter yang ditentukan dalam file policy dengan replacementChar. Tindakan ini hanya tersedia untuk file Microsoft Binary Office dan Office Open XML.
  • Require - Laporkan semua kecocokan dan jangan regenerasi file input kecuali setidaknya satu kecocokan ditemukan. Tindakan ini hanya tersedia untuk file teks biasa, dan setidaknya satu harus ditentukan.

API untuk Word Search mendukung pencocokan string, berbasis karakter, dan ekspresi reguler. Lihat Word Search Library untuk dokumentasi Word Search API.