ข้ามไปยังเนื้อหาหลัก

การค้นหาคำและการปกปิดข้อมูล

Glasswall Embedded Engine มีความสามารถในการจับคู่รูปแบบในรูปแบบไฟล์ต่อไปนี้:

  • Microsoft Binary Office
  • Office Open XML
  • ข้อความธรรมดาแบบ ASCII และ UTF-8 (เมื่อระบุ enable_text_support เป็น true ภายใต้ sysConfig)

สตริงสำหรับการค้นหาถูกกำหนดค่าผ่านไฟล์ policy โดยสามารถระบุเป็นรายการ text หรือรายการ regex ได้:

  • Text - จับคู่เฉพาะคำหรือตัวเลขที่เป็นหน่วยแยกกันเท่านั้น คำและตัวเลขจะถือว่าเป็นหน่วยแยกกัน หากอักขระที่อยู่ก่อนหน้าหรือถัดจากข้อความที่จับคู่ไม่ใช่ตัวอักษรหรือตัวเลขตามลำดับ ซึ่งหมายความว่า or จะไม่ถูกจับคู่เมื่อพบใน "ore", "word" หรือ "door"
  • Regex - Match anywhere the regular expression pattern is found. This includes matches within distinct words or numbers, e.g. a regular expression of r[aeiou]+ will match the "re" in "regular", "expression" and "anywhere".
    • Word Search ไม่รองรับ regular expression assertions โดย regular expression ที่มี ^ หรือ $ จะคืนค่าการจับคู่ที่พบที่ตำแหน่งใดก็ได้ในไฟล์ และ regular expression ที่มี lookaround จะไม่คืนค่าการจับคู่ใด ๆ

สำหรับทุก pattern ที่จับคู่ได้ สามารถดำเนินการต่อไปนี้ (textSetting) ได้:

  • Allow - สร้างรายงานการวิเคราะห์ XML ที่ระบุจำนวนสตริงที่ตรงกันภายในไฟล์และตำแหน่งของสตริงเหล่านั้น
  • Disallow - รายงานการจับคู่ทั้งหมด และไม่สร้างไฟล์อินพุตขึ้นใหม่หากพบการจับคู่ใด ๆ
  • Redact - รายงานการจับคู่และสร้างไฟล์อินพุตขึ้นใหม่โดยแทนที่ทุกอินสแตนซ์ด้วยอักขระที่ระบุไว้ในไฟล์ policy ด้วย replacementChar การดำเนินการนี้ใช้ได้เฉพาะกับไฟล์ Microsoft Binary Office และ Office Open XML เท่านั้น
  • Require - รายงานการจับคู่ทั้งหมด และจะไม่สร้างไฟล์อินพุตขึ้นใหม่ เว้นแต่จะพบการจับคู่อย่างน้อยหนึ่งรายการ การดำเนินการนี้ใช้ได้เฉพาะกับไฟล์ข้อความธรรมดาเท่านั้น และต้องระบุอย่างน้อยหนึ่งรายการ

API สำหรับ Word Search รองรับการจับคู่แบบ string, character based และ regular expression ดูเอกสาร API ของ Word Search ได้ที่ Word Search Library