การค้นหาคำและการปกปิดข้อมูล
Glasswall Embedded Engine มีความสามารถในการจับคู่รูปแบบในรูปแบบไฟล์ต่อไปนี้:
- Microsoft Binary Office
- Office Open XML
- ข้อความธรรมดาแบบ ASCII และ UTF-8 (เมื่อระบุ
enable_text_supportเป็นtrueภายใต้sysConfig)
สตริงสำหรับการค้นหาถูกกำหนดค่าผ่านไฟล์ policy โดยสามารถระบุเป็นรายการ text หรือรายการ regex ได้:
- Text - จับคู่เฉพาะคำหรือตัวเลขที่เป็นหน่วยแยกกันเท่านั้น คำและตัวเลขจะถือว่าเป็นหน่วยแยกกัน หากอักขระที่อยู่ก่อนหน้าหรือถัดจากข้อความที่จับคู่ไม่ใช่ตัวอักษรหรือตัวเลขตามลำดับ ซึ่งหมายความว่า
orจะไม่ถูกจับคู่เมื่อพบใน "ore", "word" หรือ "door" - Regex - Match anywhere the regular expression pattern is found. This includes matches within distinct words or numbers, e.g. a regular expression of
r[aeiou]+will match the "re" in "regular", "expression" and "anywhere".- Word Search ไม่รองรับ regular expression assertions โดย regular expression ที่มี
^หรือ$จะคืนค่าการจับคู่ที่พบที่ตำแหน่งใดก็ได้ในไฟล์ และ regular expression ที่มี lookaround จะไม่คืนค่าการจับคู่ใด ๆ
- Word Search ไม่รองรับ regular expression assertions โดย regular expression ที่มี
สำหรับทุก pattern ที่จับคู่ได้ สามารถดำเนินการต่อไปนี้ (textSetting) ได้:
- Allow - สร้างรายงานการวิเคราะห์ XML ที่ระบุจำนวนสตริงที่ตรงกันภายในไฟล์และตำแหน่งของสตริงเหล่านั้น
- Disallow - รายงานการจับคู่ทั้งหมด และไม่สร้างไฟล์อินพุตขึ้นใหม่หากพบการจับคู่ใด ๆ
- Redact - รายงานการจับคู่และสร้างไฟล์อินพุตขึ้นใหม่โดยแทนที่ทุกอินสแตนซ์ด้วยอักขระที่ระบุไว้ในไฟล์ policy ด้วย
replacementCharการดำเนินการนี้ใช้ได้เฉพาะกับไฟล์ Microsoft Binary Office และ Office Open XML เท่านั้น - Require - รายงานการจับคู่ทั้งหมด และจะไม่สร้างไฟล์อินพุตขึ้นใหม่ เว้นแต่จะพบการจับคู่อย่างน้อยหนึ่งรายการ การดำเนินการนี้ใช้ได้เฉพาะกับไฟล์ข้อความธรรมดาเท่านั้น และต้องระบุอย่างน้อยหนึ่งรายการ
API สำหรับ Word Search รองรับการจับคู่แบบ string, character based และ regular expression ดูเอกสาร API ของ Word Search ได้ที่ Word Search Library