Chuyển đến nội dung chính

Tìm kiếm từ trong tài liệu & biên tập xóa

Glasswall Embedded Engine cung cấp khả năng đối sánh mẫu trong các định dạng tệp sau:

  • Microsoft Binary Office
  • Office Open XML
  • Văn bản thuần ASCII và UTF-8 (khi enable_text_support được chỉ định là true trong sysConfig)

Các chuỗi tìm kiếm được cấu hình thông qua một tệp policy, trong đó chúng có thể được chỉ định dưới dạng mục text hoặc mục regex:

  • Text - Chỉ khớp các từ hoặc số riêng biệt. Từ và số được coi là riêng biệt nếu ký tự ngay trước hoặc ngay sau phần khớp lần lượt không phải là chữ cái hoặc chữ số, nghĩa là or sẽ không tạo ra kết quả khớp khi được tìm thấy trong "ore", "word" hoặc "door".
  • Regex - Match anywhere the regular expression pattern is found. This includes matches within distinct words or numbers, e.g. a regular expression of r[aeiou]+ will match the "re" in "regular", "expression" and "anywhere".
    • Word Search không hỗ trợ assertion của biểu thức chính quy. Biểu thức chính quy chứa ^ hoặc $ sẽ trả về các kết quả khớp được tìm thấy ở bất kỳ đâu trong tệp và biểu thức chính quy chứa lookaround sẽ không trả về bất kỳ kết quả khớp nào.

Đối với mỗi mẫu được khớp, có thể thực hiện các hành động sau (textSetting):

  • Allow - Tạo báo cáo phân tích XML nêu rõ số lượng chuỗi khớp trong tệp và vị trí của chúng
  • Disallow - Báo cáo tất cả kết quả khớp và không tái tạo tệp đầu vào nếu tìm thấy bất kỳ kết quả nào
  • Redact - Báo cáo các kết quả khớp và tái tạo tệp đầu vào với tất cả các trường hợp được thay thế bằng một ký tự được chỉ định trong tệp policy bằng replacementChar. Hành động này chỉ khả dụng cho các tệp Microsoft Binary Office và Office Open XML.
  • Require - Báo cáo tất cả kết quả khớp và không tái tạo tệp đầu vào trừ khi tìm thấy ít nhất một kết quả khớp. Hành động này chỉ khả dụng cho các tệp văn bản thuần và phải chỉ định ít nhất một mục.

Các API cho Word Search hỗ trợ đối sánh chuỗi, dựa trên ký tựbiểu thức chính quy. Xem Thư viện Word Search để biết tài liệu API Word Search.