Quản lý nội dung
Các policy Quản lý nội dung là một tập hợp các công tắc quản lý nội dung có thể được áp dụng cho một loại tệp cụ thể.
Công tắc quản lý nội dung được dùng để xác định một loại phần tử tệp và hành động liên quan.
Cài đặt quản lý nội dung chỉ định hành động sẽ được Glasswall thực hiện cho một công tắc quản lý nội dung cụ thể. Mỗi công tắc quản lý nội dung có thể được đặt thành một trong ba cài đặt sau:
-
Cho phép - Glasswall Embedded Engine xử lý mọi loại phần tử tệp liên quan và chúng vẫn được giữ lại trong tệp được tái tạo. Cấu trúc liên quan được ghi lại trong báo cáo Analysis dưới dạng Allowed Item.
-
Không cho phép - Nếu bất kỳ loại phần tử tệp liên quan nào được xác định trong tệp, Glasswall Embedded Engine sẽ xác định tệp là không tuân thủ và tệp sẽ không được tái tạo. Cấu trúc liên quan được ghi lại trong báo cáo Analysis dưới dạng Issue Item.
-
Làm sạch - Nếu bất kỳ loại phần tử tệp liên quan nào được xác định trong tệp, Glasswall Embedded Engine sẽ loại bỏ chúng khỏi tài liệu được tái tạo. Cấu trúc liên quan được ghi lại trong báo cáo Analysis dưới dạng Sanitisation Item.
Báo cáo quản lý nội dung
Các phần sau đây cho thấy cách nội dung nằm dưới sự kiểm soát của một công tắc quản lý nội dung được trình bày trong báo cáo XML Analysis, tùy thuộc vào cài đặt của công tắc nội dung.
Cho phép
Đây là một đoạn trích từ báo cáo XML cho một tệp nhị phân Word (.doc), có chứa siêu dữ liệu. Công tắc quản lý nội dung metadata đã được đặt thành allow.
<gw:Camera cameraName="wordConfig">
<gw:ContentSwitch>
<gw:ContentName>metadata</gw:ContentName>
<gw:ContentValue>allow</gw:ContentValue>
</gw:ContentSwitch>
...
<gw:AllowedItems itemCount="1">
<gw:AllowedItem>
<gw:TechnicalDescription>Metadata detected in #05SummaryInformation</gw:TechnicalDescription>
<gw:InstanceCount>1</gw:InstanceCount>
<gw:TotalSizeInBytes>4096</gw:TotalSizeInBytes>
</gw:AllowedItem>
</gw:AllowedItems>
Không cho phép
Đây là một đoạn trích từ báo cáo XML cho một tệp Word (.doc) Binary có chứa siêu dữ liệu bên trong. Công tắc quản lý nội dung metadata đã được đặt thành disallow. Trong Protect Mode, điều này sẽ khiến tệp được đánh dấu là không tuân thủ.
<gw:Camera cameraName = "wordConfig">
<gw:ContentSwitch>
<gw:ContentName>metadata</gw:ContentName>
<gw:ContentValue>disallow</gw:ContentValue>
</gw:ContentSwitch>
...
<gw:IssueItem>
<gw:TechnicalDescription> Metadata detected in #05SummaryInformation</gw:TechnicalDescription>
<gw:IssueId>96</gw:IssueId>
<gw:InstanceCount>1</gw:InstanceCount>
<gw:RiskLevel>Medium</gw:RiskLevel>
</gw:IssueItem>
Làm sạch
Đây là một đoạn trích từ báo cáo XML cho một tệp Word (.doc) Binary có chứa siêu dữ liệu bên trong. Công tắc quản lý nội dung metadata đã được đặt thành sanitise. Trong Protect Mode, điều này sẽ dẫn đến việc siêu dữ liệu bị xóa khỏi tệp được tái tạo.
<gw:Camera cameraName = "wordConfig">
<gw:ContentSwitch>
<gw:ContentName>metadata</gw:ContentName>
<gw:ContentValue>sanitise</gw:ContentValue>
</gw:ContentSwitch>
...
<gw:SanitisationItem>
<gw:TechnicalDescription>Metadata detected in #05SummaryInformation</gw:TechnicalDescription>
<gw:InstanceCount>1</gw:InstanceCount>
<gw:TotalSizeInBytes>4096</gw:TotalSizeInBytes>
</gw:SanitisationItem>
Các policy quản lý nội dung
Đây là các policy quản lý nội dung hiện có:
| Công tắc quản lý nội dung | Mô tả |
|---|---|
| pdfConfig | Công tắc quản lý nội dung cho loại tệp PDF |
| wordConfig | Công tắc quản lý nội dung cho loại tệp Word |
| pptConfig | Công tắc quản lý nội dung cho loại tệp PowerPoint |
| xlsConfig | Công tắc quản lý nội dung cho loại tệp Excel |
| tiffConfig | Công tắc quản lý nội dung cho loại tệp TIFF |
| svgConfig | Công tắc quản lý nội dung cho loại tệp SVG |
| webpConfig | Công tắc quản lý nội dung cho loại tệp WebP |
| jpegConfig | Công tắc quản lý nội dung cho loại tệp JPEG |
| sysConfig | Công tắc quản lý nội dung để kiểm soát các cài đặt Engine khác nhau |
Lưu ý: Các policy quản lý nội dung xlsConfig, pptConfig và wordConfig bao gồm cả loại tệp Office Open XML và Office Binary.
Các công tắc quản lý nội dung hiện có và các loại tệp áp dụng được hiển thị trong bảng bên dưới:
| Công tắc quản lý nội dung | Mô tả |
|---|---|
| acroform | Kiểm soát nội dung biểu mẫu tương tác (AcroForm) |
| javascript | Kiểm soát mã JavaScript được nhúng trong tệp |
| external_hyperlinks | Kiểm soát các siêu liên kết đến các vị trí bên ngoài tệp |
| embedded_files | Kiểm soát nội dung tệp nhúng |
| metadata | Kiểm soát siêu dữ liệu của tệp |
| actions_all | Kiểm soát các Hành động PDF như Rendition, Sound, Movie, Hide, SetOCGState, GoTo3DView |
| internal_hyperlinks | Kiểm soát các siêu liên kết đến các vị trí bên trong tệp |
| value_outside_reasonable_limits | Kiểm soát các hạn chế do Glasswall xác định, chẳng hạn như các giá trị vượt quá phạm vi hợp lý, ví dụ: kích thước đối tượng |
| digital_signatures | Kiểm soát nội dung chữ ký số cho các tệp đã ký hoặc các đối tượng đã ký trong tệp. LƯU Ý: không thể sử dụng thiết lập 'allow' cho công tắc quản lý nội dung digital_signatures. |
| macros | Kiểm soát VBA Macros sử dụng mã Visual Basic để tạo các hàm tùy chỉnh do người dùng tạo ra |
| review_comments | Kiểm soát các nhận xét rà soát tài liệu trong tệp |
| embedded_images | Kiểm soát nội dung hình ảnh nhúng cho các định dạng hình ảnh được Glasswall hỗ trợ |
| dynamic_data_exchange | Kiểm soát các lệnh DDE và nội dung DDE trong tài liệu |
| tracked_changes | Kiểm soát các thay đổi được theo dõi trong tài liệu |
| hidden_data | Kiểm soát dữ liệu ẩn trong tài liệu |
| in_text_comments | Kiểm soát các chú thích trong văn bản trong tài liệu |
| slide_notes | Kiểm soát ghi chú trang chiếu trong tài liệu |
| kết nối | Kiểm soát các kết nối tới nguồn dữ liệu và thông tin bên ngoài cho các cấu trúc như công thức OLAP, QueryTables hoặc PivotTables |
| tập lệnh | Kiểm soát XML Scripts cho phép tạo, lưu trữ và thao tác biến và dữ liệu trong quá trình xử lý |
| đối tượng bên ngoài | Kiểm soát các đối tượng được nhúng trong các định dạng dựa trên XML như SVG |
| siêu liên kết | Kiểm soát các siêu liên kết bên ngoài và bên trong |
| geotiff | Kiểm soát thông tin tham chiếu địa lý được nhúng trong tệp TIFF |
| jfif | Kiểm soát các phân đoạn dấu đánh dấu JFIF trong tệp ảnh JPEG |
| undefined_type | Kiểm soát các phân đoạn TIFF IFD có kiểu không xác định |
| doc_variables | Kiểm soát các biến tài liệu trong docx |
| web_video_extension | Kiểm soát việc sử dụng Web Video Extensions trong DOCX |
| headers_footers | Kiểm soát nội dung Header và Footer trong DOCX |
Các switch hiện có cho từng định dạng được trình bày trong bảng bên dưới:
| Switch | DOC | DOCX | PPT | PPTX | XLS | XLSX | GIF | JPEG | SVG | WEBP | TIFF | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| acroform | ✓ | |||||||||||
| actions_all | ✓ | |||||||||||
| kết nối | ✓ | |||||||||||
| digital_signatures | ✓ * | |||||||||||
| dynamic_data_exchange | ✓ | ✓ | ||||||||||
| embedded_files | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |||||
| embedded_images | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |||||
| external_hyperlinks | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |||||
| đối tượng bên ngoài | ✓ | |||||||||||
| geotiff | ✓ | |||||||||||
| hidden_data | ✓ | ✓ | ✓ | |||||||||
| siêu liên kết | ✓ | |||||||||||
| internal_hyperlinks | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |||||
| in_text_comments | ✓ | |||||||||||
| javascript | ✓ | |||||||||||
| jfif | ✓ † | |||||||||||
| macros | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ||||||
| metadata | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ † | ✓ | |||
| retain_exported_streams | ✓ * | |||||||||||
| review_comments | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ||||||
| slide_notes | ✓ * | |||||||||||
| tập lệnh | ✓ | |||||||||||
| tracked_changes | ✓ | ✓ | ||||||||||
| value_outside_reasonable_limits | ✓ | |||||||||||
| undefined_type | ✓ † | |||||||||||
| doc_variables | ✓ | |||||||||||
| web_video_extension | ✓ | |||||||||||
| headers_footers | ✓ |
[ *]: Switch quản lý nội dung khả dụng trong chế độ "enablerebuild" (mặc định) hoặc chỉ Rebuild của Editor [ †]: Switch quản lý nội dung khả dụng trong chế độ "editoronly" của Editor, chỉ có thể được sử dụng với tính năng Export/Import
Tất cả các loại nội dung không được biểu diễn bởi một loại quản lý nội dung cho một định dạng tệp cụ thể sẽ được Glasswall engine tự động khắc phục nếu được xác định là độc hại.
Tệp nhúng
Loại quản lý nội dung "Embedded Files" áp dụng cho các định dạng tệp không phải hình ảnh nằm trong một tệp vùng chứa riêng biệt. Đối với các định dạng MS-Office, policy cho tệp nhúng được áp dụng khác nhau tùy thuộc vào việc tệp đang được xem xét có được engine hỗ trợ và truy cập hay không:
Hành động được áp dụng cho tệp nhúng theo policy quản lý nội dung đối với tệp Microsoft Office:
| Cho phép | Làm sạch | Không cho phép | |
|---|---|---|---|
| Được hỗ trợ | Được xử lý như một tệp độc lập. Nếu tệp không tuân thủ, tệp chứa sẽ bị từ chối và lý do không tuân thủ sẽ được báo cáo dưới dạng một Issue Item. | Được xử lý như một tệp độc lập. Nếu tệp không tuân thủ, tệp chứa sẽ bị từ chối và lý do không tuân thủ sẽ được báo cáo dưới dạng một Issue Item. | Tệp chứa sẽ bị từ chối, với tệp nhúng được mô tả trong một Issue Item. |
| Không được hỗ trợ | Được tạo lại mà không có thay đổi và được báo cáo dưới dạng một Allowed Item. | Được loại bỏ khỏi tệp chứa, cùng với mọi tham chiếu đến tệp đó, và được báo cáo dưới dạng một Sanitisation Item. | Tệp chứa sẽ bị từ chối, với tệp nhúng được mô tả trong một Issue Item. |
Bảng dưới đây nêu rõ những định dạng tệp nhúng nào được hỗ trợ (✓) trong từng loại tệp chứa, và những định dạng nào không được hỗ trợ (✗).
[†]: Bị định dạng tệp chứa không cho phép
[‡]: Không bị loại bỏ bởi công tắc Embedded Files nhưng có thể bị loại bỏ bởi công tắc All Actions. Tệp nhúng được tạo lại mà không được xử lý.
⚠️ Lưu ý: Để bảo toàn tính toàn vẹn về mặt hiển thị giữa phiên bản gốc và phiên bản đã được làm sạch của tệp, các thành phần hiển thị liên quan (chẳng hạn như hình thu nhỏ và các tham chiếu
blip) của các tệp nhúng không được hỗ trợ sẽ không bị loại bỏ trong quá trình làm sạch. Điều này đảm bảo rằng các tệp sau xử lý vẫn giữ được tính nhất quán về mặt hiển thị với phiên bản gốc của chúng.
Hỗ trợ độ sâu nhúng
Embedded Engine hỗ trợ tối đa chín cấp nội dung nhúng lồng nhau trong các tệp OfficeXML. Nếu phát hiện bất kỳ tệp nhúng nào vượt quá độ sâu này, tệp chứa sẽ bị từ chối và một Issue Item sẽ được tạo để cho biết rằng đã vượt quá giới hạn đệ quy tối đa. Giới hạn này chỉ áp dụng cho độ sâu lồng nhau, và nhiều tệp nhúng ở cùng một cấp sẽ không bị tính vào giới hạn đó.
Hình ảnh nhúng
Đối với các định dạng tệp hình ảnh, nên sử dụng công tắc quản lý nội dung "Embedded Images". Công tắc này có hành vi sau tùy theo cài đặt công tắc:
Hành động được áp dụng cho hình ảnh nhúng theo policy quản lý nội dung:
| Cho phép | Làm sạch | Không cho phép | |
|---|---|---|---|
| Được hỗ trợ | Được xử lý như một tệp độc lập. Nếu tệp không tuân thủ, tệp chứa sẽ bị từ chối và lý do không tuân thủ sẽ được báo cáo dưới dạng một Issue Item. | Được xử lý như một tệp độc lập. Nếu tệp không tuân thủ, tệp chứa sẽ bị từ chối và lý do không tuân thủ sẽ được báo cáo dưới dạng một Issue Item. | Tệp chứa bị từ chối, với hình ảnh nhúng được mô tả trong một Issue Item |
| Không được hỗ trợ* | Được tái tạo mà không thay đổi và được báo cáo là một Allowed Item | Bị xóa khỏi tệp chứa, cùng với mọi tham chiếu đến nó, và được báo cáo là một Sanitisation Item | Tệp chứa bị từ chối, với hình ảnh nhúng được mô tả trong một Issue Item |
[ * ] : Các hình ảnh nhúng không được hỗ trợ có thể được xử lý thay thế bằng công tắc "embedded_files" nếu engine không nhận diện được loại tệp
Bảng dưới đây cho biết những định dạng hình ảnh nào chúng tôi cố gắng tái tạo lại (✓) khi "Embedded Images" được đặt thành sanitise so với những định dạng bị loại bỏ (✗):
[⸸]: Sẽ được tệp vùng chứa chuyển đổi sang một định dạng khác
Xin lưu ý rằng khi "Embedded Images" được đặt thành "Disallow", bất kỳ hình ảnh nào được phát hiện sẽ dẫn đến việc từ chối tệp chứa. Điều này bao gồm cả hình thu nhỏ của các tài liệu chứa hoặc tài liệu nhúng và do đó có thể ghi đè công tắc quản lý nội dung "Embedded File".
Macro
Công tắc nội dung macros cho các tệp MS Office áp dụng cho cả macro Microsoft Visual Basic for Applications (VBA) và macro Excel 4.0.
Microsoft Visual Basic for Applications
Macro VBA được viết bằng ngôn ngữ lập trình Visual Basic và có thể được đưa vào bất kỳ định dạng tệp MS Office nào. Việc xử lý macro VBA có thể được cấu hình như sau:
- Sanitise - Macro VBA bị xóa khỏi tệp.
- Disallow - Macro VBA bị cấm. Nếu phát hiện macro, tệp chứa macro đó sẽ bị từ chối.
- Allow - Macro VBA được xử lý và tạo lại như một phần của tệp chứa chúng, miễn là chúng tuân thủ đặc tả.
Hành vi của chế độ Export
Trong chế độ Export, VBA Project Binaries được tính vào giới hạn đệ quy. Điều này có nghĩa là độ sâu lồng tối đa giảm xuống còn tám nếu tệp nhúng sâu nhất chứa macro VBA.
Macro Excel 4.0
Macro Excel 4.0 là một tính năng cũ được bao gồm trong các tệp XLSX và XLS. Các tệp XLSX chứa macro Excel 4.0 sẽ được lưu bằng phần mở rộng tệp ".xlsm" và sẽ phát sinh lỗi nếu phần mở rộng này bị sửa đổi. Việc xử lý macro Excel 4.0 có thể được cấu hình như sau:
- Sanitise - Trong tệp XLS, tệp sẽ bị chặn và
Excel 4.0 Macro found: Not supportedđược báo cáo là một mục sự cố. Trong tệp XLSX/XLSM, các trang tính chứa macro sẽ bị xóa khỏi tài liệu và được báo cáo là một mục sanitisation. Nếu điều này khiến tệp bị lỗi cấu trúc (tức là làm giảm số lượng trang tính hiển thị xuống bằng không), tệp sẽ bị từ chối và một mục sự cố phù hợp sẽ được báo cáo. - Disallow - Macro Excel 4.0 bị cấm. Nếu phát hiện macro, tệp chứa macro đó sẽ bị từ chối.
- Allow - Trong tệp XLS, tệp sẽ bị chặn và
Excel 4.0 Macro found: Not supportedđược báo cáo là một mục sự cố. Trong tệp XLSX/XLSM, tệp sẽ được tạo lại với macro được giữ nguyên.
Siêu dữ liệu
Trong OOXML, siêu dữ liệu đề cập đến thông tin mô tả nội dung, cấu trúc và thuộc tính của tài liệu nhưng không phải là một phần của nội dung chính của tài liệu. Siêu dữ liệu trong tài liệu OOXML chủ yếu được lưu trữ trong các tệp XML nằm trong thư mục docProps:
- core.xml: Chứa các thuộc tính cốt lõi dựa trên Dublin Core Metadata Element Set.
- app.xml: Chứa các thuộc tính mở rộng dành riêng cho các ứng dụng Microsoft Office.
- custom.xml: Chứa các thuộc tính tùy chỉnh.
Việc xử lý siêu dữ liệu OOXML có thể được cấu hình như sau:
- Sanitise - Tệp được tạo lại với siêu dữ liệu đã bị loại bỏ (xem bên dưới để biết tất cả các thuộc tính hiện đang được làm sạch)
- Disallow - Siêu dữ liệu bị cấm. Nếu phát hiện bất kỳ siêu dữ liệu nào (các thuộc tính được liệt kê bên dưới), tệp chứa sẽ bị từ chối.
- Allow - Tệp được xử lý và siêu dữ liệu được tạo lại.
Là một phần của công tắc quản lý nội dung 'metadata', hiện tại chúng tôi làm sạch những mục sau trong:
- core.xml: title, subject, creator, keywords, description, lastModifiedBy, revision, lastPrinted, created, modified, category, contentStatus, language, and version.
- app.xml: manager, company, and hyperlinkBase
- custom.xml: mọi thuộc tính tùy chỉnh được thêm vào tài liệu OOXML.
Các công tắc dành riêng cho OfficeXML (DOCX, XLSX, PPTX)
Dữ liệu ẩn
Các định dạng tệp Office cung cấp nhiều cách hợp lệ khác nhau để "ẩn" văn bản hoặc dữ liệu, bao gồm toàn bộ trang tính Excel, trang chiếu PowerPoint hoặc các dòng văn bản trong tài liệu Word. Công cụ Glasswall xử lý dữ liệu ẩn theo các cách sau, tùy thuộc vào cài đặt công tắc quản lý nội dung:
- Sanitise - Tệp được tạo lại với mọi dữ liệu ẩn được "hiện ra", để người dùng có thể nhìn thấy hoàn toàn.
- Disallow - Dữ liệu ẩn bị cấm. Nếu phát hiện bất kỳ dữ liệu ẩn nào, tệp chứa sẽ bị từ chối.
- Allow - Mọi dữ liệu ẩn được tạo lại và vẫn được giữ ẩn.
Lưu ý: Với mục đích của cài đặt quản lý nội dung này, “Hidden Data” không đề cập đến các cách đa dạng để làm rối hoặc chôn giấu dữ liệu trong các tệp Office 2007. Thay vào đó, nó chỉ cụ thể cho các phương pháp ẩn dữ liệu có sẵn trực tiếp trong GUI của Office 2007. Dữ liệu bị làm rối hoặc che giấu được quản lý bởi cài đặt policy tương ứng với phương pháp được sử dụng; ví dụ: metadata sẽ loại bỏ dữ liệu được che giấu trong các trường văn bản tự do chứa trong siêu dữ liệu của tài liệu.
Thay đổi được theo dõi
Công tắc quản lý nội dung tracked_changes đề cập đến nội dung được thêm bởi chức năng "Track Changes" trong các tệp DOCX và XLSX, còn được gọi là "revisions". Chúng có thể chứa dữ liệu lịch sử liên quan đến các phiên bản trước của tài liệu, bao gồm tên của những người đóng góp và bản ghi về nội dung đã bị xóa hoặc làm mờ kể từ đó. Việc xử lý các thay đổi được theo dõi có thể được cấu hình như sau:
- Sanitise - Toàn bộ dữ liệu lịch sử bị xóa và "Track Changes" bị vô hiệu hóa. Tài liệu được tái tạo sẽ tương đương với trạng thái cuối cùng của tài liệu gốc.
- Disallow - Không cho phép các thay đổi được theo dõi. Nếu có bất kỳ bằng chứng nào về các bản sửa đổi trước đó hoặc các thay đổi được theo dõi vẫn còn trong tệp, tệp sẽ bị từ chối.
- Allow - Tệp được tái tạo với toàn bộ thay đổi lịch sử, bản sửa đổi và thay đổi được theo dõi được giữ nguyên.
Ghi chú trang chiếu
Công tắc quản lý nội dung slide_notes đề cập đến nội dung được thêm bởi chức năng "Notes" trong các tệp PPTX, còn được gọi là "slide notes" (và/hoặc "speaker notes"). Glasswall engine xử lý các ghi chú trang chiếu này theo những cách sau, tùy thuộc vào cấu hình của cài đặt công tắc quản lý nội dung:
- Sanitise - Tệp được tái tạo với toàn bộ ghi chú trang chiếu đã bị xóa.
- Disallow - Không cho phép ghi chú trang chiếu. Nếu phát hiện bất kỳ ghi chú trang chiếu nào, tệp chứa chúng sẽ bị từ chối.
- Allow - Mọi ghi chú trang chiếu sẽ được tái tạo và vẫn được giữ trong tệp.
Chú thích trong văn bản
Công tắc in_text_comments đề cập đến nội dung được thêm bởi chức năng "In-Text Comments" trong các tệp DOCX. Việc xử lý công tắc này có thể được cấu hình như sau:
- Sanitise - Chú thích trong văn bản bị xóa cùng với siêu dữ liệu tài liệu tương ứng được tìm thấy trong
core.xml. - Disallow - Không cho phép chú thích trong văn bản. Bất kỳ tệp DOCX nào chứa chú thích trong văn bản sẽ chặn việc tái tạo tệp.
- Allow - Tệp được tái tạo với Chú thích trong văn bản hiện diện trong tệp DOCX.
Lưu ý: Khi in_text_comments sanitise được đặt thành allow và công tắc metadata được đặt thành sanitise thì tệp được tái tạo sẽ có chú thích trong văn bản hiện diện nhưng không có bất kỳ dữ liệu nào vì công tắc metadata làm sạch mô tả tương ứng khỏi tệp core.xml.
Biến tài liệu
Tùy chọn doc_variables đề cập đến nội dung được thêm bởi chức năng "Document Variables" trong các tệp DOCX. Cách xử lý tùy chọn này có thể được cấu hình như sau:
- Sanitise - Tệp được tạo lại với tất cả biến tài liệu đã bị xóa.
- Disallow - Biến tài liệu bị cấm. Bất kỳ tệp DOCX nào chứa biến tài liệu sẽ chặn việc tạo lại tệp.
- Allow - Tệp được tạo lại với các biến tài liệu có trong tệp DOCX.
Tiện ích mở rộng video web
Tùy chọn web_video_extension đề cập đến nội dung được thêm bằng chức năng "Web Videos Extension" trong các tệp DOCX. Cách xử lý tùy chọn này có thể được cấu hình như sau:
- Sanitise - Tệp được tạo lại với tất cả tiện ích mở rộng video web đã bị xóa.
- Disallow - Việc sử dụng tiện ích mở rộng video web bị cấm. Bất kỳ tệp DOCX nào chứa tiện ích mở rộng video web sẽ chặn việc tạo lại tệp.
- Allow - Tệp được tạo lại với tiện ích mở rộng video web được bao gồm trong tệp DOCX.
Đầu trang và chân trang
Tùy chọn headers_footers đề cập đến nội dung được thêm vào các phần Đầu trang hoặc Chân trang của một trang trong DOCX; nội dung này có thể khác nhau ở trang đầu tiên, các trang chẵn và các trang lẻ, hoặc giống nhau trong toàn bộ tài liệu. Cách xử lý tùy chọn này có thể được cấu hình như sau:
- Sanitise - Tệp sẽ được tạo lại với toàn bộ nội dung đầu trang và chân trang đã bị xóa.
- Disallow - Việc sử dụng đầu trang và chân trang bị cấm. Bất kỳ tệp DOCX nào chứa đầu trang hoặc chân trang sẽ chặn việc tạo lại tệp.
- Allow - Tệp được tạo lại với đầu trang và chân trang được bao gồm trong tệp DOCX.
Các tùy chọn chỉ dành riêng cho PDF
Chữ ký số
Tổng quan Tệp PDF có thể chứa Chữ ký số và AcroForms; một số loại AcroForms nhất định có thể chứa chữ ký số. Trong khi chữ ký số được dùng để xác minh tính xác thực và tính toàn vẹn của tài liệu, AcroForms cung cấp nền tảng cấu trúc cho các trường biểu mẫu tương tác. Khi có chữ ký số trong PDF, AcroForm sẽ có phần thể hiện trực quan của chính chữ ký đó.
Khi xử lý các tệp PDF có bao gồm chữ ký số, Glasswall CDR engine áp dụng quy trình làm sạch được thiết kế để giữ nguyên tính toàn vẹn về mặt hiển thị đồng thời loại bỏ nội dung đang hoạt động và/hoặc có khả năng rủi ro.
Cách CDR Engine xử lý Chữ ký số Để đảm bảo cả tính an toàn và tính nhất quán của tài liệu, Glasswall CDR engine thực hiện các hành động sau trong quá trình làm sạch:
- Loại bỏ dữ liệu chữ ký mật mã, bao gồm mọi chứng chỉ được nhúng, logic xác thực hoặc script.
- Loại bỏ metadata liên quan đến chữ ký và hành vi tương tác để triệt tiêu các đường dẫn thực thi hoặc các khả năng khai thác tiềm ẩn.
- Giữ nguyên hình thức hiển thị trực quan của tiện ích chữ ký, chẳng hạn như hình ảnh chữ ký, tên người ký và văn bản ngày/giờ. Việc này được thực hiện bằng cách làm phẳng nó vào lớp nội dung tĩnh của PDF.
| AcroForm | Chữ ký số | Hành vi AcroForm dự kiến | Hành vi Chữ ký số dự kiến | Hành vi của phần AcroForm chứa Chữ ký số | Tệp có được tạo lại không? |
|---|---|---|---|---|---|
| Cho phép | Cho phép | Được tạo lại mà không làm sạch | Được tạo lại mà không làm sạch | Toàn bộ phần (bao gồm biểu mẫu tương tác và chữ ký số) được giữ nguyên như hiện trạng | Có |
| Làm sạch | Cho phép | Đã làm sạch (đã loại bỏ hoặc làm phẳng) | Được tạo lại mà không làm sạch | Chữ ký số trực quan được giữ nguyên; trường AcroForm chứa chữ ký đó được làm sạch hoặc loại bỏ | Có |
| Cho phép | Làm sạch | Được tạo lại mà không làm sạch | Đã làm sạch (đã loại bỏ các thành phần mật mã) | Phần trực quan của chữ ký số được giữ nguyên như một phần của AcroForm; chữ ký trở nên không còn chức năng | Có |
| Làm sạch | Làm sạch | Đã làm sạch | Đã làm sạch | Toàn bộ phần chữ ký số, bao gồm các trường AcroForm, bị loại bỏ hoặc được làm phẳng về mặt trực quan | Có |
| Không cho phép | * | Không áp dụng | Không áp dụng | Tệp không được tạo lại do có sự hiện diện của AcroForm không được phép | Không |
| * | Không cho phép | Không áp dụng | Không áp dụng | Tệp không được tạo lại do có sự hiện diện của Chữ ký số không được phép | Không |
Khả năng kiểm toán và chuỗi giám sát
Để hỗ trợ khả năng truy vết và trách nhiệm giải trình trong các môi trường an toàn, công cụ Glasswall CDR ghi lại các giá trị băm mật mã của cả tệp đầu vào và đầu ra. Điều này cho phép một đơn vị tích hợp hệ thống:
- Xác minh nguồn gốc tệp thông qua so sánh giá trị băm.
- Cung cấp sự bảo đảm rằng, trong trường hợp chữ ký số không còn hợp lệ, chuỗi giám sát vẫn được duy trì và có thể được chứng minh.