Chuyển đến nội dung chính

Quản lý nội dung

Các policy Quản lý nội dung là một tập hợp các công tắc quản lý nội dung có thể được áp dụng cho một loại tệp cụ thể.

Công tắc quản lý nội dung được dùng để xác định một loại phần tử tệp và hành động liên quan.

Cài đặt quản lý nội dung chỉ định hành động sẽ được Glasswall thực hiện cho một công tắc quản lý nội dung cụ thể. Mỗi công tắc quản lý nội dung có thể được đặt thành một trong ba cài đặt sau:

  • Cho phép - Glasswall Embedded Engine xử lý mọi loại phần tử tệp liên quan và chúng vẫn được giữ lại trong tệp được tái tạo. Cấu trúc liên quan được ghi lại trong báo cáo Analysis dưới dạng Allowed Item.

  • Không cho phép - Nếu bất kỳ loại phần tử tệp liên quan nào được xác định trong tệp, Glasswall Embedded Engine sẽ xác định tệp là không tuân thủ và tệp sẽ không được tái tạo. Cấu trúc liên quan được ghi lại trong báo cáo Analysis dưới dạng Issue Item.

  • Làm sạch - Nếu bất kỳ loại phần tử tệp liên quan nào được xác định trong tệp, Glasswall Embedded Engine sẽ loại bỏ chúng khỏi tài liệu được tái tạo. Cấu trúc liên quan được ghi lại trong báo cáo Analysis dưới dạng Sanitisation Item.

Báo cáo quản lý nội dung

Các phần sau đây cho thấy cách nội dung nằm dưới sự kiểm soát của một công tắc quản lý nội dung được trình bày trong báo cáo XML Analysis, tùy thuộc vào cài đặt của công tắc nội dung.

Cho phép

Đây là một đoạn trích từ báo cáo XML cho một tệp nhị phân Word (.doc), có chứa siêu dữ liệu. Công tắc quản lý nội dung metadata đã được đặt thành allow.

    <gw:Camera cameraName="wordConfig">
<gw:ContentSwitch>
<gw:ContentName>metadata</gw:ContentName>
<gw:ContentValue>allow</gw:ContentValue>
</gw:ContentSwitch>
...
<gw:AllowedItems itemCount="1">
<gw:AllowedItem>
<gw:TechnicalDescription>Metadata detected in #05SummaryInformation</gw:TechnicalDescription>
<gw:InstanceCount>1</gw:InstanceCount>
<gw:TotalSizeInBytes>4096</gw:TotalSizeInBytes>
</gw:AllowedItem>
</gw:AllowedItems>

Không cho phép

Đây là một đoạn trích từ báo cáo XML cho một tệp Word (.doc) Binary có chứa siêu dữ liệu bên trong. Công tắc quản lý nội dung metadata đã được đặt thành disallow. Trong Protect Mode, điều này sẽ khiến tệp được đánh dấu là không tuân thủ.

    <gw:Camera cameraName = "wordConfig">
<gw:ContentSwitch>
<gw:ContentName>metadata</gw:ContentName>
<gw:ContentValue>disallow</gw:ContentValue>
</gw:ContentSwitch>
...
<gw:IssueItem>
<gw:TechnicalDescription> Metadata detected in #05SummaryInformation</gw:TechnicalDescription>
<gw:IssueId>96</gw:IssueId>
<gw:InstanceCount>1</gw:InstanceCount>
<gw:RiskLevel>Medium</gw:RiskLevel>
</gw:IssueItem>

Làm sạch

Đây là một đoạn trích từ báo cáo XML cho một tệp Word (.doc) Binary có chứa siêu dữ liệu bên trong. Công tắc quản lý nội dung metadata đã được đặt thành sanitise. Trong Protect Mode, điều này sẽ dẫn đến việc siêu dữ liệu bị xóa khỏi tệp được tái tạo.

    <gw:Camera cameraName = "wordConfig">
<gw:ContentSwitch>
<gw:ContentName>metadata</gw:ContentName>
<gw:ContentValue>sanitise</gw:ContentValue>
</gw:ContentSwitch>
...
<gw:SanitisationItem>
<gw:TechnicalDescription>Metadata detected in #05SummaryInformation</gw:TechnicalDescription>
<gw:InstanceCount>1</gw:InstanceCount>
<gw:TotalSizeInBytes>4096</gw:TotalSizeInBytes>
</gw:SanitisationItem>

Các policy quản lý nội dung

Đây là các policy quản lý nội dung hiện có:

Công tắc quản lý nội dungMô tả
pdfConfigCông tắc quản lý nội dung cho loại tệp PDF
wordConfigCông tắc quản lý nội dung cho loại tệp Word
pptConfigCông tắc quản lý nội dung cho loại tệp PowerPoint
xlsConfigCông tắc quản lý nội dung cho loại tệp Excel
tiffConfigCông tắc quản lý nội dung cho loại tệp TIFF
svgConfigCông tắc quản lý nội dung cho loại tệp SVG
webpConfigCông tắc quản lý nội dung cho loại tệp WebP
jpegConfigCông tắc quản lý nội dung cho loại tệp JPEG
sysConfigCông tắc quản lý nội dung để kiểm soát các cài đặt Engine khác nhau

Lưu ý: Các policy quản lý nội dung xlsConfig, pptConfigwordConfig bao gồm cả loại tệp Office Open XML và Office Binary.

Các công tắc quản lý nội dung hiện có và các loại tệp áp dụng được hiển thị trong bảng bên dưới:

Công tắc quản lý nội dungMô tả
acroformKiểm soát nội dung biểu mẫu tương tác (AcroForm)
javascriptKiểm soát mã JavaScript được nhúng trong tệp
external_hyperlinksKiểm soát các siêu liên kết đến các vị trí bên ngoài tệp
embedded_filesKiểm soát nội dung tệp nhúng
metadataKiểm soát siêu dữ liệu của tệp
actions_allKiểm soát các Hành động PDF như Rendition, Sound, Movie, Hide, SetOCGState, GoTo3DView
internal_hyperlinksKiểm soát các siêu liên kết đến các vị trí bên trong tệp
value_outside_reasonable_limitsKiểm soát các hạn chế do Glasswall xác định, chẳng hạn như các giá trị vượt quá phạm vi hợp lý, ví dụ: kích thước đối tượng
digital_signaturesKiểm soát nội dung chữ ký số cho các tệp đã ký hoặc các đối tượng đã ký trong tệp. LƯU Ý: không thể sử dụng thiết lập 'allow' cho công tắc quản lý nội dung digital_signatures.
macrosKiểm soát VBA Macros sử dụng mã Visual Basic để tạo các hàm tùy chỉnh do người dùng tạo ra
review_commentsKiểm soát các nhận xét rà soát tài liệu trong tệp
embedded_imagesKiểm soát nội dung hình ảnh nhúng cho các định dạng hình ảnh được Glasswall hỗ trợ
dynamic_data_exchangeKiểm soát các lệnh DDE và nội dung DDE trong tài liệu
tracked_changesKiểm soát các thay đổi được theo dõi trong tài liệu
hidden_dataKiểm soát dữ liệu ẩn trong tài liệu
in_text_commentsKiểm soát các chú thích trong văn bản trong tài liệu
slide_notesKiểm soát ghi chú trang chiếu trong tài liệu
kết nốiKiểm soát các kết nối tới nguồn dữ liệu và thông tin bên ngoài cho các cấu trúc như công thức OLAP, QueryTables hoặc PivotTables
tập lệnhKiểm soát XML Scripts cho phép tạo, lưu trữ và thao tác biến và dữ liệu trong quá trình xử lý
đối tượng bên ngoàiKiểm soát các đối tượng được nhúng trong các định dạng dựa trên XML như SVG
siêu liên kếtKiểm soát các siêu liên kết bên ngoài và bên trong
geotiffKiểm soát thông tin tham chiếu địa lý được nhúng trong tệp TIFF
jfifKiểm soát các phân đoạn dấu đánh dấu JFIF trong tệp ảnh JPEG
undefined_typeKiểm soát các phân đoạn TIFF IFD có kiểu không xác định
doc_variablesKiểm soát các biến tài liệu trong docx
web_video_extensionKiểm soát việc sử dụng Web Video Extensions trong DOCX
headers_footersKiểm soát nội dung Header và Footer trong DOCX

Các switch hiện có cho từng định dạng được trình bày trong bảng bên dưới:

SwitchPDFDOCDOCXPPTPPTXXLSXLSXGIFJPEGSVGWEBPTIFF
acroform
actions_all
kết nối
digital_signatures *
dynamic_data_exchange
embedded_files
embedded_images
external_hyperlinks
đối tượng bên ngoài
geotiff
hidden_data
siêu liên kết
internal_hyperlinks
in_text_comments
javascript
jfif
macros
metadata
retain_exported_streams *
review_comments
slide_notes *
tập lệnh
tracked_changes
value_outside_reasonable_limits
undefined_type
doc_variables
web_video_extension
headers_footers

[ *]: Switch quản lý nội dung khả dụng trong chế độ "enablerebuild" (mặc định) hoặc chỉ Rebuild của Editor [ †]: Switch quản lý nội dung khả dụng trong chế độ "editoronly" của Editor, chỉ có thể được sử dụng với tính năng Export/Import

Tất cả các loại nội dung không được biểu diễn bởi một loại quản lý nội dung cho một định dạng tệp cụ thể sẽ được Glasswall engine tự động khắc phục nếu được xác định là độc hại.

Tệp nhúng

Loại quản lý nội dung "Embedded Files" áp dụng cho các định dạng tệp không phải hình ảnh nằm trong một tệp vùng chứa riêng biệt. Đối với các định dạng MS-Office, policy cho tệp nhúng được áp dụng khác nhau tùy thuộc vào việc tệp đang được xem xét có được engine hỗ trợ và truy cập hay không:

Hành động được áp dụng cho tệp nhúng theo policy quản lý nội dung đối với tệp Microsoft Office:

Cho phépLàm sạchKhông cho phép
Được hỗ trợĐược xử lý như một tệp độc lập. Nếu tệp không tuân thủ, tệp chứa sẽ bị từ chối và lý do không tuân thủ sẽ được báo cáo dưới dạng một Issue Item.Được xử lý như một tệp độc lập. Nếu tệp không tuân thủ, tệp chứa sẽ bị từ chối và lý do không tuân thủ sẽ được báo cáo dưới dạng một Issue Item.Tệp chứa sẽ bị từ chối, với tệp nhúng được mô tả trong một Issue Item.
Không được hỗ trợĐược tạo lại mà không có thay đổi và được báo cáo dưới dạng một Allowed Item.Được loại bỏ khỏi tệp chứa, cùng với mọi tham chiếu đến tệp đó, và được báo cáo dưới dạng một Sanitisation Item.Tệp chứa sẽ bị từ chối, với tệp nhúng được mô tả trong một Issue Item.

Bảng dưới đây nêu rõ những định dạng tệp nhúng nào được hỗ trợ (✓) trong từng loại tệp chứa, và những định dạng nào không được hỗ trợ (✗).

Định dạng tệp nhúng ↓ / Định dạng tệp chứa →DOCX/XLSX/PPTXDOC/XLS/PPTPDF
Office 2007
Office 2003
Office 1997
PDF
MP3không áp dụng
MP4không áp dụng
MPEGkhông áp dụng
WAV
Các định dạng không được Glasswall hỗ trợ

[†]: Bị định dạng tệp chứa không cho phép

[‡]: Không bị loại bỏ bởi công tắc Embedded Files nhưng có thể bị loại bỏ bởi công tắc All Actions. Tệp nhúng được tạo lại mà không được xử lý.

⚠️ Lưu ý: Để bảo toàn tính toàn vẹn về mặt hiển thị giữa phiên bản gốc và phiên bản đã được làm sạch của tệp, các thành phần hiển thị liên quan (chẳng hạn như hình thu nhỏ và các tham chiếu blip) của các tệp nhúng không được hỗ trợ sẽ không bị loại bỏ trong quá trình làm sạch. Điều này đảm bảo rằng các tệp sau xử lý vẫn giữ được tính nhất quán về mặt hiển thị với phiên bản gốc của chúng.

Hỗ trợ độ sâu nhúng

Embedded Engine hỗ trợ tối đa chín cấp nội dung nhúng lồng nhau trong các tệp OfficeXML. Nếu phát hiện bất kỳ tệp nhúng nào vượt quá độ sâu này, tệp chứa sẽ bị từ chối và một Issue Item sẽ được tạo để cho biết rằng đã vượt quá giới hạn đệ quy tối đa. Giới hạn này chỉ áp dụng cho độ sâu lồng nhau, và nhiều tệp nhúng ở cùng một cấp sẽ không bị tính vào giới hạn đó.

Hình ảnh nhúng

Đối với các định dạng tệp hình ảnh, nên sử dụng công tắc quản lý nội dung "Embedded Images". Công tắc này có hành vi sau tùy theo cài đặt công tắc:

Hành động được áp dụng cho hình ảnh nhúng theo policy quản lý nội dung:

Cho phépLàm sạchKhông cho phép
Được hỗ trợĐược xử lý như một tệp độc lập. Nếu tệp không tuân thủ, tệp chứa sẽ bị từ chối và lý do không tuân thủ sẽ được báo cáo dưới dạng một Issue Item.Được xử lý như một tệp độc lập. Nếu tệp không tuân thủ, tệp chứa sẽ bị từ chối và lý do không tuân thủ sẽ được báo cáo dưới dạng một Issue Item.Tệp chứa bị từ chối, với hình ảnh nhúng được mô tả trong một Issue Item
Không được hỗ trợ*Được tái tạo mà không thay đổi và được báo cáo là một Allowed ItemBị xóa khỏi tệp chứa, cùng với mọi tham chiếu đến nó, và được báo cáo là một Sanitisation ItemTệp chứa bị từ chối, với hình ảnh nhúng được mô tả trong một Issue Item

[ * ] : Các hình ảnh nhúng không được hỗ trợ có thể được xử lý thay thế bằng công tắc "embedded_files" nếu engine không nhận diện được loại tệp

Bảng dưới đây cho biết những định dạng hình ảnh nào chúng tôi cố gắng tái tạo lại () khi "Embedded Images" được đặt thành sanitise so với những định dạng bị loại bỏ ():

Định dạng hình ảnh nhúngDOCX/XLSX/PPTXDOC/XLS/PPTPDF
BMP, JPEG, GIF, PNG, EMF, SVG, TIFF
WMF, EMF
WebP
Các định dạng không được Glasswall hỗ trợ

[⸸]: Sẽ được tệp vùng chứa chuyển đổi sang một định dạng khác

Xin lưu ý rằng khi "Embedded Images" được đặt thành "Disallow", bất kỳ hình ảnh nào được phát hiện sẽ dẫn đến việc từ chối tệp chứa. Điều này bao gồm cả hình thu nhỏ của các tài liệu chứa hoặc tài liệu nhúng và do đó có thể ghi đè công tắc quản lý nội dung "Embedded File".

Macro

Công tắc nội dung macros cho các tệp MS Office áp dụng cho cả macro Microsoft Visual Basic for Applications (VBA) và macro Excel 4.0.

Microsoft Visual Basic for Applications

Macro VBA được viết bằng ngôn ngữ lập trình Visual Basic và có thể được đưa vào bất kỳ định dạng tệp MS Office nào. Việc xử lý macro VBA có thể được cấu hình như sau:

  • Sanitise - Macro VBA bị xóa khỏi tệp.
  • Disallow - Macro VBA bị cấm. Nếu phát hiện macro, tệp chứa macro đó sẽ bị từ chối.
  • Allow - Macro VBA được xử lý và tạo lại như một phần của tệp chứa chúng, miễn là chúng tuân thủ đặc tả.

Hành vi của chế độ Export

Trong chế độ Export, VBA Project Binaries được tính vào giới hạn đệ quy. Điều này có nghĩa là độ sâu lồng tối đa giảm xuống còn tám nếu tệp nhúng sâu nhất chứa macro VBA.

Macro Excel 4.0

Macro Excel 4.0 là một tính năng cũ được bao gồm trong các tệp XLSX và XLS. Các tệp XLSX chứa macro Excel 4.0 sẽ được lưu bằng phần mở rộng tệp ".xlsm" và sẽ phát sinh lỗi nếu phần mở rộng này bị sửa đổi. Việc xử lý macro Excel 4.0 có thể được cấu hình như sau:

  • Sanitise - Trong tệp XLS, tệp sẽ bị chặn và Excel 4.0 Macro found: Not supported được báo cáo là một mục sự cố. Trong tệp XLSX/XLSM, các trang tính chứa macro sẽ bị xóa khỏi tài liệu và được báo cáo là một mục sanitisation. Nếu điều này khiến tệp bị lỗi cấu trúc (tức là làm giảm số lượng trang tính hiển thị xuống bằng không), tệp sẽ bị từ chối và một mục sự cố phù hợp sẽ được báo cáo.
  • Disallow - Macro Excel 4.0 bị cấm. Nếu phát hiện macro, tệp chứa macro đó sẽ bị từ chối.
  • Allow - Trong tệp XLS, tệp sẽ bị chặn và Excel 4.0 Macro found: Not supported được báo cáo là một mục sự cố. Trong tệp XLSX/XLSM, tệp sẽ được tạo lại với macro được giữ nguyên.

Siêu dữ liệu

Trong OOXML, siêu dữ liệu đề cập đến thông tin mô tả nội dung, cấu trúc và thuộc tính của tài liệu nhưng không phải là một phần của nội dung chính của tài liệu. Siêu dữ liệu trong tài liệu OOXML chủ yếu được lưu trữ trong các tệp XML nằm trong thư mục docProps:

  1. core.xml: Chứa các thuộc tính cốt lõi dựa trên Dublin Core Metadata Element Set.
  2. app.xml: Chứa các thuộc tính mở rộng dành riêng cho các ứng dụng Microsoft Office.
  3. custom.xml: Chứa các thuộc tính tùy chỉnh.

Việc xử lý siêu dữ liệu OOXML có thể được cấu hình như sau:

  • Sanitise - Tệp được tạo lại với siêu dữ liệu đã bị loại bỏ (xem bên dưới để biết tất cả các thuộc tính hiện đang được làm sạch)
  • Disallow - Siêu dữ liệu bị cấm. Nếu phát hiện bất kỳ siêu dữ liệu nào (các thuộc tính được liệt kê bên dưới), tệp chứa sẽ bị từ chối.
  • Allow - Tệp được xử lý và siêu dữ liệu được tạo lại.

Là một phần của công tắc quản lý nội dung 'metadata', hiện tại chúng tôi làm sạch những mục sau trong:

  • core.xml: title, subject, creator, keywords, description, lastModifiedBy, revision, lastPrinted, created, modified, category, contentStatus, language, and version.
  • app.xml: manager, company, and hyperlinkBase
  • custom.xml: mọi thuộc tính tùy chỉnh được thêm vào tài liệu OOXML.

Các công tắc dành riêng cho OfficeXML (DOCX, XLSX, PPTX)

Dữ liệu ẩn

Các định dạng tệp Office cung cấp nhiều cách hợp lệ khác nhau để "ẩn" văn bản hoặc dữ liệu, bao gồm toàn bộ trang tính Excel, trang chiếu PowerPoint hoặc các dòng văn bản trong tài liệu Word. Công cụ Glasswall xử lý dữ liệu ẩn theo các cách sau, tùy thuộc vào cài đặt công tắc quản lý nội dung:

  • Sanitise - Tệp được tạo lại với mọi dữ liệu ẩn được "hiện ra", để người dùng có thể nhìn thấy hoàn toàn.
  • Disallow - Dữ liệu ẩn bị cấm. Nếu phát hiện bất kỳ dữ liệu ẩn nào, tệp chứa sẽ bị từ chối.
  • Allow - Mọi dữ liệu ẩn được tạo lại và vẫn được giữ ẩn.

Lưu ý: Với mục đích của cài đặt quản lý nội dung này, “Hidden Data” không đề cập đến các cách đa dạng để làm rối hoặc chôn giấu dữ liệu trong các tệp Office 2007. Thay vào đó, nó chỉ cụ thể cho các phương pháp ẩn dữ liệu có sẵn trực tiếp trong GUI của Office 2007. Dữ liệu bị làm rối hoặc che giấu được quản lý bởi cài đặt policy tương ứng với phương pháp được sử dụng; ví dụ: metadata sẽ loại bỏ dữ liệu được che giấu trong các trường văn bản tự do chứa trong siêu dữ liệu của tài liệu.

Thay đổi được theo dõi

Công tắc quản lý nội dung tracked_changes đề cập đến nội dung được thêm bởi chức năng "Track Changes" trong các tệp DOCX và XLSX, còn được gọi là "revisions". Chúng có thể chứa dữ liệu lịch sử liên quan đến các phiên bản trước của tài liệu, bao gồm tên của những người đóng góp và bản ghi về nội dung đã bị xóa hoặc làm mờ kể từ đó. Việc xử lý các thay đổi được theo dõi có thể được cấu hình như sau:

  • Sanitise - Toàn bộ dữ liệu lịch sử bị xóa và "Track Changes" bị vô hiệu hóa. Tài liệu được tái tạo sẽ tương đương với trạng thái cuối cùng của tài liệu gốc.
  • Disallow - Không cho phép các thay đổi được theo dõi. Nếu có bất kỳ bằng chứng nào về các bản sửa đổi trước đó hoặc các thay đổi được theo dõi vẫn còn trong tệp, tệp sẽ bị từ chối.
  • Allow - Tệp được tái tạo với toàn bộ thay đổi lịch sử, bản sửa đổi và thay đổi được theo dõi được giữ nguyên.

Ghi chú trang chiếu

Công tắc quản lý nội dung slide_notes đề cập đến nội dung được thêm bởi chức năng "Notes" trong các tệp PPTX, còn được gọi là "slide notes" (và/hoặc "speaker notes"). Glasswall engine xử lý các ghi chú trang chiếu này theo những cách sau, tùy thuộc vào cấu hình của cài đặt công tắc quản lý nội dung:

  • Sanitise - Tệp được tái tạo với toàn bộ ghi chú trang chiếu đã bị xóa.
  • Disallow - Không cho phép ghi chú trang chiếu. Nếu phát hiện bất kỳ ghi chú trang chiếu nào, tệp chứa chúng sẽ bị từ chối.
  • Allow - Mọi ghi chú trang chiếu sẽ được tái tạo và vẫn được giữ trong tệp.

Chú thích trong văn bản

Công tắc in_text_comments đề cập đến nội dung được thêm bởi chức năng "In-Text Comments" trong các tệp DOCX. Việc xử lý công tắc này có thể được cấu hình như sau:

  • Sanitise - Chú thích trong văn bản bị xóa cùng với siêu dữ liệu tài liệu tương ứng được tìm thấy trong core.xml.
  • Disallow - Không cho phép chú thích trong văn bản. Bất kỳ tệp DOCX nào chứa chú thích trong văn bản sẽ chặn việc tái tạo tệp.
  • Allow - Tệp được tái tạo với Chú thích trong văn bản hiện diện trong tệp DOCX.

Lưu ý: Khi in_text_comments sanitise được đặt thành allow và công tắc metadata được đặt thành sanitise thì tệp được tái tạo sẽ có chú thích trong văn bản hiện diện nhưng không có bất kỳ dữ liệu nào vì công tắc metadata làm sạch mô tả tương ứng khỏi tệp core.xml.

Biến tài liệu

Tùy chọn doc_variables đề cập đến nội dung được thêm bởi chức năng "Document Variables" trong các tệp DOCX. Cách xử lý tùy chọn này có thể được cấu hình như sau:

  • Sanitise - Tệp được tạo lại với tất cả biến tài liệu đã bị xóa.
  • Disallow - Biến tài liệu bị cấm. Bất kỳ tệp DOCX nào chứa biến tài liệu sẽ chặn việc tạo lại tệp.
  • Allow - Tệp được tạo lại với các biến tài liệu có trong tệp DOCX.

Tiện ích mở rộng video web

Tùy chọn web_video_extension đề cập đến nội dung được thêm bằng chức năng "Web Videos Extension" trong các tệp DOCX. Cách xử lý tùy chọn này có thể được cấu hình như sau:

  • Sanitise - Tệp được tạo lại với tất cả tiện ích mở rộng video web đã bị xóa.
  • Disallow - Việc sử dụng tiện ích mở rộng video web bị cấm. Bất kỳ tệp DOCX nào chứa tiện ích mở rộng video web sẽ chặn việc tạo lại tệp.
  • Allow - Tệp được tạo lại với tiện ích mở rộng video web được bao gồm trong tệp DOCX.

Đầu trang và chân trang

Tùy chọn headers_footers đề cập đến nội dung được thêm vào các phần Đầu trang hoặc Chân trang của một trang trong DOCX; nội dung này có thể khác nhau ở trang đầu tiên, các trang chẵn và các trang lẻ, hoặc giống nhau trong toàn bộ tài liệu. Cách xử lý tùy chọn này có thể được cấu hình như sau:

  • Sanitise - Tệp sẽ được tạo lại với toàn bộ nội dung đầu trang và chân trang đã bị xóa.
  • Disallow - Việc sử dụng đầu trang và chân trang bị cấm. Bất kỳ tệp DOCX nào chứa đầu trang hoặc chân trang sẽ chặn việc tạo lại tệp.
  • Allow - Tệp được tạo lại với đầu trang và chân trang được bao gồm trong tệp DOCX.

Các tùy chọn chỉ dành riêng cho PDF

Chữ ký số

Tổng quan Tệp PDF có thể chứa Chữ ký số và AcroForms; một số loại AcroForms nhất định có thể chứa chữ ký số. Trong khi chữ ký số được dùng để xác minh tính xác thực và tính toàn vẹn của tài liệu, AcroForms cung cấp nền tảng cấu trúc cho các trường biểu mẫu tương tác. Khi có chữ ký số trong PDF, AcroForm sẽ có phần thể hiện trực quan của chính chữ ký đó.

Khi xử lý các tệp PDF có bao gồm chữ ký số, Glasswall CDR engine áp dụng quy trình làm sạch được thiết kế để giữ nguyên tính toàn vẹn về mặt hiển thị đồng thời loại bỏ nội dung đang hoạt động và/hoặc có khả năng rủi ro.

Cách CDR Engine xử lý Chữ ký số Để đảm bảo cả tính an toàn và tính nhất quán của tài liệu, Glasswall CDR engine thực hiện các hành động sau trong quá trình làm sạch:

  • Loại bỏ dữ liệu chữ ký mật mã, bao gồm mọi chứng chỉ được nhúng, logic xác thực hoặc script.
  • Loại bỏ metadata liên quan đến chữ ký và hành vi tương tác để triệt tiêu các đường dẫn thực thi hoặc các khả năng khai thác tiềm ẩn.
  • Giữ nguyên hình thức hiển thị trực quan của tiện ích chữ ký, chẳng hạn như hình ảnh chữ ký, tên người ký và văn bản ngày/giờ. Việc này được thực hiện bằng cách làm phẳng nó vào lớp nội dung tĩnh của PDF.
AcroFormChữ ký sốHành vi AcroForm dự kiếnHành vi Chữ ký số dự kiếnHành vi của phần AcroForm chứa Chữ ký sốTệp có được tạo lại không?
Cho phépCho phépĐược tạo lại mà không làm sạchĐược tạo lại mà không làm sạchToàn bộ phần (bao gồm biểu mẫu tương tác và chữ ký số) được giữ nguyên như hiện trạng
Làm sạchCho phépĐã làm sạch (đã loại bỏ hoặc làm phẳng)Được tạo lại mà không làm sạchChữ ký số trực quan được giữ nguyên; trường AcroForm chứa chữ ký đó được làm sạch hoặc loại bỏ
Cho phépLàm sạchĐược tạo lại mà không làm sạchĐã làm sạch (đã loại bỏ các thành phần mật mã)Phần trực quan của chữ ký số được giữ nguyên như một phần của AcroForm; chữ ký trở nên không còn chức năng
Làm sạchLàm sạchĐã làm sạchĐã làm sạchToàn bộ phần chữ ký số, bao gồm các trường AcroForm, bị loại bỏ hoặc được làm phẳng về mặt trực quan
Không cho phép*Không áp dụngKhông áp dụngTệp không được tạo lại do có sự hiện diện của AcroForm không được phépKhông
*Không cho phépKhông áp dụngKhông áp dụngTệp không được tạo lại do có sự hiện diện của Chữ ký số không được phépKhông

Khả năng kiểm toán và chuỗi giám sát

Để hỗ trợ khả năng truy vết và trách nhiệm giải trình trong các môi trường an toàn, công cụ Glasswall CDR ghi lại các giá trị băm mật mã của cả tệp đầu vào và đầu ra. Điều này cho phép một đơn vị tích hợp hệ thống:

  • Xác minh nguồn gốc tệp thông qua so sánh giá trị băm.
  • Cung cấp sự bảo đảm rằng, trong trường hợp chữ ký số không còn hợp lệ, chuỗi giám sát vẫn được duy trì và có thể được chứng minh.