Pag-export at Pag-import ng Content
Nagbibigay ang Glasswall ng kakayahang mag-export at mag-import ng mga content item para sa mga sinusuportahang uri ng file.
Nagbibigay-daan ito upang maging available sa mga panlabas na proseso at application ang mga internal na bahagi ng mga naprosesong file para sa karagdagang pagproseso sa labas ng domain ng Glasswall Embedded Engine. Kapag na-export na, maaaring ma-validate ang mga bahaging ito sa labas bago i-import ng Glasswall Engine ang mga bahagi at buuing muli ang mga file.
Upang mabigyang-daan ang user na magsagawa ng karagdagang pagsusuri sa mga bahagi sa loob ng mga file, kailangang iproseso ang mga file ng Glasswall Embedded Engine nang dalawang beses; una upang mag-extract ng package na naglalaman ng mga bahaging bumubuo sa isang file (export), at ikalawang pasada upang muling isama sa file ang mga bahaging sinuri at/o binago sa labas (import). Awtomatiko ring napoprotektahan ang mga file sa pamamagitan ng Embedded Engine CDR process sa buong export at import cycles.
Mga halimbawang use case
Kabilang sa mga halimbawang use case para sa Export-Import processing ang mga sumusunod, ngunit hindi limitado sa:
- Pattern For Safely Importing Data - Inilalantad ng Glasswall ang internal na istruktura ng file sa isang standard na anyo gaya ng XML, na nagbibigay-daan sa mga third party na magsagawa ng hardware verification bilang bahagi ng pattern for safely importing data
- Data Loss Prevention - Ang na-export na content gaya ng text ay nilalagyan ng annotation upang matukoy ang lahat ng text, na nagbibigay-daan sa mga user na magsagawa ng mga DLP process gaya ng text search at redaction.
- Image analysis - Karagdagang pagproseso ng imahe upang matukoy at/o maiwasan ang mga steganography attack.
Mae-export na content
Nagbibigay ang Glasswall ng kakayahang mag-export ng document object model (DOM), na kinabibilangan ng lahat ng content, para sa lahat ng sinusuportahang format ng file. Ang na-export na DOM ay ipinapakita sa isa sa dalawang intermediate format, XML o SISL. May opsyon ang mga user na i-extract ang mga embedded image sa kanilang orihinal na anyo o i-export ang mga ito bilang isang DOM representation.
Mae-import na content
Nagbibigay ang Glasswall ng kakayahang muling mag-import ng document object model (DOM) para sa lahat ng sinusuportahang format ng file, anuman ang panlabas na pagbabagong ginawa sa na-export na content (basta't sumusunod ang mga pagbabago sa specification ng format ng file).
Content ng Export package
Ang Export package ay isang ZIP archive na naglalaman ng XML o SISL file streams, mga embedded image, at katumbas na JSON files na may metadata (para sa mga PDF image).
Pinaiikli ang mga internal na pangalan ng XML tags/attributes at SISL types/parameters upang mabawasan ang laki ng mga na-export na file stream.
XML tags at SISL types:
| Tag / Uri (Pinaikli) | Tag / Uri (Buo) | Paglalarawan |
|---|---|---|
| "S" | STRUCT | Kumakatawan sa isang structure node mula sa aming tree. |
| "SA" | STRUCTARRAY | Ang array ng mga STRUCT object. |
| "I" | ITEM | Isang property sa loob ng isang STRUCT object (hal., mga indicator ng whitespace, mga marker ng end-of-file, atbp.) |
| "V" | VALUE | Kumakatawan sa nakaimbak na integer value na binasa mula sa isang file. |
| "VA" | VALUEARRAY | Kumakatawan sa isang data block na binasa mula sa isang file. |
Mga XML attribute at SISL parameter
| Attribute / Parameter (Pinaikli) | Attribute / Parameter (Buo) | Uri ng Data | Paglalarawan |
|---|---|---|---|
| "o" | offset | Ang attribute ay naglalaman ng offset ng kasalukuyang item sa buffer. Maaaring kumatawan ang buffer sa mga bagay tulad ng file, isang file sa loob ng archive, isang pagsasama-sama ng mga stream mula sa isang CFB object, at iba pa. | |
| "s" | laki | Ang kabuuang haba ng kasalukuyang structure sa bytes. | |
| "i" | itemEnum | <integer string> | Ang panloob na numerikal na representasyon ng kasalukuyang ITEM. |
| "n" | pangalan | <string> | Ang panloob na pangalan ng kasalukuyang structure. |
| "t" | isText | [ "true | "false" ] | Ipinapahiwatig kung naglalaman ng teksto ang elemento o hindi. Naaangkop lamang sa mga item na minarkahan bilang teksto sa loob ng mga internal schema. |
| "se" | structEnum | <integer string> | Ang internal na numerikal na representasyon ng kasalukuyang STRUCT. |
| "sn" | streamName | <string> | Ang kasalukuyang pangalan ng stream. |
| "c" | cameraName | <string> | Ang kasalukuyang pangalan ng camera (parser/validator/writer). |
| "st" | isStructuralText | [ "true | "false" ] | Ang attribute para matukoy ang pagkakaiba sa pagitan ng impormasyong istruktural at ng nakikitang nilalamang teksto ng file. Naaangkop lamang sa mga item na minarkahan bilang teksto sa loob ng mga internal schema. |
| "e" | encoding | [ "UTF 8 | "Base64"] | Tinutukoy ng attribute ang encoding ng data sa loob ng kasalukuyang elemento. Naaangkop lamang ito sa mga item na minarkahan bilang text sa loob ng mga internal schema. |
Mga parameter na partikular sa SISL
| Parameter (Pinaikli) | Parameter (Buo) | Uri ng Data | Paglalarawan |
|---|---|---|---|
| "__s" | struct | <dictionary> | Pangkalahatang SISL structure na may uri na: [ S | SA | I | V | VA ] |
| "__m" | meta | <dictionary> | Dictionary ng mga parameter ng kasalukuyang SISL structure |
| "__d" | data | Ang nakaimbak na data ng ITEM, VALUE o VALUEARRAY | |
| "__l" | haba | Ang orihinal na laki ng data na nakaimbak sa __d bago na-escape ang mga hindi napi-print na character. |
Text dump ng export (alpha)
Ipinapakilala ng feature na Export Text Dump ang opsyon na gumawa ng file na naglalaman ng lahat ng teksto sa loob ng ini-export na input file. Ang file ay ginagawa at iniimbak sa parehong directory ng output ZIP file.
Maaaring i-export ang mga text dump kasabay ng o kahit walang mga content export zip.
| Format ng File | Sinusuportahan |
|---|---|
| Office 2003 | ✓ |
| Office 1997 | ✓ |
| ✓ * | |
| Mga binary format | ✗ |
| Mga format ng audio | ✗ |
| Mga format ng larawan | ✗ |
| Mga format ng MPEG | ✗ |
Tandaan: Ang Text Dump para sa PDF ay kasalukuyang hindi available kapag ang sysConfig switch na
export_embedded_imagesay nakatakda satrue. Limitado rin ito sa isang subset lamang ng mga PDF text encoding.