การส่งออกและนำเข้าเนื้อหา
Glasswall มีความสามารถในการส่งออกและนำเข้ารายการเนื้อหาสำหรับชนิดไฟล์ที่รองรับ
สิ่งนี้ช่วยให้องค์ประกอบภายในของไฟล์ที่ผ่านการประมวลผลสามารถถูกเปิดให้ใช้งานกับกระบวนการและแอปพลิเคชันภายนอกเพื่อการประมวลผลเพิ่มเติมนอกขอบเขตของ Glasswall Embedded Engine เมื่อส่งออกแล้ว องค์ประกอบเหล่านี้สามารถได้รับการตรวจสอบจากภายนอกก่อนที่ Glasswall Engine จะนำเข้าองค์ประกอบและประกอบไฟล์กลับขึ้นใหม่
เพื่อให้ผู้ใช้สามารถดำเนินการวิเคราะห์เพิ่มเติมกับองค์ประกอบภายในไฟล์ได้ ไฟล์จะต้องถูกประมวลผลโดย Glasswall Embedded Engine สองครั้ง; ครั้งแรกเพื่อแยกแพ็กเกจที่มีองค์ประกอบซึ่งประกอบกันเป็นไฟล์ (ส่งออก) และครั้งที่สองเพื่อนำองค์ประกอบที่ผ่านการวิเคราะห์จากภายนอกและ/หรือถูกแก้ไขกลับมารวมเข้าในไฟล์อีกครั้ง (นำเข้า) ไฟล์ยังได้รับการปกป้องโดยอัตโนมัติผ่านกระบวนการ Embedded Engine CDR ตลอดทั้งรอบการส่งออกและนำเข้า
ตัวอย่างกรณีการใช้งาน
ตัวอย่างกรณีการใช้งานสำหรับการประมวลผลแบบ Export-Import รวมถึงแต่ไม่จำกัดเพียง:
- รูปแบบสำหรับการนำเข้าข้อมูลอย่างปลอดภัย - Glasswall เปิดเผยโครงสร้างไฟล์ภายในในรูปแบบมาตรฐาน เช่น XML ทำให้บุคคลที่สามสามารถดำเนินการตรวจสอบฮาร์ดแวร์เป็นส่วนหนึ่งของ รูปแบบสำหรับการนำเข้าข้อมูลอย่างปลอดภัย
- การป้องกันข้อมูลรั่วไหล - เนื้อหาที่ส่งออก เช่น ข้อความ จะถูกใส่คำอธิบายประกอบเพื่อให้สามารถระบุข้อความทั้งหมดได้ ช่วยให้ผู้ใช้สามารถดำเนินกระบวนการ DLP เช่น การค้นหาข้อความและการปกปิดข้อมูล
- การวิเคราะห์ภาพ - การประมวลผลภาพเพิ่มเติมเพื่อตรวจจับและ/หรือป้องกันการโจมตีแบบ steganography
เนื้อหาที่ส่งออกได้
Glasswall มีความสามารถในการส่งออก document object model (DOM) ซึ่งรวมเนื้อหาทั้งหมด สำหรับรูปแบบไฟล์ที่รองรับทั้งหมด DOM ที่ส่งออกจะแสดงในหนึ่งในสองรูปแบบกลาง คือ XML หรือ SISL ผู้ใช้สามารถเลือกแยกรูปภาพที่ฝังอยู่ในรูปแบบดั้งเดิม หรือส่งออกรูปภาพเหล่านั้นเป็นการแสดงผลแบบ DOM
เนื้อหาที่นำเข้าได้
Glasswall มีความสามารถในการนำ document object model (DOM) กลับเข้ามาใหม่สำหรับรูปแบบไฟล์ที่รองรับทั้งหมด โดยไม่คำนึงถึงการแก้ไขจากภายนอกที่ทำกับเนื้อหาที่ส่งออก (โดยมีเงื่อนไขว่าการแก้ไขนั้นเป็นไปตามข้อกำหนดของรูปแบบไฟล์)
เนื้อหาของแพ็กเกจส่งออก
แพ็กเกจ Export คือไฟล์เก็บถาวร ZIP ที่มีสตรีมไฟล์ XML หรือ SISL รูปภาพที่ฝังอยู่ และไฟล์ JSON ที่เกี่ยวข้องซึ่งมีข้อมูลเมตา (สำหรับรูปภาพ PDF)
ชื่อภายในของแท็ก/แอตทริบิวต์ XML และชนิด/พารามิเตอร์ SISL ถูกย่อให้สั้นลงเพื่อลดขนาดของสตรีมไฟล์ที่ส่งออก
แท็ก XML และชนิด SISL:
| แท็ก / ประเภท (แบบย่อ) | แท็ก / ประเภท (แบบเต็ม) | คำอธิบาย |
|---|---|---|
| "S" | STRUCT | แสดงถึงโหนดโครงสร้างจาก tree ของเรา |
| "SA" | STRUCTARRAY | อาร์เรย์ของออบเจ็กต์ STRUCT |
| "I" | ITEM | พร็อพเพอร์ตีภายในออบเจ็กต์ STRUCT (เช่น ตัวบ่งชี้ช่องว่าง เครื่องหมายสิ้นสุดไฟล์ เป็นต้น) |
| "V" | VALUE | แสดงถึงค่าจำนวนเต็มที่จัดเก็บไว้ซึ่งถูกอ่านจากไฟล์ |
| "VA" | VALUEARRAY | แสดงถึงบล็อกข้อมูลที่อ่านจากไฟล์ |
แอตทริบิวต์ XML และพารามิเตอร์ SISL
| แอตทริบิวต์ / พารามิเตอร์ (แบบย่อ) | แอตทริบิวต์ / พารามิเตอร์ (แบบเต็ม) | ชนิดข้อมูล | คำอธิบาย |
|---|---|---|---|
| "o" | offset | แอตทริบิวต์นี้มี offset ของรายการปัจจุบันในบัฟเฟอร์ บัฟเฟอร์สามารถแทนสิ่งต่างๆ เช่น ไฟล์ ไฟล์ภายใน archive การรวมกันของสตรีมจากออบเจ็กต์ CFB และอื่นๆ | |
| "s" | size | ความยาวรวมของโครงสร้างปัจจุบันในหน่วยไบต์ | |
| "i" | itemEnum | <integer string> | การแสดงผลเชิงตัวเลขภายในของ ITEM ปัจจุบัน |
| "n" | name | <string> | ชื่อภายในของโครงสร้างปัจจุบัน |
| "t" | isText | [ "true | "false" ] | ระบุว่าองค์ประกอบมีข้อความหรือไม่ ใช้ได้เฉพาะกับรายการที่ถูกทำเครื่องหมายว่าเป็นข้อความภายใน schema ภายในเท่านั้น |
| "se" | structEnum | <integer string> | การแสดงผลเชิงตัวเลขภายในของ STRUCT ปัจจุบัน |
| "sn" | streamName | <string> | ชื่อสตรีมปัจจุบัน |
| "c" | cameraName | <string> | ชื่อ camera ปัจจุบัน (parser/validator/writer) |
| "st" | isStructuralText | [ "true | "false" ] | แอตทริบิวต์สำหรับแยกความแตกต่างระหว่างข้อมูลเชิงโครงสร้างกับเนื้อหาข้อความที่มองเห็นได้ของไฟล์ ใช้ได้เฉพาะกับรายการที่ถูกทำเครื่องหมายว่าเป็นข้อความภายใน schema ภายในเท่านั้น |
| "e" | การเข้ารหัส | [ "UTF 8 | "Base64"] | แอตทริบิวต์นี้ระบุการเข้ารหัสของข้อมูลภายในองค์ประกอบปัจจุบัน ใช้ได้เฉพาะกับรายการที่ถูกทำเครื่องหมายเป็นข้อความภายในสคีมาภายในเท่านั้น |
พารามิเตอร์เฉพาะของ SISL
| พารามิเตอร์ (แบบย่อ) | พารามิเตอร์ (แบบเต็ม) | ชนิดข้อมูล | คำอธิบาย |
|---|---|---|---|
| "__s" | struct | <dictionary> | โครงสร้าง SISL ทั่วไปของประเภท: [ S | SA | I | V | VA ] |
| "__m" | meta | <dictionary> | พจนานุกรมของพารามิเตอร์โครงสร้าง SISL ปัจจุบัน |
| "__d" | data | ข้อมูลที่จัดเก็บของ ITEM, VALUE หรือ VALUEARRAY | |
| "__l" | ความยาว | ขนาดดั้งเดิมของข้อมูลที่จัดเก็บใน __d ก่อนที่อักขระที่ไม่สามารถพิมพ์ได้จะถูก escape |
การส่งออก text dump (alpha)
ฟีเจอร์ Export Text Dump เพิ่มตัวเลือกในการสร้างไฟล์ที่มีข้อความทั้งหมดภายในไฟล์อินพุตที่กำลังถูกส่งออก ไฟล์จะถูกสร้างและจัดเก็บไว้ในไดเรกทอรีเดียวกับไฟล์ ZIP เอาต์พุต
สามารถส่งออก text dump พร้อมกับหรือโดยไม่ต้องมี zip การส่งออกเนื้อหาได้
| รูปแบบไฟล์ | รองรับ |
|---|---|
| Office 2003 | ✓ |
| Office 1997 | ✓ |
| ✓ * | |
| รูปแบบไบนารี | ✗ |
| รูปแบบเสียง | ✗ |
| รูปแบบรูปภาพ | ✗ |
| รูปแบบ MPEG | ✗ |
หมายเหตุ: ขณะนี้ Text Dump สำหรับ PDF ยังไม่พร้อมใช้งานเมื่อกำหนดสวิตช์ sysConfig
export_embedded_imagesเป็นtrueนอกจากนี้ยังรองรับได้เพียงชุดย่อยของการเข้ารหัสข้อความ PDF เท่านั้น