ข้ามไปยังเนื้อหาหลัก

การส่งออกและนำเข้าเนื้อหา

Glasswall มีความสามารถในการส่งออกและนำเข้ารายการเนื้อหาสำหรับชนิดไฟล์ที่รองรับ

สิ่งนี้ช่วยให้องค์ประกอบภายในของไฟล์ที่ผ่านการประมวลผลสามารถถูกเปิดให้ใช้งานกับกระบวนการและแอปพลิเคชันภายนอกเพื่อการประมวลผลเพิ่มเติมนอกขอบเขตของ Glasswall Embedded Engine เมื่อส่งออกแล้ว องค์ประกอบเหล่านี้สามารถได้รับการตรวจสอบจากภายนอกก่อนที่ Glasswall Engine จะนำเข้าองค์ประกอบและประกอบไฟล์กลับขึ้นใหม่

เพื่อให้ผู้ใช้สามารถดำเนินการวิเคราะห์เพิ่มเติมกับองค์ประกอบภายในไฟล์ได้ ไฟล์จะต้องถูกประมวลผลโดย Glasswall Embedded Engine สองครั้ง; ครั้งแรกเพื่อแยกแพ็กเกจที่มีองค์ประกอบซึ่งประกอบกันเป็นไฟล์ (ส่งออก) และครั้งที่สองเพื่อนำองค์ประกอบที่ผ่านการวิเคราะห์จากภายนอกและ/หรือถูกแก้ไขกลับมารวมเข้าในไฟล์อีกครั้ง (นำเข้า) ไฟล์ยังได้รับการปกป้องโดยอัตโนมัติผ่านกระบวนการ Embedded Engine CDR ตลอดทั้งรอบการส่งออกและนำเข้า

ตัวอย่างกรณีการใช้งาน

ตัวอย่างกรณีการใช้งานสำหรับการประมวลผลแบบ Export-Import รวมถึงแต่ไม่จำกัดเพียง:

  • รูปแบบสำหรับการนำเข้าข้อมูลอย่างปลอดภัย - Glasswall เปิดเผยโครงสร้างไฟล์ภายในในรูปแบบมาตรฐาน เช่น XML ทำให้บุคคลที่สามสามารถดำเนินการตรวจสอบฮาร์ดแวร์เป็นส่วนหนึ่งของ รูปแบบสำหรับการนำเข้าข้อมูลอย่างปลอดภัย
  • การป้องกันข้อมูลรั่วไหล - เนื้อหาที่ส่งออก เช่น ข้อความ จะถูกใส่คำอธิบายประกอบเพื่อให้สามารถระบุข้อความทั้งหมดได้ ช่วยให้ผู้ใช้สามารถดำเนินกระบวนการ DLP เช่น การค้นหาข้อความและการปกปิดข้อมูล
  • การวิเคราะห์ภาพ - การประมวลผลภาพเพิ่มเติมเพื่อตรวจจับและ/หรือป้องกันการโจมตีแบบ steganography

เนื้อหาที่ส่งออกได้

Glasswall มีความสามารถในการส่งออก document object model (DOM) ซึ่งรวมเนื้อหาทั้งหมด สำหรับรูปแบบไฟล์ที่รองรับทั้งหมด DOM ที่ส่งออกจะแสดงในหนึ่งในสองรูปแบบกลาง คือ XML หรือ SISL ผู้ใช้สามารถเลือกแยกรูปภาพที่ฝังอยู่ในรูปแบบดั้งเดิม หรือส่งออกรูปภาพเหล่านั้นเป็นการแสดงผลแบบ DOM

เนื้อหาที่นำเข้าได้

Glasswall มีความสามารถในการนำ document object model (DOM) กลับเข้ามาใหม่สำหรับรูปแบบไฟล์ที่รองรับทั้งหมด โดยไม่คำนึงถึงการแก้ไขจากภายนอกที่ทำกับเนื้อหาที่ส่งออก (โดยมีเงื่อนไขว่าการแก้ไขนั้นเป็นไปตามข้อกำหนดของรูปแบบไฟล์)

เนื้อหาของแพ็กเกจส่งออก

แพ็กเกจ Export คือไฟล์เก็บถาวร ZIP ที่มีสตรีมไฟล์ XML หรือ SISL รูปภาพที่ฝังอยู่ และไฟล์ JSON ที่เกี่ยวข้องซึ่งมีข้อมูลเมตา (สำหรับรูปภาพ PDF)

ชื่อภายในของแท็ก/แอตทริบิวต์ XML และชนิด/พารามิเตอร์ SISL ถูกย่อให้สั้นลงเพื่อลดขนาดของสตรีมไฟล์ที่ส่งออก

แท็ก XML และชนิด SISL:

แท็ก / ประเภท (แบบย่อ)แท็ก / ประเภท (แบบเต็ม)คำอธิบาย
"S"STRUCTแสดงถึงโหนดโครงสร้างจาก tree ของเรา
"SA"STRUCTARRAYอาร์เรย์ของออบเจ็กต์ STRUCT
"I"ITEM พร็อพเพอร์ตีภายในออบเจ็กต์ STRUCT (เช่น ตัวบ่งชี้ช่องว่าง เครื่องหมายสิ้นสุดไฟล์ เป็นต้น)
"V"VALUE แสดงถึงค่าจำนวนเต็มที่จัดเก็บไว้ซึ่งถูกอ่านจากไฟล์
"VA"VALUEARRAYแสดงถึงบล็อกข้อมูลที่อ่านจากไฟล์
       

แอตทริบิวต์ XML และพารามิเตอร์ SISL

แอตทริบิวต์ / พารามิเตอร์ (แบบย่อ)แอตทริบิวต์ / พารามิเตอร์ (แบบเต็ม)ชนิดข้อมูลคำอธิบาย
"o"offset แอตทริบิวต์นี้มี offset ของรายการปัจจุบันในบัฟเฟอร์ บัฟเฟอร์สามารถแทนสิ่งต่างๆ เช่น ไฟล์ ไฟล์ภายใน archive การรวมกันของสตรีมจากออบเจ็กต์ CFB และอื่นๆ
"s"size ความยาวรวมของโครงสร้างปัจจุบันในหน่วยไบต์
"i"itemEnum<integer string>การแสดงผลเชิงตัวเลขภายในของ ITEM ปัจจุบัน
"n"name <string>ชื่อภายในของโครงสร้างปัจจุบัน
"t"isText[ "true | "false" ]ระบุว่าองค์ประกอบมีข้อความหรือไม่ ใช้ได้เฉพาะกับรายการที่ถูกทำเครื่องหมายว่าเป็นข้อความภายใน schema ภายในเท่านั้น
"se"structEnum<integer string>การแสดงผลเชิงตัวเลขภายในของ STRUCT ปัจจุบัน
"sn"streamName<string>ชื่อสตรีมปัจจุบัน
"c"cameraName<string>ชื่อ camera ปัจจุบัน (parser/validator/writer)
"st"isStructuralText[ "true | "false" ]แอตทริบิวต์สำหรับแยกความแตกต่างระหว่างข้อมูลเชิงโครงสร้างกับเนื้อหาข้อความที่มองเห็นได้ของไฟล์ ใช้ได้เฉพาะกับรายการที่ถูกทำเครื่องหมายว่าเป็นข้อความภายใน schema ภายในเท่านั้น
"e"การเข้ารหัส[ "UTF 8 | "Base64"]แอตทริบิวต์นี้ระบุการเข้ารหัสของข้อมูลภายในองค์ประกอบปัจจุบัน ใช้ได้เฉพาะกับรายการที่ถูกทำเครื่องหมายเป็นข้อความภายในสคีมาภายในเท่านั้น

พารามิเตอร์เฉพาะของ SISL

พารามิเตอร์ (แบบย่อ)พารามิเตอร์ (แบบเต็ม)ชนิดข้อมูลคำอธิบาย
"__s"struct<dictionary>โครงสร้าง SISL ทั่วไปของประเภท: [ S | SA | I | V | VA ]
"__m"meta<dictionary>พจนานุกรมของพารามิเตอร์โครงสร้าง SISL ปัจจุบัน 
"__d"data ข้อมูลที่จัดเก็บของ ITEM, VALUE หรือ VALUEARRAY
"__l"ความยาว ขนาดดั้งเดิมของข้อมูลที่จัดเก็บใน __d ก่อนที่อักขระที่ไม่สามารถพิมพ์ได้จะถูก escape

การส่งออก text dump (alpha)

ฟีเจอร์ Export Text Dump เพิ่มตัวเลือกในการสร้างไฟล์ที่มีข้อความทั้งหมดภายในไฟล์อินพุตที่กำลังถูกส่งออก ไฟล์จะถูกสร้างและจัดเก็บไว้ในไดเรกทอรีเดียวกับไฟล์ ZIP เอาต์พุต

สามารถส่งออก text dump พร้อมกับหรือโดยไม่ต้องมี zip การส่งออกเนื้อหาได้

รูปแบบไฟล์รองรับ
Office 2003
Office 1997
PDF*
รูปแบบไบนารี
รูปแบบเสียง
รูปแบบรูปภาพ
รูปแบบ MPEG

หมายเหตุ: ขณะนี้ Text Dump สำหรับ PDF ยังไม่พร้อมใช้งานเมื่อกำหนดสวิตช์ sysConfig export_embedded_images เป็น true นอกจากนี้ยังรองรับได้เพียงชุดย่อยของการเข้ารหัสข้อความ PDF เท่านั้น