Ekspor & Impor Konten
Glasswall menyediakan kemampuan untuk mengekspor dan mengimpor item konten untuk jenis file yang didukung.
Hal ini memungkinkan komponen internal dari file yang diproses tersedia bagi proses dan aplikasi eksternal untuk pemrosesan tambahan di luar domain Glasswall Embedded Engine. Setelah diekspor, komponen-komponen ini dapat divalidasi secara eksternal sebelum Glasswall Engine mengimpor komponen tersebut dan menyusun ulang file.
Untuk memungkinkan pengguna melakukan analisis tambahan pada komponen di dalam file, file harus diproses oleh Glasswall Embedded Engine dua kali; pertama untuk mengekstrak paket yang berisi komponen yang membentuk sebuah file (ekspor), dan kedua untuk mengintegrasikan kembali komponen yang telah dianalisis dan/atau dimodifikasi secara eksternal ke dalam file (impor). File juga secara otomatis dilindungi melalui proses Embedded Engine CDR selama siklus ekspor dan impor.
Contoh kasus penggunaan
Contoh kasus penggunaan untuk pemrosesan Export-Import mencakup, tetapi tidak terbatas pada:
- Pola untuk Mengimpor Data dengan Aman - Glasswall mengekspos struktur file internal dalam bentuk standar seperti XML, sehingga memungkinkan pihak ketiga melakukan verifikasi perangkat keras sebagai bagian dari pola untuk mengimpor data dengan aman
- Pencegahan Kehilangan Data - Konten yang diekspor seperti teks diberi anotasi agar seluruh teks dapat diidentifikasi, sehingga memungkinkan pengguna menjalankan proses DLP seperti pencarian teks dan penyuntingan.
- Analisis gambar - Pemrosesan gambar tambahan untuk mendeteksi dan/atau mencegah serangan steganografi.
Konten yang dapat diekspor
Glasswall menyediakan kemampuan untuk mengekspor document object model (DOM), yang mencakup seluruh konten, untuk semua format file yang didukung. DOM yang diekspor disajikan dalam salah satu dari dua format perantara, XML atau SISL. Pengguna memiliki opsi untuk mengekstrak gambar tersemat dalam bentuk aslinya atau mengekspornya sebagai representasi DOM.
Konten yang dapat diimpor
Glasswall menyediakan kemampuan untuk mengimpor ulang document object model (DOM) untuk semua format file yang didukung, terlepas dari modifikasi eksternal yang dilakukan pada konten yang diekspor (dengan ketentuan bahwa modifikasi mematuhi spesifikasi format file).
Konten paket ekspor
Paket Export adalah arsip ZIP yang berisi aliran file XML atau SISL, gambar tersemat, dan file JSON terkait dengan metadata (untuk gambar PDF).
Nama internal tag/atribut XML dan tipe/parameter SISL dipersingkat untuk meminimalkan ukuran aliran file yang diekspor.
Tag XML dan tipe SISL:
| Tag / Tipe (Disingkat) | Tag / Tipe (Lengkap) | Deskripsi |
|---|---|---|
| "S" | STRUCT | Merepresentasikan node struktur dari tree kami. |
| "SA" | STRUCTARRAY | Array objek STRUCT. |
| "I" | ITEM | Sebuah properti dalam objek STRUCT (misalnya, indikator spasi kosong, penanda akhir file, dll.) |
| "V" | VALUE | Merepresentasikan nilai integer tersimpan yang dibaca dari file. |
| "VA" | VALUEARRAY | Merepresentasikan blok data yang dibaca dari file. |
Atribut XML dan parameter SISL
| Atribut / Parameter (Disingkat) | Atribut / Parameter (Lengkap) | Tipe Data | Deskripsi |
|---|---|---|---|
| "o" | offset | Atribut ini berisi offset item saat ini dalam buffer. Buffer dapat merepresentasikan hal-hal seperti file, file di dalam arsip, gabungan stream dari objek CFB, dan lainnya. | |
| "s" | ukuran | Panjang total struktur saat ini dalam byte. | |
| "i" | itemEnum | <integer string> | Representasi numerik internal dari ITEM saat ini. |
| "n" | nama | <string> | Nama internal dari struktur saat ini. |
| "t" | isText | [ "true | "false" ] | Menunjukkan apakah elemen berisi teks atau tidak. Hanya berlaku untuk item yang ditandai sebagai teks dalam skema internal. |
| "se" | structEnum | <integer string> | Representasi numerik internal dari STRUCT saat ini. |
| "sn" | streamName | <string> | Nama stream saat ini. |
| "c" | cameraName | <string> | Nama camera (parser/validator/writer) saat ini. |
| "st" | isStructuralText | [ "true | "false" ] | Atribut untuk membedakan antara informasi struktural dan konten teks file yang terlihat. Hanya berlaku untuk item yang ditandai sebagai teks dalam skema internal. |
| "e" | encoding | [ "UTF 8 | "Base64"] | Atribut ini menentukan encoding data dalam elemen saat ini. Hanya berlaku untuk item yang ditandai sebagai teks dalam skema internal. |
Parameter khusus SISL
| Parameter (Disingkat) | Parameter (Lengkap) | Tipe Data | Deskripsi |
|---|---|---|---|
| "__s" | struct | <dictionary> | Struktur SISL umum dengan tipe: [ S | SA | I | V | VA ] |
| "__m" | meta | <dictionary> | Kamus parameter struktur SISL saat ini |
| "__d" | data | Data tersimpan dari ITEM, VALUE, atau VALUEARRAY | |
| "__l" | panjang | Ukuran asli data yang disimpan dalam __d sebelum karakter yang tidak dapat dicetak di-escape. |
Dump teks ekspor (alpha)
Fitur Export Text Dump memperkenalkan opsi untuk menghasilkan file yang berisi semua teks di dalam file input yang sedang diekspor. File tersebut dihasilkan dan disimpan di direktori yang sama dengan file ZIP output.
Dump teks dapat diekspor bersamaan dengan atau tanpa zip ekspor konten.
| Format File | Didukung |
|---|---|
| Office 2003 | ✓ |
| Office 1997 | ✓ |
| ✓ * | |
| Format biner | ✗ |
| Format audio | ✗ |
| Format gambar | ✗ |
| Format MPEG | ✗ |
Catatan: Text Dump untuk PDF saat ini tidak tersedia ketika switch sysConfig
export_embedded_imagesdiatur ketrue. Fitur ini juga hanya terbatas pada sebagian subset encoding teks PDF.