メイン コンテンツにスキップ

コンテンツのエクスポートとインポート

Glasswall は、サポートされているファイル形式について、コンテンツ項目をエクスポートおよびインポートする機能を提供します。

これにより、処理済みファイルの内部コンポーネントを、Glasswall Embedded Engine ドメインの外部にある外部プロセスやアプリケーションで追加処理できるようになります。エクスポート後、これらのコンポーネントは外部で検証でき、その後 Glasswall Engine がコンポーネントをインポートしてファイルを再構成します。

ユーザーがファイル内のコンポーネントに対して追加分析を実行できるようにするには、ファイルを Glasswall Embedded Engine で 2 回処理する必要があります。1 回目はファイルを構成するコンポーネントを含むパッケージを抽出するため(エクスポート)、2 回目は外部で分析および/または変更されたコンポーネントをファイルに再統合するため(インポート)です。ファイルは、エクスポートおよびインポートの両サイクルを通じて、Embedded Engine CDR プロセスによって自動的に保護されます。

使用例

エクスポート/インポート処理の使用例には、以下が含まれますが、これらに限定されません。

  • データを安全にインポートするためのパターン - Glasswall は XML などの標準形式で内部ファイル構造を公開し、サードパーティが pattern for safely importing data の一環としてハードウェア検証を実施できるようにします
  • データ損失防止 - テキストなどのエクスポートされたコンテンツには、すべてのテキストを識別できるよう注釈が付けられ、ユーザーはテキスト検索や墨消しなどの DLP プロセスを実行できます。
  • 画像分析 - ステガノグラフィ攻撃を検出および/または防止するための追加の画像処理。

エクスポート可能なコンテンツ

Glasswall は、サポートされているすべてのファイル形式について、すべてのコンテンツを含む document object model (DOM) をエクスポートする機能を提供します。エクスポートされた DOM は、XML または SISL の 2 種類の中間形式のいずれかで提示されます。ユーザーは、埋め込み画像を元の形式で抽出するか、DOM 表現としてエクスポートするかを選択できます。

インポート可能なコンテンツ

Glasswall は、エクスポートされたコンテンツに外部で変更が加えられているかどうかにかかわらず(変更がファイル形式仕様に準拠している場合)、サポートされているすべてのファイル形式について document object model (DOM) を再インポートする機能を提供します。

エクスポートパッケージの内容

Export パッケージは、XML または SISL のファイルストリーム、埋め込み画像、およびメタデータを含む対応する JSON ファイル(PDF 画像用)を含む ZIP アーカイブです。

XML タグ/属性および SISL の型/パラメーターの内部名は、エクスポートされるファイルストリームのサイズを最小化するために短縮されています。

XML タグと SISL 型:

タグ / タイプ(短縮)タグ / タイプ(完全)説明
"S"STRUCTツリー内の構造ノードを表します。
"SA"STRUCTARRAYSTRUCT オブジェクトの配列です。
"I"ITEM STRUCT オブジェクト内のプロパティです(例: 空白インジケーター、ファイル終端マーカーなど)。
"V"VALUE ファイルから読み取られた、格納済みの整数値を表します。
"VA"VALUEARRAYファイルから読み取られたデータブロックを表します。
       

XML 属性と SISL パラメーター

属性 / パラメーター(短縮)属性 / パラメーター(完全)データ型説明
"o"offset この属性には、バッファ内の現在の項目のオフセットが含まれます。バッファは、ファイル、アーカイブ内のファイル、CFB object からのストリームの集合などを表すことができます。
"s"size 現在の構造体の合計長(バイト単位)。
"i"itemEnum<integer string>現在の ITEM の内部数値表現。
"n"name <string>現在の構造体の内部名。
"t"isText[ "true | "false" ]要素にテキストが含まれているかどうかを示します。内部スキーマ内でテキストとしてマークされている項目にのみ適用されます。
"se"structEnum<integer string>現在のSTRUCTの内部数値表現。      
"sn"streamName<string>現在のストリーム名。
"c"cameraName<string>現在のカメラ(parser/validator/writer)名。
"st"isStructuralText[ "true | "false" ]構造情報とファイルの可視テキストコンテンツを区別するための属性です。内部スキーマ内でテキストとしてマークされている項目にのみ適用されます。
"e"エンコーディング[ "UTF 8 | "Base64"]この属性は、現在の要素内のデータのエンコーディングを指定します。内部スキーマ内でテキストとしてマークされている項目にのみ適用されます。

SISL 固有のパラメーター

パラメーター(短縮形)パラメーター(完全形)データ型説明
"__s"struct<dictionary>タイプ [ S | SA | I | V | VA ] の一般的な SISL 構造
"__m"meta<dictionary>現在の SISL 構造パラメーターの辞書
"__d"data ITEM、VALUE または VALUEARRAY の保存データ
"__l"長さ 非表示文字がエスケープされる前に __d に保存されていたデータの元のサイズ。

テキストダンプのエクスポート(アルファ)

Export Text Dump 機能では、エクスポート対象の入力ファイル内のすべてのテキストを含むファイルを生成するオプションが導入されています。このファイルは生成され、出力 ZIP ファイルと同じディレクトリに保存されます。

テキストダンプは、コンテンツエクスポート zip と一緒に、またはそれなしでエクスポートできます。

ファイル形式サポート
Office 2003
Office 1997
PDF*
バイナリ形式
オーディオ形式
画像形式
MPEG 形式

注: PDF の Text Dump は、sysConfig スイッチ export_embedded_imagestrue に設定されている場合、現在利用できません。また、PDF テキストエンコーディングの一部のサブセットにのみ対応しています。