|
ドキュメントタイプ
|
ドキュメント内の実際のテキストの推定
|
|---|---|
|
プレーンテキストフォーマット (TXT、CSV、ログファイル、ソースコードなど)
|
100%
|
|
テキストマークアップフォーマット (XML、HTML、Markdown など)
|
100%
|
|
ワープロフォーマット (DOCX、ODT、RTF など)
|
10% から 50% (イメージの多いドキュメントでは低く、テキストの多いドキュメントでは高い)
|
|
スプレッドシート (XLSX、ODS など)
|
10%
|
|
プレゼンテーション (PPTX、ODP など)
|
10%
|
|
PDF ドキュメント
|
10%
|
|
ドキュメントタイプ
|
合計ファイルサイズ (GB)
|
推定されるテキストの割合
|
推定されるテキストデータ量 (GB)
|
|---|---|---|---|
|
プレーンテキストドキュメント
|
17
|
100%
|
17
|
|
テキストマークアップドキュメント
|
24
|
100%
|
24
|
|
ワープロドキュメント
|
13
|
25% (イメージの使用量は中程度)
|
3.25
|
|
スプレッドシートドキュメント
|
2
|
10%
|
0.2
|
|
プレゼンテーションドキュメント
|
3
|
10%
|
0.3
|
|
PDF ドキュメント
|
15
|
10%
|
1.5
|