Windchill AI Assistant プラグイン > 高度な操作 > AI 検索サービスに必要なパーティション数の推定
AI 検索サービスに必要なパーティション数の推定
インデックシングされたデータの量によっては、データ負荷に対応するために AI 検索サービスのストレージ容量を調整する必要がある場合があります。
現在、Windchill AI Assistant では、ドキュメントのテキストコンテンツのみがインデックシングされます。詳細については、インデックシングの制限のセクションを参照してください。各 AI 検索パーティションは、最大 45 GB のテキストデータをインデックシングできます。
このトピックでは、Windchill ボルトに保存されているコンテンツタイプに基づいて、必要なパーティション数を推定する方法について説明します。
推定方法
パーティション数を推定する際は、以下の両方の条件を満たすドキュメントのみを考慮してください。
サポートされているファイルタイプのドキュメントである (ドキュメントインデックシングの仕様を参照)。
インデックシングユーザーが、インデックシングダッシュボードでの設定に従ってドキュメントにアクセスできる。
ドキュメントにはイメージやその他のテキスト以外のコンテンツが含まれている場合がありますが、各ファイルのテキスト部分のみがインデックシングされます。次の表のガイドラインを使用して、各ドキュメントカテゴリのテキストコンテンツの量を推定できます。
ドキュメントタイプ
ドキュメント内の実際のテキストの推定
プレーンテキストフォーマット (TXT、CSV、ログファイル、ソースコードなど)
100%
テキストマークアップフォーマット (XML、HTML、Markdown など)
100%
ワープロフォーマット (DOCX、ODT、RTF など)
10% から 50% (イメージの多いドキュメントでは低く、テキストの多いドキュメントでは高い)
スプレッドシート (XLSX、ODS など)
10%
プレゼンテーション (PPTX、ODP など)
10%
PDF ドキュメント
10%
パーティション数の計算
必要な AI 検索パーティション数を推定するには、次の手順を実行します。
1. 各ファイルタイプカテゴリのドキュメントの合計サイズ (GB) を特定します。
2. 各カテゴリのサイズに、推定されるテキストの割合を乗算します。
3. 結果のテキストサイズを加算して、テキストデータの合計推定サイズを計算します。
4. テキストデータの合計サイズを 45 GB で割ります。
5. 結果を最も近い整数に切り上げます。
6. 必要に応じて、将来予想されるデータの増加を考慮して、最終的な数値を増やします。
Windchill ボルトに次のドキュメントカテゴリが含まれていると仮定します。
ドキュメントタイプ
合計ファイルサイズ (GB)
推定されるテキストの割合
推定されるテキストデータ量 (GB)
プレーンテキストドキュメント
17
100%
17
テキストマークアップドキュメント
24
100%
24
ワープロドキュメント
13
25% (イメージの使用量は中程度)
3.25
スプレッドシートドキュメント
2
10%
0.2
プレゼンテーションドキュメント
3
10%
0.3
PDF ドキュメント
15
10%
1.5
テキストデータの合計推定サイズは 46.25 GB です。予測されるデータ増加が 20% であると仮定すると、推定テキストデータは 55.5 GB に増加します。
55.5 を 45 で除算すると約 1.23 になり、これを切り上げると 2 になります。
この例では、AI 検索サービスには 2 つの Standard S1 パーティションが必要です。
ティアと価格の詳細については、Azure ドキュメントの「Azure AI Search の価格」を参照してください。
これは役に立ちましたか?