Plug-in Windchill AI Assistant > Actions avancées > Estimation du nombre de partitions requises par le service Recherche AI
Estimation du nombre de partitions requises par le service Recherche AI
Selon le volume des données indexées, vous devrez peut-être ajuster la capacité de stockage du service Recherche AI pour l'adapter au volume de chargement des données.
A l'heure actuelle, Windchill AI Assistant indexe uniquement le contenu textuel des documents. Pour plus d'informations, consultez la section Limites d'indexation. Chaque partition Recherche AI peut indexer jusqu'à 45 Go de données texte.
Cette rubrique explique comment estimer le nombre de partitions requises en fonction du type de contenu stocké dans votre coffre-fort Windchill.
Méthode d'estimation
Lorsque vous estimez le nombre de partitions, tenez uniquement compte des documents qui répondent aux deux critères suivants :
Le type de fichier du document est pris en charge (consultez la rubrique Spécifications d'indexation de documents).
Le document est accessible à l'utilisateur d'indexation, tel que configuré dans le Tableau de bord d'indexation.
Les documents contenant parfois des images ou d'autres contenus non textuels, seule la partie texte de chaque fichier est indexée. Suivez les instructions fournies dans le tableau suivant pour estimer le pourcentage de contenu textuel propre à chaque catégorie de document.
Type de document
Estimation du pourcentage de texte réel dans le document
Formats texte brut (par exemple TXT, CSV, fichiers journaux ou code source)
100 %
Formats balisage de texte (par exemple XML, HTML ou Markdown)
100 %
Formats traitement de texte (par exemple DOCX, ODT, RTF)
10 à 50 % (quantité inférieure pour les documents riches en images, et supérieure pour les documents riches en texte)
Feuilles de calcul (par exemple XLSX, ODS)
10 %
Présentations (par exemple PPTX, ODP)
10 %
Documents PDF
10 %
Calcul du nombre de partitions
Pour estimer le nombre requis de partitions Recherche AI :
1. Déterminez la taille totale (en Go) des documents appartenant à chaque catégorie de type de fichier.
2. Multipliez la taille de chaque catégorie par son pourcentage de texte estimé.
3. Ajoutez les tailles de texte obtenues pour calculer la taille totale estimée des données texte.
4. Divisez la taille totale des données texte par 45 Go.
5. Arrondissez le résultat au nombre entier le plus proche.
6. Si vous le souhaitez, augmentez la valeur finale pour tenir compte de la future croissance attendue des données.
Exemple
Supposons que le coffre-fort Windchill contienne les catégories de document suivantes :
Type de document
Taille totale des fichiers (en Go)
Pourcentage de texte estimé
Données texte estimées (en Go)
Documents au format texte brut
17
100 %
17
Documents au format balisage de texte
24
100 %
24
Documents au format traitement de texte
13
25 % (utilisation d'images modérée)
3,25
Documents au format feuille de calcul
2
10 %
0,2
Documents au format présentation
3
10 %
0,3
Documents PDF
15
10 %
1,5
La taille totale estimée des données texte est de 46,25 Go. Si nous prévoyons une future croissance des données de 20 %, la taille estimée des données texte passe à 55,5 Go.
En divisant 55,5 par 45, nous obtenons un résultat d'environ 1,23, que nous arrondissons à 2.
Dans cet exemple, le service Recherche AI nécessite donc deux partitions S1 standard.
Pour plus d'informations sur les niveaux et la tarification, consultez la page Azure AI Search pricing de la documentation Azure.
Est-ce que cela a été utile ?