Подключаемый модуль Windchill AI Assistant > Дополнительные действия > Расчет необходимого числа разделов для службы поиска A
Расчет необходимого числа разделов для службы поиска A
В зависимости от объема индексируемых данных может потребоваться скорректировать емкость хранилища службы поиска AI в соответствии с нагрузкой данных.
В настоящее время Windchill AI Assistant индексирует только текстовое содержимое документов. Дополнительные сведения см. в разделе Ограничения индексирования. В каждом разделе поиска AI доступно индексирование до 45 ГБ текстовых данных.
В этом разделе поясняется, как рассчитать необходимое число разделов на основе типов содержимого, хранящегося в архиве Windchill.
Метод расчета
При расчете числа разделов учитывайте только те документы, которые соответствуют обоим следующим критериям.
Документ является поддерживаемым типом файла (см. раздел Спецификации индексирования документов).
Документ доступен пользователю индексирования, как это сконфигурировано на Панели индексирования.
Поскольку документы могут содержать изображения или другое нетекстовое содержимое, индексируется только текстовая часть каждого файла. Используйте рекомендации, приведенные в следующей таблице, чтобы оценить объем текстового содержимого для каждой категории документов.
Тип документа
Оценка фактического текста в документе
Форматы обычного текста (например, TXT, CSV, файлы журналов или исходный код)
100%
Форматы текстовой разметки (такие как XML, HTML или Markdown)
100%
Текстовые форматы (такие как DOCX, ODT, RTF)
10–50% (меньше для документов с большим количеством изображений, больше для документов с большим количеством текста)
Электронные таблицы (например, XLSX, ODS)
10%
Презентации (такие как PPTX, ODP)
10%
Документы PDF
10%
Расчет числа разделов
Для расчета необходимого числа разделов поиска AI выполните следующие действия.
1. Определите суммарный размер (в ГБ) документов в каждой категории типов файлов.
2. Умножьте размер каждой категории на предполагаемый процент текста.
3. Добавьте результирующие размеры текстов, чтобы вычислить общий размер текстовых данных.
4. Разделите общий размер текстовых данных на 45 ГБ.
5. Округлите результат до ближайшего целого числа.
6. Можно увеличить значение результата с учетом ожидаемого роста объема данных в будущем.
Пример
Предположим, что архив Windchill содержит следующие данные документов:
Тип документа
Общий размер файлов (ГБ)
Расчетный процент текста
Расчетные текстовые данные (ГБ)
Документы с обычным текстом
17
100%
17
Документы текстовой разметки
24
100%
24
Текстовые документы
13
25 % (умеренное использование изображений)
3.25
Документы электронных таблиц
2
10%
0.2
Документы презентаций
3
10%
0.3
Документы PDF
15
10%
1.5
Общий предполагаемый размер текстовых данных составляет 46,25 ГБ. При прогнозируемом росте данных в 20 % предполагаемый рост текстовых данных увеличивается до 55,5 ГБ.
Деление 55,5 на 45 дает приблизительное значение 1,23, которое округляется до 2.
В этом примере для службы поиска AI требуются два раздела Standard S1.
Дополнительные сведения об уровнях и ценах см. в разделе Цены на поиск с использованием AI Azure в документации Azure.
Было ли это полезно?