Спецификации индексирования документов
Windchill AI Assistant поддерживает широкий спектр типов документов и бизнес-объектов как для локальной среды, так и для среды SaaS.
Типы документов
В следующей таблице приведен список форматов документов, поддерживаемых подключаемым модулем Windchill AI Assistant.
Тип документа
Наименование документа
Тип MIME
CSV
Список с разделителями-запятыми
text/csv
DOCX/DOC/DOCM
Microsoft Word
application/msword
application/vnd.ms-word.document.macroenabled.12
application/vnd.openxmlformats-officedocument.wordprocessingml.document
EML
Эл. почта
message/rfc822
EPUB
Электронная публикация
application/epub+zip
GZ
Сжатый файл GNU Zip
application/gzip
application/x-gzip
HTML
Hypertext Markup Language
text/html
JSON
Нотация объектов JavaScript
application/json
KML
Keyhole Markup Language
application/vnd.google-earth.kml+xm
MSG
Электронная почта Outlook
application/vnd.ms-outlook
application/msoutlook
ODP
Презентация OpenDocument
application/vnd.oasis.opendocument.presentation
ODS
Электронная таблица OpenDocument
application/vnd.oasis.opendocument.spreadsheet
ODT
Текст OpenDocument
application/vnd.oasis.opendocument.text
PDF
Документ Acrobat
application/pdf
PPTX/PPT/PPTM
Microsoft PowerPoint
application/vnd.ms-powerpoint
application/vnd.ms-powerpoint.presentation.macroenabled.12
application/vnd.openxmlformats-officedocument.presentationml.presentation
RTF
Формат RTF
application/rtf
TXT/LOG (примеры)
Обычный текст
text/plain
XLSX/XLS/XLSM
Microsoft Excel
application/vnd.ms-excel
application/vnd.ms-excel.sheet.macroenabled.12
application/vnd.openxmlformats-officedocument.spreadsheetml.sheet
XML
Базовые XML и специальные XML, такие как Word XML или DITA XML
application/xml
text/xml
application/vnd.ms-wordml
application/vnd.ms-word2006ml
application/dita+xml
ZIP
Сжатый ZIP-файл
application/zip
application/x-zip-compressed
Типы бизнес-объектов
В следующей таблице приведен список бизнес-объектов и связанных с ними документов, поддерживаемых подключаемым модулем Windchill AI Assistant.
Бизнес-объект
Основное содержимое
Представления
Вложения
Аннотации
WTDocument
EPM-документы (CAD)
WTPart
* 
Ссылочные документы деталей индексируются как документы WTDocument.
Динамический документ Arbortext
Запрос на изменение
Извещение об изменении
Задание на изменение
Отчет о проблеме
CAPA
Типы объектов QMS (системы управления качеством)
Типы объектов системы управления качеством (QMS) используются для управления связанными с качеством процессами в жизненном цикле изделия и в производстве. Дополнительные сведения см. в разделе Решения Windchill Quality Management.
В следующей таблице приведен список типов объектов, поддерживаемых подключаемым модулем Windchill AI Assistant.
Тип объекта
Назначение
Ключевые атрибуты
Поддерживается Windchill AI Assistant
QMS
Документы QMS
Документы, относящиеся к управлению качеством
Идентичны документам WTDocument по всем аспектам
Да
Тот же уровень поддержки, что и для документов WTDocument (включая вложения).
CAPA
Запрос CAPA
Инициирует процесс корректирующих и профилактических действий
Номер партии/серии, обозначение пакета, уникальный идентификатор устройства (UDI)
Да (только вложения)
Объекты отправки норм. отчета и объекты соответствия нормативным требованиям
Мастер создания норм. отчета
Отслеживает объекты отправки норм. отчетов и объекты соответствия нормативным требованиям
Организация, ИД отправки, статус
Да
Тот же уровень поддержки, что и для объектов управления изменениями.
Пределы индексирования
В процессе индексирования извлекаются и обрабатываются только текстовые данные из перечисленных выше поддерживаемых типов документов. Это включает в себя непрерывные текстовые разделы, заголовки, заметки, таблицы и аналогичную текстовую информацию. Изображения, диаграммы и другое нетекстовое содержимое не индексируются.
Предел индексирования для отдельного документа - максимальный размер файла составляет 128 МБ или 4 миллиона символов.
* 
Превышение поддерживаемых ограничений может привести к сбоям индексирования. Во избежание таких проблем используйте один из следующих подходов:
Разделяйте большие документы на более мелкие файлы.
Предотвращайте индексирование больших документов путем удаления доступа пользователя индексирования к этим документам. Дополнительные сведения см. в разделе Конфигурирование пользователя индексирования.
Производительность индексирования
Процесс индексирования зависит от ряда факторов, включая производительность системы Windchill, сетевое соединение между Windchill и Microsoft Azure, а также вместимость сконфигурированных облачных ресурсов.
Вместимость облачных ресурсов зависит от модели развертывания.
Вместимость локальной среды зависит от сконфигурированных ресурсов Azure.
Для индексирования в среде SaaS используются масштабируемые облачные ресурсы, управляемые PTC.
Кроме того, в службах Microsoft Azure могут наблюдаться вариации KPI производительности в зависимости от региона, времени суток или временного воздействия на службу.
Для справки: индексирование обычно занимает около двух дней для следующего набора данных:
150 000 документов
Средний размер документа: 500 КБ
Индексируемое содержимое: 100%, весь текст
* 
В некоторых случаях может отображаться, что индексирование остановлено - из-за известной проблемы индексирования в Microsoft Azure. Если это случается, индексирование автоматически возобновляется примерно через шесть часов. Microsoft планирует внедрить постоянное исправление этой проблемы в будущем обновлении.
Было ли это полезно?