Windchill AI Assistant 플러그 인 > 고급 작업 > AI 검색 서비스에 필요한 파티션 수 산정
AI 검색 서비스에 필요한 파티션 수 산정
인덱싱되는 데이터의 양에 따라 데이터 로드를 수용하기 위해 AI 검색 서비스의 스토리지 용량을 조정해야 할 수 있습니다.
현재 Windchill AI Assistant는 문서의 텍스트 콘텐츠만 인덱싱합니다. 자세한 내용은 인덱싱 제한 섹션을 참조하십시오. 각 AI 검색 파티션은 최대 45GB의 텍스트 데이터를 인덱싱할 수 있습니다.
이 항목에서는 Windchill 보관소에 저장된 콘텐츠 유형에 따라 필요한 파티션 수를 산정하는 방법을 설명합니다.
산정 방법
파티션 수를 산정할 때는 다음 두 조건을 모두 충족하는 문서만 고려합니다.
문서가 지원되는 파일 유형입니다(문서 인덱싱 사양 참조).
인덱싱 대시보드에 구성된 대로 인덱싱 사용자는 문서에 액세스할 수 있습니다.
문서에는 이미지나 텍스트가 아닌 기타 콘텐츠가 포함될 수 있지만 각 파일의 텍스트 부분만 인덱싱됩니다. 다음 표에 나오는 지침에 따라 각 문서 범주의 텍스트 콘텐츠 분량을 추정할 수 있습니다.
문서 유형(Document Type)
문서 내 실제 텍스트 분량 추정
일반 텍스트 형식(예: TXT, CSV, 로그 파일 또는 소스 코드)
100%
텍스트 마크업 형식(예: XML, HTML 또는 Markdown)
100%
워드 프로세싱 형식(예: DOCX, ODT, RTF)
10%~50%(이미지가 많은 문서의 경우 더 낮음, 텍스트가 많은 문서의 경우 높음)
스프레드시트(예: XLSX, ODS)
10%
프레젠테이션(예: PPTX, ODP)
10%
PDF 문서
10%
파티션 수 계산
필요한 AI 검색 파티션 수를 추정하려면 다음과 같이 하십시오.
1. 각 파일 유형 카테고리에서 여러 문서의 총 크기(GB)를 결정합니다.
2. 각 범주의 크기에 추정된 텍스트 백분율을 곱합니다.
3. 계산된 텍스트 크기를 더하여 추정된 전체 텍스트 데이터 크기를 계산합니다.
4. 전체 텍스트 데이터 크기를 45GB로 나눕니다.
5. 결과를 가장 가까운 정수로 반올림합니다.
6. 필요에 따라 향후 예상되는 데이터 증가를 고려하여 최종 수치를 늘립니다.
Windchill 보관소에는 다음과 같은 문서 범주가 포함되어 있다고 가정합니다.
문서 유형(Document Type)
총 파일 크기(GB)
추정된 텍스트 백분율
추정된 텍스트 데이터(GB)
일반 텍스트 문서
17
100%
17
텍스트 마크업 문서
24
100%
24
워드 프로세싱 문서
13
25%(보통 이미지 사용량)
3.25
스프레드시트 문서
2
10%
0.2
프레젠테이션 문서
3
10%
0.3
PDF 문서
15
10%
1.5
추정되는 총 텍스트 데이터 크기는 46.25GB입니다. 예상 데이터 증가가 20%라고 가정하면 추정되는 텍스트 데이터는 55.5GB로 증가합니다.
55.5를 45로 나누면 대략 1.23이 되며 이 값을 반올림하면 2가 됩니다.
이 예제에서 AI 검색 서비스에는 Standard S1 파티션 2개가 필요합니다.
계층 및 가격 책정에 대한 자세한 내용은 Azure 설명서의 Azure AI Search pricing을 참조하십시오.
도움이 되셨나요?