일괄 생성된 VM의 인스턴스 유연성 정보

이 문서에서는 Compute Engine을 사용하여 VM을 일괄 생성할 때의 인스턴스 유연성을 설명합니다.

리전에서 가상 머신 (VM)을 일괄 생성할 때 애플리케이션이 단일 머신 유형으로 제한되지 않는 경우 인스턴스 유연성을 구성하여 필요한 VM 수를 프로비저닝할 수 있는 성공률을 높일 수 있습니다. 인스턴스 유연성을 사용하면 워크로드에 적합한 머신 유형을 하나 이상 지정할 수 있습니다. 그런 다음 Compute Engine은 용량 및 할당량 가용성을 기반으로 이러한 머신 유형 중 하나를 사용하여 VM을 프로비저닝합니다.

인스턴스 유연성 사용

인스턴스 유연성을 구성하려면 리전 일괄 삽입 요청에서 하나 이상의 인스턴스 선택을 정의하여 적합한 머신 유형을 나열합니다. 예를 들어 REST 요청에서 instanceFlexibilityPolicy 객체를 포함합니다. 이 객체 내에서 머신 유형 목록이 포함된 instanceSelections 객체를 하나 이상 정의합니다.

Compute Engine은 요청을 수신하면 먼저 머신 유형과 영역 호환성을 검증하고 잘못된 항목을 제외합니다. 유효한 구성이 하나 이상 있으면 작업이 진행됩니다.

그런 다음 Compute Engine은 사용 가능한 하드웨어, 할당량, 예약을 기반으로 VM을 프로비저닝하려고 시도합니다. 인스턴스 선택의 순위를 구성하면 순위가 낮은 선택이 우선순위가 지정됩니다. 각 순위 내에서 Compute Engine은 사용되지 않은 예약 및 스팟 VM 안내를 고려하여 선점 가능성이 낮은 머신 유형을 선택합니다.

목표 분산 형태가 정의된 경우 영역 선택

리전 bulkInsert 요청과 함께 인스턴스 유연성을 사용하는 경우 목표 분산 형태를 지정하여 VM이 리전의 영역에 분산되는 방식을 제어할 수 있습니다. Compute Engine은 이 형태를 기반으로 다음과 같이 VM을 프로비저닝할 영역을 선택합니다.

  • ANY_SINGLE_ZONE: Compute Engine은 선호도가 높은 머신 유형에 가장 많은 용량을 보유한 단일 영역을 선택합니다.
  • BALANCED: Compute Engine은 사용 가능한 리소스가 있는 영역에 VM을 최대한 균등하게 분산합니다. 각 영역 내에서 Compute Engine은 선호도가 높은 머신 유형에 우선순위를 지정합니다.
  • ANY: Compute Engine은 사용 가능한 리소스가 있는 영역을 선택합니다. 순위가 구성된 경우 Compute Engine은 선호도가 높은 머신 유형으로 VM을 프로비저닝할 영역에 우선순위를 지정합니다.

자세한 내용은 리전에서 VM 일괄 생성을 참조하세요.

최소 VM 프로비저닝 및 인스턴스 유연성

bulkInsert 요청에서 필요한 최소 VM 수 (minCount)의 값을 정의하면 API가 최소한 해당 수의 VM을 만들려고 시도합니다. Compute Engine에서 필요한 최소 VM 수 (minCount)를 프로비저닝할 수 없는 경우 전체 작업이 실패하고 Compute Engine에서 VM을 만들지 않습니다. 인스턴스 유연성과 함께 minCount를 사용하면 Compute Engine은 다음과 같이 순위보다 획득 가능성을 기반으로 VM 프로비저닝에 우선순위를 지정합니다.

  • Compute Engine은 선호도가 낮은 머신을 사용해야 하더라도 최대 count까지 VM을 최대 수로 프로비저닝하는 데 우선순위를 지정합니다. 예를 들어 요청에서 필요한 최소 VM 1개(minCount=1)와 최대 VM 10개 (count=10)를 지정하고 Compute Engine에 선호도가 높은 VM 1개 또는 선호도가 낮은 VM 6개를 프로비저닝할 수 있는 용량이 있는 경우 Compute Engine은 선호도가 낮은 VM 6개를 프로비저닝합니다.
  • Compute Engine에서 서로 다른 인스턴스 선택을 사용하여 최대 count까지 동일한 최대 VM 수를 프로비저닝할 수 있는 경우 선호도가 높은 선택에 우선순위를 지정합니다. 예를 들어 요청에서 필요한 최소 VM 1개 (minCount=1)와 최대 VM 10개(count=10)를 지정하고 Compute Engine에서 선호도가 높은 인스턴스 선택 또는 선호도가 낮은 인스턴스 선택을 사용하여 VM 6개를 프로비저닝할 수 있는 경우 Compute Engine은 선호도가 높은 선택에서 VM 6개를 프로비저닝합니다.

자세한 내용은 minCount 속성을 bulkInsert에서 참조하세요.

일괄 삽입 검증 및 오류 시나리오

Compute Engine은 머신 유형과 영역 호환성에 대한 초기 검증을 수행하고 고려 대상에서 잘못된 항목을 제외합니다. 이 초기 검사 후에 유효한 구성이 하나 이상 남아 있으면 Compute Engine은 VM 생성을 진행합니다.

하지만 Compute Engine이 인스턴스 유연성 정책 및 사용 가능한 용량을 기반으로 프로비저닝에 사용할 영역과 머신 유형을 선택한 후에만 구성의 일부 검증이 발생할 수 있습니다. 이 후반 검증 단계에서 프로비저닝을 위해 선택한 특정 머신 유형과 영역 조합이 잘못된 것으로 확인되면 전체 일괄 삽입 요청이 검증 오류로 실패합니다. instanceFlexibilityPolicy 내의 다른 구성이 처음에는 유효했더라도 이 오류가 발생할 수 있습니다.

제한사항

일괄 VM 생성에 인스턴스 유연성을 사용하는 경우 다음 제한사항이 적용됩니다.

  • 리전 bulkInsert 요청에만 인스턴스 유연성을 지정할 수 있습니다. 영역 요청에는 사용할 수 없습니다.
  • 인스턴스 유연성은 미래용 예약, 유연한 시작 프로비저닝 모델, A3 Ultra, A4, 최신 GPU를 비롯한 AI 하이퍼컴퓨터 기능을 지원하지 않습니다.
  • 최대 10개의 서로 다른 인스턴스 선택에서 최대 10개의 서로 다른 머신 유형을 지정할 수 있습니다.

다음 단계

  • 인스턴스 유연성을 사용하여 VM을 일괄 생성하는 방법을 알아봅니다.