Amazon SageMaker HyperPod agora suporta grupos de instâncias flexíveis

Novo Recurso de Flexibilidade no SageMaker HyperPod

A AWS anunciou suporte a grupos de instâncias flexíveis no Amazon SageMaker HyperPod, um avanço significativo para clientes que precisam executar cargas de trabalho de treinamento e inferência em ambientes com requisitos complexos de infraestrutura. Esse novo recurso permite especificar múltiplos tipos de instância e múltiplas subnets dentro de um único grupo de instâncias, simplificando a gestão de clusters heterogêneos.

O Desafio Anterior

Clientes que utilizam o HyperPod frequentemente necessitam distribuir suas workloads através de múltiplos tipos de instância e zonas de disponibilidade. Isso ocorre por três razões principais: resiliência de capacidade, otimização de custos e melhor aproveitamento de subnets. Até agora, esse cenário exigia que os usuários criassem e gerenciassem um grupo de instâncias separado para cada combinação de tipo de instância e zona de disponibilidade.

Essa abordagem gerava sobrecarga operacional considerável. Os times precisavam lidar com complexidade adicional em configuração de cluster, escalabilidade, aplicação de patches e monitoramento — tudo multiplicado pelo número de combinações de instâncias necessárias.

Como os Grupos Flexíveis Resolvem o Problema

Com os grupos de instâncias flexíveis, a configuração muda radicalmente. Os usuários podem agora definir uma lista ordenada de tipos de instância usando o novo parâmetro InstanceRequirements e fornecer múltiplas subnets distribuídas entre zonas de disponibilidade em um único grupo de instâncias.

O HyperPod provisiona instâncias começando pelo tipo de maior prioridade e executa um fallback automático para tipos de menor prioridade quando a capacidade não está disponível. Isso elimina a necessidade de clientes tentarem manualmente diferentes grupos de instâncias quando uma opção não está disponível.

Benefícios por Caso de Uso

Para Cargas de Treinamento

Clientes de treinamento se beneficiam da distribuição entre múltiplas subnets dentro de uma mesma zona de disponibilidade, evitando esgotamento de endereços IP em uma subnet individual — um problema comum em ambientes de larga escala.

Para Cargas de Inferência

Clientes que fazem escalabilidade manual ganham fallback automático baseado em prioridade entre tipos de instância, sem precisar retentar cada grupo individualmente. Aqueles que utilizam Karpenter para autoscaling podem fazer referência a um único grupo de instâncias flexível. O Karpenter detecta automaticamente os tipos de instância suportados a partir do grupo flexível e provisiona o tipo e zona de disponibilidade ótima com base nos requisitos do pod.

Como Usar

Os grupos de instâncias flexíveis podem ser criados através das APIs CreateCluster e UpdateCluster, via AWS CLI, ou através do AWS Management Console. Esse recurso está disponível para clusters SageMaker HyperPod utilizando o orquestrador EKS (Elastic Kubernetes Service) em todas as regiões AWS onde SageMaker HyperPod é suportado.

Para detalhes técnicos completos e instruções de implementação, consulte a documentação sobre grupos de instâncias flexíveis.

Fonte

Amazon SageMaker HyperPod now supports flexible instance groups (https://aws.amazon.com/about-aws/whats-new/2026/04/sagemaker-hyperpod-flexible-instance-groups/)

Amazon SageMaker HyperPod agora suporta grupos de instâncias flexíveis

Novo Recurso de Flexibilidade no SageMaker HyperPod

O Desafio Anterior

Como os Grupos Flexíveis Resolvem o Problema

Benefícios por Caso de Uso

Para Cargas de Treinamento

Para Cargas de Inferência

Como Usar

Fonte

Comments

Leave a Reply Cancel reply

More posts

Como garantir capacidade de GPU de curto prazo para cargas de ML com EC2 Capacity Blocks e SageMaker Training Plans

AWS conquista certificações SNI 27017, SNI 27018 e SNI 9001 na Região Ásia-Pacífico (Jacarta)

Agentes que transacionam: conheça o Amazon Bedrock AgentCore Payments, desenvolvido com Coinbase e Stripe

Superando desafios de sinal de recompensa: aprendizado por reforço com recompensas verificáveis e GRPO no SageMaker AI