Amazon SageMaker AI passa a suportar APIs compatíveis com OpenAI para endpoints de inferência

O que foi anunciado

A AWS anunciou que o Amazon SageMaker Inference agora oferece suporte a APIs compatíveis com OpenAI nos endpoints de inferência. Na prática, isso significa que ferramentas e frameworks amplamente utilizados no ecossistema de Inteligência Artificial (IA) — como o OpenAI SDK, LangChain e Strands Agents — podem se conectar diretamente aos endpoints do SageMaker sem nenhuma adaptação especial.

O que muda na prática

A grande vantagem dessa novidade é a simplicidade da migração. Para quem já utiliza essas ferramentas apontando para outros serviços, a transição para o SageMaker exige apenas a troca da URL do endpoint. Não é necessário escrever código de integração personalizado, criar wrappers de SDK ou reescrever qualquer parte da aplicação existente.

Segundo a AWS, toda a lógica já construída continua funcionando normalmente: chamadas ao SDK, streaming e integrações com frameworks seguem operando exatamente como estavam — só que agora apontando para a infraestrutura gerenciada do SageMaker.

Benefícios imediatos

Com essa compatibilidade, quem adota o SageMaker Inference passa a ter acesso a uma série de vantagens de infraestrutura que não estavam disponíveis em outras plataformas de API:

  • Escolha de instâncias de GPU: é possível selecionar o tipo de instância mais adequado para cada carga de trabalho.
  • Dados dentro da sua própria Nuvem Privada Virtual (VPC): os dados não precisam sair do ambiente controlado da organização.
  • Flexibilidade de modelos: qualquer modelo de código aberto ou ajustado (fine-tuned) pode ser utilizado.
  • Auto-scaling configurável: as políticas de escalonamento automático podem ser ajustadas conforme a demanda de cada aplicação.

A autenticação é feita com as credenciais AWS já existentes, com renovação automática de token — sem nenhuma configuração adicional para gerenciar em produção.

Disponibilidade regional

O recurso já está disponível nas seguintes regiões: Leste dos EUA (Norte da Virgínia), Oeste dos EUA (Oregon), Leste dos EUA (Ohio), Ásia-Pacífico (Mumbai), Ásia-Pacífico (Jacarta), Europa (Irlanda), Europa (Frankfurt), América do Sul (São Paulo), Ásia-Pacífico (Tóquio), Ásia-Pacífico (Seul), Europa (Londres), Ásia-Pacífico (Singapura), Ásia-Pacífico (Sydney) e Canadá (Central).

Para equipes brasileiras, vale destacar a presença da região América do Sul (São Paulo) na lista, o que facilita o uso com menor latência e em conformidade com requisitos de residência de dados locais.

Como saber mais

Para aprofundar o entendimento sobre essa novidade, a AWS disponibilizou um post de lançamento no blog oficial e a documentação do SageMaker Inference com detalhes técnicos sobre como configurar e utilizar as APIs compatíveis com OpenAI.

Fonte

Amazon SageMaker AI now supports OpenAI-compatible APIs for inference endpoints (https://aws.amazon.com/about-aws/whats-new/2026/05/amazon-sagemaker-ai-openai-apis/)

Comments

Leave a Reply

Your email address will not be published. Required fields are marked *