Amazon Bedrock amplia suporte a Cotas de Serviço para o endpoint bedrock-mantle

O que mudou no Amazon Bedrock

A AWS anunciou uma expansão no suporte do Amazon Bedrock ao AWS Service Quotas, o serviço centralizado de gerenciamento de cotas da plataforma. A partir de agora, os clientes conseguem visualizar as cotas de inferência do endpoint bedrock-mantle diretamente pelo console de Service Quotas — da mesma forma que já faziam com o endpoint bedrock-runtime e outros serviços da AWS.

Na prática, isso significa que equipes de engenharia e arquitetura ganham uma visão clara e padronizada dos limites que se aplicam às suas cargas de trabalho no Bedrock, sem precisar consultar documentação separada ou abrir chamados para descobrir qual é o teto de requisições disponível.

O que é o endpoint bedrock-mantle

O bedrock-mantle é o endpoint do Amazon Bedrock que oferece compatibilidade com três APIs amplamente utilizadas no mercado de Inteligência Artificial (IA) generativa:

  • OpenAI Responses API
  • OpenAI Chat Completions API
  • Anthropic Messages API

Essa compatibilidade permite que times que já possuem aplicações construídas sobre OpenAI ou Anthropic migrem para o Amazon Bedrock com mudanças mínimas no código. É uma porta de entrada direta para quem quer aproveitar a infraestrutura gerenciada da AWS sem reescrever integrações do zero.

O que ficou visível com esta atualização

Com a expansão do suporte a Service Quotas, o endpoint bedrock-mantle passa a expor, por modelo, as seguintes cotas:

  • Tokens de entrada por minuto (input-tokens-per-minute)
  • Tokens de saída por minuto (output-tokens-per-minute)

Essa granularidade por modelo é especialmente útil para equipes que trabalham com múltiplos modelos de fundação simultaneamente e precisam planejar a capacidade de cada um de forma independente.

Como acessar as cotas no console

O acesso é simples e segue o fluxo padrão do AWS Service Quotas:

  • Abra o console do AWS Service Quotas
  • Selecione Amazon Bedrock
  • Pesquise por “Bedrock Mantle” para visualizar as cotas disponíveis

Para solicitar aumento de qualquer uma dessas cotas, basta seguir o processo padrão de aumento de limites do Amazon Bedrock.

Disponibilidade por região

O suporte a Service Quotas para o endpoint bedrock-mantle está disponível em todas as regiões da AWS onde o endpoint é oferecido:

  • EUA Leste: Norte da Virgínia, Ohio
  • EUA Oeste: Oregon
  • Ásia-Pacífico: Mumbai, Tóquio, Sydney, Jacarta
  • Europa: Frankfurt, Irlanda, Londres, Milão, Estocolmo
  • América do Sul: São Paulo

Para o público brasileiro, vale destacar a presença da região de São Paulo, o que garante baixa latência para aplicações hospedadas localmente.

Por que isso importa

Ter visibilidade de cotas de forma proativa é fundamental para quem opera em escala de produção. Sem esse tipo de informação, equipes costumam descobrir os limites apenas quando os erros começam a aparecer — o que pode significar interrupções inesperadas em aplicações críticas. Com essa atualização, o Amazon Bedrock se alinha ao padrão já consolidado de outros serviços da AWS, tornando o planejamento de capacidade mais previsível e menos reativo.

Para mais detalhes técnicos sobre os limites disponíveis, consulte a documentação de cotas do Amazon Bedrock.

Fonte

Amazon Bedrock expands support for Service Quotas (https://aws.amazon.com/about-aws/whats-new/2026/5/amazon-bedrock-service-quotas/)

Comments

Leave a Reply

Your email address will not be published. Required fields are marked *