O que mudou no Amazon Bedrock
A AWS anunciou uma expansão no suporte do Amazon Bedrock ao AWS Service Quotas, o serviço centralizado de gerenciamento de cotas da plataforma. A partir de agora, os clientes conseguem visualizar as cotas de inferência do endpoint bedrock-mantle diretamente pelo console de Service Quotas — da mesma forma que já faziam com o endpoint bedrock-runtime e outros serviços da AWS.
Na prática, isso significa que equipes de engenharia e arquitetura ganham uma visão clara e padronizada dos limites que se aplicam às suas cargas de trabalho no Bedrock, sem precisar consultar documentação separada ou abrir chamados para descobrir qual é o teto de requisições disponível.
O que é o endpoint bedrock-mantle
O bedrock-mantle é o endpoint do Amazon Bedrock que oferece compatibilidade com três APIs amplamente utilizadas no mercado de Inteligência Artificial (IA) generativa:
- OpenAI Responses API
- OpenAI Chat Completions API
- Anthropic Messages API
Essa compatibilidade permite que times que já possuem aplicações construídas sobre OpenAI ou Anthropic migrem para o Amazon Bedrock com mudanças mínimas no código. É uma porta de entrada direta para quem quer aproveitar a infraestrutura gerenciada da AWS sem reescrever integrações do zero.
O que ficou visível com esta atualização
Com a expansão do suporte a Service Quotas, o endpoint bedrock-mantle passa a expor, por modelo, as seguintes cotas:
- Tokens de entrada por minuto (input-tokens-per-minute)
- Tokens de saída por minuto (output-tokens-per-minute)
Essa granularidade por modelo é especialmente útil para equipes que trabalham com múltiplos modelos de fundação simultaneamente e precisam planejar a capacidade de cada um de forma independente.
Como acessar as cotas no console
O acesso é simples e segue o fluxo padrão do AWS Service Quotas:
- Abra o console do AWS Service Quotas
- Selecione Amazon Bedrock
- Pesquise por “Bedrock Mantle” para visualizar as cotas disponíveis
Para solicitar aumento de qualquer uma dessas cotas, basta seguir o processo padrão de aumento de limites do Amazon Bedrock.
Disponibilidade por região
O suporte a Service Quotas para o endpoint bedrock-mantle está disponível em todas as regiões da AWS onde o endpoint é oferecido:
- EUA Leste: Norte da Virgínia, Ohio
- EUA Oeste: Oregon
- Ásia-Pacífico: Mumbai, Tóquio, Sydney, Jacarta
- Europa: Frankfurt, Irlanda, Londres, Milão, Estocolmo
- América do Sul: São Paulo
Para o público brasileiro, vale destacar a presença da região de São Paulo, o que garante baixa latência para aplicações hospedadas localmente.
Por que isso importa
Ter visibilidade de cotas de forma proativa é fundamental para quem opera em escala de produção. Sem esse tipo de informação, equipes costumam descobrir os limites apenas quando os erros começam a aparecer — o que pode significar interrupções inesperadas em aplicações críticas. Com essa atualização, o Amazon Bedrock se alinha ao padrão já consolidado de outros serviços da AWS, tornando o planejamento de capacidade mais previsível e menos reativo.
Para mais detalhes técnicos sobre os limites disponíveis, consulte a documentação de cotas do Amazon Bedrock.
Fonte
Amazon Bedrock expands support for Service Quotas (https://aws.amazon.com/about-aws/whats-new/2026/5/amazon-bedrock-service-quotas/)
Leave a Reply