Novo Suporte à Responses API do OpenAI no Amazon Bedrock
A AWS anunciou o suporte à Responses API do OpenAI através de novos endpoints de serviço compatíveis com a API do OpenAI no Amazon Bedrock. Essa integração representa um avanço significativo para desenvolvedores que trabalham com cargas de trabalho de inferência de longa duração e fluxos de trabalho complexos.
Principais Capacidades da Responses API
A Responses API do OpenAI, agora disponível no Bedrock, traz funcionalidades que simplificam o desenvolvimento de aplicações baseadas em inteligência artificial. Dentre os principais benefícios estão:
- Inferência assíncrona: Permite que desenvolvedores processem cargas de trabalho de inferência de longa duração sem bloquear a aplicação.
- Gerenciamento de contexto automático: Elimina a necessidade de transmitir todo o histórico de conversas com cada requisição, reconstruindo automaticamente o contexto necessário para cada interação.
- Integração aprimorada de ferramentas: Simplifica a utilização de ferramentas em fluxos de trabalho de agentes autônomos.
- Gerenciamento de conversas com estado: Mantém o contexto das conversas de forma automática e eficiente.
Compatibilidade e Modos de Operação
Os novos endpoints de serviço suportam tanto modo streaming quanto não-streaming, além de viabilizar suporte a esforço de raciocínio dentro da Chat Completions API. Graças à compatibilidade com o SDK do OpenAI, os desenvolvedores precisam apenas alterar a URL base para integrar a solução em codebases existentes, minimizando esforço de migração ou adaptação.
Project Mantle e Infraestrutura
O suporte a Chat Completions com esforço de raciocínio está disponível para todos os modelos do Amazon Bedrock alimentados pelo Project Mantle, um novo mecanismo de inferência distribuída desenvolvido para servir modelos de machine learning de grande escala.
O Project Mantle oferece diversos benefícios para a plataforma Bedrock:
- Simplifica e acelera a integração de novos modelos ao Amazon Bedrock
- Fornece inferência serverless altamente performática e confiável com controles sofisticados de qualidade de serviço
- Desbloqueia quotas padrão mais elevadas para clientes através de gerenciamento automatizado de capacidade e pools unificados
- Oferece compatibilidade pronta com as especificações da API do OpenAI
Disponibilidade e Próximos Passos
O suporte à Responses API está disponível a partir de hoje para os modelos GPT OSS 20B/120B do OpenAI, com suporte a outros modelos previsto para breve. Para começar a utilizar a funcionalidade, desenvolvedores podem consultar a documentação do serviço.
Fonte
Amazon Bedrock now supports Responses API from OpenAI (https://aws.amazon.com/about-aws/whats-new/2025/12/amazon-bedrock-responses-api-from-openai/)
Leave a Reply