Amazon Bedrock expande ajuste fine-tuning por reforço para modelos abertos com APIs compatíveis com OpenAI

Suporte ampliado para modelos abertos no Amazon Bedrock

A AWS anunciou uma expansão significativa das capacidades de ajuste fine-tuning por reforço (RFT) no Amazon Bedrock. A plataforma agora oferece suporte a modelos abertos populares, incluindo OpenAI GPT-OSS e modelos Qwen, além de introduzir APIs de ajuste fine-tuning compatíveis com OpenAI. Essa evolução torna mais acessível para desenvolvedores melhorar a precisão de modelos abertos sem necessidade de expertise profunda em aprendizado de máquina ou grandes conjuntos de dados rotulados.

Como funciona o ajuste por reforço

O ajuste fine-tuning por reforço no Amazon Bedrock automatiza todo o fluxo de customização de modelos. Em vez de depender de grandes volumes de dados de treinamento, ele permite que modelos aprendam com feedback sobre múltiplas respostas possíveis utilizando apenas um pequeno conjunto de prompts. Essa abordagem possibilita às organizações trabalhar com variantes de modelos menores, mais rápidos e mais econômicos, mantendo alta qualidade nas respostas.

Resolvendo o dilema da customização

Muitas empresas enfrentam um desafio comum: modelos genéricos oferecem desempenho limitado, enquanto pipelines de customização complexos exigem infraestrutura especializada e equipes experientes. O Amazon Bedrock simplifica esse cenário ao fornecer uma experiência de ajuste fine-tuning totalmente gerenciada e segura.

Os clientes definem funções de recompensa utilizando avaliadores baseados em regras verificáveis ou juízes alimentados por inteligência artificial. A AWS oferece templates prontos para tarefas objetivas — como geração de código e raciocínio matemático — e subjetivas, como seguimento de instruções ou qualidade conversacional.

Recursos de customização e controle

Durante o treinamento, os clientes podem utilizar funções AWS Lambda para lógica de avaliação personalizada e acessar checkpoints intermediários do modelo. Isso permite avaliar, depurar e selecionar o melhor modelo, acelerando o ciclo de iteração e melhorando a eficiência do treinamento. Todos os dados proprietários permanecem em um ambiente seguro e governado dentro da AWS durante todo o processo de customização.

Modelos e APIs suportados

Neste lançamento, a AWS oferece suporte aos modelos qwen.qwen3-32b e openai.gpt-oss-20b. Após a conclusão do ajuste fine-tuning, os clientes podem utilizar imediatamente o modelo customizado para inferência sob demanda através das APIs compatíveis com OpenAI do Amazon Bedrock — incluindo as APIs Responses e Chat Completions — sem necessidade de etapas adicionais de implantação.

Próximos passos

Para explorar essa funcionalidade em detalhes, consulte a documentação do Amazon Bedrock.

Fonte

Amazon Bedrock reinforcement fine-tuning adds support for open-weight models with OpenAI-compatible APIs (https://aws.amazon.com/about-aws/whats-new/2026/02/amazon-bedrock-reinforcement-fine-tuning-openai)

Amazon Bedrock expande ajuste fine-tuning por reforço para modelos abertos com APIs compatíveis com OpenAI

Suporte ampliado para modelos abertos no Amazon Bedrock

Como funciona o ajuste por reforço

Resolvendo o dilema da customização

Recursos de customização e controle

Modelos e APIs suportados

Próximos passos

Fonte

Comments

Leave a Reply Cancel reply

More posts

Como garantir capacidade de GPU de curto prazo para cargas de ML com EC2 Capacity Blocks e SageMaker Training Plans

AWS conquista certificações SNI 27017, SNI 27018 e SNI 9001 na Região Ásia-Pacífico (Jacarta)

Agentes que transacionam: conheça o Amazon Bedrock AgentCore Payments, desenvolvido com Coinbase e Stripe

Superando desafios de sinal de recompensa: aprendizado por reforço com recompensas verificáveis e GRPO no SageMaker AI