O problema real dos agentes de IA em produção
Os modelos que alimentam os agentes de Inteligência Artificial (IA) atuais são notavelmente capazes: conseguem raciocinar sobre problemas complexos, planejar fluxos de trabalho em múltiplas etapas e gerar respostas sofisticadas. Mas a maioria dos agentes opera bem abaixo desse potencial — e o gargalo não é inteligência. É acesso ao contexto certo e a mecanismos de feedback.
Pense nos exemplos práticos: um agente de atendimento ao cliente não consegue responder sobre a política de reembolso da empresa se não tiver acesso ao documento no SharePoint onde essa política está registrada. Um agente de pesquisa entrega uma visão incompleta de mercado se não puder acessar informações além dos dados com que foi treinado. Um agente de consultoria financeira retorna recomendações de segunda linha quando os dados de mercado em tempo real que ele precisa estão por trás de uma barreira de pagamento que ele não consegue atravessar. E, em todos esses cenários, as equipes raramente têm uma forma sistemática de saber se seus agentes estão melhorando ou piorando depois do deploy.
Foi para fechar essas lacunas que a AWS anunciou um conjunto de novas capacidades no Amazon Bedrock AgentCore, a plataforma para construir, conectar e otimizar agentes.
Agentes que sabem mais e alcançam mais
O AgentCore passa a oferecer acesso nativo a três camadas de conhecimento, cada uma ampliando o que os agentes conseguem acessar e realizar.
Camada de conhecimento organizacional: Bedrock Managed Knowledge Base
As informações mais valiosas de uma empresa estão espalhadas por SharePoint, Google Drive, Confluence, S3 e wikis internos. Tornar esse conteúdo acessível a agentes exigia, até então, construir pipelines de ingestão customizados, ajustar a recuperação de dados e manter a atualização ao longo do tempo — meses de engenharia antes que o agente conseguisse responder uma pergunta básica sobre o próprio negócio.
O Bedrock Managed Knowledge Base, agora disponível no AgentCore, substitui todo esse trabalho. A equipe conecta as fontes de dados não estruturados e o AgentCore cuida do restante: gerencia o armazenamento vetorial, os modelos de embeddings e re-ranking usados na recuperação, além das preocupações de escalabilidade como limites de taxa.
No centro dessa solução está um recuperador agêntico que vai muito além do Geração Aumentada por Recuperação (RAG) tradicional. Em vez de apenas associar uma consulta aos trechos mais próximos, ele planeja consultas entre múltiplas bases de conhecimento, conecta conceitos relacionados entre documentos, avalia resultados intermediários e faz re-ranking antes de responder. Para consultas complexas com múltiplas partes, essa abordagem entrega cobertura notavelmente mais ampla e completa do que a recuperação básica.
Camada de conhecimento global: Web Search no AgentCore
O conhecimento interno tem lacunas. Regulamentações mudam, mercados se movem, concorrentes lançam produtos constantemente. Para fazer o melhor trabalho possível, os agentes precisam entender o que acontece no mundo fora da organização — para pesquisa, verificação de fatos, atendimento ao cliente e inteligência de mercado.
A AWS está introduzindo o Web Search, uma nova ferramenta para desenvolvedores que constroem agentes de IA. Ela fornece informações da web mantendo os dados dentro do ambiente seguro da AWS do cliente. Construída sobre a mesma infraestrutura de busca da Amazon que alimenta o Alexa+, o Amazon Quick Suite e o Kiro, a ferramenta é otimizada para recuperação agêntica, retornando trechos de alto valor que entregam alta inteligência por token.
A abordagem combina informações públicas da web com o grafo de conhecimento proprietário da Amazon, que adiciona dados estruturados sobre entidades, fatos verificados e informações em tempo real como cotações de ações e resultados esportivos. Tudo isso permanece dentro do perímetro de segurança e conformidade da AWS, sem a necessidade de integrar um fornecedor externo adicional.
Camada de conhecimento pago: pagamentos no AgentCore e monetização de tráfego de IA no AWS WAF
As melhores informações nem sempre são gratuitas: feeds de mercado financeiro, pesquisas licenciadas, conjuntos de dados proprietários e APIs premium. Se o agente não consegue acessar recursos pagos, ele retorna uma resposta subótima — e o usuário nunca sabe o que foi perdido.
Acessar conteúdo pago exige duas partes: os agentes precisam de uma forma de pagar, e os provedores precisam de uma forma de receber. Os pagamentos do AgentCore, anunciados em preview no mês anterior, resolvem o lado do agente, permitindo que ele descubra serviços e conteúdos pagos, acesse-os e pague dentro do próprio loop de execução. Já a monetização de tráfego de IA no WAF, agora disponível para todos, resolve o lado do provedor, dando aos donos de conteúdo a capacidade de controlar o acesso de agentes: bloquear, permitir ou cobrar.
Como ambas as capacidades rodam na mesma plataforma, provedores que usam o Firewall de Aplicações Web (WAF) reconhecem automaticamente os agentes verificados no AgentCore. O resultado é um canal confiável: menos fricção para agentes verificados e compensação garantida para os provedores.
Agentes que aprendem com cada interação
Dar aos agentes melhor acesso ao conhecimento é apenas parte da equação. É preciso também saber se o agente está realmente atingindo seu objetivo — e identificar quando não está.
Isso é mais difícil do que parece. As falhas mais perigosas não são as que geram erros. São as que parecem normais nos dashboards: um agente que confirma uma modificação de pedido que nunca executou; outro que fabrica disponibilidade de produto quando uma API atinge timeout; um terceiro que pula uma etapa de aprovação enquanto os painéis mostram 99% de sucesso. Essas falhas não produzem sinais de erro — elas surgem através de reclamações de clientes semanas depois, frequentemente após milhares de sessões afetadas.
A AWS está anunciando novas capacidades de otimização no AgentCore que transformam rastros de produção em melhoria contínua.
Entender o que os agentes estão fazendo
Disponível em preview, o AgentCore passa a oferecer insights ricos sobre falhas, intenções e trajetórias em centenas de sessões, revelando padrões que nenhum dashboard ou revisão manual de rastros um a um conseguiria identificar.
- Insights de falha: descobrem padrões recorrentes de falha, incluindo as falhas comportamentais silenciosas que não produzem sinal de erro, explicam a causa raiz de cada uma em detalhes e as classificam por abrangência — para que a equipe saiba quais problemas estão afetando mais usuários e corrija primeiro os mais críticos.
- Insights de intenção: agrupam requisições pelo que os usuários estavam realmente tentando fazer, revelando o perfil real de uso do agente.
- Insights de trajetória: agrupam os caminhos que os agentes percorrem em uma tarefa, permitindo identificar padrões comuns e casos atípicos.
É possível ativar monitoramento contínuo com relatórios diários ou semanais, ou executar uma investigação pontual após um deploy ou um pico de reclamações — com resultados em minutos.
Corrigir com confiança
Uma vez identificado o que precisa mudar, recomendações e testes A/B — agora disponíveis para todos — ajudam a agir. As recomendações analisam rastros e saídas de avaliação para sugerir melhorias específicas nos prompts de sistema e nas descrições de ferramentas, com base no comportamento real do agente. A avaliação em lote testa essas recomendações contra o conjunto de dados de teste definido e reporta pontuações agregadas, detectando regressões antes que as mudanças cheguem à produção. O teste A/B executa uma comparação controlada entre versões do agente dividindo o tráfego real de produção, fornecendo evidências concretas de que uma mudança funciona sob condições reais antes do commit definitivo.
Tudo isso funciona independentemente de onde os agentes rodam: no runtime do AgentCore, no AWS Lambda, no Amazon Elastic Kubernetes Service (EKS) ou em ambientes fora da AWS.
Controles mais fortes à medida que os agentes ficam mais capazes
Agentes mais capazes significam mais superfície de exposição. E agentes introduzem um desafio de segurança que softwares tradicionais nunca tiveram: eles são probabilísticos. Agentes tomam decisões, e decisões podem ser influenciadas pelo contexto. O novo ponto de exposição não é a rede — é o contexto do agente, onde injeção de prompt e envenenamento de memória não exigem uma invasão, mas simplesmente convencer o agente a tomar uma decisão ruim.
A forma de proteger algo probabilístico é com algo determinístico: não como o cérebro, mas como guardrails ao redor dele. As capacidades de política no AgentCore já oferecem controles determinísticos em tempo real que definem o que um agente pode ou não fazer com ferramentas e dados no gateway. Agora, a AWS estende isso com a integração ao Bedrock Guardrails — disponível para todos —, que avalia cada ação do agente em busca de tentativas de injeção de prompt, conteúdo prejudicial e exposição de dados sensíveis. Essas verificações rodam na camada de gateway, fora do código do agente, onde o agente não consegue vê-las em seu contexto, não consegue raciocinar ao redor delas e não consegue se convencer de que não se aplicam.
Em breve, o AgentCore permitirá também alimentar sinais de detecção de provedores de segurança líderes — incluindo Check Point, Zscaler, Rubrik, Netskope e SentinelOne — nas mesmas políticas. O princípio se mantém independentemente da origem do sinal: a detecção pode ser probabilística, mas a aplicação da política é sempre determinística.
Do conceito a um agente funcional em minutos: AgentCore Harness disponível para todos
Um agente é mais do que um modelo. Se o modelo é o cérebro, o harness é o corpo: tudo o que o cérebro precisa para realizar trabalho. Ele executa o loop de orquestração, executa ferramentas, gerencia a janela de contexto, persiste estado entre turnos, se recupera de falhas e isola cada sessão.
O AgentCore harness, agora disponível para todos, entrega essa camada como uma capacidade gerenciada. Em vez de codificar o loop, a equipe define o agente em configuração: o modelo que usa, as ferramentas que chama, as habilidades que tem acesso, as instruções que segue. O AgentCore monta e executa esse loop automaticamente. A partir dessa definição única, é possível ter um agente funcional em minutos, rodando em seu próprio ambiente isolado, com sistema de arquivos, shell, memória entre sessões, habilidades e navegação na web.
Um diferencial importante é o desacoplamento entre harness e modelo: é possível escolher qualquer modelo e trocar entre eles durante a sessão sem tocar na lógica do agente. À medida que a fronteira avança e o melhor modelo para uma tarefa muda, a base do agente permanece estável. Quando for necessária orquestração customizada, é possível exportar o harness para código e continuar na mesma plataforma sem reconstruir nada.
O que está disponível agora
As seguintes capacidades estão disponíveis para todos no AgentCore: harness gerenciado, Bedrock Managed Knowledge Base, Web Search, integração com Guardrails, recomendações e testes A/B. Insights e pagamentos estão disponíveis em preview.
Para começar, acesse o console do AgentCore, use o AgentCore CLI ou consulte a documentação oficial para saber mais.
Fonte
New in Amazon Bedrock AgentCore: Build agents with broader knowledge and continuous learning (https://aws.amazon.com/blogs/machine-learning/new-in-amazon-bedrock-agentcore-build-agents-with-broader-knowledge-and-continuous-learning/)
Leave a Reply