CloudTroop Weekly #015 — 2026-w23
7 de junho de 2026
Resumo da Semana
A semana consolidou um sinal claro: IA agêntica está saindo do laboratório e entrando em produção — com todas as responsabilidades que isso traz. AWS entregou peças importantes nessa direção: isolamento de tenants no Bedrock AgentCore, observabilidade de LLMs do nível de GPU até qualidade de resposta, e operações autônomas com open source. Paralelamente, segurança ganhou atenção com flow logs em tempo real no Shield Advanced e a nova API do KMS para auditar chaves ociosas. Para times brasileiros, destaque para o Cognito com replicação agora disponível em São Paulo.
O que muda na prática
- Operar LLMs em produção agora exige dashboard unificado correlacionando métricas de infraestrutura e qualidade de resposta — monitorar só CPU e memória não é mais suficiente.
- A nova API GetKeyLastUsage do KMS fecha um gap histórico de auditoria: times de FinOps e compliance podem identificar chaves ociosas e reduzir custos sem risco de exclusão acidental.
- Cognito com replicação multi-região disponível em sa-east-1 muda o padrão mínimo de resiliência para sistemas de autenticação com SLA elevado no Brasil.
Ações da semana
- Execute a API GetKeyLastUsage no seu ambiente de produção esta semana e liste chaves KMS sem uso nos últimos 90 dias — candidatas a desativação ou revisão de custo.
- Se você opera LLMs no SageMaker, revise se seu stack de observabilidade atual captura métricas de qualidade de resposta além das métricas de infraestrutura — e avalie o guia de dashboard unificado publicado esta semana.
Top 10 da Semana
Segurança multi-tenant em agentes de IA com Bedrock AgentCore
Provedores SaaS que constroem plataformas de IA precisam de padrões concretos para isolar tenants sem duplicar infraestrutura — este guia entrega exatamente isso.
Para quem: Arquitetos e engenheiros de segurança que desenvolvem plataformas multi-tenant com IA generativa.
Segurança IA
Visibilidade total em ataques DDoS com flow logs no Shield Advanced
Flow logs em tempo real durante ataques DDoS permitem análise forense e ajuste de mitigações sem infraestrutura adicional — mudança operacional significativa para equipes de segurança.
Para quem: Engenheiros de segurança e SREs responsáveis por proteção de aplicações expostas à internet.
DDoS Segurança
Nova API AWS KMS identifica chaves não utilizadas e evita exclusões
A API GetKeyLastUsage resolve um gap histórico de auditoria no KMS, permitindo otimizar custos e prevenir exclusões acidentais de chaves críticas em produção.
Para quem: Engenheiros de segurança, auditores de compliance e times de FinOps que gerenciam chaves criptográficas.
KMS Compliance
Amazon Cognito ganha replicação multi-região com suporte em São Paulo
Replicação de identidade em tempo quase real com failover transparente é um requisito crítico de resiliência para aplicações com SLA elevado — e agora está disponível em sa-east-1.
Para quem: Arquitetos de soluções e engenheiros que precisam de alta disponibilidade em sistemas de autenticação.
Resiliência Identidade
Bedrock Ops Alert: operações de IA autônomas e open source
Solução open source que automatiza detecção de incidentes, ajuste de alarmes e abertura de chamados para workloads de IA generativa — reduz carga operacional de SREs diretamente.
Para quem: SREs e engenheiros de plataforma que operam workloads de IA generativa em produção.
AIOps Observabilidade
SFT + DPO no SageMaker aumenta precisão de agentes em 30%
Combinar ajuste fino supervisionado com otimização de preferências permite alcançar desempenho superior com modelos menores, reduzindo custo de hospedagem de agentes de IA.
Para quem: Cientistas de dados e engenheiros de ML que desenvolvem e otimizam agentes de IA em produção.
Fine-tuning IA
Step Functions integra raciocínio agêntico com AgentCore
Incorporar etapas de IA agêntica em workflows visuais com suporte a aprovação humana e rastreamento via CloudWatch acelera a adoção de automações inteligentes em processos existentes.
Para quem: Arquitetos e desenvolvedores que constroem automações de processos com Step Functions.
Workflows Agênticos
Controle de acesso granular B2C com Cognito e Verified Permissions
A separação clara entre autenticação (Cognito) e autorização (Cedar/Verified Permissions) reduz débito técnico e melhora auditabilidade em aplicações B2C com regras de acesso complexas.
Para quem: Desenvolvedores e arquitetos que constroem aplicações B2C com requisitos avançados de autorização.
IAM Autorização
Observabilidade completa para LLMs no SageMaker: GPU à qualidade
Dashboard unificado que correlaciona métricas de infraestrutura com qualidade de respostas de LLMs é essencial para operar modelos em produção com responsabilidade.
Para quem: Engenheiros de ML e SREs responsáveis por LLMs em produção no SageMaker.
Observabilidade LLM
ElastiCache para Valkey ganha durabilidade para dados críticos
Durabilidade com latência de microssegundos abre o ElastiCache para casos de uso antes inviáveis, como memória persistente de agentes de IA e tokenização de pagamentos.
Para quem: Arquitetos e engenheiros que usam cache em workloads que exigem baixa latência e persistência de dados.
Cache Persistência
Patrocínio
Quer patrocinar a CloudTroop Weekly? Entre em contato
Leave a Reply