CloudTroop Weekly #015 — 2026-w23





CloudTroop Weekly #015 — 2026-w23

7 de junho de 2026

Resumo da Semana

A semana consolidou um sinal claro: IA agêntica está saindo do laboratório e entrando em produção — com todas as responsabilidades que isso traz. AWS entregou peças importantes nessa direção: isolamento de tenants no Bedrock AgentCore, observabilidade de LLMs do nível de GPU até qualidade de resposta, e operações autônomas com open source. Paralelamente, segurança ganhou atenção com flow logs em tempo real no Shield Advanced e a nova API do KMS para auditar chaves ociosas. Para times brasileiros, destaque para o Cognito com replicação agora disponível em São Paulo.

O que muda na prática

  • Operar LLMs em produção agora exige dashboard unificado correlacionando métricas de infraestrutura e qualidade de resposta — monitorar só CPU e memória não é mais suficiente.
  • A nova API GetKeyLastUsage do KMS fecha um gap histórico de auditoria: times de FinOps e compliance podem identificar chaves ociosas e reduzir custos sem risco de exclusão acidental.
  • Cognito com replicação multi-região disponível em sa-east-1 muda o padrão mínimo de resiliência para sistemas de autenticação com SLA elevado no Brasil.

Ações da semana

  • Execute a API GetKeyLastUsage no seu ambiente de produção esta semana e liste chaves KMS sem uso nos últimos 90 dias — candidatas a desativação ou revisão de custo.
  • Se você opera LLMs no SageMaker, revise se seu stack de observabilidade atual captura métricas de qualidade de resposta além das métricas de infraestrutura — e avalie o guia de dashboard unificado publicado esta semana.

Top 10 da Semana

1

Segurança multi-tenant em agentes de IA com Bedrock AgentCore

Provedores SaaS que constroem plataformas de IA precisam de padrões concretos para isolar tenants sem duplicar infraestrutura — este guia entrega exatamente isso.

Para quem: Arquitetos e engenheiros de segurança que desenvolvem plataformas multi-tenant com IA generativa.

Segurança IA

2

Visibilidade total em ataques DDoS com flow logs no Shield Advanced

Flow logs em tempo real durante ataques DDoS permitem análise forense e ajuste de mitigações sem infraestrutura adicional — mudança operacional significativa para equipes de segurança.

Para quem: Engenheiros de segurança e SREs responsáveis por proteção de aplicações expostas à internet.

DDoS Segurança

3

Nova API AWS KMS identifica chaves não utilizadas e evita exclusões

A API GetKeyLastUsage resolve um gap histórico de auditoria no KMS, permitindo otimizar custos e prevenir exclusões acidentais de chaves críticas em produção.

Para quem: Engenheiros de segurança, auditores de compliance e times de FinOps que gerenciam chaves criptográficas.

KMS Compliance

4

Amazon Cognito ganha replicação multi-região com suporte em São Paulo

Replicação de identidade em tempo quase real com failover transparente é um requisito crítico de resiliência para aplicações com SLA elevado — e agora está disponível em sa-east-1.

Para quem: Arquitetos de soluções e engenheiros que precisam de alta disponibilidade em sistemas de autenticação.

Resiliência Identidade

5

Bedrock Ops Alert: operações de IA autônomas e open source

Solução open source que automatiza detecção de incidentes, ajuste de alarmes e abertura de chamados para workloads de IA generativa — reduz carga operacional de SREs diretamente.

Para quem: SREs e engenheiros de plataforma que operam workloads de IA generativa em produção.

AIOps Observabilidade

6

SFT + DPO no SageMaker aumenta precisão de agentes em 30%

Combinar ajuste fino supervisionado com otimização de preferências permite alcançar desempenho superior com modelos menores, reduzindo custo de hospedagem de agentes de IA.

Para quem: Cientistas de dados e engenheiros de ML que desenvolvem e otimizam agentes de IA em produção.

Fine-tuning IA

7

Step Functions integra raciocínio agêntico com AgentCore

Incorporar etapas de IA agêntica em workflows visuais com suporte a aprovação humana e rastreamento via CloudWatch acelera a adoção de automações inteligentes em processos existentes.

Para quem: Arquitetos e desenvolvedores que constroem automações de processos com Step Functions.

Workflows Agênticos

8

Controle de acesso granular B2C com Cognito e Verified Permissions

A separação clara entre autenticação (Cognito) e autorização (Cedar/Verified Permissions) reduz débito técnico e melhora auditabilidade em aplicações B2C com regras de acesso complexas.

Para quem: Desenvolvedores e arquitetos que constroem aplicações B2C com requisitos avançados de autorização.

IAM Autorização

9

Observabilidade completa para LLMs no SageMaker: GPU à qualidade

Dashboard unificado que correlaciona métricas de infraestrutura com qualidade de respostas de LLMs é essencial para operar modelos em produção com responsabilidade.

Para quem: Engenheiros de ML e SREs responsáveis por LLMs em produção no SageMaker.

Observabilidade LLM

10

ElastiCache para Valkey ganha durabilidade para dados críticos

Durabilidade com latência de microssegundos abre o ElastiCache para casos de uso antes inviáveis, como memória persistente de agentes de IA e tokenização de pagamentos.

Para quem: Arquitetos e engenheiros que usam cache em workloads que exigem baixa latência e persistência de dados.

Cache Persistência


Comments

Leave a Reply

Your email address will not be published. Required fields are marked *