Uma evolução importante para automação em navegadores
A AWS expandiu as capacidades do Amazon Bedrock AgentCore Browser para incluir interações no nível do sistema operacional. Essa adição representa um passo significativo para desenvolvedores que trabalham com agentes de IA e engenheiros de teste automatizado, pois resolve limitações que existiam anteriormente ao usar exclusivamente o Protocolo de Ferramentas de Desenvolvedor do Chrome (CDP).
O protocolo CDP, embora poderoso, não consegue lidar com certos cenários de automação — como operações com caixas de diálogo do sistema, atalhos de teclado específicos ou interações com elementos fora da área visível do navegador. A AWS identificou essas lacunas e as preencheu com suporte direto ao sistema operacional.
Que capacidades foram adicionadas?
O novo recurso traz três categorias principais de funcionalidades:
- Operações de mouse: cliques, movimento, arraste e rolagem — todos coordenados pelas posições do sistema operacional
- Operações de teclado: digitação, pressão de teclas e atalhos como Ctrl+A e Ctrl+P
- Captura de tela completa: screenshots em resolução de desktop que vão além da viewport do navegador
Essas capacidades funcionam em coordenadas do nível do SO, ampliando a visibilidade e o controle muito além do que o navegador sozinho consegue oferecer.
Casos de uso práticos
A adição desses recursos abre caminho para automatizar cenários que eram difíceis ou impossíveis antes:
- Testes automatizados que precisam lidar com caixas de diálogo de sistema nativo
- Fluxos de trabalho de gerenciamento de documentos que envolvem impressão e diálogos de salvamento
- Interações complexas de interface que incluem menus de clique direito
- Agentes de IA baseados em visão que necessitam ter visibilidade completa do ambiente do navegador
Esses usos cases cobrem um espectro amplo: desde a automação de testes até a construção de ferramentas de interação web alimentadas por modelos de linguagem grande.
Disponibilidade global
O recurso está disponível por padrão em todas as instâncias de navegador do Amazon Bedrock AgentCore Browser em todos os 14 regiões da AWS onde o serviço está presente: US East (N. Virginia), US East (Ohio), US West (Oregon), Europa (Frankfurt), Europa (Irlanda), Europa (Londres), Europa (Paris), Europa (Estocolmo), Ásia Pacífico (Mumbai), Ásia Pacífico (Singapura), Ásia Pacífico (Sydney), Ásia Pacífico (Tóquio), Ásia Pacífico (Seul) e Canadá (Central).
Essa cobertura global garante que organizações em diferentes regiões possam aproveitar os novos recursos de automação sem restrições geográficas.
Próximos passos
Para aprender mais sobre como integrar essas capacidades em seus agentes e ferramentas de automação, consulte a documentação do AgentCore Browser.
Fonte
Amazon Bedrock AgentCore Browser adds OS-level interaction capabilities (https://aws.amazon.com/about-aws/whats-new/2026/04/agentcore-browser-os-actions/)
Leave a Reply