Transformando o Processamento de Documentos com IA
O processamento inteligente de documentos (Intelligent Document Processing — IDP) representa uma mudança fundamental em como as organizações lidam com dados não estruturados. Faturas, contratos, relatórios e outros documentos comerciais contêm informações valiosas que, tradicionalmente, exigem extração manual. A AWS demonstra uma abordagem programática e automatizada para essa tarefa, combinando tecnologias recentes em inteligência artificial.
A solução apresentada integra o Strands SDK, Amazon Bedrock AgentCore, Amazon Bedrock Knowledge Base e Bedrock Data Automation (BDA). Todo o processo é documentado através de um Jupyter notebook que permite aos usuários fazer upload de documentos multimodais e extrair conhecimentos aplicando BDA como analisador de conteúdo, recuperando trechos relevantes e enriquecendo prompts enviados para modelos de linguagem.
Um caso de uso prático demonstra a extração de contexto educacional relevante a partir de relatórios públicos — especificamente, dados de distritos escolares públicos obtidos do relatório nacional da educação americana.

Capacidades e Componentes Principais
Amazon Bedrock Data Automation
Amazon Bedrock Data Automation pode funcionar de duas formas: como recurso independente ou como analisador integrado ao configurar uma base de conhecimento para fluxos de Geração Aumentada por Recuperação (Retrieval-Augmented Generation — RAG). O serviço processa conteúdo multimodal não estruturado — documentos, imagens, vídeos e áudio — gerando insights automaticamente e de forma econômica.
A combinação de BDA com fluxos RAG permite construir sistemas que entendem contextos complexos armazenando representações vetoriais dos documentos. Para isso, a solução utiliza Amazon OpenSearch Service como repositório das embeddings vetoriais necessárias.
Amazon Bedrock AgentCore
Amazon Bedrock AgentCore é um serviço totalmente gerenciado que permite construir e configurar agentes autônomos. Desenvolvedores podem criar e implantar agentes usando frameworks populares e um conjunto diverso de modelos — incluindo opções da Amazon Bedrock, Anthropic, Google e OpenAI — sem necessidade de gerenciar infraestrutura subjacente ou escrever código customizado.
Na solução apresentada, o AgentCore utiliza BDA através de ferramentas para executar RAG multimodal aplicado ao processamento inteligente de documentos.
Strands Agents SDK
O Strands Agents SDK é um toolkit sofisticado de código aberto que revoluciona o desenvolvimento de agentes de inteligência artificial por meio de uma abordagem orientada por modelo. Desenvolvedores criam um agente Strands com um prompt (que define o comportamento do agente) e uma lista de ferramentas disponíveis. Um modelo de linguagem grande (Large Language Model — LLM) realiza o raciocínio, decidindo autonomamente quais ações executar e quando utilizar cada ferramenta com base no contexto e na tarefa solicitada.
Esse fluxo de trabalho suporta sistemas complexos, minimizando o código necessário para orquestrar colaboração entre múltiplos agentes. O Strands SDK é responsável pela criação do agente e definição das ferramentas necessárias para realizar o processamento inteligente de documentos.
Pré-requisitos e Arquitetura
Preparação Inicial
Antes de começar, certifique-se de que você possui:
- Credenciais AWS com permissões apropriadas
- Acesso ao Github
- Git instalado localmente — consulte Getting Started – Installing Git para instruções
Componentes da Arquitetura
A solução integra os seguintes serviços AWS:
- Amazon S3 para armazenamento e upload de documentos
- Bedrock Knowledge Bases para converter objetos armazenados no S3 em um fluxo preparado para RAG
- Amazon OpenSearch para embeddings vetoriais
- Amazon Bedrock AgentCore para orquestrar o fluxo de processamento inteligente
- Strands Agent SDK como framework de código aberto para definir ferramentas de IDP
- Bedrock Data Automation para extrair insights estruturados dos documentos
Implementação Passo a Passo
Configuração da AWS CLI
O primeiro passo é configurar a AWS Command Line Interface (AWS CLI) com suas credenciais e região. Execute o comando:
aws configure
Antes de prosseguir, verifique a disponibilidade regional e preços de AWS Bedrock Data Automation for region availability and pricing.
Clonagem do Repositório
Faça o clone do repositório de exemplo localmente:
git clone https://github.com/aws-samples/sample-for-amazon-bda-agents
cd sample-for-amazon-bda-agents
Abra o Jupyter notebook chamado bedrock-data-automation-with-agents.ipynb.
Fluxo de Trabalho com Bedrock Data Automation e AgentCore
O notebook demonstra como criar uma solução de processamento inteligente usando BDA com o Amazon Bedrock AgentCore Runtime. Em vez de usar agentes tradicionais do Bedrock, a solução implanta um agente Strands através do AgentCore, fornecendo capacidades de nível empresarial com flexibilidade de framework.
O processo segue estas etapas:
- Importar bibliotecas e configurar capacidades do AgentCore
- Criar a Knowledge Base para Amazon Bedrock com BDA
- Fazer upload do dataset de relatórios acadêmicos para Amazon S3
- Implantar o agente Strands usando o AgentCore Runtime
- Testar o agente hospedado no AgentCore
- Limpar todos os recursos após conclusão
Instruções mais específicas estão incluídas no Jupyter notebook fornecido.
Fluxo de Dados da Solução
O fluxo geral da solução funciona da seguinte forma:
- Usuários fazem upload de documentos relevantes para Amazon S3
- A Knowledge Base do Amazon Bedrock processa a fonte de dados no S3 utilizando Bedrock Data Automation como analisador
- Chunks de documentos são armazenados como embeddings vetoriais em Amazon OpenSearch
- Um agente Strands implantado no Amazon Bedrock AgentCore Runtime executa RAG para responder perguntas do usuário
- O usuário final recebe a resposta consultada
Considerações de Segurança
A implementação inclui várias salvaguardas de segurança:
- Tratamento seguro de upload de arquivos
- Controle de acesso baseado em papéis (Identity and Access Management — IAM)
- Validação de entrada e tratamento de erros
É importante notar que essa implementação destina-se a fins de demonstração. Antes de implantar em um ambiente de produção, controles de segurança adicionais, testes abrangentes e revisões arquiteturais são necessários.
Benefícios e Casos de Uso
Essa solução é particularmente valiosa para:
- Fluxos de trabalho automatizados de processamento de documentos
- Análise inteligente de documentos em datasets de grande escala
- Sistemas de perguntas e respostas baseados em conteúdo de documentos
- Processamento de conteúdo multimodal
Recursos Adicionais
Para saber mais sobre cada componente:
- Amazon Bedrock
- Amazon Bedrock Knowledge Bases User Guide
- Amazon Bedrock AgentCore User Guide
- Strands Agents: Open Source AI Agents SDK
- Amazon Bedrock Data Automation User Guide
- Amazon Bedrock Data Automation AWS Samples
- Amazon Bedrock AgentCore AWS Samples
- Strands Agents Samples
Conclusão
A solução apresentada demonstra como o Amazon Bedrock AgentCore e suas capacidades podem ser usados para construir aplicações robustas de processamento inteligente de documentos. Ao criar agentes Strands que suportam Amazon Bedrock Data Automation, é possível desenvolver aplicações poderosas que compreendem e interagem com conteúdo multimodal de documentos utilizando ferramentas especializadas.
Com Amazon Bedrock Data Automation, as organizações podem aprimorar significativamente a experiência RAG para formatos de dados mais complexos — incluindo documentos visualmente ricos, imagens, áudios e vídeos — sem necessidade de construir infraestrutura customizada.
Fonte
Programmatically creating an IDP solution with Amazon Bedrock Data Automation (https://aws.amazon.com/blogs/machine-learning/programmatically-creating-an-idp-solution-with-amazon-bedrock-data-automation/)
Leave a Reply