O desafio de integrar dados na pesquisa de cânceres raros
Quem trabalha com pesquisa oncológica sabe bem o problema: os dados estão espalhados em dezenas de fontes diferentes. Sequenciamento genômico, registros de ensaios clínicos, repositórios de biomarcadores, literatura científica revisada por pares — cada uma dessas fontes fala uma língua diferente, usa esquemas distintos e vive em sistemas isolados. Antes de qualquer análise começar, equipes inteiras precisam construir pipelines de Extração, Transformação e Carga (ETL) customizados, reconciliar esquemas manualmente e fazer consultas iterativas em sistemas desconectados. Um processo que facilmente consome semanas.
É exatamente esse gargalo que a AWS propõe resolver com o Amazon Quick Research. Em um post recente, a empresa demonstrou como a ferramenta pode ser aplicada à pesquisa de sarcomas pediátricos — um tipo raro de câncer — usando bases de dados biomédicas públicas como o PubMed.
O que é o Amazon Quick Research
O Amazon Quick Research é um fluxo de trabalho de pesquisa agêntico dentro do Amazon Quick. Na prática, ele orquestra a recuperação de dados de múltiplas fontes e aplica síntese baseada em Modelos de Linguagem de Grande Escala (LLM) para gerar relatórios estruturados, com citações rastreáveis e controle de versão.
Os componentes centrais da ferramenta são:
- Interpretação do objetivo de pesquisa: o agente lê uma pergunta em linguagem natural e a divide em subtópicos estruturados para investigação paralela.
- Ingestão de múltiplas fontes: suporta busca na web (incluindo PubMed, ClinicalTrials.gov e periódicos de acesso aberto), upload de arquivos (PDF, Word, Excel, PowerPoint) e ativos do Amazon Quick como Spaces, dashboards, bases de conhecimento e datasets.
- Plano de pesquisa gerado por IA: antes de executar, o agente produz um plano estruturado listando os tópicos que investigará, as fontes que consultará por tópico e a abordagem analítica. O usuário pode revisar e ajustar esse plano antes de confirmar a execução.
- Geração de relatório com citações: o resultado é um relatório estruturado com citações inline rastreáveis até os documentos ou URLs de origem. O recurso “Entender a afirmação” expõe a cadeia de evidências por trás de conclusões individuais.
- Fluxo de revisão versionado: é possível anotar afirmações específicas com comentários de revisão (até 400 caracteres). Ao submeter uma revisão, um novo ciclo de pesquisa é iniciado com escopo nas seções anotadas, o número de versão é incrementado e as versões anteriores ficam disponíveis para comparação.
- Formatos de exportação: os relatórios podem ser exportados em PDF ou Word. Variantes de resumo (Executivo, Geral, Personalizado) permitem ajustar o tamanho do output e a densidade de citações para diferentes públicos.
O papel dos Spaces na organização dos dados
O Spaces é a camada de organização de dados que alimenta o Amazon Quick Research. Um Space funciona como um contêiner lógico que agrupa até 10.000 arquivos junto com dashboards, tópicos e bases de conhecimento do Amazon Quick. Os arquivos são indexados no momento do upload e ficam disponíveis como corpus de recuperação para os ciclos de pesquisa.
Os formatos suportados incluem Word, Excel, PowerPoint, PDF, CSV, TXT, RTF, JSON, YAML, XML e HTML. No exemplo demonstrado pela AWS, um Space foi populado com datasets públicos de genômica oncológica e resumos do PubMed para servir como corpus de conhecimento interno, complementado por buscas na web em tempo real.
Passo a passo: pesquisa sobre sarcomas pediátricos
A demonstração publicada pela AWS percorre o fluxo completo de uso do Amazon Quick Research aplicado à investigação de sarcomas pediátricos. Veja como o processo funciona na prática:
Parte 1 — Criação do Space
O primeiro passo é abrir o Amazon Quick, acessar a seção Spaces e criar um novo Space. Nele, o usuário adiciona os arquivos relevantes para a pesquisa — seja por upload direto, conexão com dashboards ou bases de conhecimento existentes. Todos os arquivos precisam aparecer com o status “Indexado” antes de prosseguir.
Parte 2 — Criação do projeto de pesquisa
Na página inicial do Amazon Quick, o usuário acessa a opção Quick Research e inicia um novo projeto. O fluxo guiado conduz desde a definição do objetivo até a geração do relatório final.
Parte 3 — Definição do objetivo
O objetivo de pesquisa é inserido em linguagem natural. A AWS recomenda que a pergunta seja focada e específica para obter melhores resultados. O exemplo utilizado na demonstração foi:
“Quais são as abordagens promissoras de terapia-alvo para sarcomas pediátricos com alterações genômicas específicas, e como podemos identificar pacientes que podem se beneficiar desses tratamentos?”
O agente de IA ajuda a refinar a pergunta e sugere ângulos adicionais de investigação com base nas fontes de dados disponíveis.
Parte 4 — Seleção e integração de fontes de dados
O usuário escolhe quais fontes incluir na pesquisa. No exemplo, foram habilitadas as seguintes opções:
- Busca na web: para acessar fontes publicamente indexadas como PubMed, ClinicalTrials.gov e periódicos de acesso aberto. URLs específicas também podem ser adicionadas, como:
- Upload de arquivos: para adicionar documentos específicos ao corpus.
- Ativos do Quick: para incluir Spaces, dashboards e bases de conhecimento já existentes.
Para a investigação de sarcomas pediátricos, o sistema reconheceu automaticamente conexões entre dados de mutação genômica e bancos de alvos terapêuticos, dados de desfecho clínico e literatura de protocolos de tratamento, perfis de biomarcadores e padrões de resposta de pacientes, além de dados históricos de ensaios clínicos e opções terapêuticas atuais.
Parte 5 — Revisão do plano gerado por IA
Antes de executar a pesquisa, o Quick Research gera um plano estruturado para revisão. No exemplo demonstrado, os tópicos foram:
- Tópico 1: Terapias-alvo guiadas por genômica para sarcomas pediátricos — seleção de pacientes e abordagens de tratamento.
- Tópico 2: Panorama genômico dos sarcomas pediátricos — mutações, fusões gênicas (como PAX3) e subtipos incluindo rabdomiossarcoma, sarcoma de Ewing e osteossarcoma.
- Tópico 3: Terapias-alvo aprovadas pela Administração de Alimentos e Medicamentos (FDA) — mecanismos de ação, eficácia e perfis genômicos.
- Tópico 4: Direções futuras — edição gênica, terapias celulares, novos sistemas de entrega de fármacos e pesquisa pré-clínica.
O usuário pode ajustar o plano antes de confirmar a execução, adicionando focos específicos como análise de mutações particulares ou comparações entre abordagens terapêuticas.
Parte 6 — Execução e acompanhamento
Após confirmar o plano, o usuário inicia a pesquisa. O sistema exibe um indicador de progresso e o status muda de “Não iniciado” para “Em andamento”. O processo completo leva entre 20 e 30 minutos.
Parte 7 — Revisão do relatório gerado
O relatório final sintetiza as descobertas de todas as fontes selecionadas em um formato estruturado, incluindo:
- Resumo executivo com as principais descobertas e implicações clínicas.
- Seções de análise detalhada com visualizações de dados de suporte.
- Recomendações baseadas em evidências para direções futuras de pesquisa.
- Fontes citadas e transparência metodológica.
- Próximos passos acionáveis para implementação clínica.
A navegação entre seções é feita pela aba de Tópicos no painel lateral. As citações numeradas ao longo do texto permitem acessar diretamente os materiais de origem para verificação. O recurso “Entender a afirmação” mostra como cada conclusão foi determinada e apresenta um resumo das evidências utilizadas.
Parte 8 — Revisão e versionamento
Para refinar a pesquisa com focos adicionais, o usuário pode adicionar comentários de revisão diretamente no relatório — selecionando o trecho que deseja expandir ou revisar e adicionando uma anotação de até 400 caracteres. Ao acionar o botão de revisão, o Quick Research analisa o conteúdo existente, aplica os comentários e gera uma nova versão (por exemplo, Versão 2) em 20 a 40 minutos. As versões anteriores ficam preservadas para comparação, criando um histórico de auditoria claro do processo de pesquisa.
A ferramenta também oferece três formatos de resumo para diferentes necessidades de apresentação:
- Resumo Executivo: orientado para lideranças, máximo de 2 páginas, sem citações.
- Compartilhamento Geral: amigável para negócios, máximo de 6 páginas, com citações essenciais.
- Resumo Personalizado: formato sob medida, até 5.000 caracteres.
Os relatórios podem ser exportados em PDF (para apresentações) ou Word (para edição colaborativa) e compartilhados com membros da equipe diretamente pela plataforma.
Limpeza dos recursos
Como o Amazon Quick é um serviço pago, a AWS orienta que os usuários excluam os relatórios e os arquivos carregados nos Spaces ao final do uso para evitar cobranças contínuas. O processo envolve excluir o relatório pelo menu de ações e remover o Space pelo console do Amazon Quick. É recomendável exportar qualquer resultado relevante antes de realizar a limpeza.
Por que isso importa
O caso de uso demonstrado pela AWS evidencia um potencial real para equipes de pesquisa biomédica: a possibilidade de fazer perguntas complexas em linguagem natural que atravessam múltiplas fontes de dados, identificar correlações sutis via análise por IA e sintetizar descobertas de datasets heterogêneos — tudo isso em um fluxo estruturado, rastreável e versionado.
Para quem trabalha com submissões regulatórias, pedidos de financiamento ou tomada de decisão clínica, ter um relatório com citações verificáveis e histórico de versões é um diferencial significativo. O resultado prometido é pesquisa mais rápida e insights mais abrangentes, baseados em evidências, que podem informar decisões clínicas e melhorar os desfechos para pacientes com diagnósticos de cânceres raros.
Para explorar o serviço, a AWS disponibiliza a página do produto Amazon Quick para iniciar um trial e criar o primeiro Space, além da documentação do Amazon Quick Research com guias detalhados e boas práticas. Dúvidas e experiências podem ser compartilhadas na comunidade AWS para Saúde e Ciências da Vida.
Fonte
Transforming rare cancer research with Amazon Quick: Integrating biomedical databases for breakthrough discoveries (https://aws.amazon.com/blogs/machine-learning/transforming-rare-cancer-research-with-amazon-quick-integrating-biomedical-databases-for-breakthrough-discoveries/)
Leave a Reply