ProBreast: diagnóstico de câncer de mama com Inteligência Artificial (IA) e arquitetura AWS

O câncer de mama é o tipo de câncer mais prevalente no mundo e a principal causa de morte entre mulheres. A detecção precoce salva vidas, mas o diagnóstico definitivo ainda depende da análise manual de tecidos histopatológicos por patologistas, um processo demorado, custoso e sujeito a variações de interpretação mesmo entre profissionais experientes.

A Claranet foi convidada pela ProBreast, um consórcio de pesquisa aplicada financiado pelo governo da Região das Marcas, na Itália, formado por meio de um edital público de incentivo à inovação científica e tecnológica (Bando Régionale), para apoiar um projeto com o objetivo de construir uma solução de diagnóstico assistido por computador (CAD) capaz de transformar esse cenário. 

 

O Desafio 

As ferramentas CAD disponíveis no mercado executam, no máximo, uma etapa isolada do processo diagnóstico. Para obter um laudo completo, os médicos precisavam operar múltiplos sistemas, o que gerava ineficiência, inconsistência e sobrecarga para as equipes clínicas. 

O projeto exigia resolver um problema complexo na raiz: a alta variabilidade dos dados de imagem histológica, que compromete a confiabilidade dos modelos de machine learning quando não tratada corretamente. 

O objetivo era criar uma plataforma integrada, capaz de cobrir todo o fluxo diagnóstico, da imagem ao laudo, em uma única solução escalável, segura e baseada em IA. 

 

A solução Claranet 

A Claranet desenhou e implementou uma arquitetura completa na AWS, cobrindo cada etapa da jornada: coleta, preparação, treinamento, validação e deploy dos modelos de inteligência artificial. 

Amostras anônimas de biópsia foram digitalizadas, gerando centenas de conjuntos de imagens histológicas em diferentes ampliações (de 1,25x a 40x), anotadas manualmente por profissionais médicos e acompanhadas de informações clínicas detalhadas. Técnicas de normalização de coloração e extração de patches foram aplicadas para construir datasets robustos para o treinamento. 

A arquitetura foi construída sobre o AWS S3 como base de armazenamento, todas as imagens histopatológicas e dados clínicos ficam organizados e protegidos para acesso rápido e seguro. A partir daí, o AWS Glue DataBrew assume a preparação dos dados de forma automatizada, limpando, normalizando e padronizando os datasets para garantir homogeneidade e eliminar inconsistências que comprometeriam a performance dos modelos. 

O Amazon SageMaker centraliza todo o ciclo de vida dos modelos de deep learning, do treinamento e validação ao ajuste de hiperparâmetros e deployment, suportando tanto as Redes Neurais Convolucionais Profundas (DCNNs), como o VGG16 com transfer learning, quanto o XGBoost para análises clínicas e predições prognósticas. O AWS Lambda orquestra os fluxos de processamento de forma orientada a eventos, sem servidores dedicados, mantendo o pipeline ágil e econômico. Já o AWS ECS garante que a aplicação de diagnóstico rode em containers gerenciados em produção, com escalabilidade automática e alta disponibilidade. 

Completando a arquitetura, o AWS CloudWatch monitora em tempo real a performance dos modelos e serviços, permitindo ajustes proativos antes que qualquer problema impacte os usuários. O AWS IAM fecha o ciclo garantindo que apenas pessoas e sistemas autorizados acessem dados sensíveis, atendendo aos requisitos mais rigorosos de compliance em saúde. 

 

Os resultados 

Os modelos desenvolvidos entregaram resultados expressivos, validando a viabilidade clínica da solução: 

  • 87,6% de precisão na classificação de imagens histológicas com o modelo VGG16 ajustado; 

  • 95% de precisão na predição do grau do câncer com o algoritmo XGBoost; 

  • 71% de precisão na predição de recorrência do câncer em 10 anos com regressão linear; 

Pipeline de dados totalmente automatizado, eliminando etapas manuais propensas a erro; 

  • Arquitetura segura e em conformidade com os requisitos de proteção de dados em saúde; 

  • Solução escalável, com capacidade de incorporar novos modelos e dados. 

     

Conclusão 

A ferramenta CAD desenvolvida pela Claranet em parceria com a ProBreast representa um avanço concreto no diagnóstico oncológico assistido por IA. Ao combinar análise de imagens histológicas com dados clínicos estruturados, a solução é capaz de gerar laudos diagnósticos e prognósticos completos, em uma única plataforma integrada. 

A arquitetura AWS permitiu construir uma solução escalável, segura e de alta performance, capaz de suportar os modelos de deep learning mais exigentes e evoluir conforme novos dados e abordagens forem incorporados ao projeto. 

Mais do que um projeto de tecnologia, este projeto demonstra como a Claranet atua como parceira estratégica em desafios de alto impacto social, onde a qualidade da entrega técnica pode, literalmente, salvar vidas.