21/08/2023 . Novidade
Identificar padrões e correlações entre dados de pesquisa já é, por si só, desafiador. Quando a amostra ou banco do estudo é gigantesco, da ordem das dezenas ou centenas de milhões de informações, o que chamamos de big data, o processo pode ser ainda mais difícil e humanamente impossível.
Nessa hora, a ciência de dados desempenha um papel fundamental para ajudar o pesquisador a minerar, ou seja, identificar padrões, associações e correlações entre as informações. As chamadas regras de associação (RAs) auxiliam bastante neste processo. Contudo, elas têm limitações. Normalmente, esses programas ainda entregam um número gigantesco de possíveis correlações que o pesquisador tem de analisar depois, tornando a avaliação demorada. Outras vezes, os resultados são muito óbvios ou não são tão interessantes para o tema pesquisado.
Para resolver esse problema, pesquisadores brasileiros de diferentes instituições propuseram uma nova abordagem capaz de identificar padrões, associações e correlações dentro de grandes bases de dados. Trata-se do Divergent Association Rules Approach (DARA), que foca na divergência na distribuição dos dados para encontrar padrões interessantes e ainda não explorados. Com a ajuda desta metodologia, os pesquisadores podem chegar a conclusões e insights que dificilmente seriam possíveis por meio de outras análises.
Com o objetivo de validar a nova metodologia, o estudo “Uma análise da malária na Amazônia Legal brasileira usando regras de associação” utilizou o DARA para analisar o conjunto de dados sobre ocorrência de malária nos estados que compõem a Amazônia entre os anos de 2009 e 2015. Trata-se de uma doença tropical negligenciada causada por parasitas protozoários do gênero plasmodium e transmitida pela picada do mosquito Anopheles em regiões tropicais. O Brasil é o segundo país das Américas com maior número de casos.
Utilizando o DARA, a pesquisa analisou dados de mais de 15.764.287 prontuários registrados no Sistema de Informação de Vigilância Epidemiológica (Sivep-Malária), uma das principais ferramentas de monitoramento da doença no Brasil. Cerca de 12% desses registros correspondem a casos positivos de malária. Os dados foram possíveis quando são preenchidas informações mais detalhadas sobre o paciente.
Os padrões descobertos pela metodologia trouxeram novos e relevantes insights sobre a doença. Segundo a Organização Mundial da Saúde (OMS), a análise de associações de variáveis relacionadas a desfechos positivos para a malária é essencial para seu controle e suporte no processo de tomada de decisão. Portanto, a pesquisa contribui tanto para a ciência da computação quanto para a área médica.
Veja abaixo as principais associações e conclusões do estudo:
ASSOCIAÇÃO ENTRE TIPO DE MALÁRIA E REGIÃO DE SAÚDE
A região de saúde do Codo, no Maranhão, é a que tem mais casos de malária do tipo falciparum, a mais grave e agressiva da doença.
Essa região de saúde corresponde aos municípios de Codo, Coroatá, São Mateus do Maranhão, Alto Alegre do Maranhão e Timbiras, todas no Maranhão. Ela não é uma das que têm maiores taxas de malária – as regiões com mais incidência são a de Marajó I e Triângulo, no Pará. No entanto, a região de Codo se destacou por ter mais casos do tipo falciparum do que vivax, principalmente em 2009.
ASSOCIAÇÃO ENTRE MALÁRIA E RAÇA
Indígenas são menos propensos a procurar uma unidade de saúde e são mais dependentes de campanhas ativas de detecção do que outras raças
A raça indígena possui um percentual de detecção passiva muito menor do que a ativa, em comparação com outras raças, e é mais vulnerável à malária. Essa informação, aliada ao fato de que essa população tende a não procurar atendimento médico, é relevante.
ASSOCIAÇÕES ENTRE MALÁRIA E OUTRAS DOENÇAS
Em 70% de casos de doença de Chagas há também malária vivax
Entre os casos positivos de malária, os pesquisadores detectaram presença maior de parasitas do tipo Trypanosoma, o causador da doença de Chagas. Cerca de 70% dos casos detectados do gênero Trypanosoma estão associados ao tipo vivax, uma forma mais branda e raramente mortal. No entanto, seu tratamento pode ser mais complicado, já que o Plasmodium vivax, o protozoário que causa a doença, se aloja por mais tempo no fígado, dificultando sua eliminação.
34% dos casos de filariose foram acompanhados de um resultado negativo para malária
Em casos negativos de malária, houve uma tendência maior para o aparecimento de doenças causadas por parasitas do sangue (hemoparasitas), como a filariose, doença tropical negligenciada popularmente conhecida como “elefantíase”.
ASSOCIAÇÃO ENTRE MALÁRIA E PROFISSÃO DOS PACIENTES TESTADOS
Muitas das campanhas de detecção de malária ocorrem em locais de construção de estradas
Isso porque o estudo encontrou maior associação de casos negativos da doença quando a profissão do indivíduo era construtor de estradas. Essas observações eram anteriormente desconhecidas, mas são coerentes. A chance de se obter resultados negativos é esperada quando os profissionais de saúde procuram potenciais infectados em grupos de risco, a chamada vigilância ativa. Ao contrário, mais casos positivos podem ocorrer quando as pessoas percebem os sintomas e procuram atendimento, na chamada vigilância passiva.
Uma análise da malária na Amazônia Legal brasileira usando regras de associação
Lais Baronia, Rebecca Salles, Gustavo Guedes, Eduardo Bezerra, Eduardo Ogasawara (Centro Federal de Educação Tecnológica Celso Suckow da Fonseca - CEFET/RJ), Christovam Barcellos, Marcel Pedroso (Fundação Oswaldo Cruz -Fiocruz), Samella Salles (Universidade Federal do Rio de Janeiro - UFRJ) e Fabio Porto (Laboratório Nacional de Computação Científica - LNCC).
O estudo propõe e testa uma nova abordagem em ciência de dados chamada Divergent Association Rules Approach (DARA), que foca na divergência na distribuição dos dados para encontrar padrões interessantes e ainda não explorados. O DARA foi avaliado em um estudo real sobre a ocorrência de malária na Amazônia Legal brasileira. Usando o DARA, foi possível obter novos achados sobre a doença que talvez não fossem revelados, se dependessem de abordagens tradicionais de análise de dados.
É a primeira vez que o DARA foi testado num banco de dados em saúde brasileiro como o do Sistema de Informação de Vigilância Epidemiológica (Sivep-Malária). As análises sobre prevalência de malária que resultaram dessa abordagem também são inéditas e úteis tanto para a ciência de dados como para a área da saúde.
O objetivo da pesquisa foi compreender os fatores associados à ocorrência (ou não) da malária entre 2009 e 2015 utilizando a abordagem DARA. Foram analisados dados de mais de 15.764.287 prontuários registrados no Sistema de Informação de Vigilância Epidemiológica (Sivep-Malária), uma das principais ferramentas de monitoramento da doença no Brasil. Cerca de 12% desses registros correspondem a casos positivos de malária, situação em que são preenchidas informações mais detalhadas sobre o paciente. A regra de associação (RA) foi configurada para o atributo resultado do exame. Os valores possíveis incluem Plasmodium falciparum (Falciparum), Non-Falciparum, Plasmodium vivax (Vivax), Plasmodium malariae (Malariae), Plasmodium ovale (Ovale) e Negativo (quando a malária não foi confirmada).
A análise encontrou mais casos do tipo falciparum, a forma mais grave, na região de Codo, no Maranhão. Mostrou ainda que Indígenas são menos propensos a procurar uma unidade de saúde e são mais dependentes de campanhas ativas de detecção do que outras raças, tornando-os mais vulneráveis. Em algumas regiões de saúde, a malária aparece associada a outras doenças tropicais negligenciadas como Chagas e filariose. Em 70% de casos de doença de Chagas há também malária vivax e 34% dos casos de filariose foram acompanhados de um resultado negativo para malária. Além disso, muitas das campanhas de detecção ocorrem em locais de construção de estradas, o que mostra que há lacunas em outras áreas. Também foi possível detectar algumas limitações do método: uma delas é que valores indicados como divergentes nem sempre garantem análises interessantes.
Os resultados das análises podem orientar melhores políticas públicas para a detecção, prevenção e controle da malária. Isso é especialmente importante nas áreas em que o estudo mostrou maior prevalência do tipo falciparum e de presença de outras doenças tropicais negligenciadas concomitantes, como Chagas. Por determinar claramente os grupos de risco, a análise pode ser útil para orientar campanhas de prevenção. A metodologia pode ainda ajudar a esclarecer padrões que podem estar relacionados a surtos de outras doenças.
O Brasil é o segundo país das Américas com maior número de casos de malária. De acordo com dados do Ministério da Saúde, em 2021, o país registrou 145 mil casos da doença, 40% deles estão no Estado do Amazonas.
A equipe de pesquisa pretende estudar e avaliar o DARA usado de maneira autônoma, antes e depois da utilização de outros métodos tradicionais em análise de dados e ainda em vários conjuntos de dados.
21/08/2023 . Novidade
22/03/2024 . Notícia