14/03/2023 . Notícia
A equipe da Plataforma de Ciência de Dados aplicada à Saúde (PCDaS) concluiu, recentemente, o oferecimento de uma capacitação formada por uma turma com duas entradas diferentes (Curso de Atualização e Disciplina Eletiva do PPGICS, ambos pelo Instituto de Comunicação e Informação Científica e Tecnológica em Saúde (Icict/Fiocruz). Intitulado Ciência de Dados aplicada à Saúde, o curso formou 26 pessoas, entre mestrandos, doutorandos e profissionais da saúde.
Coordenado pelo pesquisador Marcel Pedroso, que também lidera a PCDaS, o curso foi realizado remotamente entre abril e julho deste ano (com entregas de trabalhos finais em agosto) e teve carga horária de 60 horas — sendo 40 delas dedicadas a atividades síncronas, que incluíram aulas teóricas, práticas e palestras com pesquisadores externos à Fiocruz.
A capacitação tem como principal objetivo promover a interface entre aspectos teóricos e práticos sobre ciência de dados, machine learning e análise preditiva e visual de grandes ou complexas bases de dados.
Com o conteúdo focado no setor da saúde e em seus determinantes socioambientais, o público-alvo do curso foi bastante abrangente e incluiu profissionais graduados atuantes na área de Saúde Pública ou de interesse para a área, e também estudantes de pós-graduação em Saúde Pública; Ciências Exatas e da Terra; Probabilidade e Estatística; Ciência da Computação; e Ciências Sociais Aplicadas, bem como outras especializações de áreas de interesse para a saúde.
Analisando grandes bases de dados
Os interessados em realizar o curso buscavam, principalmente, aprofundar seus conhecimentos em relação à análise de grandes e complexas bases de dados. A enfermeira Marcela Quaresma Soares, doutoranda em Saúde Coletiva pelo Instituto René Rachou (Fiocruz-MG), foi uma das alunas que concluíram o curso. “Trabalho com análise de dados em saúde na Vigilância Epidemiológica do município de Viçosa (MG), e após iniciar o doutorado em 2019, pude me aprofundar em algumas técnicas de análise quantitativa e me interessei pela Ciência de Dados. Por isso, resolvi fazer a disciplina”, explica Marcela.
Outra aluna que buscava aprofundar sua capacidade para análise de dados foi a fisioterapeuta Tarini de Souza, mestranda em Saúde Pública na Escola Nacional de Saúde Pública Sergio Arouca (ENSP/Fiocruz). “O curso foi realizado como um complemento à minha formação no campo da saúde pública”, explica Tarini, “e considero que tive um bom aprendizado: hoje já consigo visualizar um banco de dados mais criticamente, fazer análises e gráficos e organizar um dataset”.
Para Tarini, esses conhecimentos farão toda diferença na realização de sua dissertação. “Mesmo que eu precise de ajuda para elaborar uma análise mais complexa, agora sei por onde começar e até mesmo definir o que é válido ou não para minha pesquisa”, explica.
Marcela Quaresma concluiu o curso com uma visão parecida. “Todo o conhecimento adquirido será muito útil para mim como pesquisadora e trabalhadora do SUS”, analisa. “Pretendo continuar a me dedicar a essa área”.
Desafios
Ao longo de quatro meses, semanalmente, os alunos participavam de aulas teóricas, práticas ou assistiam a palestras de pesquisadores e professores da área.
No início, aprenderam a extrair e manipular dados usando a linguagem de programação Python — o que, para alguns, foi um desafio. “Eu tinha alguma familiaridade com R, mas nunca tinha utilizado Python”, explica Marcela, que superou a dificuldade inicial contando com o apoio dos professores e colegas — e, claro, muita dedicação e prática de exercícios.
Tarini tinha mais familiaridade com a linguagem Python, pois havia realizado anteriormente um curso de introdução ofertado pela equipe PCDaS no Campus Virtual da Fiocruz. Mesmo assim, aproveitou o acesso à plataforma DataCamp, concedido pela equipe docente da capacitação, para se aprofundar. “Durante a disciplina, fomos incentivados pelos professores a realizar o curso introdutório de Python do DataCamp”, explica. “Com esses conhecimentos, eu consegui realizar as tarefas necessárias ao longo do semestre”.
Para Marcela, o acesso aos cursos do DataCamp foi imprescindível para o seu aprendizado. “Além, claro, da ajuda da equipe da disciplina e dos colegas da turma, que gerou uma troca de experiências muito rica”.
Conforme a disciplina avançava, os estudantes ainda se aprofundaram em machine learning, aprendendo conceitos como transformação de dados, padronização e normalização, valores faltantes e feature engineering. Algumas tecnologias e ferramentas livres em Ciência de Dados também foram apresentadas, e houve um debate sobre a ética e a interpretabilidade em machine learning.
Palestras
Além das aulas teóricas, o grupo recebeu pesquisadores da Fiocruz e de outras instituições para duas palestras temáticas. A primeira delas tratou do projeto Observatório Covid-19, da Fiocruz, com exposições de Carlos Machado (ENSP), Christovam Barcellos (Icict), e Raphael Saldanha (PCDaS). A segunda discutiu as aplicações em Ciência de Dados e machine learning, com a presença de Alexandre Chiavegatto (FSP/USP), Eduardo Ogasawara (Cefet/RJ) e Fábio Porto (LNCC).
Tudo isso de forma remota, um desafio superado pela equipe docente da capacitação, que, antes da pandemia da Covid-19, era oferecida presencialmente. “Toda a equipe esteve presente, comprometida e disposta a sanar as dúvidas dos alunos”, diz Tarini. “Isso fez a diferença principalmente considerando a realização de forma remota”.
Aos envolvidos com a área de saúde interessados em aprofundar seus conhecimentos em Ciência de Dados, o curso Ciência de Dados aplicada à Saúde está previsto para ser realizado novamente em 2023 (ainda não há confirmação se de maneira remota ou presencial). Fique de olho no site da PCDaS e do Icict para mais informações.