24/10/2022 . Análise
A PCDaS acaba de lançar uma importante atualização em uma das bases de informações tratadas e disponibilizadas pela Plataforma: o Conjunto de Dados do Sistema de Informações sobre Nascidos Vivos (SINASC).
A atualização se refere aos dados relativos ao ano de 2020, obtidos junto ao DATASUS. Foram 2.730.145 registros de nascimentos tratados e enriquecidos pela equipe de engenharia de dados da PCDaS. A base atualizada já pode ser acessada gratuitamente via notebook Google Colab com codificação em R, baixado em sua íntegra ou consultado via painel interativo para análise visual de dados.
A incorporação destes dados é bastante relevante, considerando o cenário da saúde brasileira no ano de 2020. “Agora é possível, por exemplo, elaborar diversos indicadores que podem avaliar e explicitar os impactos da pandemia sobre diferentes aspectos relacionados à natalidade no período”, explica Vinicius Kreischer, engenheiro de dados que integra a equipe responsável pela atualização.
O SINASC, que já contava com os dados relativos ao período de 1996 a 2019 no site da PCDaS, contém um dataset anual com todos os registros das declarações de nascidos vivos. A atualização dos dados é realizada pelo DATASUS, e a PCDaS extrai os registros anuais assim que disponibilizados. Em seguida, os dados são tratados e enriquecidos com uma metodologia própria de ETL (em inglês, extract, transform, load, ou extração, transformação, carregamento).
Além do SINASC, a PCDaS ainda disponibiliza outros quatro conjuntos de dados em seu site: o Pólis PCDaS, o Cadastro Nacional de Estabelecimentos de Saúde (CNES), o Sistema de Informações Hospitalares do SUS (SIHSUS) e o Sistema de Informação sobre Mortalidade (SIM).