Pólis PCDaS


Fluxo ETL: Pólis PCDaS


A documentação a seguir apresenta o processo ETL (extract, transform, load) aplicado aos dados da Pólis PCDaS, Base de municípios e indicadores produzida na Plataforma de Ciência de Dados aplicada à Saúde. Esses dados consistem na união de outras bases de diversas fontes e serão explicadas abaixo:

Extract:

Transform :

  • Tratar o conjunto de dados adquirido de maneira a:

Load:

  • Indexar dados tratados da Pólis PCDaS em banco de dados NoSQL Elasticsearch localizado em infraestrutura da PCDaS no Laboratório Nacional de Computação Científica (LNCC);
  • Coletar log de indexação;

Fase Extract:

- Para as bases Cadastro Único, Munic Saúde 2018 e PIB a extração foi feita manualmente
- Os dados de Nascimentos, Mortalidade e Internação Hospitalar foram extraídos diretamente pela API da PCDaS

OBSERVAÇÃO : Em breve a api estará disponível para todos os usuários cadastrados na PCDaS


Extração SIM e SINASC

Querys para extração SIM e SINASC

Dados referentes ao SIM de 2019 sobre menores de 1 ano para cálculo de taxa de mortalidade infantil.

http://tabnet.datasus.gov.br/cgi/idb2000/fqc01.htm

base campo filtro
datasus-sinasc qtd_obitos_ate_um_ano_2019 idade_obito_anos = 0 AND ano_obito=2019

Dados referentes ao SINASC de 2019 para todos os nascimentos.

base campo filtro
datasus-sinasc qtd_NASC_2019 ano_obito=2019

Dados referentes ao SINASC de 2019 para os nascimentos com 7 ou mais consultas pré natal.

base campo filtro
datasus-sinasc qtd_nasc_7_mais_consultas_2019 def_consultas='7 e mais' AND ano_nasc=2019

Dados referentes ao SINASC de 2019 para os nascimentos com baixo peso.

http://www.acm.org.br/acm/revista/pdf/artigos/818.pdf

base campo filtro
datasus-sinasc qtd_nasc_baixo_peso_2019 PESO < 2500 AND ano_nasc=2019

Dados referentes ao SIM de 2019 para todos os óbitos.

base campo filtro
datasus-sim qtd_OBITOS_2019 ano_obito=2019

Dados referentes ao SIM de 2019 para os óbitos por homicídio.

https://www.ipea.gov.br/atlasviolencia/quem/5/glossario

base campo filtro
datasus-sim qtd_obitos_homicidio_2019 CAUSABAS in ('X85-X99','Y00-Y009','Y35-Y36') AND ano_obito=2019

Dados referentes ao SIM de 2019 para os óbitos por acidentes de trânsito.

https://mobilidadeativa.org.br/cid-10/

base campo filtro
datasus-sim qtd_obitos_acidente_2019 CAUSABAS in ('V01-V99') AND ano_obito = 2019

Dados referentes ao SIM de 2019 para os óbitos por suicídios.

https://www.ipea.gov.br/atlasviolencia/quem/5/glossario

base campo filtro
datasus-sim qtd_obitos_suicidios_2019 CAUSABAS in ('X60-X84') AND ano_obito = 2019

Dados referentes ao SIM de 2019 para os óbitos por agressões.

https://www.ipea.gov.br/atlasviolencia/quem/5/glossario

base campo filtro
datasus-sim qtd_obitos_agressoes_2019 CAUSABAS in ('X85-X99','Y00-Y09') AND ano_obito = 2019

Dados referentes ao SIM de 2019 para os óbitos maternos diretos.

https://www.proadess.icict.fiocruz.br/index.php?pag=fic&cod=B18&tab=1

base campo filtro
datasus-sim qtd_obitos_agressoes_2019 CAUSABAS in ('O00-O08', 'O11-O23', 'O24.4', 'O26-O927') AND ano_obito = 2019

Dados referentes ao SINASC de 2019 para a quantidade de meninas de 10 a 14 anos que tiveram filhos.

base campo filtro
datasus-sinasc qtd_obitos_agressoes_2019 IDADEMAE in ('10-14') AND ano_obito = 2019

Dados referentes ao SINASC de 2019 para a quantidade de adolescentes de 15 a 17 anos que tiveram filhos.

base campo filtro
datasus-sinasc qtd_obitos_agressoes_2019 IDADEMAE in ('15-17') AND ano_obito = 2019

População para o ano de 2019

base campo filtro
POPTCU POPULACAO ANO = 2019

Dados referentes a quantidade de internações por doenças relacionadas ao saneamento ambiental inadequado

https://www.sustenere.co/index.php/rica/article/view/CBPC2179-6858.2019.001.0008/1561

base campo filtro
datasus-sih int_drsai DIAG_PRINC in ('A00','A02-A04','A06-A09','A01','A90','A91','A95','B55','B74','B50-B54','B57','B65','A27','A71','H10','B35-B36','B68-B69','B71','B76-B83') AND ano_internacao = 2019

Dados referentes a quantidade de internações por condições sensíveis à atenção primária

https://www.scielo.br/j/csp/a/y5n975h7b3yW6ybnk6hJwft/?lang=pt

base campo filtro
datasus-sih int_sap DIAG_PRINC in ('A36-A37','B16','G00.0','A17.0','B26','B05-B06','A33-A35','A19','I00-I02','A51-A53','A15.4-A15.9','A16.3-A16.9')
datasus-sih int_sap DIAG_PRINC in ('A17.1-A17.9','A15.0-A15.3','A16.0-A16.2','E86','A00-A09','D50','E40-E46','E50-E64','J06','J00-J03','H66','J31')
datasus-sih int_sap DIAG_PRINC in ('J15.8-J15.9','J18.1','J13-J14','J45-J46','J20-J21','J40-J44','J47','I10-I11','I20','I24','I50','J81','I63-I67','I69','G45-G46','E10.0-E10.1')
datasus-sih int_sap DIAG_PRINC in ('E11.0-E11.1','E12.0-E12.1','E13.0-E13.1','E14.0-E14.1','E10.9', 'E11.9','E12.9,'E13.9','E14.9','E10.2-E10.8','E11.2-E11.8','E12.2-E12.8')
datasus-sih int_sap DIAG_PRINC in ('E13.2-E13.8','E14.2-E14.8','G40-G41','N10-N11','N39.0','L01-L04') AND ano_internacao = 2019

Dados referentes a quantidade total de internações

base campo filtro
datasus-sih qtd_INTERNACOES ano_internacao = 2019

Fase Transform:

- Retira colunas do MUNIC
- Calcula as taxas referentes ao SIM, SINASC, SIH, PIB e Cadastro Único

Retira colunas

Retira colunas do MUNIC Saúde 2018

Retira os dados de informações do gestor da base

Campos de informação de gestor Definições
MSAU03 Sexo do gestor de saúde no município
MSAU04 Idade do gestor de saúde no município
MSAU05 Cor/raça do gestor de saúde no município
MSAU051 O quesito cor/raça foi respondido pelo próprio titular de saúde do município
MSAU06 Escolaridade do gestor de saúde no município
MSAU07 Formação de nível superior do titular do órgão gestor de saúde no município
MSAU171 Responsável pela gestão do Fundo Municipal de Saúde

Cálculo de taxas

Taxa de mortalidade infantil por 1000 nascimentos - campo tx_mortalidade_infantil_2019

  • Numeradores
    • qtd_obitos_ate_um_ano_2019
  • Denominador
    • qtd_NASC_2019

Taxa de nascimentos com 7 ou mais consultas (percentual) - campo tx_nasc_7_mais_consultas_2019

  • Numeradores
    • qtd_obitos_ate_um_ano_2019
  • Denominador
    • qtd_NASC_2019

Taxa de nascimentos com baixo peso ao nascer (percentual) - campo tx_nasc_baixo_peso_2019

  • Numeradores
    • qtd_nasc_baixo_peso_2019
  • Denominador
    • qtd_NASC_2019

Taxa de óbitos (percentual) - campo tx_obitos_2019

  • Numeradores
    • qtd_obitos_ate_um_ano_2019
  • Denominador
    • POPULACAO

Taxa de óbitos por homicidio (percentual) - campo tx_obitos_homicidio_2019

  • Numeradores
    • qtd_obitos_homicidio_2019
  • Denominador
    • POPULACAO

Taxa de óbitos por acidentes por cem mil habitantes - campo tx_obitos_homicidio_2019

  • Numeradores
    • qtd_obitos_acidente_2019
  • Denominador
    • POPULACAO

Taxa de óbitos por suicídios por cem mil habitantes - campo tx_obitos_suicidio_2019

  • Numeradores
    • qtd_obitos_suicidios_2019
  • Denominador
    • POPULACAO

Taxa de óbitos por agressão por cem mil habitantes - campo tx_obitos_agressoes_2019

  • Numeradores
    • qtd_obitos_agressoes_2019
  • Denominador
    • POPULACAO

Taxa de óbitos matenos diretos por cem mil nascimentos - campo tx_obitos_maternos_diretos_2019

  • Numeradores
    • qtd_obitos_maternos_2019
  • Denominador
    • qtd_NASC_2019

Participação percentual de meninas 10 a 14 anos que tiveram filhos - campo tx_nasc_mae_10_14_2019

  • Numeradores
    • qtd_nasc_maes_10_14_2019
  • Denominador
    • qtd_NASC_2019

Participação percentual de adolescentes 15 a 17 anos que tiveram filhos - campo tx_nasc_mae_15_17_2019

  • Numeradores
    • qtd_nasc_maes_15_17_2019
  • Denominador
    • qtd_NASC_2019

Taxa de internações por doenças relacionadas ao saneamento ambiental inadequado - campo tx_interdrsai_2019

  • Numeradores
    • int_drsai
  • Denominador
    • qtd_INTERNACOES

Taxa de internações por condições sensíveis à atenção primária - campo tx_intersap_2019

  • Numeradores
    • int_sap
  • Denominador
    • qtd_INTERNACOES

Valor adicionado per capita por preços correntes (R$ 1000,00) - campo vapc_2018

  • Numeradores
    • VAB_2018
  • Denominador
    • POPULACAO (2018)

Taxa de pessoas com deficiência inscritas no cadastro único - campo tx_PESCADUNICO_PCD

  • Numeradores
    • PESCADUNICO_PCD
  • Denominador
    • PESCADUNICO_TOT

Taxa de pessoas em situação de extrema pobreza inscritas no cadastro único - campo tx_PESCADUNICO_SIT_EXT_POBREZA

  • Numeradores
    • PESCADUNICO_SIT_EXT_POBREZA
  • Denominador
    • PESCADUNICO_TOT

Taxa de pessoas em situação pobreza inscritas no cadastro único - campo tx_PESCADUNICO_SIT_POBREZA

  • Numeradores
    • PESCADUNICO_SIT_POBREZA
  • Denominador
    • PESCADUNICO_TOT

Fase Load:

Indexando dados tratados do PCDaS em banco de dados NoSQL Elasticsearch: Uma vez finalizada a trasformação/preparação dos dados, estes são indexados em um servidor de banco de dados NoSQL Elasticsearch localizado em infraestrutura da PCDaS no LNCC.