Doctoral Thesis
Full name
Émerson Flamarion da Cruz
Knowledge Area
Date of Defense
São Paulo, 2022
Cozman, Fabio Gagliardi (President)
Bianchi, Reinaldo Augusto da Costa
Corrêa, Pedro Luiz Pizzigatti
Gonçalves, Bernardo Nunes
Sorpreso, Isabel Cristina Esposito
Title in Portuguese
Redes bayesianas, redes credais e inferência causal: uma aplicação na análise do impacto da gravidez na adolescência sobre a evasão escolar.
Keywords in Portuguese
Evasão escolar
Gravidez na adolescência
Inferência Bayesiana
Inteligência artificial
Saúde pública
Abstract in Portuguese
Conforme apontado pela Organização Mundial da Saúde - OMS, a gravidez na adolescência é uma grande preocupação não somente na saúde pública, mas também em vista de múltiplos impactos negativos que vão desde os aspectos socioeconômicos até a exposição de riscos contra a própria vida da adolescente. Neste trabalho, investiga-se a relação de causalidade entre a gravidez na adolescência e o abandono escolar considerando outros atributos que gravitam o tema, tais como: faixa etária, grupo étnico-racial, realidade socioeconômica, situação trabalhista e influência da mãe da adolescente ter experimentado, também, o evento da gravidez na adolescência. Neste estudo, utilizou-se a abordagem das Redes Bayesianas e das Redes Credais para a representação e análise estatístico-matemática da inferência causal percorrendo as três camadas na denominada Hierarquia Causal de Pearl: Associação, Intervenção e Raciocínio Contrafactual. Como fonte de dados utilizou-se um conjunto de dados produzidos com a Casa do Adolescente, parte do Programa Saúde do Adolescente pertencente à Secretária do Estado da Saúde de São Paulo, e um conjunto de avaliações de especialistas nas áreas de Saúde, Educação e Assistência Social sobre as relações de causa-efeito entre os atributos analisados. A análise dos resultados obtidos indicaram forte relação de causalidade entre a gravidez na adolescência e o abandono escolar, intensificada pelos demais atributos também considerados como fatores causais de modo que, segundo os dados utilizados, na camada associacional foi possível inferir o perfil da adolescente que abandona a escola: meninas com mais de 15 anos de idade, que engravidaram pelo menos uma vez (incluindo abortos), autodeclaradas brancas, não presentes no mercado de trabalho e que pertencem ao grupo em que a renda familiar é menor ou igual a US$780 mensais. As simulações nas camadas da Intervenção e Raciocínio Contrafactual também apontaram o impacto negativo da gravidez na adolescência sobre a situação de matrícula escolar. Outro resultado obtido relevante foi a verificação de que a história da mãe da adolescente diante da gravidez na adolescência é, de algum modo, propagada para a vida da adolescente (o denominado fator de impacto materno). Os resultados corroboram, portanto, com a percepção dos especialistas, em particular sobre o impacto negativo da gravidez na adolescência sobre o abandono escolar, validando, assim, as Redes Bayesianas e Redes Credais como ferramentas úteis na representação, análise e inferência estatística causal em fenômenos como o estudado neste trabalho, fenômenos esses que não raro são vulneráveis a correlações espúrias e, por conseguinte, a decisões equivocadas em políticas públicas. Como o fenômeno da gravidez na adolescência, assim como muitos outros, não permite a realização de estudos nos moldes dos Estudos Clínicos Randomizados, é interessante contar com alternativas que permitam a inferência causal recorrendo-se a intervenções realizadas diretamente em modelos a priori; Redes Bayesianas e as Redes Credais cumprem satisfatoriamente essa tarefa.
Title in English
Bayesian networks, credal networks and causal inference: an application to the analysis of the impact of teenage pregnancy on school dropout
Keywords in English
Artificial intelligence
Bayesian networks
Causal inference
Credal networks
Public health
School dropout
Teenage pregnancy
Abstract in English
As reported by the World Health Organization - WHO, pregnancy in adolescence is a major concern not only in Public Health, but also with respect to multiple negative impacts ranging from socioeconomic aspects to the exposure of risks against the adolescents own life. In this study, we investigate the causal relationship between teenage pregnancy and school dropout, taking into account other attributes that gravitate around the topic, such as: age group, ethnic-racial group, socioeconomic reality, employment status, and the influence of the teens mother having also experienced the event of teenage pregnancy. We employed Bayesian Networks and Credal Networks for statistical-mathematical representation and analysis in causal inference, by traversing the three layers in the so-called Pearls Causal Hierarchy: Association, Intervention, and Counterfactual Reasoning. As data sources, we used data produced with the Casa do Adolescente Project, which is part of the Adolescent Health Program belonging to the State Health Secretary of São Paulo, and a set of evaluations of experts in Health, Education and Social Assistance about the cause-effect relations amongst the various attributes. The analysis of the results indicated a strong causal relationship between teenage pregnancy and school dropout, enhanced by the other attributes also taken as causal factors; according to the data used, the associative layer draws a profile of the adolescent who drops out of school: girls over 15 years old, who got pregnant at least once (including abortions), self-declared white, not present in the labor market and who belong to the group in which the family income is lower than or equal to US$780 per month. The simulations in the intervention and counterfactual reasoning layers also pointed out negative impact of teenage pregnancy on school enrollment status. Another relevant result was the verification that the adolescents mothers history of teenage pregnancy is propagated into the adolescents life, the so-called maternal impact factor. The results corroborate experts perceptions, in particular about the negative impact of teenage pregnancy on school dropout, thus validating Bayesian Networks and Credal Networks as useful tools in the representation, analysis, and statistical causal inference in phenomena such as the one studied in this work, phenomena that are often vulnerable to interpretations that suffer from spurious correlations and, consequently, may lead to incorrect decisions in public policy. In addition, the phenomenon of teenage pregnancy, similarly to many others, does not allow for studies along the lines of Randomized Clinical Trials, hence it is interesting to rely on alternatives that allow for causal inference using statistical interventions directly on a priori models; Bayesian Networks and Credal Networks satisfactorily accomplish this task.
