• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Dissertação de Mestrado
DOI
https://doi.org/10.11606/D.3.2024.tde-12072024-071217
Documento
Autor
Nome completo
Guilherme Goto Escudero
E-mail
Unidade da USP
Área do Conhecimento
Data de Defesa
Imprenta
São Paulo, 2024
Orientador
Banca examinadora
Lopes, Roseli de Deus (Presidente)
Ayres, Fábio José
Silva, Flavio Soares Correa da
Título em português
Pycausal-explorer: uma biblioteca de inferência causal para dados observacionais.
Palavras-chave em português
Causalidade
Inteligência estatística
Software livre
Resumo em português
A crescente disseminação dos algoritmos de machine learning trouxe avanços notáveis em diversas áreas do conhecimento. Esses progressos foram impulsionados pela expansão da capacidade de coleta, armazenamento e processamento de dados. No entanto, à medida que os métodos de machine learning se desenvolvem e encontram novas aplicações, surge uma questão fundamental e frequentemente negligenciada: se existe apenas correlação entre as variáveis ou se elas têm uma relação causal. A necessidade de responder à pergunta E se? se torna cada vez mais urgente. Nesse contexto, as técnicas de inferência causal, como as usadas em experimentos controlados aleatórios, desempenham um papel fundamental na obtenção de insights confiáveis. No entanto, esses experimentos controlados aleatórios enfrentam desafios como altos custos e duração prolongada, enquanto os dados observacionais (coletados sem manipulação deliberada) são uma alternativa viável, mas que por sua vez apresentam complexidades próprias, como a falta de controle sobre o tratamento aplicado. A questão do contrafactual, que envolve considerar E se uma ação alternativa tivesse sido tomada em vez daquela observada?, torna-se central na inferência causal. Nesta pesquisa, foi realizada uma revisão dos conceitos de causalidade e inferência causal, seguida do detalhamento e comparação entre os frameworks de modelagem causal de Neyman-Rubin e de Pearl. Tomando como base o framework de Neyman-Rubin, foi revisada a teoria por trás dos principais modelos utilizados em inferência causal de dados observacionais. Outra contribuição desta pesquisa foi a elaboração da Pycausal-explorer, uma biblioteca em Python de código aberto, que, além de implementar os modelos descritos e analisados neste texto, permite a integracao com o scikit-learn que é uma das principais bibliotecas de machine learning em Python. Com isso, espera-se promover a compreensão e aplicação desses modelos em análises de dados observacionais nas mais diversas áreas, proporcionando insights valiosos e embasados em relações de causa e efeito mais robustas e sólidas.
Título em inglês
Untitled in english
Palavras-chave em inglês
Causal inference
Observational data
Open source
Resumo em inglês
The increasing prevalence of machine learning algorithms has brought remarkable advancements in various fields of knowledge. These progressions are driven by the expansion of data collection, storage, and processing capabilities. However, as machine learning methods continue to evolve and find new applications, a fundamental and often overlooked question arises: whether there is only a correlation between variables or if they have a causal relationship. The need to answer the what if?question becomes increasingly urgent. In this context, causal inference techniques, such as those used in randomized controlled experiments, play a fundamental role in obtaining reliable insights. However, these randomized controlled experiments face challenges such as high costs and extended duration, while observational data (collected without deliberate manipulation) are a viable alternative but come with their own complexities, such as the lack of control over the applied treatment. The issue of counterfactuals, involving considering What if an alternative action had been taken instead of the one observed?becomes central in causal inference. In this research, a review of causality and causal inference concepts was conducted, followed by a detailed comparison between the Neyman-Rubin and Pearl causal modeling frameworks. Building upon the Neyman-Rubin framework, the theory behind the main models used in causal inference from observational data was reviewed. Another contribution of this research was the development of Pycausal-explorer, an open-source Python library that not only implements the models described and analyzed in this text but also allows integration with scikit-learn, one of the leading machine learning libraries in Python. With this, it is expected to promote the understanding and application of these models in observational data analysis in various fields, providing valuable insights based on more robust and solid cause-and-effect relationships.
 
AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.
Data de Publicação
2024-07-15
 
AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.
Todos os direitos da tese/dissertação são de seus autores
CeTI-SC/STI
Biblioteca Digital de Teses e Dissertações da USP. Copyright © 2001-2024. Todos os direitos reservados.