Planejamento probabilístico sensível a risco com ILAO* e função utilidade exponencial

Freitas, Elthon Manhas de

doi:10.11606/D.100.2019.tde-17012019-092638

Inicío

Serviços

Trabalhos decorrentes

Como citar

Formato MARC

Formato OAI DC

Dissertação de Mestrado

DOI

https://doi.org/10.11606/D.100.2019.tde-17012019-092638

Documento

Dissertação de Mestrado

Autor

Freitas, Elthon Manhas de (Catálogo USP)

Nome completo

Elthon Manhas de Freitas

E-mail

Unidade da USP

Escola de Artes, Ciências e Humanidades

Área do Conhecimento

Metodologia e Técnicas da Computação

Data de Defesa

2018-10-18

Imprenta

São Paulo, 2019

Orientador

Delgado, Karina Valdivia (Catálogo USP)

Banca examinadora

Delgado, Karina Valdivia (Presidente)
Ferreira, Fernando Fagundes
Oliveira, Patrícia Rufino
Ribeiro, Carlos Henrique Costa

Título em português

Planejamento probabilístico sensível a risco com ILAO* e função utilidade exponencial

Palavras-chave em português

Aversão a risco
Planejamento probabilístico
Processos de decisão de Markov
Sensibilidade a risco
Utilidade exponencial

Resumo em português

Os processos de decisão de Markov (Markov Decision Process - MDP) têm sido usados para resolução de problemas de tomada de decisão sequencial. Existem problemas em que lidar com os riscos do ambiente para obter um resultado confiável é mais importante do que maximizar o retorno médio esperado. MDPs que lidam com esse tipo de problemas são chamados de processos de decisão de Markov sensíveis a risco (Risk-Sensitive Markov Decision Process - RSMDP). Dentre as diversas variações de RSMDP, estão os trabalhos baseados em utilidade exponencial que utilizam um fator de risco, o qual modela a atitude a risco do agente e que pode ser propensa ou aversa. Os algoritmos existentes na literatura para resolver esse tipo de RSMDPs são ineficientes se comparados a outros algoritmos de MDP. Neste projeto, é apresentada uma solução que pode ser usada em problemas maiores, tanto por executar cálculos apenas em estados relevantes para atingir um conjunto de estados meta partindo de um estado inicial, quanto por permitir processamento de números com expoentes muito elevados para os ambientes computacionais atuais. Os experimentos realizados evidenciam que (i) o algoritmo proposto é mais eficiente, se comparado aos algoritmos estado-da-arte para RSMDPs; e (ii) o uso da técnica LogSumExp permite resolver o problema de trabalhar com expoentes muito elevados em RSMDPs.

Título em inglês

Probabilistic risk-sensitive planning with ILAO* and exponential utility function

Palavras-chave em inglês

Exponential utility
Markov decision process
Probabilistic planning
Risk averse
Risk sensitive

Resumo em inglês

Markov Decision Process (MDP) has been used very efficiently to solve sequential decision-making problems. There are problems where dealing with environmental risks to get a reliable result is more important than maximizing the expected average return. MDPs that deal with this type of problem are called risk-sensitive Markov decision processes (RSMDP). Among the several variations of RSMDP are the works based on exponential utility that use a risk factor, which models the agent's risk attitude that can be prone or averse. The algorithms in the literature to solve this type of RSMDPs are inefficient when compared to other MDP algorithms. In this project, a solution is presented that can be used in larger problems, either by performing calculations only in relevant states to reach a set of meta states starting from an initial state, or by allowing the processing of numbers with very high exponents for the current computational environments. The experiments show that (i) the proposed algorithm is more efficient when compared to state-of-the-art algorithms for RSMDPs; and (ii) the LogSumExp technique solves the problem of working with very large exponents in RSMDPs

AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.

Dissertacao_Elthon_Freitas_Versao_Final_Pos_Banca_2019_01_15.pdf (1.68 Mbytes)

Data de Publicação

2019-01-22

Trabalhos decorrentes

AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.