• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Mémoire de Maîtrise
DOI
https://doi.org/10.11606/D.45.2015.tde-20230727-113351
Document
Auteur
Nom complet
Luis Gustavo Rocha Vianna
Unité de l'USP
Domain de Connaissance
Date de Soutenance
Editeur
São Paulo, 2015
Directeur
Titre en portugais
Programação dinâmica simbólica aproximada e assíncrona para processos de decisão markovianos com variáveis contínuas
Mots-clés en portugais
Inteligência Artificial
Programação Dinâmica
Resumé en portugais
Este trabalho trata o problema de planejamento em inteligência artificial, mais especificamente, planejamento probabilístico com variáveis contínuas. Aplicações de planejamento em inteligência artificial, em geral, envolvem recursos contínuos, portanto é necessário que os agentes raciocinem com modelos que representem variáveis contínuas. Uma solução exata, recentemente proposta, para uma classe de problemas de planejamento probabilístico é a programação dinâmica simbólica - PDS, que é capaz de resolver de maneira eficiente problemas com variáveis discretas e contínuas, utilizando manipulação simbólica. Essa técnica resolve problemas com variáveis contínuas manipulando expressões definidas por casos que envolvem essas variáveis para obter a expressão da solução exata. No entanto, a manipulação envolve um aumento no número de casos usados na expressão, de forma que a representação exata das soluções pode se tornar intratavelmente custosa. Neste trabalho, pretendemos adaptar a PDS com uma técnica de aproximação que permite controlar o crescimento da complexidade das expressões em troca de um pequeno erro em seus valores. A maneira como pretendemos simplificar as expressões é baseada em reduzir o número de casos numa expressão simbólica, o que é feito unindo regiões de casos diferentes que apresentam valores próximos. Além disso, a eficiência da PDS pode ser melhorada modificando qual o cálculo usado para obter a expressão da solução. Uma forma de evitar cálculos desnecessários é utilizar a informação do estado inicial e fazer uma busca heurística a partir dele, restringindo a região de valores para os quais precisamos da solução ótima. Assim, pretendemos criar dois novos algoritmos que usam a manipulação simbólica das expressões com variáveis contínuas, adicionando componentes de técnicas recentes para planejamento probabilístico discreto.
Titre en anglais
Approximate and asynchronous symbolic dynamic programming for Markov decision processes in continuous spaces
Resumé en anglais
This work is a study on the planning problem in artificial intelligence, specifically probabilis- tic planning in continuous spaces. The efficient solution of planning problems is a major goal in artificial intelligence and can be applied extensively in autonomous agents. In many applications, the modelled problem contains continuous resources, so that an optimal planner must reason over continuos quantities to obtain appropriate actions. A recent and exact solution is Symbolic Dyna- mic Programming, which extends discrete probabilistic planning solutions to continuous problems by using a symbolic representation of state variables. This solution is interesting because it can find optimal solutions, however it is limited in efficiency because it relies on standard dynamic pro- gramming and doesn2019t use initial state information or heuristic search. On this work, I will extend Symbolic Dynamic Programming to use more efficient dynamic programming approaches, based on recent solutions for discrete probabilistic planning. A novel planner using symbolic representation and heuristic search is proposed and compared to previous works on relevant continuos scenarios.
 
AVERTISSEMENT - Regarde ce document est soumise à votre acceptation des conditions d'utilisation suivantes:
Ce document est uniquement à des fins privées pour la recherche et l'enseignement. Reproduction à des fins commerciales est interdite. Cette droits couvrent l'ensemble des données sur ce document ainsi que son contenu. Toute utilisation ou de copie de ce document, en totalité ou en partie, doit inclure le nom de l'auteur.
Date de Publication
2023-07-27
 
AVERTISSEMENT: Apprenez ce que sont des œvres dérivées cliquant ici.
Tous droits de la thèse/dissertation appartiennent aux auteurs
CeTI-SC/STI
Bibliothèque Numérique de Thèses et Mémoires de l'USP. Copyright © 2001-2024. Tous droits réservés.