Método de diferenças temporais aplicado às equações de Riccati acopladas entre si
Neste trabalho apresentaremos uma técnica iterativa baseada em simulações de Monte Carlo para calcular o controle ótimo de um problema de regulador linear quadrático de horizonte infinito para um sistema linear com saltos Markovianos a tempo discreto, quando a matriz de transição de probabilidade não é conhecida. Sabemos que o controle ótimo deste problema é dado em termos da solução maximal de um conjunto de equações algébricas de Riccati acopladas entre si (EARA) a tempo discreto, que foram extensivamente estudadas nos últimos anos. Traçaremos um paralelo com a teoria do algoritmo TD(lambda) para Processos Markovianos de Decisão (PMD) para desenvolver o algoritmo TD(lambda) para o controle ótimo associado à solução maximal de uma EARA.
Main Authors: | , |
---|---|
Format: | Digital revista |
Language: | Portuguese |
Published: |
Sociedade Brasileira de Automática
2003
|
Online Access: | http://old.scielo.br/scielo.php?script=sci_arttext&pid=S0103-17592003000300001 |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|