Método de diferenças temporais aplicado às equações de Riccati acopladas entre si

Neste trabalho apresentaremos uma técnica iterativa baseada em simulações de Monte Carlo para calcular o controle ótimo de um problema de regulador linear quadrático de horizonte infinito para um sistema linear com saltos Markovianos a tempo discreto, quando a matriz de transição de probabilidade não é conhecida. Sabemos que o controle ótimo deste problema é dado em termos da solução maximal de um conjunto de equações algébricas de Riccati acopladas entre si (EARA) a tempo discreto, que foram extensivamente estudadas nos últimos anos. Traçaremos um paralelo com a teoria do algoritmo TD(lambda) para Processos Markovianos de Decisão (PMD) para desenvolver o algoritmo TD(lambda) para o controle ótimo associado à solução maximal de uma EARA.

Saved in:
Bibliographic Details
Main Authors: Costa,Oswaldo L. V., Aya,Julio C.C.
Format: Digital revista
Language:Portuguese
Published: Sociedade Brasileira de Automática 2003
Online Access:http://old.scielo.br/scielo.php?script=sci_arttext&pid=S0103-17592003000300001
Tags: Add Tag
No Tags, Be the first to tag this record!