Questa tesi analizza i processi decisionali di Markov, approfondendone le basi probabilistiche e la formulazione a orizzonte finito. Dopo aver introdotto gli strumenti fondamentali della teoria della misura e della probabilità, viene presentata la struttura del modello, che include gli spazi di stato e di azione, le probabilità di transizione e le funzioni di ricompensa. Infine, si affronta il problema dell’ottimalità, illustrando le equazioni di Bellman e l’algoritmo di induzione a ritroso per la determinazione di strategie ottimali.

Processi di Markov a Orizzonte Finito e Criteri di Ottimalità

ANTONELLO, EDOARDO
2024/2025

Abstract

Questa tesi analizza i processi decisionali di Markov, approfondendone le basi probabilistiche e la formulazione a orizzonte finito. Dopo aver introdotto gli strumenti fondamentali della teoria della misura e della probabilità, viene presentata la struttura del modello, che include gli spazi di stato e di azione, le probabilità di transizione e le funzioni di ricompensa. Infine, si affronta il problema dell’ottimalità, illustrando le equazioni di Bellman e l’algoritmo di induzione a ritroso per la determinazione di strategie ottimali.
2024
Finite-Horizon Markov Processes and Optimality Criteria
Processi di Markov
Processi Decisionali
Catene di Markov
File in questo prodotto:
File Dimensione Formato  
Antonello_Edoardo.pdf

accesso aperto

Dimensione 1.6 MB
Formato Adobe PDF
1.6 MB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/98971