Questa tesi analizza i processi decisionali di Markov, approfondendone le basi probabilistiche e la formulazione a orizzonte finito. Dopo aver introdotto gli strumenti fondamentali della teoria della misura e della probabilità, viene presentata la struttura del modello, che include gli spazi di stato e di azione, le probabilità di transizione e le funzioni di ricompensa. Infine, si affronta il problema dell’ottimalità, illustrando le equazioni di Bellman e l’algoritmo di induzione a ritroso per la determinazione di strategie ottimali.
Processi di Markov a Orizzonte Finito e Criteri di Ottimalità
ANTONELLO, EDOARDO
2024/2025
Abstract
Questa tesi analizza i processi decisionali di Markov, approfondendone le basi probabilistiche e la formulazione a orizzonte finito. Dopo aver introdotto gli strumenti fondamentali della teoria della misura e della probabilità, viene presentata la struttura del modello, che include gli spazi di stato e di azione, le probabilità di transizione e le funzioni di ricompensa. Infine, si affronta il problema dell’ottimalità, illustrando le equazioni di Bellman e l’algoritmo di induzione a ritroso per la determinazione di strategie ottimali.File in questo prodotto:
| File | Dimensione | Formato | |
|---|---|---|---|
|
Antonello_Edoardo.pdf
accesso aperto
Dimensione
1.6 MB
Formato
Adobe PDF
|
1.6 MB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
Utilizza questo identificativo per citare o creare un link a questo documento:
https://hdl.handle.net/20.500.12608/98971