Il reinforcement learning è un tipo di tecnica di machine learning che permette ad un agente di imparare a svolgere delle azioni utilizzando l’ambiente circostante e imparando, con vari tentativi, dalle proprie esperienze passate e dai propri errori. Uno degli esempi più eclatanti di applicazioni del reinforcement learning è AlphaGo, un software che gioca a Go, sviluppato da Google DeepMind, che nel 2016 è riuscito a battere Lee Sedol, uno dei più grandi giocatori di Go. In questa tesi, dopo aver parlato della storia dell’intelligenza artificiale e del reinforcement learning e dopo aver trattato della teoria dietro al machine learning, ho proposto un software che impara autonomamente a giocare a Snake.

Reinforcement Learning: studio e sviluppo di un IA che impari a giocare a Snake

OUTMANI, AYOUB
2022/2023

Abstract

Il reinforcement learning è un tipo di tecnica di machine learning che permette ad un agente di imparare a svolgere delle azioni utilizzando l’ambiente circostante e imparando, con vari tentativi, dalle proprie esperienze passate e dai propri errori. Uno degli esempi più eclatanti di applicazioni del reinforcement learning è AlphaGo, un software che gioca a Go, sviluppato da Google DeepMind, che nel 2016 è riuscito a battere Lee Sedol, uno dei più grandi giocatori di Go. In questa tesi, dopo aver parlato della storia dell’intelligenza artificiale e del reinforcement learning e dopo aver trattato della teoria dietro al machine learning, ho proposto un software che impara autonomamente a giocare a Snake.
2022
A study on Reinforcement Learning and the creation of an AI that learns how to play Snake
Machine Learning
AI
RL
Snake
File in questo prodotto:
File Dimensione Formato  
Outmani_Ayoub.pdf

accesso aperto

Dimensione 701.49 kB
Formato Adobe PDF
701.49 kB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/43586