Per anni l’uomo ha sognato di creare e di aver a che fare con macchine intelligenti, in grado quindi di pensare e di agevolare la propria vita quotidiana. L’intelligenza artificiale tutt’oggi è un florido e innovativo campo dell’informatica che trova applicazioni in svariati campi di ricerca. Il principale obiettivo che tale disciplina si pone è quello di poter creare delle macchine in grado di assumere comportamenti intellettuali prossimi a quelli dell’uomo come, per esempio, quello di riuscire a prendere decisioni. Per raggiungere tale scopo, sono state introdotte le reti neurali, sofisticate strutture alla base dell’intelligenza artificiale, che, tramite l’utilizzo di complessi algoritmi, sono in grado di apprendere sfruttando meccanismi simili (o almeno in parte) a quelli dell’intelligenza umana. Esse sono state ideate prendendo ispirazione dalle complesse reti neurali biologiche, ovvero le reti neurali che trovano sede nel nostro cervello, in grado di comprendere l’ambiente, i suoi mutamenti e di fornire risposte adattive calibrate sulle esigenze che si presentano. Come vedremo, una rete neurale artificiale necessita prima di tutto di un processo di addestramento, nel quale viene fornito alla rete un “training set”, ovvero un insieme di dati di addestramento, che viene processato dalla rete, tramite l’utilizzo di determinati algoritmi. Dopo una serie più o meno numerosa di cicli di elaborazione, la rete sarà più o meno in grado di produrre il corretto output dato un generico input. Nella seguente trattazione ci si concentrerà principalmente sugli algoritmi di apprendimento supervisionato, ovvero la tipologia di apprendimento caratterizzato dal fatto di possedere, oltre all’insieme di dati di input, i rispettivi valori di output che tali dati devono produrre. Analizzando tali insiemi, la rete si allena cogliendo il nesso che li unisce. Verranno inizialmente trattate le principali tipologie di reti neurali introducendone prima il modello più basilare, la rete neurale a singolo strato per la quale saranno esposte le limitazioni che hanno spinto all’ideazione e alla progettazione delle più complesse e funzionali reti neurali multistrato, trattate nel seguito. Per ciascuna tipologia di rete verranno illustrati i principali algoritmi di allenamento ed infine verranno proposti degli esempi pratici di applicazione di tali algoritmi analizzandone il comportamento rispetto alla variazione dei parametri che tipicamente incidono nella prestazione e nel funzionamento delle reti.

Architettura e tecniche di addestramento delle reti neurali

SCHIAVO, CARLOTTA
2021/2022

Abstract

Per anni l’uomo ha sognato di creare e di aver a che fare con macchine intelligenti, in grado quindi di pensare e di agevolare la propria vita quotidiana. L’intelligenza artificiale tutt’oggi è un florido e innovativo campo dell’informatica che trova applicazioni in svariati campi di ricerca. Il principale obiettivo che tale disciplina si pone è quello di poter creare delle macchine in grado di assumere comportamenti intellettuali prossimi a quelli dell’uomo come, per esempio, quello di riuscire a prendere decisioni. Per raggiungere tale scopo, sono state introdotte le reti neurali, sofisticate strutture alla base dell’intelligenza artificiale, che, tramite l’utilizzo di complessi algoritmi, sono in grado di apprendere sfruttando meccanismi simili (o almeno in parte) a quelli dell’intelligenza umana. Esse sono state ideate prendendo ispirazione dalle complesse reti neurali biologiche, ovvero le reti neurali che trovano sede nel nostro cervello, in grado di comprendere l’ambiente, i suoi mutamenti e di fornire risposte adattive calibrate sulle esigenze che si presentano. Come vedremo, una rete neurale artificiale necessita prima di tutto di un processo di addestramento, nel quale viene fornito alla rete un “training set”, ovvero un insieme di dati di addestramento, che viene processato dalla rete, tramite l’utilizzo di determinati algoritmi. Dopo una serie più o meno numerosa di cicli di elaborazione, la rete sarà più o meno in grado di produrre il corretto output dato un generico input. Nella seguente trattazione ci si concentrerà principalmente sugli algoritmi di apprendimento supervisionato, ovvero la tipologia di apprendimento caratterizzato dal fatto di possedere, oltre all’insieme di dati di input, i rispettivi valori di output che tali dati devono produrre. Analizzando tali insiemi, la rete si allena cogliendo il nesso che li unisce. Verranno inizialmente trattate le principali tipologie di reti neurali introducendone prima il modello più basilare, la rete neurale a singolo strato per la quale saranno esposte le limitazioni che hanno spinto all’ideazione e alla progettazione delle più complesse e funzionali reti neurali multistrato, trattate nel seguito. Per ciascuna tipologia di rete verranno illustrati i principali algoritmi di allenamento ed infine verranno proposti degli esempi pratici di applicazione di tali algoritmi analizzandone il comportamento rispetto alla variazione dei parametri che tipicamente incidono nella prestazione e nel funzionamento delle reti.
2021
Neural network architecture and training techniques
reti neurali
strati
funzione
File in questo prodotto:
File Dimensione Formato  
Schiavo_Carlotta.pdf

accesso riservato

Dimensione 2.14 MB
Formato Adobe PDF
2.14 MB Adobe PDF

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/32562