Machine learning is the study of computer systems that improve through experience. Active learning is the study of machine learning systems that improve by asking questions. So why ask questions? The key hypothesis is that if the learner is allowed to choose the data from which it learns — to be active, curious, or exploratory — it can learn efficiently. Consider that in order for most supervised machine learning systems to perform well they must often be trained on many hundreds or thousands of labeled data instances. Sometimes these labels come at little or no cost, but for many real-world applications, labeling is a difficult, time-consuming, or expensive process. Fortunately in today’s data-drenched society, unlabeled data are often abundant (or at least easier to acquire). This suggests that much can be gained by using active learning systems to ask effective questions, exploring the most informative nooks and crannies of a vast data landscape (rather than randomly and expensively sampling data from the domain of interest). In this thesis, we will examine active learning and its main implementation approaches in detail, analyzing the advantages and disadvantages of each approach and comparing their results in different usage situations. In addition, we will explore how active learning can be used in combination with other machine learning techniques.

L'apprendimento automatico è lo studio dei sistemi informatici che migliorano grazie all'esperienza. L'apprendimento attivo è lo studio dei sistemi di apprendimento automatico che migliorano ponendo domande. Perché porre domande? L'ipotesi chiave è che se all'apprendente viene permesso di scegliere i dati da cui imparare - di essere attivo, curioso o esplorativo - può imparare in modo efficiente. Si consideri che, per ottenere buone prestazioni, la maggior parte dei sistemi di apprendimento automatico supervisionati deve essere addestrata su molte centinaia o migliaia di istanze di dati etichettati. A volte queste etichette non hanno alcun peso economico, ma per molte applicazioni reali l'etichettatura è un processo difficile, lungo o costoso. Fortunatamente, nella società odierna, ricca di dati, i dati non etichettati sono spesso abbondanti (o almeno più facili da acquisire). Ciò suggerisce che si può guadagnare molto utilizzando sistemi di apprendimento attivo per porre domande efficaci, esplorando gli angoli più informativi di un vasto panorama di dati (piuttosto che campionare casualmente a caro prezzo i dati del dominio di interesse). In questa tesi esamineremo in dettaglio l'apprendimento attivo e i suoi principali approcci di implementazione, analizzando i vantaggi e gli svantaggi di ciascun approccio e confrontando i loro risultati in diverse situazioni di utilizzo. Inoltre, esploreremo come l'apprendimento attivo possa essere utilizzato in combinazione con altre tecniche di apprendimento automatico.

Active Learning per la Progettazione degli Esperimenti: una applicazione Industriale

FERRETTO, FRANCESCO
2022/2023

Abstract

Machine learning is the study of computer systems that improve through experience. Active learning is the study of machine learning systems that improve by asking questions. So why ask questions? The key hypothesis is that if the learner is allowed to choose the data from which it learns — to be active, curious, or exploratory — it can learn efficiently. Consider that in order for most supervised machine learning systems to perform well they must often be trained on many hundreds or thousands of labeled data instances. Sometimes these labels come at little or no cost, but for many real-world applications, labeling is a difficult, time-consuming, or expensive process. Fortunately in today’s data-drenched society, unlabeled data are often abundant (or at least easier to acquire). This suggests that much can be gained by using active learning systems to ask effective questions, exploring the most informative nooks and crannies of a vast data landscape (rather than randomly and expensively sampling data from the domain of interest). In this thesis, we will examine active learning and its main implementation approaches in detail, analyzing the advantages and disadvantages of each approach and comparing their results in different usage situations. In addition, we will explore how active learning can be used in combination with other machine learning techniques.
2022
Active Learning for Design of Experiments: an Industrial application
L'apprendimento automatico è lo studio dei sistemi informatici che migliorano grazie all'esperienza. L'apprendimento attivo è lo studio dei sistemi di apprendimento automatico che migliorano ponendo domande. Perché porre domande? L'ipotesi chiave è che se all'apprendente viene permesso di scegliere i dati da cui imparare - di essere attivo, curioso o esplorativo - può imparare in modo efficiente. Si consideri che, per ottenere buone prestazioni, la maggior parte dei sistemi di apprendimento automatico supervisionati deve essere addestrata su molte centinaia o migliaia di istanze di dati etichettati. A volte queste etichette non hanno alcun peso economico, ma per molte applicazioni reali l'etichettatura è un processo difficile, lungo o costoso. Fortunatamente, nella società odierna, ricca di dati, i dati non etichettati sono spesso abbondanti (o almeno più facili da acquisire). Ciò suggerisce che si può guadagnare molto utilizzando sistemi di apprendimento attivo per porre domande efficaci, esplorando gli angoli più informativi di un vasto panorama di dati (piuttosto che campionare casualmente a caro prezzo i dati del dominio di interesse). In questa tesi esamineremo in dettaglio l'apprendimento attivo e i suoi principali approcci di implementazione, analizzando i vantaggi e gli svantaggi di ciascun approccio e confrontando i loro risultati in diverse situazioni di utilizzo. Inoltre, esploreremo come l'apprendimento attivo possa essere utilizzato in combinazione con altre tecniche di apprendimento automatico.
Active Learning
Machine Learning
Regression
Optimal DOE
DOE
File in questo prodotto:
File Dimensione Formato  
Ferretto_Francesco.pdf

accesso riservato

Dimensione 6.23 MB
Formato Adobe PDF
6.23 MB Adobe PDF

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/43120