Data augmentation is a widely used technique in many machine learning tasks, such as image classification, to virtually expand the data size and avoid overfitting. Among the various data augmentation techniques that modify the original images with rotations, flips, noise additions, and resizes, this paper proposes a solution based on diffeomorphic transformations on image datasets that have highly variable shapes. As a result of our tests, we were able to obtain an Accuracy of 92.36% and, with ResNet50 ensembles up to 94.38%.
L’incremento dei dati è una tecnica ampiamente utilizzata in molti compiti di apprendimento automatico, come la classificazione delle immagini, per ampliare virtualmente la dimensione di dati ed evitare l’overfitting. Tra le varie tecniche di data augmentation che modificano le immagini originali con rotazioni, capovolgimenti, aggiunte di rumore e resize, questo elaborato propone una soluzione basata su trasformazioni diffeomorfiche su dataset di immagini che presentano shape molto variabili. In seguito ai test effettuati siamo riusciti ad ottenere un Accuracy del 92.36% e, con ensemble di ResNet50 fino a 94.38%.
Trasformazioni diffeomorfiche per l'incremento dei dati
COCCO, ALESSIO
2021/2022
Abstract
Data augmentation is a widely used technique in many machine learning tasks, such as image classification, to virtually expand the data size and avoid overfitting. Among the various data augmentation techniques that modify the original images with rotations, flips, noise additions, and resizes, this paper proposes a solution based on diffeomorphic transformations on image datasets that have highly variable shapes. As a result of our tests, we were able to obtain an Accuracy of 92.36% and, with ResNet50 ensembles up to 94.38%.File | Dimensione | Formato | |
---|---|---|---|
Cocco_Alessio.pdf
accesso aperto
Dimensione
10.5 MB
Formato
Adobe PDF
|
10.5 MB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/33531