I recenti progressi delle tecniche di intelligenza artificiale generativa hanno reso possibile la creazione o modifica di immagini, audio e video con una qualità tale da produrre contenuti artificiali difficilmente distinguibili persino dagli esseri umani. I contenuti multimediali così ottenuti si prestano a svariati utilizzi e presentano diversi vantaggi (soprattutto nell'abbattimento dei costi di produzione), ma celano anche preoccupanti pericoli nel caso di un loro utilizzo malevolo. Si è, pertanto, reso necessario lo sviluppo di strumenti atti al riconoscimento di simili contenuti multimediali sintetici o artefatti, attività sempre più difficile e stimolante data la varietà e la continua evoluzione delle tecniche generative esistenti. Lo studio di questa tesi si focalizza sulla generazione e il rilevamento di audio sintetici, analizzando sia le principali strategie e tecnologie allo stato dell'arte, sia gli sviluppi più recenti. In particolare, verrà dedicata un'attenzione specifica alla problematica del rilevamento, sottolineandone le complessità e delineando i percorsi che la ricerca sta intraprendendo per farvi fronte.

Generazione e rilevamento di audio deepfake: stato dell'arte e sviluppi futuri

POSENATO, GABRIELE
2024/2025

Abstract

I recenti progressi delle tecniche di intelligenza artificiale generativa hanno reso possibile la creazione o modifica di immagini, audio e video con una qualità tale da produrre contenuti artificiali difficilmente distinguibili persino dagli esseri umani. I contenuti multimediali così ottenuti si prestano a svariati utilizzi e presentano diversi vantaggi (soprattutto nell'abbattimento dei costi di produzione), ma celano anche preoccupanti pericoli nel caso di un loro utilizzo malevolo. Si è, pertanto, reso necessario lo sviluppo di strumenti atti al riconoscimento di simili contenuti multimediali sintetici o artefatti, attività sempre più difficile e stimolante data la varietà e la continua evoluzione delle tecniche generative esistenti. Lo studio di questa tesi si focalizza sulla generazione e il rilevamento di audio sintetici, analizzando sia le principali strategie e tecnologie allo stato dell'arte, sia gli sviluppi più recenti. In particolare, verrà dedicata un'attenzione specifica alla problematica del rilevamento, sottolineandone le complessità e delineando i percorsi che la ricerca sta intraprendendo per farvi fronte.
2024
Audio deepfake generation and detection: state of the art and future developments
Deepfake
Audio
Detection
Deep learning
File in questo prodotto:
File Dimensione Formato  
Posenato_Gabriele.pdf

accesso aperto

Dimensione 4.18 MB
Formato Adobe PDF
4.18 MB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/92215