Le reti neurali convoluzionali (CNN) sono state utilizzate con successo in molte applicazioni in cui le informazioni importanti sui dati sono descritte dalla posizione delle features, come nel caso delle immagini. La maggior parte dei dati tabellari non presuppone una relazione spaziale tra le caratteristiche e quindi non è adatta alla modellazione con le CNN. Per risolvere questo problema, ho implementato l’algoritmo “image generator for tabular data” (IGTD) per trasformare i dati tabellari in immagini assegnando le caratteristiche alle posizioni dei pixel così che le caratteristiche simili appaiano tra loro vicine nell'immagine. L'algoritmo ottimizza l’assegnazione minimizzando la differenza tra la classifica delle distanze tra le caratteristiche e quella delle distanze tra i pixel assegnati nell'immagine. Ho inoltre applicato IGTD per trasformare i profili di espressione genica di alcune linee cellulari tumorali (CCL) e i descrittori molecolari di alcuni farmaci nelle rispettive rappresentazioni delle immagini. Rispetto ai metodi di trasformazione esistenti, IGTD genera rappresentazioni di immagini compatte con una migliore conservazione della struttura del vicinato delle caratteristiche. Valutate su set di dati di riferimento per lo screening dei farmaci, le CNN addestrate sulle rappresentazioni di immagini IGTD di CCL e farmaci hanno in alcuni casi mostrato prestazioni migliori nella previsione della risposta ai farmaci antitumorali rispetto sia alle CNN addestrate su rappresentazioni di immagini alternative, sia ai modelli di previsione addestrati sui dati tabellari originali.

Algoritmo per la generazione di immagini da dati tabellati

LUCON XICCATO, GREGORY
2022/2023

Abstract

Le reti neurali convoluzionali (CNN) sono state utilizzate con successo in molte applicazioni in cui le informazioni importanti sui dati sono descritte dalla posizione delle features, come nel caso delle immagini. La maggior parte dei dati tabellari non presuppone una relazione spaziale tra le caratteristiche e quindi non è adatta alla modellazione con le CNN. Per risolvere questo problema, ho implementato l’algoritmo “image generator for tabular data” (IGTD) per trasformare i dati tabellari in immagini assegnando le caratteristiche alle posizioni dei pixel così che le caratteristiche simili appaiano tra loro vicine nell'immagine. L'algoritmo ottimizza l’assegnazione minimizzando la differenza tra la classifica delle distanze tra le caratteristiche e quella delle distanze tra i pixel assegnati nell'immagine. Ho inoltre applicato IGTD per trasformare i profili di espressione genica di alcune linee cellulari tumorali (CCL) e i descrittori molecolari di alcuni farmaci nelle rispettive rappresentazioni delle immagini. Rispetto ai metodi di trasformazione esistenti, IGTD genera rappresentazioni di immagini compatte con una migliore conservazione della struttura del vicinato delle caratteristiche. Valutate su set di dati di riferimento per lo screening dei farmaci, le CNN addestrate sulle rappresentazioni di immagini IGTD di CCL e farmaci hanno in alcuni casi mostrato prestazioni migliori nella previsione della risposta ai farmaci antitumorali rispetto sia alle CNN addestrate su rappresentazioni di immagini alternative, sia ai modelli di previsione addestrati sui dati tabellari originali.
2022
Algorithm for generating images from tabular data
dati tabellati
CNN
reti neurali
File in questo prodotto:
File Dimensione Formato  
Lucon_Xiccato_Gregory.pdf

accesso riservato

Dimensione 1.53 MB
Formato Adobe PDF
1.53 MB Adobe PDF

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/44032