The integration of single-cell RNA sequencing (scRNA-seq) and imaging-based spatial transcriptomics (ST) data represents a critical step toward the spatial resolution of cellular heterogeneity. This thesis investigates loss-based optimization strategies for the integration of scRNA-seq with in situ hybridization (ISH)-based spatial transcriptomics data, using a refined implementation of the Tangram model as reference. The study systematically evaluates how individual loss components and optimization choices influence model convergence, spatial mapping accuracy, and generalization. Through a structured ablation and sensitivity analysis, the contribution of each objective term is quantified under controlled experimental conditions. Additional optimization adjustments and hyperparameter tuning procedures are explored to improve robustness and perfrormance. The resulting analysis leads to practical guidelines for configuring and validating Tangram-like models on ISH datasets, with the broader goal of supporting standardized and data-driven integration workflows for spatial transcriptomics applications.

L’integrazione tra dati di RNA sequencing a singola cellula (scRNA-seq) e dati di trascrittomica spaziale ottenuti mediante tecniche di imaging (ST) rappresenta un passaggio fondamentale per la ricostruzione spaziale dell’eterogeneità cellulare. Questa tesi analizza strategie di ottimizzazione basate su funzioni di perdita per l’integrazione di dati scRNA-seq con dati di trascrittomica spaziale derivati da tecniche di ibridazione in situ (ISH), utilizzando come riferimento un’implementazione migliorata del modello Tangram. Lo studio valuta in modo sistematico come le singole componenti della funzione di perdita e le scelte di ottimizzazione influenzino la convergenza del modello, la precisione della mappatura spaziale e la capacità di generalizzazione. Attraverso un’analisi di sensibilità e uno studio di ablazione, viene quantificato il contributo di ciascun termine della funzione obiettivo in condizioni sperimentali controllate. Vengono inoltre esplorati diversi accorgimenti di ottimizzazione e procedure di regolazione degli iperparametri al fine di migliorare la robustezza e le prestazioni del modello. L’analisi condotta porta alla definizione di linee guida pratiche per la configurazione e la validazione di modelli tipo Tangram su dati ISH, con l’obiettivo più ampio di supportare flussi di integrazione standardizzati e guidati dai dati per applicazioni di trascrittomica spaziale.

Analysis of Loss-Based Optimization Methods for Integrating scRNA-seq and Imaging-Based Spatial Transcriptomics Data

BAZZACCO, ENRICO
2024/2025

Abstract

The integration of single-cell RNA sequencing (scRNA-seq) and imaging-based spatial transcriptomics (ST) data represents a critical step toward the spatial resolution of cellular heterogeneity. This thesis investigates loss-based optimization strategies for the integration of scRNA-seq with in situ hybridization (ISH)-based spatial transcriptomics data, using a refined implementation of the Tangram model as reference. The study systematically evaluates how individual loss components and optimization choices influence model convergence, spatial mapping accuracy, and generalization. Through a structured ablation and sensitivity analysis, the contribution of each objective term is quantified under controlled experimental conditions. Additional optimization adjustments and hyperparameter tuning procedures are explored to improve robustness and perfrormance. The resulting analysis leads to practical guidelines for configuring and validating Tangram-like models on ISH datasets, with the broader goal of supporting standardized and data-driven integration workflows for spatial transcriptomics applications.
2024
Analysis of Loss-Based Optimization Methods for Integrating scRNA-seq and Imaging-Based Spatial Transcriptomics Data
L’integrazione tra dati di RNA sequencing a singola cellula (scRNA-seq) e dati di trascrittomica spaziale ottenuti mediante tecniche di imaging (ST) rappresenta un passaggio fondamentale per la ricostruzione spaziale dell’eterogeneità cellulare. Questa tesi analizza strategie di ottimizzazione basate su funzioni di perdita per l’integrazione di dati scRNA-seq con dati di trascrittomica spaziale derivati da tecniche di ibridazione in situ (ISH), utilizzando come riferimento un’implementazione migliorata del modello Tangram. Lo studio valuta in modo sistematico come le singole componenti della funzione di perdita e le scelte di ottimizzazione influenzino la convergenza del modello, la precisione della mappatura spaziale e la capacità di generalizzazione. Attraverso un’analisi di sensibilità e uno studio di ablazione, viene quantificato il contributo di ciascun termine della funzione obiettivo in condizioni sperimentali controllate. Vengono inoltre esplorati diversi accorgimenti di ottimizzazione e procedure di regolazione degli iperparametri al fine di migliorare la robustezza e le prestazioni del modello. L’analisi condotta porta alla definizione di linee guida pratiche per la configurazione e la validazione di modelli tipo Tangram su dati ISH, con l’obiettivo più ampio di supportare flussi di integrazione standardizzati e guidati dai dati per applicazioni di trascrittomica spaziale.
transcriptomics
data integration
single cell
machine learning
bioinformatics
File in questo prodotto:
File Dimensione Formato  
Bazzacco_Enrico.pdf

Accesso riservato

Dimensione 15.43 MB
Formato Adobe PDF
15.43 MB Adobe PDF

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/99601