La k-Nearest Neighbour Search, nell’ambito dell’analisi dei dati, è un tipo di ricerca che si pone il problema di individuare i k elementi più vicini ad uno dato. Dal punto di vista teorico lo si può vedere come uno spazio vettoriale, formato da dei vettori di dimensione fissata, in cui si vuole individuare un numero k di vettori più vicini ad uno fornito. La k-NNS copre un problema molto ricorrente e viene sviluppata da diverse aziende tra le quali colossi delle Big Tech come Facebook e Google. La tesi prende in analisi Faiss che è l’algoritmo di k-NNS di Facebook. Faiss presenta una struttura incentrata sugli indici in cui ogni Index avrà delle caratteristiche specifiche per il salvataggio dei dati presenti nei vettori e il metodo di ricerca. Queste caratteristiche spaziano dalla compressione dei vettori per ridurre la dimensione al diverso modo di creazione della struttura di spazio vettoriale. La tesi pone accento sull’analisi degli indici Flat e HNSW.

Faiss e la K-Nearest Neighbour Search

MIELE, RICCARDO
2022/2023

Abstract

La k-Nearest Neighbour Search, nell’ambito dell’analisi dei dati, è un tipo di ricerca che si pone il problema di individuare i k elementi più vicini ad uno dato. Dal punto di vista teorico lo si può vedere come uno spazio vettoriale, formato da dei vettori di dimensione fissata, in cui si vuole individuare un numero k di vettori più vicini ad uno fornito. La k-NNS copre un problema molto ricorrente e viene sviluppata da diverse aziende tra le quali colossi delle Big Tech come Facebook e Google. La tesi prende in analisi Faiss che è l’algoritmo di k-NNS di Facebook. Faiss presenta una struttura incentrata sugli indici in cui ogni Index avrà delle caratteristiche specifiche per il salvataggio dei dati presenti nei vettori e il metodo di ricerca. Queste caratteristiche spaziano dalla compressione dei vettori per ridurre la dimensione al diverso modo di creazione della struttura di spazio vettoriale. La tesi pone accento sull’analisi degli indici Flat e HNSW.
2022
Faiss and the K-Nearest Neighbour Search
K-nearest neighbors
Faiss
c++
File in questo prodotto:
File Dimensione Formato  
Miele_Riccardo.pdf

accesso riservato

Dimensione 818.67 kB
Formato Adobe PDF
818.67 kB Adobe PDF

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/48347