Il successo del motore di ricerca Google si basa principalmente sull’algoritmo di PageRank, capace di valutare quantitativamente l’importanza di ogni pagina web, consentendo a Google di classificare le pagine e quindi presentare all’utente per prime quelle più importanti e pertinenti. L’algoritmo di PageRank è un’applicazione dell’algebra lineare standard, infatti, per la sua elaborazione si sfruttano nozioni su matrici e grafi. In questa tesi si definisce il web come un grafo orientato e si studia la matrice dei link ad esso associata. Possono sorgere problemi come la presenza di dangling nodes, ossia pagine senza collegamenti in uscita, oppure il grafo del web potrebbe non essere fortemente connesso; la matrice dei link viene così modificata in modo da risultare stocastica per righe, irriducibile e non-negativa. Tale matrice viene detta matrice di Google. Si definisce il PageRank vector come l’autovettore sinistro della matrice di Google relativo all’autovalore 1. Si forniscono alcune espressioni implicite ed esplicite per il PageRank vector, lo si calcola, utilizzando il metodo delle potenze ed infine si è studiato l’errore alla k-esima iterata.

L'Algoritmo di PageRank

BORGHESAN, GIULIA
2021/2022

Abstract

Il successo del motore di ricerca Google si basa principalmente sull’algoritmo di PageRank, capace di valutare quantitativamente l’importanza di ogni pagina web, consentendo a Google di classificare le pagine e quindi presentare all’utente per prime quelle più importanti e pertinenti. L’algoritmo di PageRank è un’applicazione dell’algebra lineare standard, infatti, per la sua elaborazione si sfruttano nozioni su matrici e grafi. In questa tesi si definisce il web come un grafo orientato e si studia la matrice dei link ad esso associata. Possono sorgere problemi come la presenza di dangling nodes, ossia pagine senza collegamenti in uscita, oppure il grafo del web potrebbe non essere fortemente connesso; la matrice dei link viene così modificata in modo da risultare stocastica per righe, irriducibile e non-negativa. Tale matrice viene detta matrice di Google. Si definisce il PageRank vector come l’autovettore sinistro della matrice di Google relativo all’autovalore 1. Si forniscono alcune espressioni implicite ed esplicite per il PageRank vector, lo si calcola, utilizzando il metodo delle potenze ed infine si è studiato l’errore alla k-esima iterata.
2021
PageRank Algorithm
Metodo delle Potenze
Matrice di Google
PageRank Vector
File in questo prodotto:
File Dimensione Formato  
Borghesan_Giulia.pdf

accesso riservato

Dimensione 608.68 kB
Formato Adobe PDF
608.68 kB Adobe PDF

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/29694