Il successo del motore di ricerca Google si basa principalmente sull’algoritmo di PageRank, capace di valutare quantitativamente l’importanza di ogni pagina web, consentendo a Google di classificare le pagine e quindi presentare all’utente per prime quelle più importanti e pertinenti. L’algoritmo di PageRank è un’applicazione dell’algebra lineare standard, infatti, per la sua elaborazione si sfruttano nozioni su matrici e grafi. In questa tesi si definisce il web come un grafo orientato e si studia la matrice dei link ad esso associata. Possono sorgere problemi come la presenza di dangling nodes, ossia pagine senza collegamenti in uscita, oppure il grafo del web potrebbe non essere fortemente connesso; la matrice dei link viene così modificata in modo da risultare stocastica per righe, irriducibile e non-negativa. Tale matrice viene detta matrice di Google. Si definisce il PageRank vector come l’autovettore sinistro della matrice di Google relativo all’autovalore 1. Si forniscono alcune espressioni implicite ed esplicite per il PageRank vector, lo si calcola, utilizzando il metodo delle potenze ed infine si è studiato l’errore alla k-esima iterata.
L'Algoritmo di PageRank
BORGHESAN, GIULIA
2021/2022
Abstract
Il successo del motore di ricerca Google si basa principalmente sull’algoritmo di PageRank, capace di valutare quantitativamente l’importanza di ogni pagina web, consentendo a Google di classificare le pagine e quindi presentare all’utente per prime quelle più importanti e pertinenti. L’algoritmo di PageRank è un’applicazione dell’algebra lineare standard, infatti, per la sua elaborazione si sfruttano nozioni su matrici e grafi. In questa tesi si definisce il web come un grafo orientato e si studia la matrice dei link ad esso associata. Possono sorgere problemi come la presenza di dangling nodes, ossia pagine senza collegamenti in uscita, oppure il grafo del web potrebbe non essere fortemente connesso; la matrice dei link viene così modificata in modo da risultare stocastica per righe, irriducibile e non-negativa. Tale matrice viene detta matrice di Google. Si definisce il PageRank vector come l’autovettore sinistro della matrice di Google relativo all’autovalore 1. Si forniscono alcune espressioni implicite ed esplicite per il PageRank vector, lo si calcola, utilizzando il metodo delle potenze ed infine si è studiato l’errore alla k-esima iterata.File | Dimensione | Formato | |
---|---|---|---|
Borghesan_Giulia.pdf
accesso riservato
Dimensione
608.68 kB
Formato
Adobe PDF
|
608.68 kB | Adobe PDF |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/29694