Il lavoro descritto in questa relazione è stato svolto all'interno di un progetto che ha lo scopo di valutare l'effettiva efficacia degli algoritmi di link analysis nell'individuare le pagine web di maggiore qualità. Il nostro lavoro è consistito nel contribuire al crawling esaustivo del web italiano per costruirne l'intero grafo; in particolare, ci siamo occupati della scelta di un insieme ottimale di documenti da cui esso ha avuto inizio (seed list) e della gestione del crawling
Da una seed list al crawling e al grafo del web italiano
Compagnin, Marco
2010/2011
Abstract
Il lavoro descritto in questa relazione è stato svolto all'interno di un progetto che ha lo scopo di valutare l'effettiva efficacia degli algoritmi di link analysis nell'individuare le pagine web di maggiore qualità. Il nostro lavoro è consistito nel contribuire al crawling esaustivo del web italiano per costruirne l'intero grafo; in particolare, ci siamo occupati della scelta di un insieme ottimale di documenti da cui esso ha avuto inizio (seed list) e della gestione del crawlingFile in questo prodotto:
File | Dimensione | Formato | |
---|---|---|---|
Marco_Compagnin_-_Da_una_seed_list_al_crawling_e_al_grafo_de.pdf
accesso aperto
Dimensione
816.23 kB
Formato
Adobe PDF
|
816.23 kB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
Utilizza questo identificativo per citare o creare un link a questo documento:
https://hdl.handle.net/20.500.12608/14102