Il lavoro descritto in questa relazione è stato svolto all'interno di un progetto che ha lo scopo di valutare l'effettiva efficacia degli algoritmi di link analysis nell'individuare le pagine web di maggiore qualità. Il nostro lavoro è consistito nel contribuire al crawling esaustivo del web italiano per costruirne l'intero grafo; in particolare, ci siamo occupati della scelta di un insieme ottimale di documenti da cui esso ha avuto inizio (seed list) e della gestione del crawling

Da una seed list al crawling e al grafo del web italiano

Compagnin, Marco
2010/2011

Abstract

Il lavoro descritto in questa relazione è stato svolto all'interno di un progetto che ha lo scopo di valutare l'effettiva efficacia degli algoritmi di link analysis nell'individuare le pagine web di maggiore qualità. Il nostro lavoro è consistito nel contribuire al crawling esaustivo del web italiano per costruirne l'intero grafo; in particolare, ci siamo occupati della scelta di un insieme ottimale di documenti da cui esso ha avuto inizio (seed list) e della gestione del crawling
2010-09-30
52
seed list, crawling, web, italiano
File in questo prodotto:
File Dimensione Formato  
Marco_Compagnin_-_Da_una_seed_list_al_crawling_e_al_grafo_de.pdf

accesso aperto

Dimensione 816.23 kB
Formato Adobe PDF
816.23 kB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/14102