Lo studio si propone di realizzare la classificazione automatica di referti radiologici in due categorie, in base alla presenza o meno di una specifica patologia. Poichè i referti si presentano come testo non strutturato, è necessario estrarre features rilevanti dagli stessi attraverso un processo di Information Extraction. Tali features sono state ottenute mediante Natural Language Processing con GATE, un open source che permette di analizzare il testo e di inserire sullo stesso annotazioni con valenza semantica. Tali annotazioni sono state poi utilizzate come parametri in quattro algoritmi di machine learning, ottenendo la classificazione richiesta. Un confronto dei risultati ha permesso di valutare quale algoritmo, in questo specifico contesto e con le features considerate, ha ottenuto il miglior grado di accuratezza
Natural language processing e tecniche semantiche per il supporto alla diagnosi: un esperimento
Tono, Raffaella
2010/2011
Abstract
Lo studio si propone di realizzare la classificazione automatica di referti radiologici in due categorie, in base alla presenza o meno di una specifica patologia. Poichè i referti si presentano come testo non strutturato, è necessario estrarre features rilevanti dagli stessi attraverso un processo di Information Extraction. Tali features sono state ottenute mediante Natural Language Processing con GATE, un open source che permette di analizzare il testo e di inserire sullo stesso annotazioni con valenza semantica. Tali annotazioni sono state poi utilizzate come parametri in quattro algoritmi di machine learning, ottenendo la classificazione richiesta. Un confronto dei risultati ha permesso di valutare quale algoritmo, in questo specifico contesto e con le features considerate, ha ottenuto il miglior grado di accuratezzaFile | Dimensione | Formato | |
---|---|---|---|
Tesi_per_pdf.pdf
accesso aperto
Dimensione
4.79 MB
Formato
Adobe PDF
|
4.79 MB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/13466