Negli ultimi anni, i Large Language Models (LLM) hanno rivoluzionato il campo dell'intelligenza artificiale, trasformando il modo in cui il linguaggio naturale viene elaborato e generato. Questa tesi fornisce un’analisi approfondita dei LLM, con un focus particolare sugli aspetti linguistici, spesso trascurati nella letteratura scientifica a favore di approcci matematici e informatici. Dopo un'introduzione storica sull'evoluzione dell'intelligenza artificiale e lo sviluppo dei primi modelli linguistici, il lavoro esamina il funzionamento tecnico dei LLM, approfondendo concetti chiave come i Transformer, l’embedding, l’attenzione e il feed-forward. Si analizzano poi le applicazioni pratiche di questi modelli, il loro impatto sulla società e il loro ruolo nei diversi ambiti della ricerca e della comunicazione. Si tratta inoltre della linguistica computazionale, mettendo a confronto la tokenizzazione dei LLM con la morfologia, la sintassi e la semantica del linguaggio naturale. Particolare attenzione è data alla traduzione automatica e ai meccanismi che permettono a questi modelli di elaborare il significato testuale, nonostante la loro natura puramente statistica. Infine, la tesi esplora criticità e implicazioni etiche, tra cui allucinazioni, bias linguistici e questioni legate a copyright e privacy. L’obiettivo è dimostrare che, sebbene i LLM non comprendano realmente il linguaggio, la loro sofisticata capacità di imitazione può fornire strumenti innovativi per lo studio e l’applicazione delle scienze linguistiche.
Linguistica delle AI
TRAVERSARI, ALESSANDRO
2024/2025
Abstract
Negli ultimi anni, i Large Language Models (LLM) hanno rivoluzionato il campo dell'intelligenza artificiale, trasformando il modo in cui il linguaggio naturale viene elaborato e generato. Questa tesi fornisce un’analisi approfondita dei LLM, con un focus particolare sugli aspetti linguistici, spesso trascurati nella letteratura scientifica a favore di approcci matematici e informatici. Dopo un'introduzione storica sull'evoluzione dell'intelligenza artificiale e lo sviluppo dei primi modelli linguistici, il lavoro esamina il funzionamento tecnico dei LLM, approfondendo concetti chiave come i Transformer, l’embedding, l’attenzione e il feed-forward. Si analizzano poi le applicazioni pratiche di questi modelli, il loro impatto sulla società e il loro ruolo nei diversi ambiti della ricerca e della comunicazione. Si tratta inoltre della linguistica computazionale, mettendo a confronto la tokenizzazione dei LLM con la morfologia, la sintassi e la semantica del linguaggio naturale. Particolare attenzione è data alla traduzione automatica e ai meccanismi che permettono a questi modelli di elaborare il significato testuale, nonostante la loro natura puramente statistica. Infine, la tesi esplora criticità e implicazioni etiche, tra cui allucinazioni, bias linguistici e questioni legate a copyright e privacy. L’obiettivo è dimostrare che, sebbene i LLM non comprendano realmente il linguaggio, la loro sofisticata capacità di imitazione può fornire strumenti innovativi per lo studio e l’applicazione delle scienze linguistiche.File | Dimensione | Formato | |
---|---|---|---|
TRAVERSARI_ALESSANDRO.pdf
accesso aperto
Dimensione
417.19 kB
Formato
Adobe PDF
|
417.19 kB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/83457