Ogni volta che chiedi qualcosa a ChatGPT, a Claude o a Gemini, stai interrogando il risultato di un processo lungo, costoso e sorprendentemente concreto: l’addestramento. Capire come si addestra un modello di intelligenza artificiale è il modo migliore per smettere di vedere l’AI come una scatola magica e iniziare a usarla con consapevolezza, che tu sia un professionista curioso, uno studente o qualcuno che valuta di portare questi strumenti nella propria azienda. In questa guida ti accompagno attraverso l’intero percorso: dai dati grezzi raccolti dal web fino al modello rifinito che risponde alle tue domande, passando per le fasi di pre-addestramento, fine-tuning e valutazione. Alla fine saprai esattamente cosa succede dietro le quinte, quali sono i costi in gioco e perché alcune scelte fatte in fase di addestramento si riflettono direttamente sulla qualità delle risposte che ricevi.
Cosa significa davvero addestrare un modello
Addestrare un modello significa fargli imparare dei comportamenti a partire da esempi, invece di programmarli a mano regola per regola. Un modello di intelligenza artificiale è, nella sua essenza, una gigantesca funzione matematica con miliardi di parametri, cioè numeri che ne determinano il comportamento. All’inizio questi parametri sono casuali e il modello produce output privi di senso. L’addestramento è il processo che, esempio dopo esempio, aggiusta quei numeri finché il modello non diventa capace di svolgere il compito per cui è progettato.
Nel caso dei grandi modelli linguistici, il compito di base è quasi banale nella sua formulazione: prevedere la parola successiva in un testo. Il modello legge miliardi di frasi e impara a indovinare come continuano. Da questo obiettivo apparentemente semplice emergono, su scala sufficientemente grande, capacità sorprendenti: grammatica, conoscenza del mondo, ragionamento, persino attitudine alla programmazione. L’architettura che ha reso possibile tutto questo è quella dei transformer, mentre la struttura di calcolo sottostante è quella delle reti neurali artificiali, ispirate in modo molto libero al funzionamento dei neuroni biologici.
I tre ingredienti: dati, calcolo e algoritmi
Qualunque addestramento poggia su tre pilastri. I dati sono gli esempi da cui il modello impara, e la loro quantità e qualità determinano il tetto massimo delle prestazioni. Il calcolo è la potenza dei processori, tipicamente GPU, necessaria a elaborare quei dati migliaia di volte. Gli algoritmi sono le procedure matematiche che traducono gli errori del modello in correzioni dei parametri. Quando leggi che un’azienda ha investito miliardi in data center, o che i chip di Nvidia sono introvabili, il motivo è esattamente questo: senza calcolo non c’è addestramento, e senza addestramento non c’è modello.
La fase dei dati: raccolta, pulizia e preparazione
Tutto comincia dai dati, e questa è la fase più sottovalutata dell’intero processo. Per un grande modello linguistico si parte da corpora enormi: pagine web, libri digitalizzati, articoli scientifici, codice sorgente pubblico, conversazioni, documentazione tecnica. Si misurano in migliaia di miliardi di token, dove un token è l’unità minima in cui il testo viene spezzato, all’incirca una parola o un pezzo di parola.
La materia prima grezza, però, è piena di spazzatura: pagine duplicate, spam, testo generato automaticamente, contenuti tossici, informazioni personali. Per questo i team dedicano una parte enorme del lavoro alla pulizia: deduplicazione, filtri di qualità, rimozione di dati sensibili, bilanciamento delle lingue e degli argomenti. Una regola empirica attraversa tutto il settore: la qualità dei dati conta più della quantità. Un modello addestrato su meno dati ma più curati batte regolarmente un modello ingozzato di testo mediocre. È lo stesso principio che vale in cucina: con ingredienti scadenti, nessuna ricetta produce un buon piatto.
Prima di entrare nel modello, il testo viene tokenizzato, cioè convertito in sequenze di numeri che la rete può elaborare. Anche questa scelta, apparentemente tecnica, ha conseguenze pratiche: una tokenizzazione che rappresenta male una lingua, per esempio l’italiano rispetto all’inglese, rende il modello meno efficiente e più costoso da usare in quella lingua.
Il pre-addestramento: dove il modello impara il mondo
Il pre-addestramento è la fase più lunga e costosa. Il modello legge i dati a blocchi e per ogni blocco prova a prevedere il token successivo. All’inizio sbaglia quasi sempre. Ogni errore viene misurato da una funzione di perdita, un numero che quantifica quanto la previsione era lontana dalla realtà. Un algoritmo chiamato retropropagazione calcola quanto ciascun parametro ha contribuito all’errore, e la discesa del gradiente corregge ogni parametro nella direzione che riduce la perdita. Questo ciclo, previsione, errore, correzione, si ripete miliardi di volte.
Su scala industriale, il processo gira per settimane o mesi su cluster di migliaia di GPU che lavorano in parallelo, coordinate da software di distribuzione sofisticati. I costi variano da qualche milione di dollari per modelli di media dimensione a centinaia di milioni per i modelli di frontiera, senza contare energia, raffreddamento e stipendi dei team. È il motivo per cui il pre-addestramento da zero resta appannaggio di poche organizzazioni al mondo, mentre tutti gli altri partono da modelli già pre-addestrati, spesso open source.
Al termine di questa fase si ottiene il cosiddetto modello base: un sistema che conosce moltissimo ma non sa ancora comportarsi. Se gli fai una domanda, potrebbe continuare il testo invece di rispondere, perché ha imparato a completare documenti, non a dialogare. Per trasformarlo in un assistente servono le fasi successive.
Fine-tuning e allineamento: dal modello grezzo all’assistente
La prima rifinitura è il fine-tuning supervisionato: il modello viene riaddestrato su un insieme molto più piccolo ma curatissimo di esempi di conversazione, scritti o selezionati da persone, che gli mostrano il formato desiderato, domanda e risposta utile, istruzione ed esecuzione corretta. Qui il modello impara a essere un assistente. La stessa tecnica serve alle aziende per specializzare un modello sul proprio dominio, dal linguaggio legale a quello medico: se ti interessa questo aspetto, trovi un approfondimento dedicato nella nostra guida al fine-tuning dei modelli AI.
Il secondo passaggio è l’allineamento alle preferenze umane. La tecnica più nota è il reinforcement learning from human feedback, in sigla RLHF: valutatori umani confrontano coppie di risposte del modello indicando quale preferiscono, con quei giudizi si addestra un modello di ricompensa, e il modello principale viene ottimizzato per massimizzare quella ricompensa. È in questa fase che il modello impara a essere utile senza essere dannoso, a rifiutare richieste pericolose, a mantenere un tono appropriato. Varianti più recenti riducono il ruolo dei valutatori umani usando principi scritti o feedback generato da altre AI, ma la logica resta la stessa: orientare il comportamento verso ciò che le persone considerano una buona risposta.
La valutazione: benchmark, overfitting e limiti
Un modello addestrato va misurato. La valutazione avviene su benchmark standardizzati che testano conoscenza, ragionamento, matematica, programmazione e sicurezza, oltre che su test interni e sessioni di red teaming in cui esperti cercano deliberatamente di far sbagliare il sistema. Una regola fondamentale: i dati di valutazione devono essere separati da quelli di addestramento, altrimenti il modello ottiene voti alti semplicemente perché ha già visto le risposte.
Il nemico classico di questa fase è l’overfitting: il modello impara a memoria gli esempi di addestramento invece di generalizzare, e crolla appena incontra casi nuovi. È come uno studente che memorizza le soluzioni degli esercizi senza capire il metodo: brillante sul libro, perso all’esame. Per contrastarlo si usano tecniche di regolarizzazione, si monitora la differenza di prestazioni tra dati visti e non visti, e soprattutto si cura la varietà del dataset. Anche a valle di tutte le verifiche, comunque, nessun addestramento elimina del tutto errori e allucinazioni: per questo la valutazione oggi si estende al comportamento del modello in produzione, con monitoraggio continuo e aggiornamenti periodici.
E se vuoi addestrare qualcosa tu?
La buona notizia è che non ti serve un data center per sperimentare. L’addestramento completo di un piccolo modello di classificazione, per riconoscere categorie di testo o immagini, si fa sul tuo computer con librerie open source come PyTorch o TensorFlow e dataset pubblici. Il percorso realistico per un professionista o una piccola azienda, però, quasi mai parte da zero: si prende un modello open source già pre-addestrato e lo si specializza con il fine-tuning, oppure si evita del tutto l’addestramento usando tecniche come il retrieval augmented generation, che collega il modello ai tuoi documenti senza toccarne i parametri. La scelta dipende dal problema: per orientarti tra le famiglie di algoritmi disponibili e capire quale approccio si adatta al tuo caso, parti dalla nostra guida agli algoritmi di machine learning.
Se invece vuoi consolidare il vocabolario tecnico incontrato in questa guida, dai token alla funzione di perdita, trovi tutte le definizioni nel nostro glossario dell’intelligenza artificiale.
Conclusioni
Addestrare un modello di intelligenza artificiale è un processo a strati: si parte da montagne di dati puliti con cura, si paga un conto salato di calcolo per il pre-addestramento, si rifinisce il comportamento con fine-tuning e feedback umano, e si misura tutto con valutazioni rigorose prima di mettere il sistema nelle mani degli utenti. Conoscere queste fasi ti rende un utilizzatore più consapevole: capisci perché i modelli hanno limiti di conoscenza temporale, perché a volte inventano, perché alcuni sono più adatti di altri al tuo caso d’uso, e quando ha senso investire in una personalizzazione. Il prossimo passo sta a te: esplora le guide collegate in questo articolo per approfondire i singoli tasselli, e continua a seguire intelligenzaartificiale.net per capire, con un linguaggio chiaro, come funziona davvero la tecnologia che sta ridisegnando il nostro modo di lavorare.
Intelligenza Artificiale Tutto su AI e machine learning