Glossario dei termini dell intelligenza artificiale, concetto tecnologico

Foto: Unsplash (licenza Unsplash, uso libero)

Glossario dell’intelligenza artificiale: i termini fondamentali da conoscere

Il mondo dell’intelligenza artificiale è pieno di termini tecnici, sigle e anglicismi che possono scoraggiare chi si avvicina per la prima volta, ma anche confondere chi la usa già ogni giorno. Capire il vocabolario di base non è un esercizio accademico, è il modo più rapido per leggere una notizia, scegliere uno strumento o seguire una discussione senza perdere il filo. In questo glossario trovi spiegati con parole semplici i concetti fondamentali, organizzati per aree tematiche in modo che tu possa leggerlo tutto d’un fiato oppure consultarlo quando incontri una parola che non conosci. Per ogni termine trovi una definizione discorsiva e, dove serve, un riferimento a una guida di approfondimento.

I concetti di base

Prima di addentrarci nei dettagli tecnici, conviene fissare i mattoni su cui poggia tutto il resto. Sono i termini che ricorrono in qualsiasi articolo o presentazione sull’argomento, e che spesso vengono dati per scontati.

Intelligenza artificiale

Con intelligenza artificiale si indica l’insieme delle tecniche che permettono a un sistema informatico di svolgere compiti che normalmente richiederebbero l’intelligenza umana, come riconoscere immagini, comprendere il linguaggio o prendere decisioni. Non è una singola tecnologia, ma un campo molto ampio che racchiude approcci diversi. Se vuoi un quadro completo puoi partire dalla nostra guida su che cos’è e come funziona un’intelligenza artificiale.

Machine learning

Il machine learning, o apprendimento automatico, è il ramo dell’intelligenza artificiale in cui i sistemi imparano dai dati invece di seguire regole scritte a mano da un programmatore. Mostrando al modello molti esempi, questo individua da solo gli schemi ricorrenti e li usa per fare previsioni su dati nuovi. È l’approccio che ha reso possibile gran parte dei progressi degli ultimi anni, come spieghiamo nella guida dedicata al machine learning.

Deep learning

Il deep learning, o apprendimento profondo, è un sottoinsieme del machine learning basato su reti neurali con molti livelli. Questa profondità permette di analizzare dati complessi come immagini, audio e testo, ed è la tecnologia che alimenta gli strumenti generativi più recenti. Trovi una spiegazione estesa nella guida sul deep learning.

Rete neurale

Una rete neurale artificiale è un modello matematico ispirato in modo molto semplificato al funzionamento del cervello. È composta da unità chiamate neuroni, organizzate in livelli e collegate tra loro, che si attivano in risposta ai dati in ingresso. Regolando la forza di queste connessioni durante l’addestramento, la rete impara a trasformare un input, ad esempio una foto, in un output, ad esempio l’etichetta gatto.

Algoritmo

Un algoritmo è una sequenza precisa di istruzioni per risolvere un problema o portare a termine un compito. Nell’intelligenza artificiale gli algoritmi definiscono come un modello apprende dai dati e come elabora le richieste. È bene non confondere l’algoritmo, cioè il procedimento, con il modello, cioè il risultato addestrato.

Dataset

Un dataset è l’insieme di dati usati per addestrare o valutare un modello. La sua qualità è decisiva, perché un sistema impara esattamente ciò che trova negli esempi. Dati incompleti, sbilanciati o di scarsa qualità producono modelli poco affidabili, secondo il principio per cui se entra spazzatura, esce spazzatura.

Capire i modelli generativi e il linguaggio

Questa è l’area che ha portato l’intelligenza artificiale sotto i riflettori, grazie a strumenti capaci di scrivere testi, generare immagini e dialogare. Ecco i termini che incontri più spesso quando si parla di assistenti come ChatGPT, Claude o Gemini.

Intelligenza artificiale generativa

L’intelligenza artificiale generativa indica i modelli capaci di creare contenuti nuovi, come testo, immagini, audio o video, a partire da una richiesta. A differenza dei sistemi che si limitano a classificare o riconoscere, questi modelli producono qualcosa che prima non esisteva, basandosi su ciò che hanno appreso da enormi quantità di esempi.

Modello linguistico di grandi dimensioni

Un modello linguistico di grandi dimensioni, in inglese large language model o LLM, è un sistema addestrato su enormi quantità di testo per comprendere e generare linguaggio naturale. È il cuore degli assistenti conversazionali, e funziona prevedendo la parola più probabile da generare dopo quelle che ha già davanti. La sua capacità di tenere il contesto e seguire le istruzioni dipende dalla scala dell’addestramento.

Token

Il token è l’unità minima con cui un modello elabora il testo. Può corrispondere a una parola intera, a una parte di parola o anche a un singolo segno di punteggiatura. I modelli misurano la lunghezza di una conversazione in token, e su questa base si calcolano spesso i costi di utilizzo tramite le interfacce di programmazione.

Parametri

I parametri sono i valori interni che un modello regola durante l’addestramento e che ne determinano il comportamento. Si parla spesso di modelli con miliardi di parametri, e questo numero dà un’idea approssimativa della loro complessità. Più parametri non significano però sempre prestazioni migliori, perché contano molto anche la qualità dei dati e le tecniche di addestramento.

Prompt

Il prompt è l’istruzione o la domanda che fornisci a un modello generativo per ottenere una risposta. Può essere semplice, come una domanda secca, oppure articolato, con esempi, contesto e indicazioni sul formato desiderato. La qualità del prompt influenza in modo diretto la qualità della risposta.

Prompt engineering

Il prompt engineering è l’insieme delle tecniche per scrivere istruzioni efficaci e ottenere dai modelli risultati migliori e più affidabili. Comprende accorgimenti come fornire esempi, suddividere un compito complesso in passaggi e specificare ruolo e tono. È una competenza pratica diventata centrale per chiunque lavori con questi strumenti.

Allucinazione

Si parla di allucinazione quando un modello produce un’informazione falsa o inventata, presentandola però con sicurezza come se fosse vera. È uno dei limiti più importanti dei sistemi generativi, e nasce dal fatto che il modello genera testo plausibile senza una reale verifica dei fatti. Per questo è sempre consigliabile controllare le affermazioni rilevanti.

Multimodalità

Un modello multimodale è capace di lavorare con più tipi di dati contemporaneamente, ad esempio testo, immagini e audio. Questo permette usi più ricchi, come descrivere una foto, rispondere a domande su un grafico o generare immagini a partire da una descrizione testuale.

Come imparano le macchine

Dietro ogni modello c’è un processo di apprendimento. Conoscere questi termini ti aiuta a capire come un sistema passa da una massa di dati grezzi a uno strumento capace di rispondere alle tue richieste.

Addestramento

L’addestramento, in inglese training, è la fase in cui il modello impara dai dati regolando i propri parametri. È un processo che richiede grandi quantità di esempi e molta potenza di calcolo, e rappresenta la parte più costosa nella creazione di un modello di frontiera.

Apprendimento supervisionato

Nell’apprendimento supervisionato il modello impara da esempi già etichettati, in cui a ogni input corrisponde la risposta corretta. È l’approccio usato, ad esempio, per insegnare a riconoscere se un’email è spam, mostrando molti messaggi già classificati.

Apprendimento non supervisionato

Nell’apprendimento non supervisionato il modello lavora su dati privi di etichette e cerca da solo strutture e somiglianze. È utile per scoprire raggruppamenti nascosti, come segmentare automaticamente i clienti di un’azienda in base ai loro comportamenti.

Apprendimento per rinforzo

L’apprendimento per rinforzo è una tecnica in cui un agente impara per tentativi ed errori, ricevendo ricompense o penalità in base alle azioni compiute in un ambiente. È usato in ambiti come la robotica e i giochi, dove l’obiettivo è massimizzare un risultato nel tempo.

RLHF

La sigla RLHF sta per apprendimento per rinforzo con feedback umano. È la tecnica con cui i grandi assistenti vengono affinati grazie alle valutazioni di persone, che indicano quali risposte sono migliori. Serve a rendere i modelli più utili, più sicuri e più allineati alle aspettative di chi li usa.

Fine-tuning

Il fine-tuning è il processo con cui si specializza un modello già addestrato su un compito o un dominio specifico, fornendogli ulteriori esempi mirati. Permette, ad esempio, di adattare un modello generico al linguaggio e alle esigenze di una determinata azienda, senza doverlo costruire da zero.

Inferenza

L’inferenza è la fase in cui un modello già addestrato viene effettivamente usato per generare risposte o fare previsioni. Mentre l’addestramento avviene una volta, l’inferenza si ripete a ogni richiesta, ed è la parte che determina i costi e la velocità percepita quando interagisci con uno strumento.

Overfitting

Si ha overfitting quando un modello impara troppo bene i dati di addestramento, memorizzandone anche i dettagli irrilevanti, e per questo funziona male su dati nuovi. È un problema classico che si combatte con dati più vari e con tecniche che favoriscono la capacità di generalizzare.

Strumenti, agenti e applicazioni

Dai concetti passiamo agli strumenti concreti, cioè i termini che descrivono come l’intelligenza artificiale arriva nelle mani delle persone e delle aziende.

Chatbot

Un chatbot è un programma che dialoga con l’utente in linguaggio naturale. I chatbot moderni basati su modelli linguistici sono molto più flessibili dei vecchi sistemi a regole fisse, perché comprendono richieste formulate liberamente e sostengono conversazioni articolate.

Agente AI

Un agente AI è un sistema che non si limita a rispondere, ma è capace di pianificare e compiere azioni per raggiungere un obiettivo, usando strumenti esterni e correggendosi lungo il percorso. È una delle direzioni più importanti del momento, e la approfondiamo nella guida agli agenti AI.

RAG

La sigla RAG indica la generazione aumentata dal recupero, una tecnica che collega un modello a una fonte di dati esterna e aggiornata, da cui recupera informazioni prima di rispondere. Serve a ridurre le allucinazioni e a fornire risposte basate su documenti specifici, ad esempio i contenuti aziendali.

Visione artificiale

La visione artificiale, o computer vision, è il campo che permette ai sistemi di interpretare immagini e video. Alimenta applicazioni come il riconoscimento facciale, il controllo qualità nelle fabbriche e la guida assistita, traducendo i pixel in informazioni utili.

Elaborazione del linguaggio naturale

L’elaborazione del linguaggio naturale, in inglese natural language processing o NLP, raccoglie le tecniche che permettono ai computer di comprendere e produrre il linguaggio umano. È alla base di traduzione automatica, analisi dei testi e assistenti vocali.

API

Un’API è un’interfaccia di programmazione che consente a software diversi di comunicare tra loro. Nel contesto dell’intelligenza artificiale, le API permettono agli sviluppatori di integrare un modello dentro le proprie applicazioni, pagando in genere in base ai token elaborati.

Etica, limiti e sicurezza

Per usare l’intelligenza artificiale in modo consapevole serve conoscere anche i suoi rischi e i concetti legati alla responsabilità. Sono termini sempre più presenti nel dibattito pubblico e nelle normative.

Bias

Il bias è una distorsione sistematica nelle risposte di un modello, che spesso riflette pregiudizi o squilibri presenti nei dati di addestramento. Può portare a risultati ingiusti o discriminatori, ed è uno dei temi centrali quando si parla di intelligenza artificiale responsabile.

Allineamento

L’allineamento, in inglese alignment, è l’insieme delle tecniche e degli obiettivi volti a garantire che un sistema di intelligenza artificiale agisca in modo coerente con i valori e le intenzioni umane. Diventa tanto più importante quanto più i modelli diventano capaci e autonomi.

Deepfake

Un deepfake è un contenuto audiovisivo falso ma molto realistico, creato con l’intelligenza artificiale per far dire o fare a una persona qualcosa che non ha mai detto o fatto. È una tecnologia che pone seri problemi di disinformazione e di tutela dell’identità.

Dati di addestramento

I dati di addestramento sono i materiali da cui un modello impara. La loro provenienza, qualità e legittimità sono al centro di molte discussioni, dal rispetto del diritto d’autore alla protezione dei dati personali, e influenzano direttamente il comportamento del sistema finale.

AGI

La sigla AGI indica l’intelligenza artificiale generale, cioè un’ipotetica AI capace di svolgere qualunque compito intellettuale al pari o meglio di un essere umano. Oggi non esiste, e resta un obiettivo dibattuto, ma è un termine che incontri spesso quando si parla degli sviluppi futuri del settore.

Conclusioni

Questo glossario ti offre una mappa per orientarti nel linguaggio dell’intelligenza artificiale, dai concetti di base ai temi più avanzati di etica e sicurezza. Non serve memorizzare tutto in una volta, l’obiettivo è darti un riferimento da consultare ogni volta che incontri un termine nuovo, così da leggere notizie e guide con maggiore sicurezza. Il modo migliore per fissare questi concetti è metterli in pratica, provando di persona gli strumenti e approfondendo le voci che ti interessano di più attraverso le guide collegate. Salva questa pagina tra i preferiti, continua a esplorare gli approfondimenti del sito e, se pensi manchi un termine che ti sta a cuore, segnalacelo nei commenti, così potremo arricchire il glossario nel tempo.