Anthropic e l’AI che costruisce se stessa: cos’è l’auto-miglioramento ricorsivo

Indice dei contenuti

L’intelligenza artificiale che progetta e costruisce versioni migliori di se stessa non è più soltanto uno scenario da romanzo di fantascienza. In un nuovo rapporto intitolato When AI builds itself, l’Anthropic Institute, il centro studi della società che sviluppa Claude, mostra con dati interni e benchmark pubblici quanto l’AI stia già accelerando lo sviluppo dell’AI stessa. La conclusione è prudente ma netta, l’auto-miglioramento ricorsivo non è ancora realtà e non è nemmeno inevitabile, ma secondo l’azienda potrebbe arrivare prima di quanto la maggior parte delle istituzioni sia pronta a gestire.

Che cosa significa auto-miglioramento ricorsivo

Per gran parte della sua storia, l’intelligenza artificiale è stata costruita interamente da esseri umani, che scrivevano il codice, progettavano gli esperimenti e decidevano quali strade percorrere. Quello che Anthropic descrive è uno spostamento progressivo di questo lavoro verso i modelli stessi. Quando una parte sempre più ampia dello sviluppo viene delegata all’AI, il ritmo accelera. Portato alle estreme conseguenze, e con abbastanza potenza di calcolo a disposizione, questo processo conduce a un sistema capace di progettare e addestrare in modo autonomo il proprio successore. È questo il significato di auto-miglioramento ricorsivo, un’AI che migliora se stessa in un ciclo che si autoalimenta.

Il punto importante è che non si tratta di un interruttore che si accende all’improvviso. Anthropic parla di una scala graduale, in cui il contributo umano si restringe passo dopo passo. Prima i modelli aiutavano a scrivere brevi frammenti di codice, poi hanno iniziato a modificare interi file, quindi a eseguire e correggere il codice in autonomia. L’ultimo gradino, ancora ipotetico, è la chiusura del ciclo, il momento in cui i modelli diventano capaci di costruire e addestrare altri modelli da soli.

La differenza tra ingegneria e ricerca

Per capire quanto siamo vicini a quel traguardo, il rapporto distingue due tipi di lavoro necessari a costruire un modello di frontiera. Da un lato c’è l’ingegneria, cioè scrivere il codice, predisporre l’infrastruttura e seguire l’addestramento. Dall’altro c’è la ricerca, cioè decidere quali esperimenti condurre, interpretare i risultati e capire quali idee provare. Secondo Anthropic, sul fronte dell’ingegneria Claude riesce ormai ad affrontare problemi definiti in modo vago, dove l’essere umano fornisce l’obiettivo ma non più il metodo. Nella ricerca, il modello sa eseguire bene un esperimento già impostato, ma fatica ancora quando deve scegliere da solo quali obiettivi perseguire. Quel divario, la cosiddetta capacità di giudizio, è proprio ciò che separa l’AI di oggi da un sistema in grado di progettare il proprio successore.

I numeri che arrivano da dentro Anthropic

La parte più interessante del rapporto riguarda i dati interni, raramente resi pubblici dalle aziende del settore. Anthropic dichiara che a maggio 2026 oltre l’ottanta per cento del codice integrato nel proprio software era scritto da Claude. Prima del lancio di Claude Code, all’inizio del 2025, questa quota era nell’ordine di pochi punti percentuali. Il risultato è che un ingegnere medio dell’azienda, nel secondo trimestre del 2026, integra circa otto volte più codice al giorno rispetto al 2024. L’azienda stessa avverte che le righe di codice sono una misura imperfetta, perché contano la quantità e non la qualità, ma il segnale di accelerazione resta evidente.

Ci sono poi esempi concreti che danno la misura del cambiamento. Ad aprile 2026 Claude ha prodotto oltre ottocento correzioni che hanno ridotto di mille volte una categoria di errori nelle interfacce di programmazione, un lavoro che un essere umano, secondo la stima dell’ingegnere che lo supervisionava, avrebbe richiesto circa quattro anni. Sul fronte della ricerca, in un test che chiede di ottimizzare il codice di addestramento di un piccolo modello, il salto è stato impressionante, da un miglioramento di circa tre volte ottenuto a maggio 2025 a circa cinquantadue volte ad aprile 2026. Per avere un termine di paragone, un ricercatore esperto impiega dalle quattro alle otto ore per arrivare a un fattore quattro. Sulle attività più aperte e meno definite, infine, il tasso di successo dei modelli ha raggiunto il settantasei per cento a maggio 2026, in crescita di cinquanta punti in sei mesi.

Le prove che arrivano dai benchmark pubblici

I dati interni da soli non basterebbero a convincere, ma si accompagnano a una tendenza visibile anche dall’esterno. L’organizzazione indipendente METR misura da tempo la lunghezza dei compiti che un modello riesce a portare a termine in autonomia, e ha osservato che questa durata raddoppia ogni quattro mesi circa, contro i sette mesi di una fase precedente. In termini concreti, a marzo 2024 un modello gestiva compiti software da pochi minuti, un anno dopo arrivava a un’ora e mezza, e nella primavera del 2026 a compiti da circa dodici ore.

Lo stesso schema appare sui test di programmazione e ricerca. Su SWE-bench, una prova che chiede di correggere bug reali in progetti open source, i modelli sono passati in due anni da punteggi vicini allo zero alla saturazione del test. Su CORE-bench, che verifica la capacità di riprodurre i risultati di un articolo scientifico, si è passati da circa il venti per cento di successo nel 2024 alla saturazione quindici mesi dopo. Sono proprio queste curve, tutte orientate verso l’alto e non ancora piegate, a sostenere la tesi del rapporto. Se vuoi capire meglio come funzionano i sistemi alla base di questi modelli, trovi un approfondimento dedicato ai large language model e alla loro architettura.

Perché Anthropic chiede di potersi fermare

La parte conclusiva del documento è anche la più delicata sul piano politico. Anthropic sostiene che, se fosse possibile rallentare lo sviluppo di questa tecnologia per darsi più tempo, sarebbe probabilmente una buona cosa. Ma aggiunge un avvertimento, una frenata unilaterale di un singolo laboratorio servirebbe a poco, perché lascerebbe semplicemente avanzare gli attori meno prudenti. Per questo l’azienda parla della necessità di un meccanismo di coordinamento globale, con la possibilità di rallentare o sospendere temporaneamente lo sviluppo dei modelli di frontiera, ma solo se tutti i principali laboratori, in più Paesi, accettassero di farlo in modo verificabile.

Il rapporto riconosce che si tratta di un problema complesso, perché un addestramento è molto più facile da nascondere di un missile e l’incentivo a proseguire di nascosto è enorme. L’analogia citata è quella dei trattati sul controllo degli armamenti, costruiti in decenni di lavoro e di fiducia reciproca, tempo che oggi non sembra disponibile. Anthropic scrive che l’auto-miglioramento ricorsivo, testualmente, “could come sooner than most institutions are prepared for”, cioè potrebbe arrivare prima di quanto le istituzioni siano pronte. A sostegno di questa urgenza l’azienda cita anche il progetto Glasswing, con cui nelle prime settimane un modello interno avrebbe individuato oltre diecimila vulnerabilità software gravi o critiche, al punto che il collo di bottiglia si è spostato dalla scoperta dei problemi alla loro correzione.

Che cosa cambia per te e per il settore

Al di là dei toni da scenario, ci sono ricadute molto concrete anche per chi non costruisce modelli di frontiera. La prima è che lo sviluppo software sta diventando radicalmente più veloce, e con esso il lavoro di conoscenza in generale, dalla redazione di documenti all’analisi dei dati. Anthropic descrive un mondo in cui il fare, cioè scrivere il codice o eseguire un esperimento, costa quasi nulla in tempo umano, mentre il valore si sposta verso il decidere, cioè scegliere quali problemi affrontare e di quali risultati fidarsi. È un cambiamento che riguarda da vicino chi lavora con strumenti basati su agenti AI, perché significa imparare a supervisionare e indirizzare sistemi sempre più capaci, più che eseguire ogni singolo passaggio.

Vale però la pena mantenere lo spirito critico. Lo stesso rapporto ammette che alcune metriche, come le righe di codice prodotte, tendono a sovrastimare il guadagno reale di produttività, e che le curve di crescita potrebbero rivelarsi delle parabole destinate ad appiattirsi. Non è detto che la capacità di giudizio, il vero ingrediente mancante, possa emergere semplicemente aumentando potenza di calcolo e dati. Resta il fatto che, anche nello scenario più conservativo, l’effetto netto è un’accelerazione che conviene osservare con attenzione. Se questi temi ti sono nuovi, può aiutarti partire dalle basi di che cos’è e come funziona un’intelligenza artificiale e dal funzionamento di un assistente come Claude, il modello al centro di questo rapporto.

Conclusioni

Il rapporto di Anthropic è prezioso non perché annunci l’arrivo imminente di una super intelligenza, ma perché mette numeri e contesto su una sensazione diffusa, l’AI sta già contribuendo in modo misurabile a costruire l’AI di domani. Che si tratti di una curva esponenziale o di un fenomeno che rallenterà, la direzione di marcia chiede a istituzioni, aziende e professionisti di prepararsi per tempo, sul piano tecnico e su quello delle regole. Per chi lavora ogni giorno con questi strumenti, il consiglio pratico è duplice, capire davvero come funzionano e non smettere di esercitare il proprio giudizio critico. Continua a seguire i nostri approfondimenti per restare aggiornato su come l’intelligenza artificiale sta cambiando il modo in cui lavoriamo, e raccontaci nei commenti come la stai già usando nel tuo settore.

Intelligenza Artificiale Tutto su AI e machine learning

Anthropic e l’AI che costruisce se stessa: cos’è l’auto-miglioramento ricorsivo

Che cosa significa auto-miglioramento ricorsivo

La differenza tra ingegneria e ricerca

I numeri che arrivano da dentro Anthropic

Le prove che arrivano dai benchmark pubblici

Perché Anthropic chiede di potersi fermare

Che cosa cambia per te e per il settore

Conclusioni

Articoli correlati

Anthropic e l’AI che costruisce se stessa: cos’è l’auto-miglioramento ricorsivo

Che cosa significa auto-miglioramento ricorsivo

La differenza tra ingegneria e ricerca

I numeri che arrivano da dentro Anthropic

Le prove che arrivano dai benchmark pubblici

Perché Anthropic chiede di potersi fermare

Che cosa cambia per te e per il settore

Conclusioni

Articoli correlati

L’AI a un bivio ambientale: il rapporto ONU rivela i costi nascosti dei data center

Anthropic e Gates Foundation: 200 milioni di dollari per portare l’AI nella sanità globale