L’azienda che ha costruito Claude, uno dei modelli di intelligenza artificiale più usati al mondo, ha lanciato giovedì 4 giugno un monito destinato a far discutere l’intero settore: l’AI si sta avvicinando al punto in cui potrebbe migliorarsi da sola, senza intervento umano, e il mondo non è pronto per questo scenario. Nel post intitolato When AI builds itself, pubblicato sul blog dell’Anthropic Institute, la responsabile della ricerca interna Marina Favaro e il responsabile delle politiche Jack Clark chiedono ai laboratori di frontiera di considerare una pausa coordinata nello sviluppo dei modelli più avanzati. Non un blocco unilaterale, precisano, ma un meccanismo internazionale condiviso. Anthropic stessa, scrivono, smetterebbe di sviluppare se i competitor facessero lo stesso in modo verificabile.
Il dato che ha spinto Anthropic a pubblicare questo documento
Il tono di allarme non nasce dall’astratto: nasce dai numeri interni di Anthropic. Secondo il documento, a maggio 2026 oltre l’80 per cento del codice integrato nel codebase di Anthropic è stato scritto da Claude, rispetto a percentuali a singola cifra di febbraio 2025, quando è stato lanciato Claude Code. Gli ingegneri dell’azienda producono in media otto volte più codice per trimestre rispetto al periodo 2021-2025. Ad aprile 2026, Claude ha completato autonomamente oltre 800 fix che hanno ridotto una classe di errori API di un fattore mille: un lavoro che un ingegnere umano, secondo la stima interna, avrebbe impiegato quattro anni.
Il fenomeno non è limitato ad Anthropic. GitHub registrava circa 275 milioni di commit di codice a settimana a metà 2026, un ritmo che proietta circa 14 miliardi di commit sull’intero anno. L’AI non sta solo supportando gli sviluppatori: sta diventando il principale autore del software che fa funzionare l’AI stessa. “Il settore ha un acceleratore, ma non ha un freno”, ha dichiarato Jack Clark in un’intervista a BBC Newsnight.
Cos’è il recursive self-improvement e perché preoccupa
Il termine chiave del documento è recursive self-improvement: la capacità di un sistema AI di progettare e sviluppare in autonomia il proprio successore, senza supervisione umana significativa. Non è fantascienza: è una progressione logica di quello che già sta accadendo. Oggi gli ingegneri umani usano Claude per scrivere il codice di Claude. Il passo successivo, che Favaro e Clark descrivono come credibile entro due anni, è che Claude scriva il codice del prossimo Claude senza che nessun ingegnere umano sia nel loop.
Anthropic precisa che questo scenario non è ancora avvenuto e non è inevitabile. Ma l’argomento del documento è che la velocità di avanzamento è tale che, se succede, coglierà tutti impreparati: governi, istituzioni di governance internazionale, e la stessa ricerca sull’allineamento AI. “Riteniamo che sarebbe positivo per il mondo avere la possibilità di rallentare o sospendere temporaneamente lo sviluppo dell’AI di frontiera, per permettere alle strutture sociali e alla ricerca sull’allineamento di tenere il passo con l’avanzamento tecnologico”, scrivono gli autori.
Per chi vuole capire le basi tecniche di questo scenario, la nostra guida sull’allineamento AI spiega nel dettaglio perché controllare i sistemi AI man mano che diventano più capaci è uno dei problemi aperti più difficili del settore.
La proposta concreta: una pausa coordinata, non unilaterale
Anthropic non propone di fermarsi da sola. Il documento è esplicito: una pausa unilaterale da parte di un singolo laboratorio non farebbe che spostare il vantaggio competitivo ai competitor, peggiorando la situazione complessiva senza produrre alcun beneficio in termini di sicurezza. La proposta è un meccanismo di coordinamento multilaterale, paragonato dagli autori ai trattati di non proliferazione nucleare della Guerra Fredda, con tre condizioni necessarie: che più laboratori ben finanziati, in più paesi, si accordino sulle stesse condizioni di pausa; che esista un sistema di verifica credibile (audit, tracciamento della provenienza del codice, attestazione dell’uso di infrastruttura computazionale); e che le condizioni di uscita dalla pausa siano definite in anticipo.
Gli autori ammettono che nascondere un training run di AI è significativamente più facile che nascondere un silo missilistico, e che la cooperazione con la Cina, che non ha mostrato interesse ad aderire a meccanismi simili, renderebbe qualsiasi accordo fragile. Nonostante questi limiti, Anthropic Institute dice che inizierà a lavorare con policy maker e ricercatori per costruire le fondamenta verificative che un accordo di questo tipo richiederebbe.
Il contesto: Anthropic a un bivio commerciale
Il documento arriva in un momento insolito per Anthropic. La settimana precedente, l’azienda aveva annunciato un round di finanziamento da 65 miliardi di dollari che ha portato la valutazione vicino ai mille miliardi, e lunedì 1 giugno aveva depositato in forma riservata il prospetto S-1 per la quotazione in borsa prevista nei prossimi mesi. In questo contesto, il timing della pubblicazione non è passato inosservato agli osservatori del settore.
La coincidenza tra il picco di valore commerciale di Anthropic e il suo appello alla decelerazione dell’industria ha alimentato le critiche di chi accusa l’azienda di perseguire una strategia di regulatory capture: usare la narrativa della sicurezza per rallentare la concorrenza, in particolare i modelli open source che Anthropic non produce. David Sacks, venture capitalist vicino all’amministrazione Trump, aveva già in precedenza accusato Anthropic di “promuovere un’agenda di cattura regolatoria” volta a favorire regolamentazioni che penalizzerebbero i modelli a basso costo a vantaggio di quelli proprietari. Il documento di giovedì ha riaperto questo dibattito con forza.
Le reazioni del settore
Le prime reazioni nel mondo dell’AI sono polarizzate. Sul fronte di chi prende il monito sul serio, molti ricercatori di sicurezza AI indipendenti hanno acccolto il documento come un contributo raro di trasparenza da parte di un laboratorio di frontiera: pubblicare dati interni sull’automazione del proprio processo di sviluppo è un atto insolito nel settore, caratterizzato da riserbo quasi totale sulle pipeline interne. Il fatto che Anthropic abbia mostrato i numeri, invece di limitarsi all’allarme astratto, ha dato al documento più credibilità di un normale comunicato di sicurezza.
Sul fronte critico, oltre al tema della regulatory capture, alcuni osservatori sottolineano che la stessa Anthropic sta accelerando il proprio sviluppo mentre chiede agli altri di rallentare: Claude Opus 4.8 è stato appena rilasciato, Claude Code è in piena espansione e l’azienda ha dichiarato piani di potenziamento aggressivi dell’infrastruttura. La coerenza tra l’appello alla decelerazione e la traiettoria aziendale è una domanda a cui Anthropic dovrà rispondere nelle prossime settimane.
Il tema si inserisce nel dibattito più ampio sulla superintelligenza artificiale e sui rischi esistenziali di lungo periodo che i ricercatori di AI safety discutono da anni ma che raramente trovano spazio nei comunicati ufficiali delle grandi aziende.
Conclusioni
Il documento di Anthropic è la prima volta che uno dei laboratori di frontiera più capitalizzati del settore pubblica dati concreti sul grado di automazione del proprio processo di sviluppo e chiede esplicitamente meccanismi di rallentamento coordinato. Che si tratti di un contributo genuino al dibattito sulla sicurezza AI o di una mossa strategica nel panorama competitivo, le sue implicazioni sono reali: mette sul tavolo il tema del recursive self-improvement in un momento in cui i dati interni di Anthropic mostrano che la transizione verso un’AI che sviluppa AI è già in corso, non nei laboratori del futuro ma nei server di Anthropic oggi. Il documento completo è disponibile su anthropic.com/institute/recursive-self-improvement.
Intelligenza Artificiale Tutto su AI e machine learning