Per anni la parte difficile della cybersecurity è stata trovare le vulnerabilità nascoste dentro milioni di righe di codice. Oggi quel collo di bottiglia si è spostato, e a spostarlo è stata proprio l’intelligenza artificiale. Il 22 giugno 2026 OpenAI ha annunciato un’espansione importante di Daybreak, il suo programma dedicato alla sicurezza informatica, presentando nuovi strumenti, la versione completa del modello GPT-5.5-Cyber e un’iniziativa per mettere in sicurezza il software open source. Il messaggio di fondo è chiaro: i modelli ora trovano falle più velocemente di quanto i team riescano a correggerle, e la nuova sfida non è più scoprire i problemi ma chiuderli prima che lo facciano gli attaccanti.
Cos’è Daybreak e perché segna un cambio di paradigma
Daybreak è il contenitore con cui OpenAI riunisce le sue capacità offensive e difensive applicate alla sicurezza: i modelli di frontiera addestrati sul codice, il sistema di accesso controllato chiamato Trusted Access for Cyber, i flussi di lavoro di Codex Security e una rete di partner dell’ecosistema. L’obiettivo dichiarato è democratizzare la possibilità di correggere il software vulnerabile alla velocità della macchina, mettendo questi strumenti nelle mani dei difensori invece di lasciarli concentrati in poche aziende.
Il punto interessante è il ragionamento che c’è dietro. Storicamente, individuare una vulnerabilità seria richiedeva competenze rare, tempo e una profonda familiarità con sistemi complessi. I modelli linguistici hanno cambiato questa fisica: oggi un agente può navigare grandi basi di codice, ricostruire i possibili percorsi di attacco, validare ipotesi e far emergere problemi che altrimenti resterebbero invisibili. Il risultato è che i team di sicurezza si trovano sommersi non più dalla difficoltà di trovare i bug, ma dalla mole di segnalazioni da gestire. Una vulnerabilità segnalata, da sola, non protegge nessuno: il valore arriva quando il problema viene validato, se ne capisce l’impatto, si sviluppa e si testa una patch, si coordina la divulgazione e si aiuta il team a installare la correzione.
Dal trovare le falle al correggerle
È esattamente su questa seconda metà del percorso che Daybreak vuole intervenire. Se l’AI ha reso quasi banale la scoperta, il vero salto di qualità sta nell’automatizzare la riparazione end to end, cioè dall’individuazione del difetto fino alla generazione e verifica della patch. Questa logica si lega bene a quanto avevamo già raccontato parlando di come l’intelligenza artificiale protegge le aziende dagli attacchi informatici: la difesa non è più solo una questione di rilevamento, ma di velocità di reazione e di capacità di rimediare su larga scala.
GPT-5.5-Cyber e Codex Security: i numeri dietro l’annuncio
Il cuore tecnico dell’annuncio è duplice. Da un lato c’è l’aggiornamento di Codex Security, il plugin che integra le capacità di sicurezza direttamente nell’ambiente di sviluppo. Dall’altro arriva la versione completa di GPT-5.5-Cyber, un modello pensato per il lavoro di cybersecurity autorizzato, più capace e al tempo stesso meno incline a rifiutare richieste legittime che in passato venivano bloccate per eccesso di prudenza.
Sul piano delle prestazioni i dati raccontano un progresso concreto. GPT-5.5-Cyber raggiunge l’85,6% su CyberGym, il benchmark che misura la capacità di un agente di riprodurre vulnerabilità note, contro l’81,8% di GPT-5.5: è il punteggio più alto mai registrato da OpenAI con un singolo modello su questo test. I miglioramenti si vedono anche su prove più dure, come ExploitGym, dove il modello passa dal 25,95% al 39,5% nel trasformare vulnerabilità note in exploit funzionanti, e SEC-bench Pro, dove sale al 69,8% rispetto al 63,1% del modello base. Il modello, peraltro, eredita l’intelligenza generale e la capacità di lavorare su compiti lunghi e complessi che caratterizza l’intera famiglia nata con il passaggio a GPT-5.5.
Ancora più eloquenti sono i numeri d’uso reale di Codex Security. Da quando è stato lanciato in anteprima di ricerca a marzo, il sistema ha analizzato oltre 30 milioni di commit distribuiti su più di 30.000 basi di codice. I revisori umani hanno marcato manualmente come risolte più di 70.000 segnalazioni, mentre oltre 500.000 problemi sono stati determinati come corretti in automatico. La filosofia resta quella di affiancare a ogni sviluppatore l’equivalente di un ingegnere della sicurezza: il sistema comprende il codice del team e il suo modello di minaccia, identifica le vulnerabilità plausibili, verifica se il codice difettoso è effettivamente raggiungibile, raccoglie le prove, sviluppa una patch mirata e ne verifica il risultato. La decisione su quali segnalazioni investigare e quali modifiche applicare resta però sempre in mano alle persone.
Patch the Planet e la sfida dell’open source
La parte forse più significativa per il lungo periodo è Patch the Planet, l’iniziativa nata insieme a Trail of Bits e con la collaborazione di HackerOne, pensata per aiutare i manutentori del software libero a passare dalle segnalazioni alle correzioni. Il software open source alimenta prodotti, servizi pubblici, strumenti per sviluppatori e infrastrutture critiche in ogni settore, eppure molti di questi progetti sono sostenuti da team minuscoli. OpenAI cita una ricerca della Linux Foundation e di Harvard secondo cui, nel 94% dei progetti più usati analizzati, meno di dieci sviluppatori sono responsabili di oltre il 90% del codice aggiunto in un anno.
Il rischio, paradossalmente, è che l’AI peggiori la situazione: trovando più vulnerabilità più in fretta, rischia di scaricare sui manutentori una valanga di report, molti dei quali falsi positivi. Per questo Patch the Planet ruota attorno alla revisione esperta condotta da persone. Ricercatori di sicurezza retribuiti, equipaggiati con Codex Security e i modelli avanzati di OpenAI, lavorano fianco a fianco con i manutentori, validano e deduplicano sia le vulnerabilità sia le patch prima che arrivino ai team di progetto, e rispettano le priorità e i processi di divulgazione già esistenti. Tra i primi progetti coinvolti, più di trenta in totale, ci sono nomi fondamentali dell’ecosistema come cURL, Go, Python, Sigstore e pyca/cryptography, che ricevono anche accesso a ChatGPT Pro e crediti API. Questo tipo di lavoro collaborativo ricorda da vicino l’approccio che avevamo descritto raccontando come un anno di minacce informatiche potenziate dall’AI stia ridisegnando le regole della difesa.
Cosa cambia concretamente per le aziende e per chi sviluppa
Se lavori nella sicurezza o gestisci infrastrutture, l’annuncio ha alcune implicazioni pratiche. La prima è la natura dichiaratamente duale di questi strumenti: la stessa capacità che aiuta a difendere può aiutare ad attaccare, e OpenAI lo riconosce adottando un approccio iterativo e basato sulle prove, che accelera i difensori e al tempo stesso rallenta gli abusi. GPT-5.5-Cyber, ad esempio, non è disponibile a chiunque ma resta riservato a difensori verificati, con controlli, monitoraggio e revisione più stringenti. Per la maggior parte delle organizzazioni il punto di partenza consigliato è la combinazione tra GPT-5.5 con Trusted Access for Cyber e Codex Security.
La seconda implicazione riguarda l’ecosistema. Con il nuovo Daybreak Cyber Partner Program, fornitori di software e servizi di sicurezza possono integrare i modelli nei propri prodotti, portando le capacità difensive ai clienti finali senza dare a tutti accesso diretto al modello. L’elenco dei partner iniziali comprende realtà molto note del settore, da Cloudflare a CrowdStrike, da Cisco a Palo Alto Networks, da IBM a Wiz e Zscaler. In parallelo OpenAI sta stringendo accordi di Trusted Access for Cyber con governi e istituzioni: nel solo mese precedente all’annuncio sono state avviate collaborazioni con Australia, Canada, Francia, Germania, Giappone, Corea del Sud ed enti europei come ENISA, oltre a una partnership consolidata con il governo del Regno Unito. C’è anche un dialogo continuo con il governo statunitense sull’attuazione del recente ordine esecutivo in materia di AI e sicurezza. Per chi adotta agenti autonomi in contesti sensibili, il tema della governance resta centrale, come avevamo evidenziato nella guida dei Five Eyes per adottare gli agenti AI senza rischi.
La terza implicazione è culturale. Per la prima volta una capacità difensiva di frontiera viene presentata non come prodotto chiuso, ma come bene da distribuire il più possibile, perché il software tocca ogni aspetto della vita, dalle infrastrutture critiche alle applicazioni aziendali fino alle reti governative. Se gli attaccanti possono già usare l’AI per trovare i difetti, l’idea è che i difensori debbano avere lo stesso vantaggio, e possibilmente arrivarci prima.
Conclusioni
Daybreak racconta bene il momento che stiamo attraversando: l’intelligenza artificiale non si limita più a segnalare i problemi di sicurezza, ma comincia a risolverli in modo strutturato, con la persona che resta al comando delle decisioni. I numeri di Codex Security e i progressi di GPT-5.5-Cyber mostrano che la riparazione automatica su larga scala non è più una promessa teorica, mentre Patch the Planet prova a non lasciare indietro l’open source, l’ossatura invisibile su cui poggia gran parte del software che usi ogni giorno. La direzione, però, va seguita con attenzione, perché strumenti tanto potenti richiedono regole, monitoraggio e un’idea chiara di chi può accedervi. Se ti occupi di sicurezza, sviluppo o gestione di sistemi, è il momento di capire come questi strumenti possano entrare nei tuoi flussi di lavoro. Puoi approfondire i dettagli leggendo l’annuncio ufficiale di OpenAI e continuare a seguirci per restare aggiornato su come l’AI sta cambiando la cybersecurity.
Intelligenza Artificiale Tutto su AI e machine learning