Per anni l’intelligenza artificiale ha promesso di accelerare la scienza, ma quasi sempre rimanendo sulla carta, tra simulazioni e suggerimenti teorici. Il 17 giugno 2026 OpenAI ha pubblicato un risultato che sposta l’asticella nel mondo fisico, dove le idee devono fare i conti con molecole vere, strumenti e rumore sperimentale. Insieme alla startup Molecule.one, OpenAI ha collegato il modello GPT-5.4 a un laboratorio automatizzato e gli ha affidato un obiettivo aperto, migliorare una reazione chimica difficile e utile per la sintesi dei farmaci. Il sistema ha generato l’ipotesi, progettato gli esperimenti, analizzato i dati e proposto i passi successivi, arrivando a un miglioramento concreto che chimici umani hanno poi verificato al banco. È uno dei primi casi documentati in cui un modello di frontiera agisce come un ricercatore quasi autonomo in un vero flusso di lavoro di chimica di laboratorio, e merita di essere capito a fondo.
Cosa hanno fatto OpenAI e Molecule.one
Il cuore dell’esperimento è la combinazione di due intelligenze diverse. Da una parte GPT-5.4, il modello di OpenAI usato per ragionare, leggere la letteratura scientifica e proporre idee. Dall’altra Maria, l’AI per la chimica sviluppata da Molecule.one, integrata con un laboratorio ad altissima produttività capace di eseguire reazioni su scala di microlitri, cioè con quantità minuscole di sostanze. A questo sistema combinato i ricercatori hanno dato una consegna volutamente generica, migliorare una tra diverse classi di reazioni importanti per la chimica farmaceutica, senza indicare la strada.
Partendo da quell’obiettivo, il modello ha individuato da solo un bersaglio interessante, una versione particolarmente ostica della reazione nota come accoppiamento di Chan-Lam. È una reazione, catalizzata dal rame, che serve a formare legami tra atomi di carbonio e azoto, legami diffusissimi nelle molecole dei medicinali. Una sua variante, quella che coinvolge i sulfonammidi primari, ha storicamente reso poco, producendo basse rese e limitando di fatto la possibilità di usarla nella ricerca farmaceutica. GPT-5.4 ha proposto un’idea sorprendente per superare il problema, usare ossidanti blandi, in particolare il composto noto come TEMPO, per spingere la reazione verso risultati migliori.
Come ha lavorato il sistema
Il flusso di lavoro è stato pensato a strati. Con prompt scritti dagli scienziati, GPT-5.4 ha generato e ordinato per priorità migliaia di possibili proposte di ricerca. I chimici umani hanno esaminato il piccolo gruppo di proposte meglio classificate e ne hanno scelte quattro da portare in laboratorio. A quel punto Maria ha tradotto i piani di alto livello in istruzioni operative dettagliate, ha eseguito migliaia di esperimenti ad alta produttività, ha analizzato i dati grezzi e li ha restituiti al modello, che ha potuto così proporre un secondo ciclo di esperimenti più mirati. È un dialogo continuo tra chi formula ipotesi e chi le mette alla prova, un po’ come accade in un vero gruppo di ricerca.
I tempi raccontano bene la natura del progetto. Tutto è durato tre mesi, dal primo prompt all’inizio di marzo fino alla condivisione dei risultati con esperti indipendenti all’inizio di giugno. Conviene sottolineare un punto che gli stessi autori mettono in chiaro, il sistema è quasi autonomo, non del tutto. Gli esseri umani hanno mantenuto il controllo nelle decisioni chiave, hanno corretto alcuni dettagli sperimentali, per esempio scegliendo di evitare un solvente che avrebbe potuto reagire con gli ossidanti più aggressivi, hanno preparato i materiali di laboratorio e hanno ripetuto a mano gli esperimenti più importanti. La macchina ha proposto le idee migliori, le persone hanno fornito giudizio, supervisione e validazione. Questa logica di collaborazione ricorda da vicino il modo in cui funzionano gli agenti AI autonomi, sistemi capaci di pianificare ed eseguire compiti complessi sotto controllo umano.
I numeri del risultato
La proposta vincente, identificata con la sigla OAI-M1-03, ha indicato il TEMPO come additivo utile per l’accoppiamento di Chan-Lam dei sulfonammidi primari. Sotto le condizioni ottimizzate la reazione è migliorata su due fronti, la resa media è salita e un numero maggiore di combinazioni di reagenti ha raggiunto livelli di resa praticamente utili. In termini concreti, le rese sono migliorate per l’88 per cento degli acidi boronici e per l’83 per cento dei sulfonammidi testati. La resa media è passata dal 16,6 al 25,2 per cento, mentre la quota di reazioni capaci di superare il 30 per cento di resa è cresciuta dal 15,6 al 37,5 per cento.
A dare peso a questi numeri è la scala su cui sono stati ottenuti. Nei due cicli di sperimentazione il laboratorio ha eseguito in totale 10.080 reazioni, più di quante un chimico che ne facesse tre al giorno completerebbe in un decennio. È una mole che conta, perché in chimica un risultato può sembrare promettente su pochi esempi e poi crollare quando lo si prova su una gamma più ampia di molecole. Avere migliaia di prove ha permesso di scegliere il TEMPO tra dieci ossidanti diversi, di vedere l’effetto ripetersi su combinazioni varie e anche di individuarne i limiti. In un secondo giro di esperimenti il sistema ha pure scoperto che il TEMPO può essere sostituito da un suo analogo molto più economico senza perdere quasi nulla in prestazioni, un dettaglio prezioso per chi pensa all’applicazione pratica.
Il passaggio più importante per la credibilità scientifica è arrivato dopo. I chimici hanno riprodotto a mano alcune reazioni rappresentative su scala da banco, cioè con le quantità e gli strumenti che si usano davvero in un laboratorio di ricerca, e hanno osservato un aumento della resa in 11 casi su 14, con un miglioramento superiore al doppio nella maggior parte di essi. Questa replica conta, perché gli esperimenti su scala minuscola possono talvolta introdurre effetti che svaniscono quando si passa a dimensioni maggiori. Il preprint che descrive il lavoro è stato inoltre esaminato da quattro esperti esterni di chimica, che ne hanno sostenuto la novità e l’interesse.
Perché è importante per la ricerca sui farmaci
Per capire l’entusiasmo serve un passo indietro. La chimica organica è alla base di tutti i farmaci a piccola molecola, ma anche di prodotti in agricoltura, elettronica e scienza dei materiali. Una reazione è utile quando produce lo stesso tipo di legame in modo affidabile su molte molecole diverse. Quando invece rende poco o genera troppi sottoprodotti, i ricercatori sono spesso costretti ad abbandonare molecole promettenti o a perdere tempo per trovare una via alternativa. La sintesi diventa così un collo di bottiglia, perché gli scienziati possono testare soltanto le molecole che riescono a produrre.
Qui sta il valore della scoperta. Il gruppo dei sulfonammidi compare in medicinali di moltissimi ambiti terapeutici, dagli antitumorali agli antimicrobici fino ai diuretici, eppure proprio l’accoppiamento di questi composti con gli acidi boronici dava finora risultati scarsi. Rendere più affidabile questa reazione significa offrire ai chimici farmaceutici un modo più ampio e pratico di costruire ed esplorare molecole potenzialmente utili. Non è la scoperta di un nuovo farmaco, è qualcosa di più sottile e forse più duraturo, un miglioramento dello strumento con cui i farmaci si costruiscono. Si inserisce in una tendenza più ampia, quella in cui l’intelligenza artificiale accelera la ricerca scientifica, come già si vede nella biologia molecolare con sistemi come AlphaFold.
I limiti e l’attenzione alla sicurezza
Va detto con chiarezza cosa questo risultato non dimostra. Non prova che l’AI possa condurre un programma di ricerca chimica dall’inizio alla fine senza l’uomo. Il giudizio umano è rimasto essenziale e il lavoro ha richiesto infrastrutture specializzate. Non garantisce nemmeno che il metodo funzioni con altre reazioni, altre classi di molecole o in condizioni di produzione industriale. Le stime di resa vengono da una piattaforma ad alta produttività e la validazione al banco ha riguardato 14 coppie di reagenti rappresentative, quindi servirà altro lavoro per capire il meccanismo, definire i limiti e far replicare il risultato da laboratori indipendenti.
C’è poi il tema, delicato, della sicurezza. Le capacità chimiche di un modello vanno trattate con prudenza, perché gli stessi strumenti che aiutano la medicina potrebbero in teoria essere usati male. OpenAI ha spiegato di aver volutamente circoscritto il progetto a un problema legittimo di chimica farmaceutica, escludendo tossine, armi chimiche e qualunque richiesta di progettare composti dannosi. Il lavoro è stato condotto all’interno del quadro di sicurezza dell’azienda, il modello aveva già superato valutazioni specifiche con un istituto pubblico dedicato alla sicurezza dell’AI, e i chimici umani hanno mantenuto in ogni momento il controllo fisico del laboratorio. È un approccio che indica una strada, scegliere problemi di chiaro valore scientifico, affiancare le tutele del modello alla supervisione esperta e valutare il sistema attraverso esperimenti fisici controllati.
Conclusioni
Il risultato ottenuto da OpenAI e Molecule.one è un esempio precoce ma concreto di come l’intelligenza artificiale possa diventare un partner della scienza dentro il laboratorio, non solo davanti a uno schermo. Un modello ha letto la letteratura, proposto un’idea inattesa, contribuito a progettare e interpretare esperimenti e raggiunto una scoperta che i chimici hanno potuto valutare e riprodurre. Se la tendenza si confermerà, la parte più lenta della ricerca, cioè provare fisicamente le ipotesi, potrebbe accelerare molto, con ricadute sulla medicina e oltre. Puoi leggere l’annuncio originale direttamente sul blog di OpenAI. Continua a seguire il nostro spazio dedicato a ricerca e innovazione per capire, con occhio critico e senza facili entusiasmi, dove sta andando davvero l’AI applicata alla scienza.
Intelligenza Artificiale Tutto su AI e machine learning