Rappresentazione astratta di intelligenza artificiale e tecnologia

DeepSeek V4: cosa sappiamo del nuovo modello AI cinese in arrivo

Il laboratorio cinese DeepSeek si prepara a rilasciare la versione ufficiale di DeepSeek V4, il suo nuovo modello di punta, dopo l’anteprima arrivata sulle API a fine aprile 2026. Il debutto della versione stabile è atteso nella seconda metà di luglio e porta con sé non solo un salto di capacità, ma anche una revisione dei prezzi e la dismissione dei modelli precedenti. Per chi segue da vicino la corsa all’intelligenza artificiale è una notizia rilevante, perché DeepSeek è diventato il simbolo di un approccio diverso rispetto ai grandi laboratori statunitensi: modelli molto capaci, spesso a pesi aperti e con costi aggressivi, capaci di ridurre la distanza dai sistemi di frontiera. Vediamo cosa sappiamo, cosa cambia e perché conta anche se non sei uno sviluppatore.

Che cosa è DeepSeek V4 e cosa lo rende diverso

DeepSeek V4 è la quarta generazione della famiglia di modelli del laboratorio di Hangzhou. La linea si articola in due varianti pensate per esigenze diverse. Da un lato c’è una versione di punta, orientata ai compiti più complessi di ragionamento, scrittura di codice e pianificazione. Dall’altro una versione più leggera e rapida, pensata per volumi elevati e per applicazioni dove contano velocità e costo per singola richiesta. È la stessa logica di segmentazione che ormai adottano quasi tutti i grandi fornitori, perché non tutti i compiti richiedono la stessa potenza e far girare il modello più grande per ogni operazione sarebbe uno spreco.

Il tratto tecnico più interessante è l’architettura a esperti, la cosiddetta mixture of experts. Invece di attivare l’intera rete neurale a ogni richiesta, un modello di questo tipo accende solo una frazione dei suoi parametri, quelli più adatti al compito specifico. Il risultato è che il modello può avere un numero enorme di parametri complessivi, ma ne usa attivamente solo una porzione per ogni risposta, tenendo sotto controllo i costi di calcolo. Secondo le informazioni diffuse sull’anteprima, la versione di punta conterrebbe un numero di parametri nell’ordine di migliaia di miliardi complessivi con solo alcune decine di miliardi attivi per richiesta, mentre la variante rapida lavorerebbe su numeri più contenuti. Se questi concetti ti sono nuovi, l’architettura di base che ha reso possibili questi sistemi è quella descritta nella nostra guida su cosa sono i transformer e come funzionano.

Finestra di contesto ampia e pesi aperti

Un secondo elemento che DeepSeek ha sottolineato è la finestra di contesto molto estesa, indicata attorno al milione di token per entrambe le varianti. Una finestra di contesto è la quantità di testo che il modello riesce a tenere in memoria durante una singola conversazione o analisi. Con uno spazio così ampio diventa possibile dare in pasto al modello interi documenti, basi di codice o raccolte di ricerca senza doverli spezzettare, un vantaggio pratico enorme per chi lavora con materiali lunghi. È lo stesso terreno su cui competono i modelli occidentali più recenti, dalla famiglia di Google alla proposta di OpenAI, segno che il contesto lungo è ormai un requisito e non più una funzione di nicchia.

C’è poi la filosofia dei pesi aperti, storicamente il marchio di fabbrica di DeepSeek. Rilasciare un modello con pesi accessibili significa permettere a ricercatori, aziende e sviluppatori di scaricarlo, studiarlo, adattarlo ai propri dati ed eseguirlo sulla propria infrastruttura. È una strada opposta a quella dei modelli completamente chiusi e ricorda l’approccio che ha reso popolare la linea open source di Meta con Llama. Per molte organizzazioni la possibilità di controllare dove risiedono i dati e di non dipendere da un unico fornitore vale quanto la pura potenza del modello.

Prezzi a fasce orarie e addio ai modelli vecchi

La transizione verso la versione ufficiale porta due cambiamenti concreti che conviene conoscere. Il primo riguarda il listino. DeepSeek introduce un sistema di prezzi a fasce orarie, con tariffe delle API che raddoppiano durante alcune finestre lavorative definite sul fuso di Pechino, indicate nella mattina e nel primo pomeriggio, mentre restano più basse nelle ore fuori punta. È un meccanismo simile a quello dell’energia elettrica, dove il costo varia in base alla domanda, e serve a garantire stabilità del servizio nei momenti di maggior carico. Per chi sviluppa applicazioni significa che pianificare i lavori pesanti nelle ore meno affollate può ridurre sensibilmente la spesa.

Il secondo cambiamento è la dismissione dei modelli precedenti. Le versioni storiche note come deepseek-chat e deepseek-reasoner verranno ritirate e non saranno più raggiungibili dopo il 24 luglio 2026. Chi ha costruito prodotti su quelle interfacce dovrà quindi migrare verso V4 entro quella data. È una scelta comune quando si consolida una nuova generazione, ma va gestita per tempo per evitare interruzioni di servizio. Il consiglio pratico, se ti appoggi a questi modelli, è provare quanto prima la nuova versione e verificare che i tuoi flussi continuino a funzionare come previsto.

Perché questa notizia conta nella corsa globale all’AI

Al di là dei numeri, il rilascio di DeepSeek V4 ha un valore strategico. Nell’ultimo anno il laboratorio cinese ha dimostrato che è possibile avvicinarsi ai modelli di frontiera con budget più contenuti e con un modello di distribuzione aperto, mettendo pressione sui prezzi di tutto il settore. Ogni volta che un modello capace arriva a costi bassi, l’intero mercato è costretto a rivedere le proprie tariffe e le proprie strategie. È una dinamica che avvantaggia gli utenti finali, perché rende l’accesso all’intelligenza artificiale più economico, ma che alimenta anche una competizione geopolitica sempre più marcata tra Stati Uniti e Cina sul controllo di questa tecnologia.

Il confronto è utile anche per capire dove si sta spostando l’asticella. Mentre OpenAI ha da poco mostrato la sua nuova generazione di modelli in anteprima e Google ha delineato il suo modello più potente e i tempi di arrivo, DeepSeek risponde puntando su efficienza, contesto lungo e apertura. Non è detto che vinca chi ha il punteggio più alto in un singolo benchmark: spesso, per chi deve costruire un prodotto reale, contano di più il rapporto tra qualità e prezzo, la libertà di personalizzazione e la prevedibilità dei costi. Su tutti questi fronti DeepSeek gioca una partita seria.

Cosa cambia per te, anche se non scrivi codice

Potresti pensare che un annuncio del genere riguardi solo sviluppatori e grandi aziende, ma le sue conseguenze arrivano più lontano. Quando un modello capace diventa disponibile a costi bassi e con pesi aperti si moltiplicano gli strumenti costruiti sopra di esso, dagli assistenti alle applicazioni di scrittura, dai servizi di analisi dei dati ai chatbot specializzati. Molti dei prodotti che userai nei prossimi mesi, magari senza sapere quale modello hanno sotto il cofano, potrebbero appoggiarsi proprio a sistemi come DeepSeek V4. Una maggiore concorrenza tra modelli si traduce quasi sempre in più scelta e prezzi più bassi per chi usa questi servizi ogni giorno.

C’è però anche un aspetto di consapevolezza da coltivare. Un modello sviluppato in un contesto normativo diverso solleva domande legittime su dove finiscono i dati che gli affidi e su come vengono trattati. La regola pratica vale per qualsiasi servizio di intelligenza artificiale, non solo per DeepSeek: evita di inserire informazioni sensibili o riservate in strumenti di cui non conosci le politiche sulla privacy, e privilegia soluzioni che ti spiegano con chiarezza come gestiscono i tuoi contenuti. La potenza di un modello non ti esime dal valutare quanta fiducia riporre in chi lo mette a disposizione.

Conclusioni

DeepSeek V4 conferma che la frontiera dell’intelligenza artificiale non è più un affare esclusivo di pochi laboratori occidentali. Un modello a esperti con finestra di contesto molto ampia, distribuito con pesi aperti e prezzi aggressivi, cambia le regole del gioco per sviluppatori e aziende, e obbliga i concorrenti a rispondere. Restano da verificare sul campo le prestazioni della versione ufficiale, che valuteremo quando saranno disponibili dati indipendenti, ma la direzione è chiara. Se lavori con questi strumenti, ti conviene testare per tempo la nuova versione, capire l’impatto dei prezzi a fasce orarie e pianificare la migrazione dai modelli in dismissione. Puoi consultare i dettagli tecnici e le tariffe nella documentazione ufficiale di DeepSeek e continuare a seguirci per gli aggiornamenti sui prossimi modelli in arrivo.

Suggerimento di lettura

Microchip su circuito stampato - chip neuromorfico MIT per AI

Il MIT sviluppa un chip neuromorfico che fa girare LLM da 70 miliardi di parametri a basso consumo

Ricercatori del MIT hanno sviluppato un chip neuromorfico che riduce dell'80% il consumo energetico per l'inferenza di LLM rispetto alle GPU tradizionali.