Avrai di certo captato nell’aria innumerevoli citazioni, articoli, dibattiti e approfondimenti circa l’esplosione sul mercato globale della nuovissima intelligenza artificiale cinese. Se così non fosse, ci pensiamo noi di Eufemia a darti una breve ma funzionale infarinata al riguardo. Stiamo parlando, come forse avrai già capito, di DeepSeek.
E stiamo parallelamente parlando, per forza di cose, di un inatteso e gargantuesco successo, in grado di scuotere Wall Street, esperti e, soprattutto, l’ex primatista di settore ChatGPT.
Il programma ha rapidamente conquistato il primo posto tra le app più scaricate sull’Apple Store. Rilasciato solo il 20 gennaio, il software ha a dir poco impressionato esperti e investitori, provocando una potente onda a catena sui mercati tecnologici e suscitando reazioni politiche su più versanti, inclusa una dichiarazione del presidente statunitense Donald Trump che ha definito l’evento un “campanello d’allarme” per le aziende americane.
Ma perché tanto clamore, potresti domandarti. Devi sapere che DeepSeek si distingue per essere stato sviluppato a un costo nettamente inferiore rispetto ai modelli leader del settore, come i già citati amici di OpenAI, grazie (ad esempio) all’uso di chip meno costosi. Questo approccio ha portato il colosso dei semiconduttori Nvidia a perdere quasi 600 miliardi di dollari di valore di mercato, segnando la più grande perdita giornaliera nella storia degli Stati Uniti!

Insomma, un’app che è già un trend, come dimostrano le centinaia di video TikTok e Instagram prodotti al riguardo in tutte le lingue possibili. Delle volte per decantarne le lodi delle caratteristiche tecniche, altre per burlarsi di uno strano spirito censorio che aleggerebbe sul programma. “L’app funziona come ChatGPT – spiega un influencer – fornendo risposte su matematica, programmazione e altre attività, ma con una forte componente censoria imposta dal governo cinese. Ad esempio, il chatbot evita domande politicamente sensibili come quelle relative alla strage di Piazza Tiananmen!”.
Secondo gli stessi ricercatori di DeepSeek, il modello è stato “addestrato” con un costo di soli 6 milioni di dollari, una cifra davvero irrisoria rispetto gli oltre 100 milioni spesi da OpenAI per sviluppare GPT-4.
Liang Wenfeng, (fino a poco fa sottovalutato) fondatore del programma, ha accumulato una riserva di chip Nvidia A100, vietati all’esportazione verso la Cina dal 2022, che ha utilizzato insieme a componenti più economici per ottenere un modello IA potente ed efficiente. Il fenomeno, insomma, rappresenta senza dubbio un’importante vittoria per Pechino, che sta puntando a ridurre la dipendenza tecnologica dall’Occidente. Il presidente Xi Jinping ha dichiarato l’IA una priorità strategica, e la rapida ascesa di DeepSeek è celebrata come prova del crescente potenziale tecnologico cinese.
In chiusura, ti lasciamo qualche dato più “tecnico”, nel caso la tecnologia rientrasse fra le tue passioni:
DeepSeek
Architettura: Utilizza il design Mixture of Experts (MoE) con ben 671 miliardi di parametri, di cui solo 37 miliardi attivi per compiti specifici.
Dati di addestramento: Allenato su 14,8 trilioni di token, in grado di garantire risultati precisi.
Efficienza: Completa il training con solo 2,788 milioni di ore su GPU H800 grazie a processi ultra-ottimizzati.
Innovazioni: Integra metodi per bilanciare il carico e previsioni multi-token per risposte più rapide e precise.
Parola di Eufemia.
CHINA’S DEEPSEEK AI











