DeepSeek è una startup cinese operante nel settore dell’intelligenza artificiale, che ha attirato un’attenzione crescente da parte degli esperti del settore. Fondata a maggio 2023 da Liang Wenfeng, che vanta una significativa esperienza in hedge fund e intelligenza artificiale, l’azienda è nota per il suo approccio innovativo che offre modelli AI avanzati a costi molto competitivi. Grazie all’applicazione di tecnologie all’avanguardia nel machine learning, come l’apprendimento per rinforzo e l’architettura Mixture of Experts (MoE), DeepSeek ha raggiunto prestazioni elevate senza compromettere l’efficienza delle risorse. L’azienda ha scelto di rendere open source i propri modelli, contribuendo alla democratizzazione dell’intelligenza artificiale. Questo articolo esamina le tecnologie sviluppate da DeepSeek, il suo impatto sui maggiori attori della Silicon Valley e le sue strategie di pricing.
L’efficienza dei modelli DeepSeek
Indice Articolo
DeepSeek mira a competere con i principali operatori nel campo dell’intelligenza artificiale. Nel novembre 2023, ha lanciato il suo primo prodotto rilevante, DeepSeek Coder, un modello open source dedicato alla codifica. Successivamente, sono stati introdotti il modello linguistico DeepSeek LLM, contenente 67 miliardi di parametri, e, nel maggio 2024, il modello DeepSeek-V2, apprezzato per le sue elevate prestazioni a costi notevolmente ridotti. Questi modelli si caratterizzano per la loro capacità di contenere il consumo di risorse computazionali, grazie a tecniche come l’apprendimento per rinforzo, che permette miglioramenti graduali nelle loro capacità.
Un ulteriore punto di forza della strategia di DeepSeek è l’architettura MoE, che attiva solo una frazione dei parametri per ciascun compito, assicurando una riduzione significativa dei costi di calcolo e un miglioramento dell’efficienza. L’integrazione della capacità di utilizzo dell’attenzione latente multi-testa nel modello DeepSeek-V3 consente una gestione più precisa di input complessi, affrontando più aspetti delle informazioni simultaneamente.
Nel gennaio 2025, DeepSeek ha presentato il modello avanzato DeepSeek-R1, progettato per attività di ragionamento, posizionandosi così come un concorrente diretto dei modelli avanzati di altri leader del settore. L’azienda ha altresì sviluppato modelli distillati, come DeepSeek-R1-Distill, che combinano l’efficienza dei modelli più piccoli con le capacità dei modelli più grandi.
La differenza tra DeepSeek e la concorrenza
Le peculiarità di DeepSeek rispetto alla concorrenza risiedono principalmente nel suo modello di business. Finanziata esclusivamente da High-Flyer, un hedge fund creato da Liang Wenfeng, l’azienda non ha bisogno di investitori esterni, potendo così concentrare le proprie energie sulla ricerca a lungo termine. Sebbene abbia già ottenuto un certo successo, DeepSeek non ha ancora manifestato intenzioni concrete di commercializzazione su larga scala, mantenendo un focus prioritario su ricerca e sviluppo.
La politica di contenimento dei costi è un aspetto cruciale dell’attività di DeepSeek, evidente nelle sue tariffe, significativamente più basse rispetto a quelle dei concorrenti. Per esempio, l’API di DeepSeek-R1 è disponibile a soli 0,55 dollari per milione di token di input e 2,19 dollari per milione di token di output, contrariamente ai prezzi di altri colossi come OpenAI, che richiede 15 dollari per milione di token di input e 60 dollari per milione di token di output. Questa notevole efficienza dei costi potrebbe spingere i concorrenti a riconsiderare i loro prezzi per mantenere la competitività.
Inoltre, l’approccio open source adottato da DeepSeek consente a piccole imprese e sviluppatori indipendenti di accedere a tecnologie avanzate senza le onerose spese tipiche del settore.
Le sfide di DeepSeek e i limiti di censura
Malgrado i suoi progressi, DeepSeek è chiamata ad affrontare diverse sfide. Una delle più significative riguarda la disponibilità limitata di risorse di calcolo avanzate, complicata dai controlli sulle esportazioni di chip dagli Stati Uniti. L’accesso a hardware più potente risulta cruciale per mantenere la competitività rispetto ai rivalità della Silicon Valley.
In quanto azienda cinese, DeepSeek deve fare i conti con la censura dei propri modelli per prevenire la diffusione di contenuti contrari alle normative nazionali. Questo potrebbe rappresentare un ostacolo considerevole alla sua adozione globale, specialmente in contesti dove la libertà di espressione è un valore fondamentale. Le modalità con cui DeepSeek affronterà queste sfide rimangono da osservare nel tempo.