Interfaccia di Qwen2.5–Max. Credit: Alibaba.
Indice Articolo
Il gigante cinese del commercio Alibaba ha annunciato nelle scorse ore il rilascio di Qwen2.5-Max, il suo nuovo LLM (Large Language Model) completamente open-source, che potrebbe superare DeepSink R-1, il recente modello di intelligenza artificiale che ha scosso il mercato. La presentazione di Qwen2.5-Max avviene in un momento strategico, coincidente con il Capodanno cinese e seguito rapidamente dall’annuncio di DeepSeek-R1, suggerendo una risposta diretta a quest’ultimo. Alibaba ha dichiarato che, secondo alcuni benchmark, Qwen2.5-Max supera DeepSeek-V3, la versione precedente di R-1, e anche Llama 3.1-405B, il modello open-source di Meta. Se queste affermazioni venissero confermate, Alibaba si posizionerebbe in modo dominante nel campo dell’AI generativa open-source.
Cos’è e come funziona il modello AI di Alibaba Qwen2.5-Max
Dal punto di vista tecnologico, Qwen2.5-Max si distingue per la sua multimodalità, ovvero la capacità di comprendere testo e immagini e di generare contenuti video, caratteristiche che lo avvicinano ai modelli occidentali più avanzati, come GPT-4 di OpenAI e Claude 3.5 Sonnet di Anthropic. Alibaba ha spiegato il processo di training del nuovo modello, affermando che si tratta di un modello MoE su larga scala, pre-addestrato su oltre 20 trilioni di token, e ulteriormente ottimizzato mediante metodologie curate di Supervised Fine-Tuning (SFT) e Reinforcement Learning from Human Feedback (RLHF). I risultati conseguiti da Qwen2.5-Max includono prestazioni eccezionali in vari benchmark, come Arena-Hard, LiveBench e LiveCodeBench. Alibaba riporta che il modello ha ottenuto risultati competitivi anche nel test di MMLU-Pro, che verifica la conoscenza attraverso problemi di livello universitario.
Benchmark che mettono a confronto Qwen2.5–Max con altri modelli competitor. Credit: Alibaba.
Nel seguente video potete vedere Qwen2.5-Max all’opera.
Dubbi e limiti su Qwen2.5-Max
Tuttavia, emergono anche preoccupazioni riguardanti la sicurezza e la gestione dei dati. Come per DeepSeek, Qwen2.5-Max conserva le informazioni degli utenti su server cinesi, il che solleva la possibilità di accessi da parte del Governo cinese. Questa situazione ha già portato il Garante della privacy italiano ad avviare un’indagine, comportando la rimozione dell’app di DeepSeek dagli store italiani. È probabile che misure simili possano essere applicate ad altri modelli AI provenienti dalla Cina. Inoltre, nonostante la sua natura open-source, l’uso di Qwen2.5-Max richiede la registrazione di un account Alibaba Cloud e l’attivazione di specifici servizi, un processo che potrebbe risultare poco intuitivo per gli utenti meno esperti.
Qwen 2.5-Max, DeepSeek e le altre intelligenze artificiali: cosa sta succedendo
L’annuncio di Alibaba si colloca in un contesto di crescente competizione tra le aziende cinesi nel mercato dell’AI. Il recente successo di DeepSeek, con il rilascio del modello DeepSeek-R1 il 20 gennaio scorso, ha provocato destabilizzazione nel mercato, contribuendo al calo delle azioni di alcune aziende tecnologiche occidentali. DeepSeek ha dimostrato la possibilità di sviluppare modelli di alta qualità a costi operativi inferiori rispetto a quelli delle società statunitensi, ponendo interrogativi sugli ingenti investimenti delle aziende come OpenAI, Google e Anthropic.
Questa dinamica ha indotto una reazione immediata da parte di altre aziende in Cina, come ByteDance, che ha aggiornato il suo modello AI, affermando di superare OpenAI o1 in test specifici. Nel contesto della competizione open-source, è rilevante notare che Qwen2.5 (la versione precedente a Qwen 2.5-Max) ha raggiunto 94 milioni di download su Hugging Face, metà dei quali solo nell’ultimo mese, stabilendosi come il modello AI open-source più scaricato al mondo. Questi dati segnalano un’importante evoluzione del mercato dell’intelligenza artificiale verso soluzioni più accessibili e personalizzabili, in opposizione ai modelli “chiusi” di aziende come OpenAI.