back to top

Qwen2.5-Max: funzionamento e limiti

Interfaccia di Qwen2.5–Max. Credit: Alibaba.

Il gigante cinese del commercio Alibaba ha annunciato nelle scorse ore il rilascio di Qwen2.5-Max, il suo nuovo LLM (Large Language Model) completamente open-source, che potrebbe superare DeepSink R-1, il recente modello di intelligenza artificiale che ha scosso il mercato. La presentazione di Qwen2.5-Max avviene in un momento strategico, coincidente con il Capodanno cinese e seguito rapidamente dall’annuncio di DeepSeek-R1, suggerendo una risposta diretta a quest’ultimo. Alibaba ha dichiarato che, secondo alcuni benchmark, Qwen2.5-Max supera DeepSeek-V3, la versione precedente di R-1, e anche Llama 3.1-405B, il modello open-source di Meta. Se queste affermazioni venissero confermate, Alibaba si posizionerebbe in modo dominante nel campo dell’AI generativa open-source.

Cos’è e come funziona il modello AI di Alibaba Qwen2.5-Max

Dal punto di vista tecnologico, Qwen2.5-Max si distingue per la sua multimodalità, ovvero la capacità di comprendere testo e immagini e di generare contenuti video, caratteristiche che lo avvicinano ai modelli occidentali più avanzati, come GPT-4 di OpenAI e Claude 3.5 Sonnet di Anthropic. Alibaba ha spiegato il processo di training del nuovo modello, affermando che si tratta di un modello MoE su larga scala, pre-addestrato su oltre 20 trilioni di token, e ulteriormente ottimizzato mediante metodologie curate di Supervised Fine-Tuning (SFT) e Reinforcement Learning from Human Feedback (RLHF). I risultati conseguiti da Qwen2.5-Max includono prestazioni eccezionali in vari benchmark, come Arena-Hard, LiveBench e LiveCodeBench. Alibaba riporta che il modello ha ottenuto risultati competitivi anche nel test di MMLU-Pro, che verifica la conoscenza attraverso problemi di livello universitario.

Immagine
Benchmark che mettono a confronto Qwen2.5–Max con altri modelli competitor. Credit: Alibaba.

Nel seguente video potete vedere Qwen2.5-Max all’opera.

Dubbi e su Qwen2.5-Max

Tuttavia, emergono anche preoccupazioni riguardanti la sicurezza e la gestione dei dati. Come per DeepSeek, Qwen2.5-Max conserva le informazioni degli utenti su server cinesi, il che solleva la possibilità di accessi da parte del Governo cinese. Questa situazione ha già portato il Garante della privacy italiano ad avviare un’indagine, comportando la rimozione dell’app di DeepSeek dagli store italiani. È probabile che misure simili possano essere applicate ad altri modelli AI provenienti dalla . Inoltre, nonostante la sua natura open-source, l’uso di Qwen2.5-Max richiede la registrazione di un account Alibaba Cloud e l’attivazione di specifici servizi, un processo che potrebbe risultare poco intuitivo per gli utenti meno esperti.

Qwen 2.5-Max, DeepSeek e le altre intelligenze artificiali: cosa sta succedendo

L’annuncio di Alibaba si colloca in un contesto di crescente competizione tra le aziende cinesi nel mercato dell’AI. Il recente successo di DeepSeek, con il rilascio del modello DeepSeek-R1 il 20 gennaio scorso, ha provocato destabilizzazione nel mercato, contribuendo al calo delle azioni di alcune aziende tecnologiche occidentali. DeepSeek ha dimostrato la possibilità di sviluppare modelli di alta qualità a costi operativi inferiori rispetto a quelli delle società statunitensi, ponendo interrogativi sugli ingenti investimenti delle aziende come OpenAI, Google e Anthropic.

Questa dinamica ha indotto una reazione immediata da parte di altre aziende in Cina, come ByteDance, che ha aggiornato il suo modello AI, affermando di superare OpenAI o1 in test specifici. Nel contesto della competizione open-source, è rilevante notare che Qwen2.5 (la versione precedente a Qwen 2.5-Max) ha raggiunto 94 milioni di download su Hugging Face, metà dei quali solo nell’ultimo mese, stabilendosi come il modello AI open-source più scaricato al mondo. Questi dati segnalano un’importante evoluzione del mercato dell’intelligenza artificiale verso più accessibili e personalizzabili, in opposizione ai modelli “chiusi” di aziende come OpenAI.

Fonte Verificata

GLI ULTIMI ARGOMENTI

Leggi anche

Scoperti nuovi dettagli sulle ultime ore del naufragio del Titanic grazie a una scansione 3D che rivela l’impatto con l’iceberg

Incredibile scoperta sul Titanic! Scansione digitale rivela dettagli mai visti prima sull'affondamento del 1912. Locali caldaie attivi fino all'ultimo e fori nello scafo grandi...

Dazi doganali: scoperti i loro impatti devastanti sull’importazione delle merci – ora l’economia trema

🚨 ATTENZIONE: Trump colpisce ancora! Nuovi dazi doganali annunciati durante il "Liberation Day" del 2 aprile 2025 fanno tremare il commercio mondiale. Protezionismo o...

L’intelligenza artificiale viene salvata per il pianeta, ma solo se smette di consumarlo, secondo gli esperti verdi

Nuovo report di Google rivela che l'IA promette grandi benefici per clima e competitività europea, ma consuma troppa energia e acqua. Serve trasparenza e...
è in caricamento