back to top

Qwen2.5-Max: funzionamento e limiti

Interfaccia di Qwen2.5–Max. Credit: Alibaba.

Il gigante cinese del commercio Alibaba ha annunciato nelle scorse ore il rilascio di Qwen2.5-Max, il suo nuovo LLM (Large Language Model) completamente open-source, che potrebbe superare DeepSink R-1, il recente modello di intelligenza artificiale che ha scosso il mercato. La presentazione di Qwen2.5-Max avviene in un momento strategico, coincidente con il Capodanno cinese e seguito rapidamente dall’annuncio di DeepSeek-R1, suggerendo una risposta diretta a quest’ultimo. Alibaba ha dichiarato che, secondo alcuni benchmark, Qwen2.5-Max supera DeepSeek-V3, la versione precedente di R-1, e anche Llama 3.1-405B, il modello open-source di Meta. Se queste affermazioni venissero confermate, Alibaba si posizionerebbe in modo dominante nel campo dell’AI generativa open-source.

PUBBLICITA

Cos’è e come funziona il modello AI di Alibaba Qwen2.5-Max

Dal punto di vista tecnologico, Qwen2.5-Max si distingue per la sua multimodalità, ovvero la capacità di comprendere testo e immagini e di generare contenuti video, caratteristiche che lo avvicinano ai modelli occidentali più avanzati, come GPT-4 di OpenAI e Claude 3.5 Sonnet di Anthropic. Alibaba ha spiegato il processo di training del nuovo modello, affermando che si tratta di un modello MoE su larga scala, pre-addestrato su oltre 20 trilioni di token, e ulteriormente ottimizzato mediante metodologie curate di Supervised Fine-Tuning (SFT) e Reinforcement Learning from Human Feedback (RLHF). I risultati conseguiti da Qwen2.5-Max includono prestazioni eccezionali in vari benchmark, come Arena-Hard, LiveBench e LiveCodeBench. Alibaba riporta che il modello ha ottenuto risultati competitivi anche nel test di MMLU-Pro, che verifica la conoscenza attraverso problemi di livello universitario.

Immagine
Benchmark che mettono a confronto Qwen2.5–Max con altri modelli competitor. Credit: Alibaba.

Nel seguente video potete vedere Qwen2.5-Max all’opera.

Dubbi e limiti su Qwen2.5-Max

Tuttavia, emergono anche preoccupazioni riguardanti la sicurezza e la gestione dei dati. Come per DeepSeek, Qwen2.5-Max conserva le informazioni degli utenti su server cinesi, il che solleva la possibilità di accessi da parte del Governo cinese. Questa situazione ha già portato il Garante della privacy italiano ad avviare un’indagine, comportando la rimozione dell’app di DeepSeek dagli store italiani. È probabile che misure simili possano essere applicate ad altri modelli AI provenienti dalla Cina. Inoltre, nonostante la sua natura open-source, l’uso di Qwen2.5-Max richiede la registrazione di un account Alibaba Cloud e l’attivazione di specifici servizi, un processo che potrebbe risultare poco intuitivo per gli utenti meno esperti.

Qwen 2.5-Max, DeepSeek e le altre intelligenze artificiali: cosa sta succedendo

L’annuncio di Alibaba si colloca in un contesto di crescente competizione tra le aziende cinesi nel mercato dell’AI. Il recente successo di DeepSeek, con il rilascio del modello DeepSeek-R1 il 20 gennaio scorso, ha provocato destabilizzazione nel mercato, contribuendo al calo delle azioni di alcune aziende tecnologiche occidentali. DeepSeek ha dimostrato la possibilità di sviluppare modelli di alta qualità a costi operativi inferiori rispetto a quelli delle società statunitensi, ponendo interrogativi sugli ingenti investimenti delle aziende come OpenAI, Google e Anthropic.

Questa dinamica ha indotto una reazione immediata da parte di altre aziende in Cina, come ByteDance, che ha aggiornato il suo modello AI, affermando di superare OpenAI o1 in test specifici. Nel contesto della competizione open-source, è rilevante notare che Qwen2.5 (la versione precedente a Qwen 2.5-Max) ha raggiunto 94 milioni di download su Hugging Face, metà dei quali solo nell’ultimo mese, stabilendosi come il modello AI open-source più scaricato al mondo. Questi dati segnalano un’importante evoluzione del mercato dell’intelligenza artificiale verso soluzioni più accessibili e personalizzabili, in opposizione ai modelli “chiusi” di aziende come OpenAI.

Fonte Verificata

Leggi anche

Ricostruzione del disastro aereo a Washington e possibili cause dell’incidente

La notte scorsa a Washington, un incidente avvenuto tra un aereo di linea e un elicottero militare Black Hawk ha portato entrambi i mezzi...

Cosa sono e perché la scoperta è considerata importante

Credit: NASA/Goddard/University of Arizona Campioni prelevati dall'asteroide Bennu nel 2018 e riportati sulla Terra nel 2023 dalla missione OSIRIS-REx della NASA contengono amminoacidi e...

Janus-Pro, il tool cinese per generare immagini con l’AI, è stato lanciato da DeepSeek

DeepSeek, startup cinese recentemente emersa nel panorama dell'intelligenza artificiale, ha lanciato Janus-Pro, una nuova famiglia di modelli AI dedicati alla generazione di immagini. Secondo...
è in caricamento