Timeline
Chat
Prospettiva
DeepSeek
azienda cinese di intelligenza artificiale Da Wikipedia, l'enciclopedia libera
Remove ads
DeepSeek (in cinese: 深度求索S, shēn dù qiú suǒP) è una società cinese di intelligenza artificiale che sviluppa modelli linguistici di grandi dimensioni (LLM) open source. Con sede a Hangzhou, Zhejiang, è di proprietà e finanziata esclusivamente dal fondo speculativo cinese High-Flyer, il cui co-fondatore, Liang Wenfeng, ha fondato la società nel 2023 e ne è l'amministratore delegato. L'azienda recluta giovani ricercatori di intelligenza artificiale dalle migliori università cinesi,[1] e assume al di fuori del campo dell'informatica per diversificare le conoscenze e le capacità dei suoi modelli.[2]
Il modello DeepSeek-R1 esegue attività allo stesso livello di ChatGPT,[3] nonostante sia stato sviluppato a un costo significativamente inferiore (dichiarato in 6 milioni di dollari, rispetto ai 100 milioni di dollari per GPT-4 di OpenAI nel 2023[4]) e richieda un decimo della potenza di calcolo di un LLM comparabile.[4][5][6] Il modello di intelligenza artificiale è stato sviluppato da DeepSeek nel mezzo delle sanzioni degli Stati Uniti alla Cina (per i chip Nvidia), che avevano lo scopo di limitare la capacità del paese di sviluppare sistemi di intelligenza artificiale avanzati.[7][8]
Remove ads
Storia
Riepilogo
Prospettiva

Nel febbraio 2016, High-Flyer è stata co-fondata dall'appassionato di intelligenza artificiale Liang Wenfeng, che si era immerso nel mondo del trading durante la crisi finanziaria del 2007-2008, mentre frequentava l'Università dello Zhejiang.[9] Nel 2019, ha trasformato High-Flyer come hedge fund focalizzato sullo sviluppo e l'utilizzo di algoritmi di trading basati sull'intelligenza artificiale. Nel 2021 High-Flyer ha utilizzato esclusivamente l'intelligenza artificiale nel trading.[10] Prima che il governo federale degli Stati Uniti d'America imponesse restrizioni alla Cina sui chip dedicati all'AI, Liang aveva accumulato un magazzino di 10 000 GPU A100 di Nvidia.[10] Alcune notizie stimano tale quantità fino a 50 000.[9]
Nell'aprile 2023 High-Flyer ha avviato un laboratorio di intelligenza artificiale generale dedicato alla ricerca sullo sviluppo di strumenti di intelligenza artificiale separati dall'attività finanziaria di High-Flyer.[11] Nel maggio 2023 con High-Flyer come uno degli investitori, il laboratorio è diventato una società a sé stante, DeepSeek.[10][12] Le società di capitale di rischio erano riluttanti all'inizio a fornire finanziamenti poiché era altamente improbabile che la società sarebbe stata in grado di generare una release di un prodotto convincente, in un breve periodo di tempo.[10]
Il 10 gennaio 2025 la società ha reso disponibile la sua prima app chatbot gratuita per Apple IOS e Android; entro il 27 gennaio, DeepSeek-R1 ha superato ChatGPT come app gratuita più scaricata sull'App Store iOS negli Stati Uniti,[1] e ha causato un calo del 18% del prezzo delle azioni Nvidia.[13][14][15] Il successo di DeepSeek contro rivali più grandi e affermati è stato descritto come "un capovolgimento dell'intelligenza artificiale",[1] che costituisce "il primo tentativo di quella che sta emergendo come una corsa allo spazio globale dell'intelligenza artificiale"[16] e inaugura "una nuova era di rischio di intelligenza artificiale"[17] citata anche come una nuova guerra fredda.[18]
DeepSeek ha reso open source i suoi algoritmi, modelli e dettagli di allenamento dell'intelligenza artificiale generativa, rendendo il suo codice liberamente disponibile per l'uso, la modifica e la visualizzazione; ciò include il permesso di accedere e utilizzare il codice sorgente e i documenti di progettazione per scopi di costruzione.[19] Ciononostante, numerosi rapporti indicano che applica restrizioni sui contenuti in conformità con le normative locali, limitando le risposte su argomenti come il massacro di Piazza Tienanmen, il genocidio degli uiguri[20][21][22] e lo status di Taiwan.[23][24]
Remove ads
Prodotti
Riepilogo
Prospettiva
DeepSeek LLM
Il 2 novembre 2023 DeepSeek ha pubblicato la sua prima serie di modelli, DeepSeek-Coder
, disponibile gratuitamente sia per i ricercatori che per gli utenti commerciali. Il codice per il modello è stato reso open source con la licenza MIT, con un accordo di licenza aggiuntivo ("licenza DeepSeek") riguardante "l'utilizzo downstream aperto e responsabile" per il modello stesso.[25]
V2
A maggio 2024 hanno distribuito la serie di modelli DeepSeek-V2
. La serie include 4 modelli, 2 modelli base (DeepSeek-V2
, DeepSeek-V2-Lite
) e 2 chatbot (-Chat
). Il Financial Times ha riferito che la soluzione era più economica dei suoi pari, con un prezzo di 2 RMB per ogni milione di token di output. La classifica del Tiger Lab dell'Università di Waterloo ha classificato DeepSeek-V2 al settimo posto nella sua classifica LLM.[12]
V3
Nel dicembre 2024 hanno distribuito un modello base DeepSeek-V3-Base
e un modello di chat DeepSeek-V3
. L'architettura del modello è essenzialmente la stessa della V2.
DeepSeek-V2.5
è stato pubblicato a settembre e aggiornato a dicembre. È stato realizzato combinando DeepSeek-V2-Chat
e DeepSeek-Coder-V2-Instruct
.[26]
I test di benchmark mostrano che DeepSeek-V3 ha superato le prestazioni Llama 3.1 e Qwen 2.5 mentre si avvicina a GPT-4o e Claude 3.5 Sonnet.[27][28][29]
Il modello R1
Il 20 novembre 2024 DeepSeek-R1-Lite-Preview è diventato accessibile tramite le API di DeepSeek e chat.deepseek.com.[30] È stato addestrato per inferenza logica, ragionamento matematico e risoluzione di problemi in tempo reale. DeepSeek ha affermato di aver superato le prestazioni di OpenAI o1 su benchmark come American Invitational Mathematics Examination (AIME) e MATH.[31] Tuttavia, il Wall Street Journal ha affermato che quando ha utilizzato 15 problemi dall'edizione 2024 di AIME, il modello o1 ha raggiunto una soluzione più velocemente di DeepSeek-R1-Lite-Preview.[32]
Il 20 gennaio 2025 DeepSeek-R1 e DeepSeek-R1-Zero sono stati pubblicati.[33] Entrambi sono stati inizializzati da DeepSeek-V3-Base e hanno la stessa architettura. La società ha anche distribuito alcuni modelli "DeepSeek-R1-Distill", che non sono inizializzati su V3-Base, ma sono invece inizializzati da altri modelli open-weight pre-addestrati, tra cui LLaMA e Qwen, quindi perfezionati su dati sintetici generati da R1.
DeepSeek ha reso disponibile il suo Assistente A.I., che utilizza il modello V3/R1, anche come app chatbot per Apple IOS e Android[34]. Entro il 27 gennaio 2025 l'app aveva superato ChatGPT come app gratuita con la valutazione più alta sull'App Store iOS negli Stati Uniti; il suo chatbot risponderebbe a domande, risolverebbe problemi logici e scriverebbe programmi per computer alla pari di altri chatbot sul mercato, secondo i test di benchmark utilizzati dalle aziende di intelligenza artificiale americane.[6]
DeepSeek-V3 utilizza risorse significativamente inferiori rispetto ai suoi pari; ad esempio, mentre le principali aziende di intelligenza artificiale al mondo addestrano i loro chatbot con supercomputer che utilizzano fino a 16 000 circuiti integrati (o più), DeepSeek afferma di aver avuto bisogno solo di circa duemila chip per computer specializzati, vale a dire la serie H800 della multinazionale americana Nvidia. È stato addestrato in circa 55 giorni a un costo di 5,58 milioni di dollari, che è circa dieci volte inferiore a quanto il gigante tecnologico statunitense Meta ha speso per costruire la sua ultima tecnologia di intelligenza artificiale.[6]
Remove ads
Sicurezza e protezione dei dati personali
Riepilogo
Prospettiva
L'ascesa di questo servizio ha già sollevato numerose perplessità, tanto che in Italia si è deciso di bloccare l'app con effetto immediato. A gennaio 2025, infatti, Altroconsumo ha presentato un reclamo presso il Garante per la protezione dei dati personali contro DeepSeek.[35] Di conseguenza, l'app è stata rimossa dai negozi digitali di Google e Apple sul territorio nazionale. Il blocco, tuttavia, non ha riguardato la versione online, che risulta ancora accessibile via browser.[36]
Molti esperti temono che il governo cinese possa utilizzare il sistema di intelligenza artificiale per operazioni di influenza estera, diffusione di disinformazione, sorveglianza e sviluppo di armi informatiche.[37][38][39]
Gli enti per la protezione dei dati personali dei Paesi Bassi e della Corea del Sud, e il Consiglio per la sicurezza nazionale degli Stati Uniti d'America, hanno aperto indagini sull'uso dei dati da parte di DeepSeek.[40][41][42]
Il 31 gennaio 2025 il ministero del digitale di Taiwan ha sconsigliato ai suoi dipartimenti governativi di utilizzare il servizio DeepSeek per "evitare rischi per la sicurezza delle informazioni".[41] Lo stesso giorno, il governatore del Texas Greg Abbott ha emesso un divieto statale sui dispositivi forniti dal governo per DeepSeek, insieme a REDnote e Lemon8.[43] L'accesso a DeepSeek è stato vietato sui dispositivi del New South Wales Department of Customer Service.[44] Anche l'Australia ha vietato DeepSeek per i dispositivi governativi.[45]
Note
Altri progetti
Collegamenti esterni
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads