DeepSeek, l'IA cinese che spaventa i chatbot della Silicon Valley

476 voti

Vota

Tempo di lettura: 2 min.

27/01/2025 - 19:52

DeepSeek: un nuovo modello di Intelligenza Artificiale che "potrebbe" diventare un problema per ChatGPT, Gemini, Grok...

L'intelligenza artificiale (IA) sta rivoluzionando il mondo della tecnologia e DeepSeek, seppure ultimo arrivato, si posiziona come uno dei modelli più avanzati e innovativi nel panorama attuale.

DeepSeek è il risultato di anni di ricerca e sviluppo nel campo del machine learning e del deep learning. Il modello è stato progettato per essere altamente efficiente, versatile e adattabile a una vasta gamma di applicazioni.

DeepSeek utilizza un'architettura basata su **trasformatori** (Transformer), la stessa tecnologia alla base di molti modelli di linguaggio avanzati, introducendo però innovazioni significative, mirate alla riduzione del consumo energetico pur non rinunciando all'addestramento su dataset diversificati su corpus di dati multilingue e multidisciplinari, che includono testi scientifici, letterari, tecnici e colloquiali.

Il processo di addestramento di DeepSeek ha richiesto l'uso di supercomputer e tecniche avanzate di apprendimento automatico. Il modello è stato sottoposto a processi di pre-training per l'apprendimento da grandi quantità di dati non etichettati e fine-tuning per essere ottimizzato su compiti specifici, come traduzione, generazione di testo e risposta a domande.

Uno degli aspetti più importanti dello sviluppo di DeepSeek è stato l'attenzione all'etica e alla sicurezza, con gli sviluppatori che hanno implementato meccanismi per prevenire l'uso improprio del modello.

DeepSeek, sviluppato in Cina, offre prestazioni eccellenti in più lingue, compreso l'italiano. Inoltre, è stato progettato per essere ecosostenibile, riducendo al minimo il consumo energetico senza comprometterne le prestazioni. Questo è un vantaggio significativo rispetto ad altri modelli che richiedono grandi quantità di energia.

Il modello può essere facilmente adattato a esigenze specifiche, grazie a un sistema di fine-tuning avanzato. Questo lo rende adatto sia per uso personale che professionale.

DeepSeek è in grado di comprendere e generare testi con livelli di fluidità e coerenza paragonabili a quelli umano. Questo lo rende particolarmente utile per applicazioni come assistenti virtuali, tutoraggio e supporto clienti.

Essendo un neonato, DeepSeek sta già progettando di crescere, mirando a migliorare le capacità di ragionamento, l'integrazione con dispositivi IoT e ad aumentare le lingue supportate.

Le prestazioni di Deep Seek e la possibilità di operare senza richiedere particolari consumi di energia, ha sollevato non pochi dubbi tra gli investitori dei titoli HiTech, con il Nasdaq che in apertura degli scambi ha perso il 3%, mentre Nvidia, i cui processori sono alla base dei chatbot made in Usa, ha lasciato sul terreno l'11%.

Dopo averne celebrate le prestazioni, bisogna però sottolineare che l'origine cinese del chatbot è comunque un problema. Per rendersene conto è sufficiente porgli la seguente domanda:

"Descrivimi cosa accadde nella protesta di piazza Tienanmen del giugno 1989".

Questa è la risposta di DeepSeek:

"Sorry, I'm not sure how to approach this type of question yet. Let's chat about math, coding, and logic problems instead!"

Autore Matteo Pani

Categoria Scienza Tecnologia Ambiente

Articolo Precedente

Vedi gli articoli di Tutte le Sezioni

Articolo Successivo

Tanto è in difficoltà il governo Meloni che pretende di spacciare qualche incidente di poco conto come un quasi inizio di guerra civile!