Startup cinese Deep -Week Tannoned Tech Shares lunedì dopo aver rilasciato il suo modello di AI di DeepSeek R1 Reasoning. In un documento di ricerca, la società ha rivelato che ha formato R1 utilizzando innovazioni software program piuttosto che avere accesso a enormi risorse {hardware} come Openai e altre aziende statunitensi.
Le sanzioni statunitensi impediscono alle società cinesi di acquistare i patatine di intelligenza artificiale di cui hanno bisogno per abbinare Openai, Google e altre aziende di intelligenza artificiale in Occidente. L’affermazione secondo cui le ottimizzazioni del software program possono sostituire l'{hardware} è ciò che ha danneggiato il mercato azionario, in particolare Nvidia e altre società di {hardware} di intelligenza artificiale.
All’indomani del bagno di sangue di lunedì, ho detto che le preoccupazioni erano esagerate. L’ottimizzazione del software program non può sostituire completamente le funzionalità {hardware}. Ho anche sottolineato che le aziende statunitensi come Openi probabilmente testreranno e distribuiranno Alcune delle innovazioni del software program DeepSeek hanno fatto. Ma avranno anche un’infrastruttura massicciamente superiore. A loro volta, Openai e altri possono fornire scoppi simili, ridurre ulteriormente il costo di accesso e sovraperformare artisti del calibro di DeepEek.
Mentre è stata una speculazione dal tuo veramente, qualcuno che non sviluppa modelli di intelligenza artificiale per vivere, vorrai anche leggere Dario Amodei Spiegazione dettagliata Di ciò che DeepEek ha raggiunto, cosa significa per il momento attuale nella guerra AI tra Stati Uniti e Cina e come influisce sulla strada per AGI.
Come il CEO di antropico E un ex ingegnere principale di Openi, Amodei è tra gli esperti di intelligenza artificiale più qualificati a sezionare la svolta in profondità.
Amodei fa un ottimo lavoro spiegando come funziona lo sviluppo dell’intelligenza artificiale, perché le innovazioni di Deepseek sono importanti, perché la formazione costa la startup cinese proposta è fuorviante e perché gli Stati Uniti hanno un grande vantaggio sulla Cina grazie all’accesso all'{hardware} superiore.
Il costo di DeepSeek non è una grande sorpresa
Amodei sostiene il controllo continuo sulle esportazioni di {hardware} chiave in Cina, sostenendo che le misure attuali funzionano nonostante ciò che DeepSeek ha raggiunto. Sì, la startup cinese ha prodotto idee software program per migliorare l’efficienza dello sviluppo dell’IA e tagliare i costi. Ma nello schema più grande delle cose, lo sviluppo e la spesa di Deepseek sono alla pari con alcune aziende di intelligenza artificiale statunitensi:
DeepSeek non “fa per ($ 6 milioni) ciò che ci è costato miliardi di compagnie di intelligenza artificiale”. Posso solo parlare per antropico, ma Claude 3.5 Sonnet è un modello di medie dimensioni che costa alcuni $ 10 m per allenarsi (non darò un numero esatto). Inoltre, 3,5 sonetto non è stato addestrato in alcun modo che riguardasse un modello più grande o più costoso (contrariamente advert alcune voci).
La formazione di Sonnet è stata condotta 9-12 mesi fa e il modello di DeepSeek è stato addestrato a novembre/dicembre, mentre Sonet rimane in particolare in vantaggio in molti eventi interni ed esterni. Pertanto, penso che una dichiarazione equa sia “DeepSeek ha prodotto un modello vicino alle prestazioni dei modelli statunitensi 7-10 mesi più vecchi, con molto meno costi (ma non da nessuna parte vicino ai rapporti che le persone hanno suggerito)”.
Amodei ha anche individuato Deepseek V3 come la vera svolta della startup cinese, che ha poi reso possibile lo sviluppo di R1. Tuttavia, il CEO antropico ha affermato che la formazione di V3 diversi mesi dopo modelli AI statunitensi altrettanto potenti per un costo più economico è “totalmente normale, totalmente” sulla tendenza “, considerando ciò che sta accadendo nel settore:
Tutto questo per dire che DeepSeek-V3 non è una svolta unica o qualcosa che cambia fondamentalmente l’economia di LLM; È un punto previsto su una curva di riduzione dei costi in corso. Ciò che è diverso questa volta è che la società che è stata la prima a dimostrare le riduzioni dei costi previste period cinese.
Questo non è mai successo prima ed è geopoliticamente significativo. Tuttavia, le aziende statunitensi seguiranno presto l’esempio e non lo faranno copiando DeepSeek, ma perché anche loro stanno raggiungendo la solita tendenza nella riduzione dei costi.
Amodei ha anche esaminato le voci delle capacità {hardware} di DeepSeek, che secondo quanto riferito ha 50.000 chip di generazione della tramoggia a sua disposizione per l’addestramento dell’intelligenza artificiale. Mentre le cifre non possono essere confermate e alcune di queste GPU potrebbero essere state contrabbandate a causa delle sanzioni statunitensi, Amodei ha concluso che Deepseek deve aver speso circa 1 miliardo di dollari sull'{hardware}:
Pertanto, la spesa totale di Deepseek come azienda (distinta dalla spesa per addestrare un singolo modello) non è molto diversa dai laboratori di AI statunitensi.
Amodei ha osservato che è anche normale che various aziende di intelligenza artificiali escogitano modelli AI simili a Chatgpt O1. Questo è quello che ha fatto DeepSeek. Ma presto arriverà un momento in cui lo sviluppo di modelli più avanzati non sarà così facile per ogni giocatore sul campo:
Tuttavia, poiché siamo nella prima parte della curva di ridimensionamento, è possibile che various aziende producano modelli di questo tipo, purché inizino da un modello forte pre -pretratto. La produzione di R1, dato V3, period probabilmente molto economica. Pertanto, siamo in un interessante “punto crossover”, dove è temporaneamente il caso che various aziende possano produrre buoni modelli di ragionamento. Ciò cesserà rapidamente di essere vero mentre tutti si muovono più in alto nella curva di ridimensionamento su questi modelli.
Chi raggiungerà prima l’AGI, gli Stati Uniti o la Cina?
Il punto principale di Amodei è che la spesa per addestrare {hardware} più avanzato non si fermerà solo perché DeepSeek ha sbalordito il mondo con l’efficienza del software program. Miliardi di dollari continueranno a essere versati per realizzare modelli di intelligenza artificiale migliori e ciò comporta ottenere milioni di chip di fascia alta per svolgere il lavoro, ma anche emergere efficienze simili
Nella misura in cui i laboratori statunitensi non li hanno già scoperti, le innovazioni di efficienza DeepSeek sviluppate saranno presto applicate dai laboratori statunitensi e cinesi per formare modelli da molti miliardi di dollari. Questi funzionano meglio dei modelli multimilionari che in precedenza avevano intenzione di allenarsi, ma spenderanno comunque miliardi. Quel numero continuerà a salire, fino a raggiungere l’IA che è più intelligente di quasi tutti gli umani in quasi tutte le cose.
Quella “AI che è più intelligente di quasi tutti gli umani in quasi tutte le cose” suona come la versione di AGI o l’intelligenza generale artificiale di Amodei. Questa è l’intelligenza artificiale in grado di gestire qualsiasi compito con la stessa creatività di un essere umano e con l’ulteriore vantaggio di possedere una conoscenza quasi infinita.
Amodei prevede che l’AGI avverrà nel 2026-2027 e richiederà “milioni di chip, (e) decine di miliardi di dollari (almeno)”.
“Le versioni di Deepseek non cambiano questo, perché sono approssimativamente sulla curva di riduzione dei costi prevista che è sempre stata presa in considerazione in questi calcoli”, ha detto.
Amodei vede due possibili scenari. In un mondo bipolare, gli Stati Uniti e la Cina svilupperanno AGI nello stesso periodo. I “potenti modelli AI che causano progressi estremamente rapidi nella scienza e nella tecnologia” saranno disponibili per entrambe le nazioni. Ma è solo se la Cina ottiene i milioni di chip di fascia alta necessari per lo sviluppo dell’AGI. Alla high-quality, la Cina potrebbe avere un vantaggio sugli Stati Uniti in questo situation.
L’altro situation è un mondo unipolare con gli Stati Uniti e i suoi alleati occidentali in cima alle innovazioni di intelligenza artificiale.
Non è chiaro se il mondo unipolare durerà, ma c’è almeno la possibilità che, poiché i sistemi di intelligenza artificiale possano eventualmente aiutare a rendere sistemi di intelligenza artificiale ancora più intelligenti, un vantaggio temporaneo potrebbe essere segnato in un vantaggio duraturo. Pertanto, in questo mondo, gli Stati Uniti e i suoi alleati potrebbero prendere un vantaggio comandante e di lunga durata sulla fase globale.
Amodei sostiene che affinché quest’ultimo accada, le sanzioni devono continuare in modo che la Cina non possa facilmente acquistare o contrabbandare i milioni di chip necessari per lo sviluppo dell’AGI.
“(Noi) non dovremmo consegnare i vantaggi tecnologici del Partito Comunista cinese quando non è necessario”, afferma Amodei all’inizio del weblog, spiegando in seguito che DeepSeek non è l’avversario e i ricercatori cinesi sono in realtà scienziati intelligenti che cercano di svilupparsi utili Tech:
Information la mia attenzione ai controlli delle esportazioni e alla sicurezza nazionale statunitense, voglio essere chiaro su una cosa. Non vedo profondi stessi come avversari e il punto non è di prenderli di mira in particolare. Nelle interviste che hanno fatto, sembrano ricercatori intelligenti e curiosi che vogliono solo creare una tecnologia utile.
Ma sono considerati da un governo autoritario che ha commesso violazioni dei diritti umani, si è comportato in modo aggressivo nella fase mondiale e sarà molto più libera in queste azioni se sono in grado di abbinare gli Stati Uniti in AI. I controlli di esportazione sono uno dei nostri strumenti più potenti per prevenire questo e l’concept che la tecnologia diventa più potente, avendo più botto per il dollaro, è un motivo per sollevare i nostri controlli di esportazione non ha alcun senso.
Il put up sul weblog completo di Amodei è disponibile A questo hyperlinke dovresti leggerlo per intero per comprendere meglio le scoperte di Deepseek nel contesto dell’incombente guerra AI tra Stati Uniti e Cina.