Di lunedi, Deepseek R1 si è schiantato sul mercato azionario Una volta che è diventato chiaro advert alcuni degli investitori che scambia le azioni relative all’IA che la startup cinese aveva trovato il modo di addestrare l’IA come capace come Chatgpt O1 senza accesso ai chip Nvidia all’avanguardia che Openai e US AI hanno Accesso a. Ecco perché le aziende che creano {hardware} per l’infrastruttura AI hanno subito di più. NVIDIA ha perso quasi $ 600 miliardi in capitalizzazione di mercato, mentre l’intero mercato ha perso quasi $ 1 trilione.
All’epoca ho detto che le reazioni potrebbero essere sproporzionate. SÌ, DeepSeek ha impiegato ottimizzazioni software program Sviluppare l’intelligenza artificiale come capace come O1 invece di fare affidamento sull'{hardware}. Ma ciò non significa che le GPU di Nvidia sono improvvisamente out of date. Riallina solo il campo di gioco fornendo un nuovo modo di innovare.
Penso ancora che le aziende di intelligenza artificiale con accesso agli ultimi talenti {hardware} e software program di alto livello avranno un vantaggio rispetto ai rivali cinesi. Tutto ciò che un’azienda come Openai o Google deve fare è replicare alcuni dei trucchi Deep -Week Utilizzato per abbinare l’addestramento dell’intelligenza artificiale e l’efficienza dell’utilizzo della startup cinese e poi saltarlo. Le ultime chip AI saranno ancora molto importanti qui.
Si scopre che non sono solo le grandi aziende di intelligenza artificiale che potrebbero provare a copiare ciò che Deepseek ha fatto. Un workforce di sviluppatori che si definisce Open-R1 vuole replicare il successo DeepSeek R1 per creare un modello di AI di ragionamento che è altrettanto potente di R1. C’è una grande svolta in tutto ciò che i fan dell’IA nei mercati occidentali apprezzeranno. Open-R1 dovrebbe essere ancora più trasparente di DeepSeek R1.
La decisione di Deepseek di rendere aperta i suoi modelli AI è stata brillante. Ciò ha assicurato che chiunque potesse accedere e installare il modello sul proprio pc. Da lì, avrebbero un modello locale capace come Chatgpt O1. Il percorso open supply aumenterebbe anche l’adozione e i check. Le notizie sulle capacità di R1 si diffondono rapidamente.
Ma, come spiegano i ricercatori Open-R1 Abbracciare la facciaDeepseek R1 non è completamente open-source:
L’uscita di DeepSeek-R1 è un vantaggio straordinario per la comunità, ma non hanno rilasciato qualunque cosa—O se i pesi del modello siano aperti, i set di dati e il codice utilizzati per addestrare il modello non sono 😢.
È qui che sta arrivando Open-R1:
L’obiettivo di Open-R1 è quello di costruire questi ultimi pezzi mancanti in modo che l’intera comunità di ricerca e industria possa costruire modelli simili o migliori utilizzando queste ricette e set di dati. E facendo questo all’aperto, tutti nella comunità possono contribuire!
In particolare, il workforce Open-R1 vuole rispondere alle seguenti domande su DeepSeek R1 mentre sviluppano un’intelligenza artificiale identica:
Raccolta di dati: come sono stati curati i set di dati specifici del ragionamento?
Formazione modello: nessun codice di formazione è stato rilasciato da DeepSeek, quindi non si sa quale iperparametri funzionino meglio e in che modo differiscono tra famiglie e scale various.
Leggi di ridimensionamento: quali sono i computati e i compromessi dei dati nei modelli di ragionamento della formazione?
I ricercatori hanno in programma di clonare la strategia di sviluppo di Deepseek per R1, perfezionarlo ulteriormente e creare un modello Open-Open-R1 veramente open-source che chiunque potrebbe usare.
È interessante notare che i ricercatori Open-R1 vogliono distillare DeepSeek R1 e creare un set di dati di ragionamento di alta qualità. DeepSeek avrebbe potuto fare la propria distillazione, con Openai che rivendicava la startup cinese usata GATGPT per addestrare le sue versioni precedenti di AI. Quel lavoro potrebbe essere stato fondamentale per arrivare a Deepseek R1. Non è chiaro se Openi possa dimostrare queste accuse con assoluta certezza.
Tuttavia, i ricercatori Open-R1 hanno la propria strategia dopo aver distillato R1, con il weblog Spiegare come hanno intenzione di andare avanti.
In caso di successo, Open-R1 potrebbe essere un trampolino di lancio per lo sviluppo di altri sofisticati modelli di intelligenza artificiale e chiunque potrebbe farlo. Il vantaggio qui è che non dovresti passare attraverso lo stesso processo di formazione. Al contrario, questo è ciò che Openai cube DeepSeek ha fatto con Chatgpt, usando alcuni dei suoi risultati per risparmiare denaro durante la formazione dell’IA.
Un modello di ragionamento open supply come il modello Open-R1 che i ricercatori propongono potrebbe essere utilizzato per altri scopi, non solo matematica e codifica. I ricercatori menzionano la medicina, in cui il ragionamento “potrebbe avere un impatto significativo”.
Detto questo, non è chiaro per quanto tempo impiegherà il progetto e quando Open-R1 sarà pronto per i check. Altri ricercatori di intelligenza artificiale interessati a Open-R1 possono controllare il progetto su Github.