Antropico lancia il primo modello di AI del “ragionamento ibrido” al mondo

La differenza tra un modello convenzionale e uno ragionamento è simile ai due tipi di pensiero descritti dall’economista vincitore del premio Nobel Michael Kahneman nel suo libro del 2011 Pensare velocemente e lento: Pensiero di sistema 1 veloce e istintivo e pensiero di sistema 2 più lento più deliberativo.

Il tipo di modello che ha reso possibile CHATGPT, noto come modello linguistico di grandi dimensioni o LLM, produce risposte istantanee a un immediate interrogando una grande rete neurale. Questi output possono essere sorprendentemente intelligenti e coerenti, ma potrebbero non rispondere a domande che richiedono ragionamento passo-passo, inclusa la semplice aritmetica.

Un LLM può essere costretto a imitare il ragionamento deliberativo se viene chiesto di elaborare un piano che deve quindi seguire. Questo trucco non è sempre affidabile, tuttavia, e i modelli in genere lottano per risolvere problemi che richiedono una pianificazione estesa e attenta. Openai, Google e ora antropici stanno usando tutti Un metodo di apprendimento automatico noto come apprendimento di rinforzo Per ottenere i loro ultimi modelli per imparare a generare ragionamento che indica le risposte corrette. Ciò richiede la raccolta di dati di allenamento aggiuntivi dagli umani sulla risoluzione di problemi specifici.

Penn afferma che la modalità di ragionamento di Claude ha ricevuto ulteriori dati sulle applicazioni aziendali tra cui il codice di scrittura e fissaggio, utilizzando i laptop e rispondendo a domande legali complesse. “Le cose su cui abbiamo apportato miglioramenti sono … soggetti o soggetti tecnici che richiedono un lungo ragionamento”, afferma Penn. “Ciò che abbiamo dai nostri clienti è molto interesse a distribuire i nostri modelli nei loro carichi di lavoro reali”.

Antropico afferma che Claude 3.7 è particolarmente bravo a risolvere i problemi di codifica che richiedono un ragionamento passo-passo, superando O1 di Opens su alcuni parametri di riferimento come SWE-Bench. Oggi la società sta rilasciando un nuovo strumento, chiamato Claude Code, appositamente progettato per questo tipo di codifica assistita dall’IA.

“Il modello è già bravo a codificare”, afferma Penn. Ma “il pensiero aggiuntivo sarebbe buono per i casi che potrebbero richiedere una pianificazione molto complessa: advert esempio stai guardando una base di codice estremamente grande per un’azienda”.