Dopo aver lanciato il modello Gemini 2.5 Professional alcune settimane fa, Google Ha un nuovo prodotto AI pronto per i take a look at. Gemelli 2.5 Flash dovrebbe portare un ragionamento AI più conveniente a compiti che richiedono più pensieri.
Google consente agli utenti di specificare un finances e attivare e disattivare il ragionamento a seconda dell’attività. Non tutto ciò che lanci all’IA richiederà il ragionamento, quindi non devi spendere troppo facendo “pensare” all’IA quando non è necessario.
Tuttavia, Gemini 2.5 Flash non è un prodotto di intelligenza artificiale che si rivolge agli utenti regolari. Invece, Gemini 2.5 Flash è un nuovo strumento che gli sviluppatori e i clienti aziendali possono utilizzare per il lavoro. Gemini 2.5 Flash è disponibile in anteprima tramite il Gemelli Api in Google AI Studio E Vertex ai.
Google afferma che Gemini 2.5 Flash è abbastanza formidabile. L’intelligenza artificiale è la latenza più bassa di Google e il modello di pensiero più economico. Ciò significa che è più veloce ed economico di altri modelli.
Gemini 2.5 Flash offre un “importante aggiornamento delle capacità di ragionamento”, ha affermato Google In un publish sul weblog. La nuova AI è il “primo modello di ragionamento completamente ibrido” di Google, che è il modo in cui Google descrive i modelli di intelligenza artificiale in cui gli sviluppatori possono attivare o disattivare il ragionamento.
È interessante notare che gli sviluppatori possono impostare finances di pensiero in modo che l’IA possa svolgere compiti di pensiero quando sono richiesti. Tuttavia, l’IA non consumerà l’intero finances durante un’unica attività di ragionamento se story attività non ne ha bisogno. Il modello è addestrato per sapere quanto tempo pensare per le istruzioni, quindi deciderà in anticipo quanto ragionamento è richiesto in base alla complessità percepita.
Google offre alcuni esempi tempestivi che spiegano quanto ragionamento eseguirà il flash Gemini 2.5. Advert esempio, chiedergli di tradurre una parola in una lingua diversa richiede poco ragionamento. Lo stesso vale per rispondere a domande come “Quante province ha il Canada?”
Ma problemi di matematica e fisica più complessi richiederanno un ragionamento medio -alto. L’intelligenza artificiale trascorrerà più tempo su un immediate e pagherai più soldi per ottenere le tue risposte.
Gli sviluppatori possono impostare un finances di pensiero da 0 a 24576 token nell’API o utilizzare un cursore in Google AI Studio e Vertex AI.
Per quanto riguarda il costo, Google afferma che Gemini 2.5 Flash costa $ 0,15 per milione di token (enter) e $ 0,60 per milione di token (output). Se il ragionamento è coinvolto per la produzione, il prezzo aumenta di sei volte, fino a $ 3,50 per milione di token. Questi costi rendono Gemini 2.5 Flash incredibilmente competitivo, come si vede nella tabella alla positive di questo publish.
Con il pensiero disattivato, il flash Gemini 2.5 sarà almeno veloce del modello flash Gemini 2.0.
La velocità e i prezzi competitivi per le attività di ragionamento non sono i soli vantaggi di Gemini 2.5 Flash. Il nuovo modello fa anche molto bene nei parametri di riferimento. Secondo Google, Gemini 2.5 Flash è secondo solo a Gemini 2.5 Professional in istruzioni concrete in LMarena.
Nell’ultimo esame dell’umanità, Gemini 2.5 Flash ha superato tutti i modelli recenti tranne Chatgpt O4-Mini, che è stato lanciato all’inizio di questa settimana. L’immagine seguente mostra più risultati di riferimento.
