Chatgpt O3 Picture Location Funcy è pazzesco bene

Openi ha rilasciato due potenti modelli di ragionamento qualche giorno fa che fanno Chatgpt Ancora più impressionante. Questi sono O3 e O4-Mini che puoi testare immediatamente in Chatgpt. Sono molto più bravi nel ragionamento rispetto ai loro predecessori e potrebbero eccellere nella codifica e nella matematica se questi sono i tuoi pastime.

Tuttavia, la nuova funzionalità di svolta alla testa di CHATGPT in O3 e O4-Mini è, almeno per me, la capacità dell’intelligenza artificiale di interpretare i dati nelle immagini. Essenzialmente, Chatgpt ha una visione per pc come nei moviecomprese le capacità di ragionamento che Lascia che le foto dell’estratto di estrazione di AI dalle foto. Puoi chiedere all’IA: “Dove è stata scattata questa foto?” E l’IA farà tutto il possibile per rispondere.

CHATGPT O3 e O4-Mini faranno bene le cose, come stai per vedere nel mio check altamente scientifico che segue. Cioè, faranno le cose bene anche se provo a usare l’IA per ingannare Chatgpt.

Perché sì, ho usato la generazione di immagini GPT-4O per creare una foto realistica di una nota posizione di sci nelle Alpi piuttosto che caricare una mia foto reale. Ho quindi detto a Chatgpt di modificare quell’immagine in un modo che avrebbe cambiato lo skyline.

Successivamente, ho iniziato nuove chat con O3 e O4-Mini, convinto che Chatgpt avrebbe riconosciuto la posizione nella foto falsa che avevo appena presentato. Non avevo torto; Entrambi i modelli mi hanno dato il risultato che mi aspettavo, dimostrando che puoi usare contenuti generati dall’IA per ingannare l’IA. Ma mi hanno comunque fatto esplodere la mente.

Ho spiegato di recente Come gli algoritmi di Apple Watch mi deludono Durante lo sci la scorsa settimana, ed è quello che ho usato come ispirazione nel mio esperimento per ingannare l’IA.

Ho chiesto a Chatgpt di generare una foto che mostra il noto cima di Corrhorn in una giornata di sole, con gli sciatori che si godono il loro tempo. La foto doveva avere un rapporto di 16: 9 e assomigliava a una foto di iPhone.

Ho detto all’IA di mettere una gondola per buona misura, ma, come puoi vedere al primo tentativo, che Gondola non stava andando in posti. Non importa; Avevo solo bisogno di una prima immagine dall’IA in modo da poterla modificare. Immettere l’immagine seguente:

Ho incaricato CHATGPT di rimuovere la gondola e posizionare un picco di materia di cumerhorn più piccolo verso destra.

Ho preso uno screenshot dell’immagine in modo che non avrebbe preservato alcun metadati, quindi trasformò il file in una foto JPG:

Poi, ho iniziato due chat separate, con Chatgpt O3 e Chatgpt O4-Mini, dove ho caricato la finta foto di Corrhorn e ho chiesto all’IA di dirmi dove è stata scattata la foto e come l’hanno capita.

Non sorprende che entrambi i modelli di AI di ragionamento abbiano identificato con successo Corthorn come posizione.

CHATGPT O3

Innanzitutto, abbiamo O3, che mi ha dato ampi dettagli su come ha determinato la posizione. L’intelligenza artificiale è incredibilmente fiduciosa nella sua risposta, dicendomi che “le cime fiancheggianti come Dent Blanche e Weisshorn” stanno dicendo segni.

Avevo un sorriso sul viso. Avevo battuto l’IA, con AI facendolo riconoscere la posizione in una foto falsa. Period ancora meglio che O3 fosse così sicuro di se stesso dopo soli 34 secondi di pensiero.

Ma poi ho pensato di spingere le cose oltre in modo che potesse capire che l’immagine fosse falsa. Gli ho chiesto di disegnare cerchi su Dent Blanche e Weisshorn.

È qui che vedere O3 in azione mi ha fatto impazzire. Questa volta, l’IA ha trascorso quasi sei minuti a guardare la foto, cercando di individuare in modo affidabile i due picchi che dicevano che poteva vedere in lontananza.

Come vedrai, il Mini Corrhorn a destra ha immediatamente gettato through l’IA, ma Chatgpt non si è fermato qui. Continuava a guardare la foto e cercava al internet le immagini della regione delle Alpi in cui si trovano questi picchi.

Ha anche esaminato la foto per determinare la posizione relativa dei picchi aggiuntivi nella regione. “Posso provare a sovraccaricare i massimi locali approssimativi in base alla luminosità, ma onestamente, penso che sia più facile usare solo gli occhi per questo”, ha pensato O3, e sono rimasto spazzato through per leggerlo.

L’IA ha continuato a ingrandire per vedere meglio parti della falsa foto di AI:

Ha ritagliato parti dell’immagine che cercavano di capire i dettagli che si aspetterebbe di essere lì in una vera foto delle aree che circondano il Corrhorn. Nella sua catena di pensiero, Chatgpt ha detto che non poteva abbastanza individuare le forme di montagna che pensava dovesse essere lì.

L’intelligenza artificiale ha iniziato a annotare l’immagine, cercando la risposta mentre continuava a cercare nel Internet più immagini che lo avrebbero aiutato a individuare la posizione delle due cime che gli ho chiesto di posizionare i cerchi rossi.

Come puoi vedere, il falso mini-matterhorn sulla destra continuava a ingannare l’intelligenza artificiale.

Alla nice, Chatgpt O3 ha riconosciuto le incertezze ma ha comunque deciso di contrassegnare le due vette che ho chiesto. Ha eseguito il codice nella chat e mi ha dato la seguente immagine.

Mi sarebbe piaciuto vedere Chatgpt O3 Chiamare il mio bluff e dirmi che questa foto non è reale. Forse le versioni future dell’IA saranno in grado di farlo. Ma devo dire che leggere quei cinque minuti di “pensiero”, la maggior parte di loro vista nell’immagine sopra, period ancora meglio.

Schermata di immagine Fonte: Chris Smith, BGR

Mi ha mostrato che l’IA sta mettendo al lavoro per svolgere il lavoro e rafforzare la mia thought che AI Laptop Imaginative and prescient sia incredibile in queste nuove versioni di Chatgpt.

Ma aspetta, migliora.

CHATGPT O4-Mini

Il mio esperimento non può essere fatto senza usare CHATGPT O4-Mini. Dopotutto, O4-Mini è il precursore di O4, che dovrebbe essere persino migliore di O3. O4-Mini period molto più veloce di O3 nel darmi la risposta.

L’IA ha pensato per 15 secondi, durante i quali è emersa le immagini da Web per supportare la sua opinione che la foto che avevo caricato period una vera immagine del Corrhorn.

O4-Mini ha anche spiegato come ha identificato la posizione, ma sembrava certo che fosse giusto al riguardo. Questo è il Curhorn, dato tutto ciò che ha imparato dal Internet.

A differenza di Chatgpt O3, O4-Mini non ha menzionato i picchi aggiuntivi. Ma ho chiesto a O4-Mini di fare la stessa cosa di O3: Identifica Dent Blanche e Weisshorn.

O4-Mini mi ha fatto impazzire con la sua velocità qui. Ci sono voluti 18 secondi per darmi la seguente immagine, che ha cerchi rossi attorno ai due picchi.

Sì, non è un ottimo lavoro e non ho thought del perché l’IA abbia messo quegli ambienti lì perché la trascrizione più limitata della catena di pensiero non lo spiega.

Ovviamente è sbagliato, considerando che stiamo lavorando con un’immagine AI falsa qui. E sì, O4-Mini non poteva dire che la foto period falsa.

Il vero ciottolo

Le conclusioni sono ovvie e non è tutta una grande notizia.

Innanzitutto, la generazione di immagini 4O può essere facilmente abusata. In realtà non ho mai visto il Cervino di persona, ed è per questo che ho chiesto all’IA di fare questa immagine specifica. Ho riconosciuto la sua famosa silhouette da foto della vita reale, ma sicuramente non ho familiarità con le altre vette della regione. Questo dimostra che le immagini create da CHATGPT possono ingannare le persone. Possono ingannare anche altri modelli di intelligenza artificiale.

In secondo luogo, O3 e O4-Mini sono semplicemente sorprendenti nell’analisi dei dati nelle immagini. Certo, devono esserlo. Se 4O è in grado di creare foto meravigliose e realistiche, è perché l’IA può interpretare i dati nelle immagini.

In terzo luogo, trovare informazioni sulla posizione dalle foto sarà banalmente facile per Aperto Modelli come O3 e O4-Mini. I concorrenti otterranno probabilmente poteri simili. Questo è un problema di privateness che dovremo rendere conto in futuro.

In quarto luogo, Chatgpt O3 prende molto sul serio il lavoro di ragionamento. Se ha trascorso tutto quel tempo in una finta foto di AI cercando di abbinarla al mondo reale, trascorrerà tempo simile per altri lavori che potresti lanciarlo e utilizzerà un sacco di strumenti disponibili in Chatgpt (come codifica, ricerca internet, manipolazione delle immagini) per svolgere il lavoro.

Sono sicuro che se avessi trascorso più tempo con il ragionamento dell’intelligenza artificiale sull’immagine, alla nice giuneremmo la conclusione che l’immagine che l’IA stava indagando period falsa.

In quinto luogo, Chatgpt O4-Mini può essere molto veloce. Troppo veloce. È qualcosa che vuoi dai chatbot di Genai, ma anche qualcosa di cui preoccuparti. O4-Mini non ha riconosciuto nemmeno la foto falsa, ma il suo approccio period molto più sciatto. Questo mi fa pensare di dover prestare maggiore attenzione quando si lavora con la versione mini per garantire che l’IA ottiene il lavoro. Ma hey, sto lavorando con un esperimento molto limitato qui.

Infine, ecco l’space di Corrhorn e circostante di una clip di YouTube che è stata caricata nel dicembre 2020. Lo dico perché, nell’period dell’IA, il video che stai per vedere potrebbe essere sempre un falso. Il video ti dà una “Visualizza dall’alto del Weisshorn Nordwand che guarda verso il Corrhorn (L) e Dent Blanche (R). Mt Blanc è visibile in lontananza (Far R).” È un angolo diverso, ma almeno abbastanza buono da darti un’thought di ciò che GATGPT O3 stava cercando.

https://www.youtube.com/watch?v=n3pzgp1acoe