Testo-Video per caratteri AI che parlano

La capacità di CHATGPT di ignorare il copyright e il buon senso mentre creano immagini e faux deep è il discorso della città in questo momento. Il modello del generatore di immagini che Openi è stato lanciato la scorsa settimana è così ampiamente usato sta rovinando la funzionalità di base di Chatgpt e tempo di attività per tutti.

Ma non sono solo progressi nelle immagini generate dall’IA a cui abbiamo assistito di recente. IL Modello video Runway Gen-4 Ti consente di creare clip incredibili da una singola immediate di testo e una foto, mantenendo la continuità di carattere e scena, a differenza di qualsiasi cosa abbiamo visto prima.

I video forniti dall’azienda dovrebbero mettere in considerazione Hollywood. Chiunque può realizzare clip di livello cinematografico con strumenti come quello di Ruway, supponendo che funzionino come previsto. Per lo meno, l’intelligenza artificiale può aiutare a ridurre i costi di effetti speciali per alcuni movie.

Non è solo il nuovo strumento video AI di Runway che sta girando la testa. Meta ha un prodotto Mocha AI che può essere utilizzato per creare personaggi di AI parlanti in video che potrebbero essere abbastanza buoni da ingannarti.

Mocha non è un tipo di caffè scritto. È abbreviato per il personaggio cinematografico Animatore, un progetto di ricerca di Meta e dell’Università di Waterloo. L’thought di base del modello Mocha AI è piuttosto semplice. Fornisci all’IA un immediate di testo che descrive il video e un campione di discorso. L’intelligenza artificiale mette quindi insieme un video che garantisce ai personaggi “parlano” le righe nel campione audio quasi perfettamente.

I ricercatori hanno fornito molti campioni che mostrano capacità avanzate di Mocha e i risultati sono impressionanti. Abbiamo tutti i tipi di clip che mostrano protagonisti live-action e animati che parlano le righe del campione audio. Mocha tiene conto delle emozioni e l’IA può anche supportare più personaggi nella stessa scena.