'Buitenaards': OpenAI's tekst-naar-video tool Sora maakt indruk op internet

ongeveer 2 maanden geleden gepubliceerd

OpenAI, het bedrijf achter ChatGPT, heeft een nieuwe vorm van kunstmatige intelligentie onthuld die realistische video’s creëert op basis van tekstprompts. Het heeft voor verbazing gezorgd op het internet. Het tekst-naar-video model, genaamd Sora, heeft “een diep begrip van taal” en kan “overtuigende personages genereren die levendige emoties uitdrukken”, aldus OpenAI in een blogpost.

Complexiteit en details

“Sora is in staat om complexe scènes te genereren met meerdere personages, specifieke soorten bewegingen en nauwkeurige details van het onderwerp en de achtergrond,” zei de door Microsoft gesteunde startup. “Het model begrijpt niet alleen wat de gebruiker in de prompt heeft gevraagd, maar ook hoe die dingen bestaan in de fysieke wereld.”

CEO van OpenAI, Sam Altman, nodigde gebruikers uit om prompts voor te stellen voor Sora. De resultaten waren realistische video’s van twee golden retrievers die een podcast opnemen bovenop een berg, een grootmoeder die gnocchi maakt, en zeedieren die deelnemen aan een fietsrace bovenop de oceaan.

Reacties

De hyperrealistische kwaliteit van de video’s leidde tot verbaasde reacties op sociale media, waarbij gebruikers de resultaten “buitenaards” en een “gamechanger” noemden. “Het is al twee uur geleden en mijn hersenen kunnen deze gegenereerde OpenAI Sora-video’s nog steeds niet verwerken,” zei gebruiker Allen T.

Veiligheid en risico’s

De demonstratie wekte ook zorgen over mogelijke risico’s, vooral in een jaar met nauwlettend bekeken verkiezingen over de hele wereld, waaronder de Amerikaanse presidentsverkiezingen in november.

OpenAI zei in zijn blogpost dat het verschillende belangrijke veiligheidsstappen zou nemen voordat Sora aan het grote publiek wordt vrijgegeven. “We werken samen met red teamers - experts op gebieden als desinformatie, haatdragende inhoud en vooringenomenheid - die het model op een vijandige manier zullen testen,” aldus het bedrijf. “We bouwen ook tools om misleidende inhoud te detecteren, zoals een detectieclassifier die kan aangeven wanneer een video door Sora is gegenereerd.”

Zwakke punten

OpenAI gaf ook toe dat Sora zwakheden heeft, waaronder moeilijkheden met continuïteit en het onderscheiden van links van rechts. “Bijvoorbeeld, een persoon zou een hap uit een koekje kunnen nemen, maar daarna heeft het koekje misschien geen bijtsporen,” zei de in San Francisco gevestigde startup.

Concurrenten van OpenAI, zoals Meta en Google, hebben ook tekst-naar-video AI-technologie gedemonstreerd, maar hun modellen hebben niet zulke realistische resultaten geproduceerd als Sora.

Related news