Nevronska Mreža Se Je Naučila Ustvarjati Videoposnetke Na Podlagi Opisa - Alternativni Pogled

Nevronska Mreža Se Je Naučila Ustvarjati Videoposnetke Na Podlagi Opisa - Alternativni Pogled
Nevronska Mreža Se Je Naučila Ustvarjati Videoposnetke Na Podlagi Opisa - Alternativni Pogled

Video: Nevronska Mreža Se Je Naučila Ustvarjati Videoposnetke Na Podlagi Opisa - Alternativni Pogled

Video: Nevronska Mreža Se Je Naučila Ustvarjati Videoposnetke Na Podlagi Opisa - Alternativni Pogled
Video: Почему игра на музыкальном инструменте полезна для мозга — Анита Коллинс 2024, September
Anonim

Umetna inteligenca ustvarja scenarije z video posnetki - do zdaj kratki in zamegljeni, toda nekega dne bo sama nadomestila celoten filmski studio.

Nevronske mreže so že precej dobre (in v mnogih primerih boljše od ljudi) pri prepoznavanju vzorcev na sliki in so sposobne na splošno opisati celotne prizore. Generativne nevronske mreže izvajajo obratno preobrazbo in lahko oblikujejo sliko na podlagi njenega opisa ali napovedujejo naslednji okvir na podlagi prejšnjih.

Belgijski razvijalci so šli še dlje, saj so te zmogljivosti združili v en sam sistem, ki ustvarja videoposnetke "iz nič", ki temeljijo na lastnih izkušnjah strojnega učenja in besedila scenarijev. Tinne Tuytelaars je o tem spregovorila na zasedanju Združenja za napredek umetne inteligence (AAAI) v Združenih državah Amerike.

Nevronska mreža deluje v dveh stopnjah - po Tinneju kot da posnema ustvarjalni proces človeka: na prvi stopnji se oblikuje zamegljena, približna "skica" vsakega kadra, po kateri se podrobnosti določijo in dodajo. Eden od pomembnih delov takega sistema je diskriminatorna nevronska mreža, ki primerja rezultat s "resničnimi" videoposnetki, ki ustrezajo določenemu scenariju, in vam omogoča, da ocenite njegovo kakovost in izboljšate delo generativnega dela sistema.

Nevronska mreža je bila usposobljena za 10 prizorov ("igranje golfa na travi", "kitesurfing v morju" itd.) In se naučila ločevati dejanja in okoliščine drug od drugega, poleg tega pa jih je lahko poljubno kombinirala in ustvarjala videoposnetke, na primer o tem "Golf v bazenu":

Image
Image

ali "jadranje po snegu":

Image
Image

Promocijski video:

Kakovost takšnih animacij je seveda še zdaleč sprejemljiva: "videoposnetki", ki trajajo približno sekundo, so sestavljeni iz le 32 sličic z dimenzijami 64x64 pik.

Toda z enako samozavestjo je mogoče zagotoviti, da se bodo te številke hitro izboljšale, saj se ne tako dolgo nazaj sam kino lahko pohvali le z blatno, trmasto in neumno sliko. Če je mogoče takšno nevronsko mrežo narediti res hitro in učinkovito, se bo Hollywood morda končal: dovolj bo, da posnamete scenarij in film je pripravljen. Ta priložnost bo koristna pri ustvarjanju velikih nizov za usposabljanje drugih nevronskih mrež in pri ustvarjanju novih algoritmov za stiskanje in oddajanje pretočnih videov.

Sergej Vasilijev