Tekoälyvideon aamunkoitto: Peltonen yrjöää verkkokalvoillesi
Demoni joillekin, enkeli muille.
Tekoälyvideot ovat lähellä kuvien ja musiikin tasoa. Jos osaat tiivistää parilla lauseella teeman, josta tykkäät, tekoäly saattaa yllättää. Jos jaksat muotoilla toiveen uudelleen kymmeniä tai satoja kertoja, saatat saada sitä, mitä tilasit.
OpenAI Sora on yhä vasta tulossa. Väitetysti se on vallankumous. Lumalabs Dream Machine (linkki) on köyhän miehen Sora, jonka ilmaiset testit kannattaa käydä kokeilemassa. Jutun väärti saavutus video ei ole, jos lihava mies juoksee neliulotteiset rappuset ylös 4 sekunnissa, muuttaen muotoaan puolen sekunnin välein. Jotkut kehuvat sitä, kuinka Dream Machine saa valmiit kuvat liikkumaan. Sain valtiovarainministerin puhumaan (ilman ääntä; ääni pitää aina tehdä erikseen), mutten paljastumaan vampyyriksi.
Runway Gen-3 Alpha (linkki) maksaa, mutta saattaa olla lähellä sitä, mitä Sora on käytännössä. Hinta on pullonkaula nyt, kun tahdomme vain leikkiä. Tein 50 videota, joiden joukosta kaikki artikkelin esimerkit ovat. Tahtoisin tehdä 50 000, ja tarkoitan että tänään ja rajoituksista huolimatta. 50 on surkea luku, joka yllyttää lopettamaan toimivien ideoiden hiomisen, jotta muuta ehtii kokeilla.
Kun laatu paranee, asia muotoillaan toisin. Mitäpä jos et lennä etelään tänä vuonna, vaan käytät lomabudjetin lyhytelokuvaan, joka olisi kustantanut 10 miljoonaa dollaria kolme päivää sitten? Runwayn rajoittamaton vuositilaus on lomareissun hinnoissa.
Yläpuolelta löytyvä video edustaa meemejä. Kokeillaan mitä sattuu - kivaa.
Tässä tulee haaste tekoälylle:
Ärtyisällä teinitytöllä on perinteinen saamelaisasu. Hänen värinsä ovat kuin valokuvan negatiivissa eli iho on harmaansininen, hiukset ovat valkoiset, silmän valkuaiset ovat mustat ja asu on ruskea. Taustalla näkyvä lumi on valkoista. Taustalla näkyy myös kuollut, junan kokoinen tuhatjalkainen, jonka ympärillä häärii pingviinejä toppatakeissa.
Jos vanha lastenkirjani olisi julkaistu, tuo olisi kansikuva. Gen-3 Alpha ymmärsi visiosta 5% ja sitten jo vähän enemmän. On eksoottisen ärsyttävää joutua lopettamaan yrittäminen, kun sitä muistaa takoneensa päätä seinään satoja tunteja perinteisen yrittämisen merkeissä.
Gen-3 Alpha on raskaasti sensuroitu kuten useimmat tällaiset. Luin ohjeet, mutta toisinaan tulkinnanvaraisetkin väkivaltaiset tai seksuaaliset sanat saattavat johtaa videon hylkäykseen.
Viaton vakiotemppuni on se, että yritän selittää tekoälylle, kuka tai mikä Mortal Kombat -pelien D'Vorah on olevinaan. Pelin tekijöillekin kyseinen ampiaisten pesänä toimiva zombie on ensisijaisesti tapa olla ällöttävä. Tulokset tapaavat olla kiintoisampia kuin eräiden tubettajien vakiotemput "susi ulvoo kuuta" ja "Pixarin sitruuna juo mehua".
Videossa soi Pimppari-laulu Tekoälyviisut-artikkelista. Biisi visioi, että hirviö teeskentelee ihmistä päästäkseen munimaan heihin, kuten tietyt ötökät teeskentelevät lehteä tai oksaa. D'Vorah munii vastustajiin pelissäkin, mutta mimikry-idea lähti siitä, että evoluution ja elämän karseat vaiheet alkavat näkyä, kun tekoälyltä erehtyy tilaamaan kuvia D'Vorahista.
Halusin tai en, olen herännyt keskellä yötä kirjoittamaan muistiinpanoja sketseistä ja käänteistä, jotka sopisivat pitkään mimikry-tarinaan. Tästä ja vähemmän psykoottisista sattumuksista johtuen olen vakuuttunut, että "plagiointikoneeksi" solvattu tekoäly lisää luovuutta laiskistamisen sijaan.
Onko Kotimaisten kielten keskus kuulolla?
En tahdo olla tekoälytaiteilija enkä promptaaja. Tahdon olla yrjö. Ollaan yrjöjä.
Olen jo verrannut tekoälyä siihen, kuinka supertuottajat George Lucas ja Walt Disney muuttivat taiteen suunnan kokoamalla unelmatiimin. Tekoäly-yrjö ei oletusarvoisesti osaa mitään, mutta hänelle annetaan se tiimi. Käsite taipuu kaikkiin tarpeisiin. Solvaa yrjöksi sitä, mistä et pidä, mutta varaudu myöntämään, että jokin on jo kunnon yrjöä. Ehkä siitä vastasi Pyhä Yrjö. "Yrjö plagioi elämäntyöni" on vastaava lentävä lause kuin "n***a stole my bike". Seuraava tavoitteeni on keksiä mediaseksikäs sana tekoälyajan kommunismille.
Yrjösin musiikkivideon! No, ainakin montaasin. Kaikki yrjöämäni laulut on toteutettu Suno-palvelulla. Mainitaan samalla, että D'Vorah-kuvat (yksi D'Vorah-videossa, toinen yläpuolella) on yrjötty Stable Diffusionilla.
Jos sitä lähtisi alusta saakka suunnittelemaan musiikkivideota, kokeilemissani työkaluissa on mahdollisuuksia kuten huulisynkka ja kahden kuvan välisen siirtymän animointi. Teoriassa yhden, kiinteän hahmon saa aidosti laulamaan koko biisin. Ja on muita polkuja tehdä sama. Ja huomenna on uusia.
Olen katsonut läjäpäin muiden yrjöjen testejä. Kun tubettaja kertoo ammattimaisesta mainoksesta tai musiikkivideosta, jotka teoriassa ovat teknologian huipentuma, olen erittäin kiinnostunut uutisesta, mutta 50% todennäköisyydellä unohdan katsoa sen varsinaisen videon, jos saavutus oli kustannustehokas kliseisyys.
"Tekoäly on polku moniin kykyihin, joita jotkut pitävät luonnottomina. Onko mahdollista oppia tämä voima? Ei Hollywoodilta."
- Yrjö Luukas
Keskustelut (1 viestiä)
16.07.2024 klo 09.20 9