Žvilgsnis į naująjį „Al Generative Art“.

Al Generative Art yra meno rūšis, dažniausiai vizuali, kuri remiasi žmogaus ir autonominės sistemos bendradarbiavimu. „Autonominė sistema“ apibrėžiama kaip Dirbtinis intelektas programinė įranga, algoritmas ar modelis, galintis atlikti sudėtingas operacijas be programuotojo įsikišimo.

Iš keistų vaizdų sugretinimų, kuriuos sukūrė Dall-E Mini į NFT rinkoje, AI algoritmų sukurti vaizdai vis dažniau patenka į pagrindinę vaizduotę. Tiesą sakant, du svarbūs projektai šia tema, kuriuos verta išanalizuoti: Vidurinė kelionė ir DALL-E2.

Žinoma, naujienos taip pat pateko į „Twitter“. Tai, be kita ko, komentuoja Charlesas Hoskinsonas, kuris rašė:

Al Generative Art: ankstyvieji eksperimentai ir funkcijos

Suvokus, kas yra generatyvusis menas, svarbu pabrėžti vieną iš jo pagrindinių principų: atsitiktinumas. Tai yra pagrindinė generatyvaus meno savybė.

Tiesą sakant, priklausomai nuo programinės įrangos tipo, autonominė sistema gali apdoroti rezultatus, kurie visada yra skirtingi ir unikalūs kiekvieną kartą, kai vykdoma generavimo komanda, arba ji gali pateikti kintamą skaičių rezultatų, reaguodama į vartotojo įvestį.

Pirmieji generatyvaus meno eksperimentai datuojami septintajame dešimtmetyje su eksperimentais Haroldas Cohenas ir jo AARONAS programa. Cohenas pirmą kartą panaudojo atskirą programinę įrangą, kad sukurtų abstrakčius meno kūrinius, įkvėptus Pop Art šilkografijos. Coheno darbai dabar eksponuojami Tate galerijoje Londone.

Kitas „Generative Art“ atributas, tačiau vis mažiau prerogatyva, yra programuotojo pateiktų modelių ar abstrakčių elementų kartojimas, įdiegtas programinės įrangos kode.

Be to, vis sudėtingesnių neuroninių tinklų, veikiančių naudojant teksto ir vaizdo susiejimą, kūrimas leido sukurti generatyvius modelius, galinčius sukurti vis realistiškesnius ir tikslesnius vaizdus. Žinomiausias šios generatyvaus meno kategorijos pavyzdys yra Plokštė.

Dall-E yra multimodalinis neuroninis tinklas, pagrįstas GPT-3 gilaus mokymosi modelis iš OpenAI, ta pati įmonė, kuri taip pat neseniai sukūrė ChatGPT, pokalbių robotas paleistas 2022 m. lapkritį ir optimizuotas su "prižiūrimas" ir sustiprinimo mokymosi metodai.

Grįžtant prie Dall-E matome, kad ši sistema gali generuoti vaizdus iš tekstinio aprašymo, vadinamo "pasakyti", remiantis teksto ir vaizdo porų duomenų rinkiniu.

Pirmoji „Dall-E“ versija, kuri buvo pristatyta visuomenei 2021 m. sausio mėn. ir liko nedaugelio šios srities profesionalų prerogatyva, reprezentavo tikrą revoliuciją kalbant apie tokio tipo generatyvų modelį, pranokstančią GPT naujoves. 3 pati.

Taip pat svarbu yra tai, kad Dall-E apdorotų rezultatų tikslumas pasirodė esąs puikus pasirinkimas kitam OpenAI sprendimui: CLIP (Kontrastyvios kalbos ir vaizdo išankstinis mokymas).

Vaizdų klasifikavimo ir reitingavimo neuroninis tinklas, parengtas remiantis teksto ir vaizdo asociacijomis, pvz., internete esančiomis antraštėmis. Dėl CLIP įsikišimo, kuris sumažina vartotojui siūlomų rezultatų skaičių vienu raginimu iki 32, buvo nustatyta, kad Dall-E daugeliu atvejų pateikia patenkinamus vaizdus.

Midjourney: dizainas, žmonių infrastruktūra ir dirbtinis intelektas

Kaip ir tikėtasi, Vidurinė kelionė yra svarbus projektas, kuris yra besiformuojančios Al Generative Art koncepcijos dalis. Tiksliau, „Midjourney“ yra nepriklausoma tyrimų laboratorija, kuri tiria naujas mąstymo priemones ir plečia žmonių rūšies vaizduotės galias.

Naudotis juo paprasta: pirmiausia reikia susikurti paskyrą Nesantaika, platforma, kurioje yra įvairios bendruomenės, kur Midjourney yra viena iš jų. Programoje yra įvairios pokalbių svetainės, kuriose galima aktyviai dalyvauti diskusijose arba ne.

Svarbu pažymėti, kad norint pirmą kartą pabandyti panaudoti dirbtinį intelektą, reikia eiti į "naujokai" kanalai, kur 25 nemokami atvaizdai nėra.

Vienas atvaizdavimas atitinka keturių skirtingų variantų generavimą iš tos pačios tekstinės įvesties.

Taigi 25 atvaizdai nurodo 25 apdorojimo užduotis, kurias atlieka „Midjourney“ robotas. Todėl norint sukurti vaizdą, reikia bendrauti su „Midjourney“ robotu per tekstinį pranešimą, vadinamą „prompt“, kuriame bus raktiniai žodžiai, apibūdinantys vaizdą, kurį vartotojas turi omenyje.

Galite pridėti tiek detalių, kiek norite, svarbu raktinius žodžius padalinti kableliu. Kai atvaizdavimas bus baigtas, kompiuteris grąžina keturis skirtingus vaizdus pagal aprašus, iš kurių galima pasirinkti.

Be to, kai programa baigs atvaizduoti, galite pranešti apie savo nuostatas pagal vaizdus ir, jei norite, vėl sugeneruoti dar keturias versijas.

DALL-E 2: nauja AI sistema meno kūriniams

Be Midjourney, DALL-E 2 taip pat yra nauja AI sistema, kuri gali sukurti tikroviškus vaizdus ir meno kūrinius iš natūralios kalbos aprašymo. Negana to, DALL-E 2 taip pat gali derinti koncepcijas, atributus ir stilius.

Naujosios dirbtinio intelekto sistemos stiprybė taip pat slypi galimybe išplėsti vaizdus daugiau nei originalioje drobėje, kuriant naujos ekspansyvios kompozicijos. Be to, jis gali realiai pakeisti esamus vaizdus iš antraštės natūralia kalba ir gali pridėti bei pašalinti elementus, atsižvelgdamas į šešėlius, atspindžius ir tekstūras.

DALL-E 2 galimybės taip pat apima fotografavimą ir kelių jo variantų, įkvėptų originalo, kūrimą. DALL-E 2 išmoko ryšį tarp vaizdų ir jiems apibūdinti naudojamo teksto.

Jis naudoja procesą, vadinamą „difuzija“, kuris prasideda atsitiktinių taškų raštu ir palaipsniui keičia tą modelį link vaizdo, kai atpažįsta konkrečius to vaizdo aspektus.

Taigi po to, kai 2021 m. sausio mėn. OpenAI pristatė DALL-E, dabar naujausia sistema DALL-E 2 generuoja tikroviškesnius ir tikslesnius vaizdus su keturis kartus didesne raiška.

DALL-E 2 prasidėjo kaip tyrimo projektas ir dabar yra prieinamas kaip a beta versija. Sistemos sukurtos ir toliau tobulinamos saugumo mažinimo priemonės apima: sistemos gebėjimo kurti smurtinius, neapykantos ar suaugusiųjų vaizdus apriboti ir mokymu pagrįstą laipsnišką diegimą.

Šaltinis: https://en.cryptonomist.ch/2023/02/02/ai-generative-art/