„Midjourney“ įkūrėjas Davidas Holzas apie AI poveikį menui, vaizduotei ir kūrybinei ekonomikai

Vidurinė kelionė yra viena iš pirmaujančių naujų dirbtinio intelekto (AI) technologijos varomųjų jėgų kuriant vaizdinius vaizdus iš teksto raginimų. San Franciske įsikūręs startuolis neseniai paskelbė apie meno kūrinių variklį, kuris laimėjo apdovanojimą Kolorado valstijos mugės konkurse, ir vargu ar tai bus paskutinė sudėtinga problema, su kuria AI menas susidurs ateinančiais metais.

Midjourney išsiskiria iš kitų erdvėje, pabrėždama tapybinę estetiką jos kuriamuose vaizduose. Platforma nesistengia kurti fotorealistiškų vaizdų, kuriuos būtų galima supainioti su nuotraukomis, o generalinis direktorius Davidas Holzas teigia, kad jam asmeniškai labai neramu dėl neįtikėtinos gilių klastotės ir kitų darbų, kurie per daug artimai imituoja tikrovę. Vietoj to Holzas sako, kad „Midjourney“ sukurta tam, kad išlaisvintų paprastų žmonių kūrybiškumą, suteikiant jiems įrankius gražioms nuotraukoms vien jas aprašant.

Tačiau nepaisant humanistinio, į vartotoją orientuoto įmonės dėmesio, neišvengiamai kyla klausimų apie pasekmes komerciniam menui ir profesionaliems menininkams. Aš apklausiau Holzą platesnis straipsnis apie galimus AI meno trikdžius kuriant vaizdus pramogoms, vaizdo žaidimams ir leidybai. Čia yra ilgesnė mūsų pokalbio ištrauka, kurioje Holzas pateikia daugiau informacijos ir konteksto, kai jis sprendžia šias problemas ir paaiškina savo įmonės, pramonės ir technologijų viziją. Interviu buvo redaguotas siekiant ilgumo ir aiškumo.

Robas Salkowitzas, „Forbes“ bendradarbis: koks jūsų vaidmuo ir titulas?

Davidas Holzas, Vidurio kelionė. Aš esu įkūrėjas ir generalinis direktorius. Vis dėlto dažniausiai mėgstu vadintis įkūrėju, nes generalinis direktorius skamba labai versliai, o mes nesame labai verslūs. Esame taikomųjų tyrimų laboratorija, kuri gamina produktus.

Kokia yra „Midjourney“ misija?

Mums patinka sakyti, kad bandome išplėsti žmonių rūšies vaizduotės galias. Tikslas yra padaryti žmones labiau vaizduotus, o ne kurti vaizduotę turinčias mašinas, o tai, manau, yra svarbus skirtumas.

Ar galite pateikti trumpą įmonės istoriją iki šiol?

Su vaizduotės dalimi savo įmonėje pradėjome dirbti maždaug prieš pusantrų metų. Buvo keletas proveržių difuzijos modelių srityje, žmonės suprato klipą, openAI ir panašius dalykus. Beveik visi dalyvaujantys šioje srityje yra San Franciskas ir visi supratome, kad tai taps rimta, kad tai skiriasi nuo daugelio kitų dalykų.

Kokia, Midjourney nuomone, šios teksto į vaizdą technologijos nauda verslui ir visuomenei?

Man tikrai labiau rūpi visuomenė nei verslas. Esame plataus vartojimo produktas, bet gal 30–50 % mūsų vartotojų šiuo metu yra profesionalai. Dauguma ne. Platformoje esantys menininkai mums sako, kad tai leidžia jiems iš pradžių būti kūrybiškesniems ir tyrinėti, per trumpą laiką sugalvoti daug idėjų.

Šiuo metu mūsų profesionalūs vartotojai naudoja platformą koncepcijai kurti. Sunkiausia [komercinio meno projekto] dalis dažnai būna pradžioje, kai suinteresuotoji šalis nežino, ko nori, ir turi pamatyti keletą idėjų, į kurias galėtų reaguoti. Kelionės vidurys gali padėti žmonėms daug greičiau susitaikyti su norima idėja, nes kartoti šias sąvokas yra labai sunku.

Kitas menininkų privalumas yra tai, kad tai suteikia žmonėms pasitikėjimo tose srityse, kuriomis jie nepasitiki. Dauguma, jei ne visi menininkai, jaučia, kad yra tam tikra meno dalis, kurios jie negali padaryti gerai. Tai gali būti spalvos, kompozicija, fonas. Mūsų gaminį naudoja garsus personažų dizaineris ir žmonės jo klausia, kodėl turėtumėte naudoti dirbtinį intelektą, nes jau esate toks geras. Ir jis pasakė: „Na, man sekasi tik charakterio dalis. Tai man padeda su visa kita, pasauliu, fonu, spalvų schemomis.

Kiek žmonių naudojasi šiuo produktu?

Milijonai tuo naudojasi. Mūsų nesantaika viršija du milijonus. Tai kol kas didžiausias aktyvus „Discord“ serveris.

Ar Midjourney licencija leidžia komerciniais tikslais naudoti platformos sukurtus vaizdus?

Taip. Tačiau jei dirbate įmonėje, kurios metinės pajamos didesnės nei milijonas dolerių, prašome įsigyti įmonės licenciją.

Kaip buvo sukurtas duomenų rinkinys?

Tai tik didelis interneto gabalas. Mes naudojame atvirus duomenų rinkinius, kurie yra paskelbti, ir mokome juos. Ir aš sakyčiau, kad tai daro 100% žmonių. Nebuvome išrankūs. Mokslas tikrai greitai vystosi atsižvelgiant į tai, kiek duomenų jums iš tikrųjų reikia, palyginti su modelio kokybe. Prireiks kelerių metų, kad viską išsiaiškintumėte, ir iki to laiko galite turėti modelių, kuriuos treniruojate beveik nieko neturėdami. Niekas iš tikrųjų nežino, ką jie gali padaryti.

Ar ieškojote gyvų menininkų sutikimo ar vis dar saugomų autorių teisių?

Ne. Iš tikrųjų nėra būdo gauti šimtą milijonų vaizdų ir žinoti, iš kur jie gaunami. Būtų puiku, jei vaizduose būtų įterpti metaduomenys apie autorių teisių savininką ar pan. Bet tai ne dalykas; nėra registro. Jokiu būdu negalima rasti nuotraukos internete, tada automatiškai atsekti jos savininką ir daryti bet kokius būdus, kad būtų galima ją autentifikuoti.

Ar menininkai gali atsisakyti įtraukti juos į jūsų duomenų mokymo modelį?

Mes žiūrime į tai. Dabar iššūkis yra išsiaiškinti, kokios yra taisyklės ir kaip išsiaiškinti, ar asmuo iš tikrųjų yra konkretaus kūrinio menininkas, ar tik užsideda savo vardą. Nesutikome nė vieno, kuris norėtų, kad jų vardas būtų pašalintas iš duomenų rinkinio.

Ar menininkai gali atsisakyti būti įvardijami raginimuose?

Ne dabar. Mes žiūrime į tai. Vėlgi, turėtume rasti būdą, kaip autentifikuoti tas užklausas, kurios gali būti sudėtingos.

Ką sakote komerciniams menininkams, susirūpinusiems, kad tai sunaikins jų pragyvenimo šaltinius? Kodėl meno vadovas tam tikru momentu turėtų samdyti iliustratorą, kad jis sukurtų tokius darbus kaip koncepcinis menas, gamybos dizainas, fonai – tokie dalykai – kai jie gali tiesiog įvesti raginimus ir gauti naudingos produkcijos daug greičiau ir už daug mažesnę kainą?

Dar daug darbo. Tai ne tik „padaryk man foną“. Tai gali būti dešimt kartų mažiau darbo, bet tai yra daug daugiau darbo, nei ketina atlikti vadovas.

Manau, kad tai gali vykti dviem būdais. Vienas iš būdų yra pabandyti pateikti tokio pat lygio turinį, kurį žmonės vartoja už mažesnę kainą, tiesa? Kitas būdas tai padaryti – sukurti nepaprastai geresnį turinį tokiomis kainomis, kurias jau esame pasirengę išleisti. Manau, kad dauguma žmonių, jei jau išleidžia pinigus, o jūs turite pasirinkimą tarp nepaprastai geresnio ar pigesnio turinio, iš tikrųjų renkasi nepaprastai geresnį turinį. Rinka jau nustatė kainą, kurią žmonės nori mokėti.

Manau, kad kai kurie žmonės bandys išstumti menininkus. Jie bandys pagaminti kažką panašaus už mažesnę kainą, ir manau, kad jiems nepavyks rinkoje. Manau, kad rinka sieks aukštesnės kokybės, daugiau kūrybiškumo ir daug sudėtingesnio, įvairesnio ir gilesnio turinio. Ir laimės tie žmonės, kurie iš tikrųjų gali naudotis kaip menininkai ir tam naudojasi įrankiais.

Šios technologijos iš tikrųjų sukuria daug gilesnį vizualinės terpės vertinimą ir raštingumą. Galbūt iš tikrųjų turite paklausą, pranokstate galimybę gaminti tokiu lygiu, o tada galbūt iš tikrųjų padidinsite menininkų atlyginimus. Tai gali būti keista, bet taip ir nutiks. Tos kokybės ir įvairovės paklausos didėjimo tempas lems nuostabių ir netikėtų projektų įgyvendinimą.

Studentų karta baigė meno mokyklas, daugelis jų turi didelių skolų ir tikėjosi gana gerai apmokamų pramogų gamybos, vaizdo žaidimų gamybos, komercinio meno ir kt. Kaip AI teksto į vaizdą platformų atsiradimas paveiks jų ateitį?

Manau, kad kai kurie žmonės bandys sumažinti išlaidas, o kiti – plėsti ambicijas. Manau, kad žmonės, kurie plečia ambicijas, vis tiek mokės tuos pačius atlyginimus, o žmonės, kurie bandys sumažinti išlaidas, manau, žlugs.

Ai paprastai plačiai naudojamas tokiems dalykams kaip skambučių centrai ar bagažo tikrinimas oro uostuose ir tokiems darbams, kurių žmonėms nelabai rūpi. Vertybės pasiūlymas yra tas, kad jis išlaisvina žmones dirbti naudingesnį, įdomesnį darbą. Tačiau meno darbai yra naudingi ir įdomūs. Žmonės dirba visą gyvenimą ir tobulina savo įgūdžius, kad gautų tokius darbus. Kodėl jūs nurodote šią technologiją tame ekonomikos lygmenyje kaip savotišką verslo dėmesį ir prioritetą jūsų veiklai?

Asmeniškai aš nesu. Mano daiktai nėra skirti profesionaliems menininkams. Jei jiems patinka tai naudoti, tai puiku. Mano daiktai skirti tokiems žmonėms, kurie, pavyzdžiui, yra ši moteris Honkonge, ji atėjo pas mane ir sako: „Vienas dalykas Honkonge, kurio tavo tėvai niekada nenori, kad tu būtum menininkė, ir aš dabar esu bankininkas. Aš gyvenu gerą bankininko gyvenimą. Tačiau su Midjourney dabar aš iš tikrųjų pradedu pajusti, kaip būti tuo žmogumi, kokiu iš tikrųjų norėjau būti. Arba vaikinas sunkvežimio stotelėje, kuris pats kuria beisbolo korteles su laukiniais vaizdais, tiesiog savo malonumui. Jis sukurtas tiems žmonėms, nes, kaip ir dauguma žmonių, jie niekada negali to daryti.

Svarbu pabrėžti, kad tai ne apie meną. Čia kalbama apie vaizduotę. Vaizduotė kartais naudojama menui, bet dažnai ne. Dauguma „Midjourney“ sukurtų vaizdų nėra naudojami profesionaliai. Jie net nedalinami. Jie tiesiog naudojami šiems kitiems tikslams, šiems labai žmogiškiems poreikiams.

Nepaisant to, jūsų produkto produkcija yra vaizdai, kurie, be visų kitų savybių, turi komercinę vertę profesiniame kontekste. Ir tai labai žlugdo ekonomiką.

Manau, kad mes gaminame valtį ir kas nors gali lenktyniauti su ja, bet tai nereiškia, kad laivas yra skirtas lenktynėms. Jei lenktynėms naudojate valtį, galbūt taip, žinoma. Tą akimirką yra. Tačiau žmogiškoji pusė tikrai svarbi, ir aš manau, kad mes ne... Norime, kad nuotraukos būtų gražios. Mes nemanome, kad bandome kurti meną kaip savo dalyko dalį. Norime, kad pasaulis būtų vaizdingesnis. Mes mieliau gaminsime gražius, o ne bjaurius dalykus.

Ar manote, kad kuri nors vyriausybinė institucija turi jurisdikciją ar įgaliojimus reguliuoti šią technologiją? Ir jei taip, ar manote, kad jie turėtų?

Nežinau. Reguliavimas įdomus. Turite suderinti laisvę ką nors daryti su laisve būti apsaugotam. Pati technologija nėra problema. Tai kaip vanduo. Vanduo gali būti pavojingas, jame galite nuskęsti. Bet tai taip pat būtina. Nenorime uždrausti vandens vien tam, kad išvengtume pavojingų dalių.

Na, mes norime būti tikri, kad mūsų vanduo yra švarus.

Taip, tai tiesa.

Šaltinis: https://www.forbes.com/sites/robsalkowitz/2022/09/16/midjourney-founder-david-holz-on-the-impact-of-ai-on-art-imagination-and-the- kūrybinė ekonomika/