Ką naujasis „Nvidia“ tekstas į 3D reiškia inžinerijai ir gaminių dizainui

tl; dr: Generatyvusis dirbtinis intelektas vystosi nepaprastai greitai. Naujausias Nvidia algoritmas konvertuoja tekstą į 3D tinklelį dvigubai greičiau nei projektai, paskelbti vos prieš 2 mėnesius. Tai reiškia, kad techninės galimybės dabar jau pranoksta mūsų galimybes su jomis dirbti.

Praeitą savaitę popierius Nvidia mokslininkai parodė eksponentinį greitį, kuriuo vystosi generacinė AI erdvė. Šis veiklos sprogimas, ypač pastebimas per pastaruosius 9 mėnesius, turės įtakos visoms gyvenimo sritims, ypač gaminių projektavimui, inžinerijai ir gamybai. Pokyčiai išlaisvins pramonę nuo struktūrinių suvaržymų, susijusių su idėjų perdavimu, paskatins greitesnius inovacijų ciklus ir galiausiai leis įgyvendinti savo tvarumo pažadus.

„Nvidia Research“ Magic 3D algoritmų tinklelių pavyzdžiai su jiems generuoti naudojamais raginimais.

Nvidia Deep Imagination Research

Daugelį metų buvo sakoma, kad dirbtinis intelektas iš esmės pakeis mūsų darbo būdą, tik nedaugelis tikėjosi, kad kūrybinis sektorius taps tarp pirmųjų jo aukų. 3 m. pasirodžius GPT-2020 į žmogų panašaus teksto generatoriui, galimybės buvo išryškintos. Nuo to laiko tai buvo beprotiška: DALL-E (tekstas į vaizdą), Whisper (kalbos atpažinimas), o pastaruoju metu stabili difuzija (tekstas į vaizdą) ne tik padidino kalbos ir vaizdo AI įrankių galimybes, bet ir sumažino jų naudojimui reikalingus išteklius (nuo 175 mlrd. GPT-3 parametrų iki 900 mln. stabilios difuzijos).

„Stable Diffusion“ dydis reiškia, kad diske yra mažiau nei 5 GB, todėl jį galima paleisti bet kuriame nešiojamajame kompiuteryje. Ne tik tai; Skirtingai nuo OpenAI (kurią daugiausia finansuoja Microsoft ir leidžia GPT-3, DALL-E ir Whisper), Stable Diffusion yra atvirojo kodo, o tai reiškia, kad kiti gali daug lengviau remtis jo mokymu. Tai reiškia, kad matome tik naujovių ciklo pradžią – kaip rodo „Nvidia“ dokumentas, laukia daug daugiau.

„Stable Diffusion“ rėmėjai (stability.ai) toliau skatina šią tendenciją, teikdami technologines ir finansines dotacijas kitoms komandoms, nukreipiančioms tyrinėjimą naujomis kryptimis. Be to, dėl daugybės projektų įrankiai tampa prieinami vis didesniam vartotojų ratui. Tarp jų yra „Blender“ įskiepiai, atvirojo kodo projektavimo įrankis ir „Adobe“ patentuotas „Photoshop“ atitikmuo. Visa API prieiga prie įrankių finansuojama iš didelių rizikos kapitalo dolerių, o tai reiškia, kad šimtai milijonų programinės įrangos kūrėjų, o ne tik keli šimtai tūkstančių duomenų inžinierių, dabar sukurs savo įrankius pagal šiuos algoritmus.

Kalba, vaizdai ir tekstas yra vienos iš pirmųjų vertikalių, kurias šios technologijos sutrikdo. Tačiau 3D neatsilieka. Be nišinio generatyvaus meno, animaciniai filmai yra akivaizdus pirmasis taikymo taškas. Jau yra „Pokémon“ generatorius, pagrįstas stabilia difuzija. Toliau – vaizdo efektai ir filmai. Tačiau greičiausiai bus sutrikdyta daugelyje kitų sektorių, įskaitant interjero dizainą, kuriam vadovauja Interiorai.com.

Per visą šį jaudulį naujovių taikymas projektavimo ir inžinerijos sričiai atrodo tarsi pasekmes. Tačiau greičiausiai tai bus didžiausias poveikis. Žinoma, yra ir pradinių iššūkių: „Stable Diffusion“ ir jos tautiečiai dar nėra labai tikslūs. Tai nėra animacinių filmų problema, tačiau tai yra didelis iššūkis bet kokiam bandymui paversti tekstą į visas 3D geometrijas, naudojamas pramoniniame kontekste. Tai sritis, kuri sulaukė tam tikro susidomėjimo (101 m. Izraelyje buvo pradėtas projektas Bits2015). Tai gali būti pramonės šventasis gralis, tačiau yra daug tarpinių iššūkių, kuriuos gali būti daug lengviau išspręsti. Tai apima patobulintą objektų atpažinimą (Yolo algoritmas jau naudojamas labai veiksmingai), todėl bus pagerintas citavimas ir anotacija – pagerinama kokybė ir sumažėja klaidų. Papildiniai taip pat turėtų palengvinti Generative AI naudojimą kuriant pagrindinius dizainus (Primitives), kuriuos vėliau galima redaguoti projektavimo įrankiuose, siekiant pagerinti toleranciją pagal reikalavimus. Tai metodas, jau naudojamas Altair's Inspire, kuris naudojo baigtinių elementų analizę, kad padarytų tą patį. Šie primityvai taip pat gali tarnauti kaip sintetinė anotuotų modelių duomenų bazė, kurių 3D CAD pramonėje trūksta. „Physna“ generalinis direktorius ir įkūrėjas tai nurodo straipsnyje išsamiai aprašo savo bandymus naudoti šiuos naujus metodus kuriant detalius 3D dizainus, o tai taip pat išryškina daugybę spąstų naudojant sintetinius duomenis šiems algoritmams valdyti. 3D projektų kūrimas iš 2D brėžinių yra dar viena potenciali taikymo sritis, kaip ir intelektualioji CAM, kuri skatina įrankių nusidėvėjimo biblioteka, siekiant nustatyti geriausias apdirbimo strategijas.

Šie iššūkiai yra svarbūs ir pelningi, kad juos būtų galima spręsti patiems. Tačiau pagrindinis jų poveikis bus padėti plėtoti kelią nuo idėjos iki dizaino, galiausiai sumažinant priklausomybę nuo 3D dizaino, kad būtų galima perduoti ketinimus. 2D ar 3D dizainai buvo pagrindinė priemonė klientų poreikiams paversti galutiniais produktais. Tai riboja pramonę, nes šie dizainai tarnauja kaip juodoji dėžė, kurioje saugomos visos tos vertingos klientų įžvalgos, gamybos suvaržymai ir įmonės tikslai, kurių neįmanoma atskirti, tačiau jie identifikuojami atskirai. Tai reiškia, kad kai kas nors pasikeičia, tiesiog pakoreguoti dizainą beveik neįmanoma. Dėl šios priežasties gamybos naujovės, pvz., 3D spausdinimas, perima daug laiko ir nuolat nuvilia trumpalaikius investuotojus. Orlaivį sudarantys komponentai „nustatomi“ nuo jų sukūrimo momento, nepaisant 20 ir daugiau metų produktyvaus naudojimo. Naujovių beveik nėra – jos turi laukti naujos kartos pristatymo.

Galimybė pakeisti vieną apribojimą ir leisti tokiam algoritmui kaip „Stable Diffusion“ atkurti projektavimo ir gamybos parametrus žymiai paspartins naujų inovacijų diegimą ir leis mums greičiau sukurti lengvesnius, geresnius produktus. Būsimieji inžinieriai, kaip ir „Formulėje 1“ arba „System Design“, veiks kaip suvaržymų valdytojai, galintys žodžiais ir remdamiesi duomenų šaltiniais išreikšti produkto tikslą ir apribojimus.

Tokiu būdu nepaspartindami naujų ir esamų produktų inžinerinio proceso, beveik neturime galimybių pasiekti ambicingų tvarumo tikslų, kuriuos turime išsikelti patys. Norėdami tai padaryti, pirmiausia turime susitarti dėl kalbos, kuria galėtume bendrauti ne tik projektuose. Šis naujas semantinis modelis yra akivaizdi pirmiau aprašytų naujovių spraga. Nemažai įmonių jau pradėjo su juo eksperimentuoti, pvz nTopologija su savo laukų sąvokomis. Ir vis dėlto pokyčių tempas yra lėtas, skirtingai nuo algoritmų, kuriuos pateiks semantinis modelis. Pranešama, kad naujasis „Nvidia“ algoritmas yra dvigubai greitesnis nei DreamFusion, paskelbta mažiau nei prieš 2 mėnesius. Gaminių ir inžinerijos įmonės dabar turi stengtis užfiksuoti savo idėjas naujais, ateičiai tinkančiais būdais, kad išnaudotų visas galimybes, kurias suteikia šis generatyvaus AI sprogimas. Algoritmų kaitos greitis dar kartą parodė, kad Morzės dėsnis taikomas visur, kur įrankiai yra skaitmeninami. Iššūkis tebėra mūsų žmogiškasis nesugebėjimas priimti šio pokyčio ir diegti naujus komunikacijos metodus, galinčius išlaisvinti jų potencialą, nepaisant užduoties skubumo.

Šaltinis: https://www.forbes.com/sites/andrewegner/2022/11/24/what-nvidias-new-text-to-3d-means-for-engineering–product-design/