Naujasis dirbtinis automobilio garso intelektas gali pagerinti ne tik melodijas

Holivudas nuolat vaizdavo dirbtinį intelektą (DI) kaip distopinių robotų, pakeičiančių nieko neįtariančius žmones ir sukeliančių vis didėjantį, pagrindinį konfliktą, veikiantį sluoksnį. Geriausiu atveju galite įsivaizduoti jauną Hailey Joelą Osmentą, vaidinančią Davidą, save žinantį, dirbtinį vaiką Spielbergo poliarinių kepurėlių, atšildytų ir užtvindytų pakrantės miestų pasaulyje (skamba pažįstamai?). AI: dirbtinis intelektas kuris (spoiler alert) tik nusižudo. O gal prisimenate Robino Williamso balsą kaip Dwóchsetletni Vyras kuris ir vėl yra save žinantis robotas, bandantis klestėti, kuris (dar kartą perspėjant apie spoilerį) tampa vienintele jo auka. Ir, žinoma, yra beveik klišinė nuoroda Terminatorius ir jo post-apokaliptinis pasaulis su mašinomis, bandančiomis sunaikinti žmones, ir, gerai, (ne taip jau spoileris) daug aukų per porą dešimtmečių. Tačiau nė viename iš šių scenarijų žmonės negyvena kartu su geresniu gyvenimu, jau nekalbant apie geresnes pramogas ir saugumą.

Tačiau tai yra nauja realybė. Dirbtinio intelekto algoritmai gali būti įtraukti į garso dizainą ir nuolat tobulinami naudojant naujinimus belaidžiu būdu, siekiant pagerinti vairavimo patirtį. Ir tiesiogiai prieštarauja šiems Holivudo pavyzdžiams, toks AI iš tikrųjų gali padidinti žmogaus tikimybę išgyventi.

Tiesiog Dėl malonumo

Dar visai neseniai visoms vartotojo sąsajoms (UI), įskaitant garso kūrimą, per standartinius trisdešimt šešis (36) transporto priemonės programos mėnesius reikėjo sudėtingų programavimo specialistų. Lakštinio metalo stilius ir elektroninės dėžutės yra nurodytos, gaunamos ir kuriamos lygiagrečiai, kad būtų galima kalibruoti atskirus elementus vėlyvoje kūrimo stadijoje. Firminiai garsai. Akustiniai parašai. Visos atskiros iniciatyvos to paties aneminio sistemos dizaino, kuris turi gamintojams kainavo milijardus.

Tačiau dirbtinis intelektas leido daug lankstesniu ir efektyvesniu būdu sukurti garso patirtį. „Tai, ką matome, yra tendencijų konvergencija“, – teigia Joshas Morrisas, „DSP Concept“ mašininio mokymosi inžinerijos vadovas. „Garsas tampa vis dominuojančia automobilių ypatybe, tačiau tuo pat metu matote, kad šiuolaikiniai procesoriai tampa stipresni, suteikia daugiau atminties ir galimybių.

Be to, naudojant į sistemas orientuotą kūrimo platformą, dirbtinį intelektą ir šiuos stipresnius procesorius vairuotojams ir keleiviams suteikiamas naujo lygio prisitaikymas realiuoju laiku. . „Vietoj istorinio poreikio rašyti daugybę kodų kiekvienam įmanomam scenarijui, AI vadovauja sistemos reagavimui, remdamasis išmoktu supratimu apie aplinkos sąlygas ir įvykius“, – teigia Steve'as Ernstas, „DSP Concept“ automobilių verslo plėtros vadovas.

Labai akivaizdus būdas naudoti tokią mokymosi sistemą yra „triukšmo mažinimas“ transporto priemonėje, kad aukščiausios kokybės garsą būtų galima pritaikyti ir patobulinti, nepaisant to, kad buvo pakeistos žieminės padangos ar kiti panašūs aplinkos pokyčiai. Bet „LG Electronics“ sukūrė algoritmus, veikiančius „DSP Concept“ garso audimo programoje platforma, leidžianti patobulinti filmo dialogą balsu, kai pramogaujama ant galinės sėdynės, kad paryškintų jį, palyginti su sprogimais filme, taip leidžiant keleiviui geriau išgirsti kritinį turinį.

Kitas neaiškus aspektas būtų tai, kaip firminiai garso garsai yra orkestruojami tarp kitų triukšmų. Ar šiai konkrečiai transporto priemonei reikalinga didėjanti paleidimo seka, kad būtų galima groti, o kiti garsai, pvz., radijas ir varpeliai, automatiškai išjungiami? Kiekvieną patirtį galima koreguoti.

Labiau tikėtina, kad klestės

Pasauliui lenktyniaujant ir dėl elektrinių transporto priemonių, ir dėl autonominio vairavimo, garsinių įspėjimų dažnis ir poreikiai greičiausiai smarkiai pasikeis. Pavyzdžiui, autonominio taksi saugos inžinierius negali manyti, kad keleiviai yra šalia vaizdinio ekrano, kai reikia laiku įspėti. Ir koks tas perspėjimas yra girdimas beveik 25 milijonai amerikiečių su negalia kam autonominės transporto priemonės turėtų atverti naujas mobilumo galimybes? „Garsas dabar skirtas ne tik mėgstamos dainos klausymui“, – teigia Ernstas. „Autonominio vairavimo atveju yra įvairių įspėjimų, kurių reikia, kad vairuotojas būtų įsitraukęs arba neįsitraukęs vairuotojas įspėtų apie aplink vykstančius dalykus.

„Ir kas tai daro dar sudėtingesnį“, – sako Adamas Levensonas, „DSP Concepts“ rinkodaros vadovas, – kad visi dalykai automobilyje tvarkomi vienu metu: telefonija, įtraukiantis arba erdvinis garsas, variklio triukšmas, kelio triukšmas, akustinės transporto priemonių įspėjimo sistemos, balso sistemos ir pan. Norime sakyti, kad sudėtingiausias garso produktas yra automobilis.

Pavyzdžiui, įsivaizduokite scenarijų, kai vairuotojas greitkelyje įjungė autonominio važiavimo režimą, pasisuka melodijas ir maloniai nežino apie artėjančią avarinę transporto priemonę. Kokiu tikslumu (ir atstumu) aptikdama sireną naudojant transporto priemonės mikrofoną (-ius) automobilis įspėja savo beveik išsiblaškiusį vairuotoją? Kaip tas perspėjimas turi būti pateiktas, kad būtų pašalintas aplinkos triukšmas, būtų skiriama pakankamai dėmesio, bet be reikalo neišgąsdintų vairuotojas? Visa tai galima suderinti naudojant iš anksto sukurtus modelius, išankstinius mokymus su skirtingomis sirenomis ir vėlesnį derinimą debesies pagrindu. „Čia bendra orkestruotė tampa tikrai svarbi“, – aiškina Morrisas. „Galime paimti [AI aptikimo] modelio išvestį ir nukreipti ją į skirtingas automobilio vietas. Galbūt išjungsite garsą, įjungsite įspėjamąjį garsinį signalą ir ką nors mirksite prietaisų skydelyje, kad vairuotojas atkreiptų dėmesį.

Tas pats pasakytina ir apie išorinius įspėjimus. Pavyzdžiui, tylioje elektra varomoje transporto priemonėje gali būti sureguliuotas signalizatorius pėstiesiems. Taigi naujus kalibravimus galima sukurti neprisijungus ir atsisiųsti į transporto priemones kaip programinės įrangos atnaujinimus, pagrįstus įgalintomis naujovėmis.

Inovacijos visur. Ir dirbtinis intelektas maitina utopinę patirtį, o ne kuria Holivudo distopinį pasaulį.

Autoriaus numatymas

Štai mano savaitės prognozė (ir dar tik antradienis, žmonės): kita garso raida apims visą, momentinį grįžtamąjį ryšį, įskaitant subtilų, realaus laiko naudotojų džiaugsmą. Taip, didžioji dalis dabartinio dizaino tikriausiai pagerina patirtį, tačiau nuolatinis į vartotoją orientuoto dizaino (UCD) kalibravimas gali būti papildomai patobulintas atsižvelgiant į keleivių išraiškas, kūno kalbą ir komentarus, taip individualiai suderinant pasitenkinimą realiuoju laiku. Yra visi įgalintojai: kamera, AI, procesoriai ir prisitaikanti platforma.

Taip, mes jau girdėjome apie prisitaikantis nuotaikos apšvietimas ir nuotolinis nuobodulio, streso ir kt. aptikimas, siekiant pagerinti saugumą, bet nieko, kas pagerintų bendrą patirtį, pagrįstą visų naudotojo nukreiptų jutiklių mokymosi algoritmais realiuoju laiku.

Galbūt aš per daug ekstrapoliuoju. Bet kaip ir Robino Williamso personažas, aš aprėpiau du šimtmečius... taigi galbūt aš taip pat jautriai reaguoju į tai, ko gali norėti žmonės.

Šaltinis: https://www.forbes.com/sites/stevetengler/2022/09/13/the-new-artificial-intelligence-of-car-audio-might-improve-more-than-just-tunes/