„MacWhisper“ yra nemokama transkripcijos programinė įranga, kurios aš laukiau

Ar ieškote „Mac“ programinės įrangos, skirtos garso failams perrašyti į rašytinius tekstinius failus? Yra daugybė mokamų įrankių, pvz., Otter.ai ir Trint, kurie gali kainuoti tikrus pinigus, kai pradėsite juos naudoti per daug. Bet MacWhisper yra nemokamas sprendimas, kurio internetas laukė. Arba bent jau tas, kurio laukiau.

2022 m. rugsėjo mėn. „OpenAI“ išleido neįtikėtinai galingą nemokamą programą, kuri leido žmonėms, turintiems šiek tiek technologijų išmanymo, konvertuoti savo garso ir vaizdo failus į neįtikėtinai tikslius nuorašus. Problema buvo ta, kad jis nebuvo labai prieinamas paprastam vartotojui, nes reikėjo žinoti, kaip naudoti komandas terminalo programoje.

Bet su „MacWhisper“, kurį pirmasis pastebėjo 9to5Mac, kažkas pagaliau sukūrė GUI arba grafinę vartotojo sąsają, kuri yra sukurta ant OpenAI Whisper ir palieka visą painią techninę informaciją po gaubtu, leidžiančią tiesiog vilkti ir mesti garso failą ir labai greitai gauti transkripciją. O „MacWhisper“ yra labai tikslus, nes „OpenAI Whisper“ buvo apmokytas 680,000 valandos garso duomenų žiniatinklyje.

Vienas iš malonių „MacWhisper“ dalykų yra tai, kad neįkeliate garso ar vaizdo failo, kurį norite perrašyti į internetą. Tai svarbu žurnalistams, kurie galbūt dirba su jautria istorija, arba visiems, kurie paprastai nesiryžta įkelti savo asmeninių failų į debesį. Failas lieka darbalaukyje, o tai reiškia, kad nėra tikimybės, kad kas nors galėtų perimti jūsų garsą.

Vėlgi, „MacWhisper“ yra tik nauja nemokamos programos, kurią OpenAI pristatė praėjusių metų pabaigoje, vartotojo sąsaja, tačiau ji tikrai palengvins garso transkripciją beveik visiems. Nes aš naudoju Whisper ir man pasirodė nepaprastai naudinga nuo tada, kai buvo išleista. Ir net aš dabar naudosiu MacWhsiper, nes tai tikrai pagreitins mano darbo eigą.

Kaip tik vieną pavyzdį, po žinios apie kriptovaliutų įmonės FTX žlugimą, aš panaudojau Whisper, kad perrašyčiau dešimtis valandų senų „YouTube“ interviu su įmonės įkūrėju Sam Bankman-Fried. Iš ten galėjau ieškoti nuorašų ir rasti keistų bei įdomių idėjų straipsniams rašyti, pavyzdžiui, kai 2021 m. birželio mėn. SBF pasakė, kad „blockchain“ būtų ištaisęs „Enron“.. SBF palyginimas su Enron buvo keistas sutapimas, atsižvelgiant į viską, ką dabar žinome apie FTX žlugimą. Tačiau niekada nebūčiau radęs to momento sename neaiškiame interviu, neturėdamas dešimčių nuorašų, kurių galėčiau ieškoti. Ir šis procesas, nors ir lengvesnis nei klausytis valandų valandas trunkančių juostų, vis tiek buvo sudėtingas ir nelabai automatizuotas.

Įdiegęs „Whisper“ savo kompiuteryje, į „Mac“ terminalo programą įvesdavau „whisper audiofilename.mp3 –model tiny.en“ bet kuriuo metu, kai norėjau perrašyti failą. Naudodamas WhisperMac galiu tiesiog vilkti ir nuleisti garso failą ir jis atlieka savo stebuklus be jokio papildomo spausdinimo.

Išbandžiau „MacWhisper“ su „NBC Nightly News“ epizodu, kurį atsisiunčiau iš „YouTube“. Be keleto klaidų, pavyzdžiui, žodžio „windchills“ interpretavimas kaip „windshills“ ir Lesterio Holto girdėjimas kaip „Lesterio laikymas“, stenograma buvo labai tiksli. „MacWhisper“ yra nemokama, tačiau yra mokama programinės įrangos pakopa, kuri gali būti šiek tiek tikslesnė, nes naudoja intensyvesnius „OpenAI“ mokymo modelius, tačiau nemokama versija puikiai tiks daugumai žmonių.

„MacWhisper“ leidžia eksportuoti perrašytą žodį keliais skirtingais formatais, įskaitant paprastą tekstą, CSV ar net subtitrų failo formatą, pvz., SRT ir VTT.

Ir „MacWhisper“ skirtas ne tik anglų kalbai. Galite perrašyti garsą į 100 skirtingų kalbų, o tai yra nepaprastai patogu. Vienintelė funkcija, kurios „MacWhisper“ neturi ir kuria man patiko žaisti „Whisper“ terminalo programoje, yra kalbos vertimas. Išverčiau virusinius vaizdo įrašus į rusų ir kinų kalbas ir žmonės, kalbantys šiomis kalbomis „Twitter“, man pasakė, kad vertimai yra tikslus.

Kita funkcija, kurios „MacWhisper“ neturi, nors jos taip pat nėra „OpenAI's Whisper“, yra galimybė atskirti garsiakalbius. Pavyzdžiui, jei transkribuojate interviu su dviem pranešėjais, nėra aiškių ženklų, rodančių, kada vienas kalbėtojas sustojo, o kitas pradėjo. Bet aš įtariu, kad galiausiai kas nors sukurs tą galimybę. Mokamos paslaugos, pvz., „Trint“, tai daro automatiškai, ir būtų puiku, jei galų gale būtų nemokama, bet jūs gaunate tai, už ką mokate.

Taip pat yra „MacWhisper“ funkcija, kuria galite konvertuoti kalbą iš kompiuterio mikrofono į tekstą, o tai gali būti naudinga, jei norite ką nors transkribuoti skrydžio metu.

Ištisus mėnesius galvojau, kada pagaliau kas nors sukurs Whisper GUI, nes keli žmonės ją išbandė, bet nesukūrė nieko, kas būtų patogu vartotojui. Tačiau „MacWhisper“, kurią sukūrė Jordi Bruin, yra programinė įranga, kurios aš laukiau. Bruin taip pat sukūrė tokią programinę įrangą kaip MacGPT, kuri leidžia vartotojams pasiekti „ChatGPT“ iš savo meniu juostos.

Galite atsisiųsti MacWhisper nemokamai, su registracija el. paštu, Bruin svetainėje.

Šaltinis: https://www.forbes.com/sites/mattnovak/2023/02/04/macwhisper-is-the-free-transcription-software-ive-been-waiting-for/