Transkriptsioon

Kuidas transkriptsioon töötab, täpsus, keeled, töötlemisaeg ja helikvaliteedi näpunäited.

Kui täpne on transkriptsioon?

Täpsus ületab tavaliselt 95% selge heli puhul toetatud keeltes. Kasutame kapoti all OpenAI tööstuse juhtivat kõnetuvastust — sama mudelit, mis töötab paljudes professionaalsetes transkriptsiooni tööriistades.

Reaalmaailma täpsus sõltub kolmest asjast: heli selgusest (taustamüra kahjustab), kõneleja aktsendist (tugevad piirkondlikud aktsendid võivad tulemust mõne punkti võrra langetada) ja keelest (inglise ja hispaania keeles on tavaliselt kõrgeim skoor). Kui soovid maksimaalset täpsust, vaata väikseid asju, mis teevad suure vahe, jaotisest Milline helikvaliteet annab parimaid tulemusi?.

Kas SoundScript.AI suudab tuvastada erinevaid kõnelejaid minu helisalvestises?

Jah — kõneleja tuvastamine on saadaval igal plaanil, sealhulgas Free plaanil. Seadista üleslaadimise vormil Tuvasta kõnelejad valikule Jah ja me märgistame automaatselt iga kõneleja sinu transkriptsioonis kui Speaker 1, Speaker 2 ja nii edasi.

See töötab suurepäraselt koosolekute, intervjuude, podcastide ja igasuguste mitme inimesega vestluste puhul. Tuvastame kõnelejaid piiramatu arvu. Kõneleja tuvastamine lisab veidi töötlemisaega, seega jäta see soolo salvestuste puhul (loengud, häälmärkmed, ühe jutustajaga sisu) välja, et saada kiiremaid tulemusi.

Milliseid keeli saan transkribeerida?

Toetame transkriptsiooniks 99 keelt, sealhulgas inglise, hispaania, portugali, prantsuse, saksa, itaalia, jaapani, hiina, korea, vene, araabia, hindi ja palju muud.

Parima täpsuse saamiseks saad valida keele üleslaadimise vormil või jätta selle Automaatsele ja me tuvastame selle sinu eest. Keelteloend on sama, mis OpenAI Whisper'i toetatud keeltel, ja SoundScript.AI liides ise on samuti saadaval kõigis 99 keeles — vaata, kust muuta oma liidese keelt, jaotisest Kust saan uuendada oma liidese keelt?.

Milline helikvaliteet annab parimaid tulemusi?

Selged häälitsused, mis on salvestatud mikrofoni lähedal, minimaalse taustamüraga. See on lühike versioon. Siin on, mis kõige rohkem aitab:

  • Kasuta korralikku mikrofoni — isegi algajate USB-mikrofon või kaasaegne telefon on palju parem kui sülearvuti sisseehitatud mikrofon.
  • Salvesta vaikses ruumis — sulge aknad, lülita ventilaatorid välja ja väldi kõvasid pindu, mis kajastuvad.
  • Ole mikrofonile lähedal — 15–30 cm on loomulikuks kõneks ideaalne vahemaa.
  • Väldi taustmuusikat võimalusel — vaata, mida oodata, kui muusika on vältimatu, jaotisest Kuidas SoundScript.AI käitleb taustmuusikat või müra?.

Kui kaua töötlemine tavaliselt aega võtab?

Enamik faile on valmis sekunditest paari minutini. Tüüpiline 10-minutiline helifail lõpetab tavaliselt alla 30 sekundiga.

Failid, mis on suuremad kui 25MB, jaotatakse automaatselt tükkideks ja töödeldakse paralleelselt, seega isegi tunniajane salvestus on tavaliselt 2–3 minutiga valmis. Kõneleja tuvastamise lubamine lisab veidi lisaaega. Edenemisriba uueneb reaalajas — pole midagi värskendada.

Mis juhtub failidega, mis on suuremad kui 25MB?

Jagame suured failid automaatselt kapoti all väiksemateks tükkideks, transkribeerime need paralleelselt ja ühendame tulemused kokku. Sa ei pea midagi tegema — lihtsalt lae fail üles nagu tavaliselt.

Maksimaalne üleslaadimise suurus on 1GB. Iga tükki töödeldakse iseseisvalt, mistõttu tunniajane fail saab olla valmis vaid mõne minutiga. Tüki piirid asetatakse võimalusel loomuliku vaikuse kohale, et vältida sõnade poolelt lõikamist.

Miks on minu transkriptsioonis pärisnimede vigu?

Pärisnimed — nimed, brändinimed, tehnilised terminid, akronüümid — on transkriptsiooni kõige keerulisem osa, sest need ei järgi tavapäraseid keelemustreid. Isegi suurepärane heli võib anda valesti kirjutatud nimesid.

Mõned asjad, mis aitavad:

  • Vali keel selgelt automaatse tuvastamise asemel.
  • Häälduta pärisnimesid selgelt salvestamisel, väikese pausiga nende ümber.
  • Redigeeri transkriptsiooni hiljem — saad teksti kopeerida mis tahes redaktorisse ja parandada nimesid otsi-asenda funktsiooniga. Me ei toeta praegu kohandatud sõnastikku, kuid see on meie plaanis.

Kas saan transkriptsiooni teksti muuta?

Saad kopeerida transkriptsiooni teksti tulemuste lehelt ja muuta seda mis tahes tekstiredaktoris või tekstitöötlusprogrammis — Google Docs, Microsoft Word, Notepad, ükskõik mida eelistad.

Meil pole rakendusesisest redaktorit veel, seega väljas SoundScript.AI-s tehtud muudatusi ei salvestata meie serveritesse. Algne transkriptsioon jääb sinu töölaudale, nii et saad alati värske koopia alla laadida. Kasuta redigeerimiseks ja vorminduse säilitamiseks .doc- või .txt-allalaadimise formaate.

Milleks on SRT ja TXT allalaadimise formaadid?

SRT on standardne subtiitrivorming — see sisaldab ajatempleid, et iga tekstirida ilmuks õigel hetkel sinu videos. Kasuta seda YouTube'i, Vimeo, videotöötlejate nagu Premiere või Final Cut või mis tahes subtiitritoega mängijaga.

TXT on lihttekst ilma ajatempliteta — täiuslik dokumentide, blogitekstide, transkribeeritud intervjuude või kõige muu jaoks, kus soovid lihtsalt sõnu. Pakume ka DOC (vormindatud Wordi dokument) ja PDF (trükitav) — vaata üksikasju jaotisest Kuidas laadida alla TXT, DOC või PDF?.

Kuidas SoundScript.AI käitleb taustmuusikat või müra?

Teeme oma parima, kuid tugev taustmuusika või müra vähendab täpsust. Kerge ümbritsev müra (vaikne kohvik, jooksev ventilaator) ei põhjusta tavaliselt probleeme. Vali muusika või konkureerivad hääled on kõige keerulisemad juhtumid.

Sissejuhatusmuusikaga intervjuu-stiilis sisu puhul näed tavaliselt muusikat transkribeerituna arusaamatu tekstina või vahele jäetuna, seejärel täpsus taastub kõne alguses. Kui suudad salvestada oma heli ainult kõnega (või eemaldada muusika esmalt tööriistaga nagu Audacity), on täpsus märgatavalt parem.

Vajad veel abi?

Ei leia vastust, mida otsid? Proovi SoundScript.AI tasuta — krediitkaarti pole vaja.

Proovi tasuta

või kirjuta meile [email protected]