Transkripcija

Kaip veikia transkripcija, tikslumas, kalbos, apdorojimo laikas ir garso kokybės patarimai.

Koks tikslus yra transkribavimas?

Aiškiam garso įrašui palaikomomis kalbomis tikslumas paprastai viršija 95%. Po gaubtu naudojame OpenAI pirmaujančią balso atpažinimo technologiją — tą patį modelį, kuris veikia daugelyje profesionalių transkripcijos įrankių.

Realus tikslumas priklauso nuo trijų dalykų: garso aiškumo (foninis triukšmas kenkia), kalbėtojų akcentų (stiprūs regioniniai akcentai gali sumažinti tikslumą keliais punktais) ir pačios kalbos (anglų ir ispanų paprastai gauna aukščiausius balus). Jei nori didžiausio tikslumo, peržiūrėk Kokia garso kokybė duoda geriausius rezultatus? — ten rasi smulkmenas, kurios duoda didelį skirtumą.

Ar SoundScript.AI gali identifikuoti skirtingus kalbėtojus mano garso įraše?

Taip — kalbėtojų identifikavimas galimas kiekviename plane, įskaitant Nemokamą planą. Įkėlimo formoje nustatyk Identifikuoti kalbėtojus į Taip, ir mes automatiškai pažymėsime kiekvieną kalbėtoją transkripcijoje kaip Kalbėtojas 1, Kalbėtojas 2 ir t. t.

Tai puikiai veikia susitikimams, interviu, podcast'ams ir bet kokiam pokalbiui su keliais žmonėmis. Kalbėtojų skaičius neribojamas. Kalbėtojų identifikavimas prideda šiek tiek apdorojimo laiko, todėl išjunk jį soliniams įrašams (paskaitoms, balso pranešimams, vieno pasakotojo turiniui), kad gautum greitesnius rezultatus.

Kokias kalbas galiu transkribuoti?

Transkripcijai palaikome 99 kalbų, įskaitant anglų, ispanų, portugalų, prancūzų, vokiečių, italų, japonų, kinų, korėjiečių, rusų, arabų, hindi ir daugelį kitų.

Įkėlimo formoje gali pasirinkti kalbą tiesiogiai — taip pasieksi geriausią tikslumą — arba palik Automatinis, ir mes ją aptiksime už tave. Kalbų sąrašas yra toks pat, kaip ir OpenAI Whisper palaikomų kalbų, o pati SoundScript.AI sąsaja taip pat prieinama visomis 99 kalbomis — žiūrėk Kur galiu pakeisti sąsajos kalbą?, kad pakeistum savąją.

Kokia garso kokybė duoda geriausius rezultatus?

Aiškūs balsai, įrašyti arti mikrofono, su minimaliu foniniu triukšmu. Tai trumpa versija. Štai kas padeda labiausiai:

  • Naudok padorų mikrofoną — net pradinio lygio USB mikrofonas arba šiuolaikinis telefonas yra daug geriau nei nešiojamojo kompiuterio integruotas mikrofonas.
  • Įrašinėk tylioje patalpoje — uždaryk langus, išjunk ventiliatorius ir venk kietų paviršių, kurie sukelia aidą.
  • Būk arti mikrofono — 15–30 cm yra optimalus atstumas natūraliai kalbai.
  • Venk foninės muzikos, kai įmanoma — žr. Kaip SoundScript.AI tvarkosi su foniniu triukšmu ar muzika?, kad sužinotum, ko tikėtis, kai muzikos išvengti negalima.

Kiek paprastai trunka apdorojimas?

Dauguma failų atliekami per sekundes ar porą minučių. Tipinis 10 minučių garso failas paprastai baigiamas per mažiau nei 30 sekundžių.

Failai, didesni nei 25MB, automatiškai dalijami į dalis ir apdorojami lygiagrečiai, todėl net valandos trukmės įrašas paprastai būna paruoštas per 2–3 minutes. Įjungus kalbėtojų identifikavimą pridedama šiek tiek papildomo laiko. Eigos juosta atnaujinama realiu laiku — nieko atnaujinti nereikia.

Kas atsitinka su failais, didesniais nei 25MB?

Automatiškai padaliname didelius failus į mažesnes dalis, transkribuojame jas lygiagrečiai ir vėl sujungiame rezultatus. Tau nieko daryti nereikia — tiesiog įkelk failą įprastu būdu.

Didžiausias įkėlimo dydis yra 1GB. Kiekviena dalis apdorojama nepriklausomai — todėl valandos trukmės failas gali būti paruoštas vos per kelias minutes. Dalių ribos, kai įmanoma, parenkamos natūraliose tylose, kad nebūtų nukirpti žodžiai sakinio viduryje.

Kodėl mano transkripcijoje yra klaidų tikriniuose varduose?

Tikriniai vardai — žmonių vardai, prekės ženklai, techniniai terminai, akronimai — yra sunkiausia transkripcijos dalis, nes jie neatitinka įprastų kalbos modelių. Net puikus garsas gali pateikti neteisingai užrašytus vardus.

Keli dalykai, kurie padeda:

  • Pasirink kalbą tiesiogiai, o ne naudok automatinį aptikimą.
  • Aiškiai ištark tikrinius vardus įrašant, su trumpa pauze prieš ir po jų.
  • Suredaguok transkripciją vėliau — gali nukopijuoti tekstą į bet kurį redaktorių ir ištaisyti vardus naudodamas „rasti ir pakeisti“. Šiuo metu nepalaikome individualaus žodyno, bet turime tai galvoje.

Ar galiu redaguoti transkripcijos tekstą?

Transkripcijos tekstą gali nukopijuoti iš rezultatų puslapio ir redaguoti bet kuriame teksto redaktoriuje ar tekstų rengyklėje — Google Docs, Microsoft Word, Notepad — kad ir kurią labiau mėgsti.

Programėlės viduje redaktoriaus dar neturime, todėl pakeitimai, kuriuos atlieki už SoundScript.AI ribų, nėra grąžinami į mūsų serverius. Originali transkripcija lieka tavo valdymo skydelyje, todėl visada gali atsisiųsti naują kopiją. Naudok .doc arba .txt atsisiuntimo formatus, jei nori redaguoti ir išsaugoti formatavimą.

Kam skirti SRT ir TXT atsisiuntimo formatai?

SRT yra standartinis subtitrų formatas — jame yra laiko žymos, todėl kiekviena teksto eilutė pasirodo tinkamu momentu vaizdo įraše. Naudok jį YouTube, Vimeo, vaizdo redaktoriams, tokiems kaip Premiere ar Final Cut, arba bet kuriam grotuvui, palaikančiam subtitrus.

TXT yra paprastas tekstas be laiko žymų — tobulai tinka dokumentams, tinklaraščio įrašams, transkribuotiems interviu ar bet kam, kur reikia tik žodžių. Taip pat siūlome DOC (formatuotas Word dokumentas) ir PDF (spausdinamas) — detalių ieškok Kaip atsisiųsti TXT, DOC ar PDF?.

Kaip SoundScript.AI tvarkosi su foniniu triukšmu ar muzika?

Stengiamės kuo geriau, bet stipri fono muzika ar triukšmas sumažins tikslumą. Lengvas aplinkos triukšmas (tyli kavinė, dirbantis ventiliatorius) paprastai problemų nesukelia. Garsi muzika ar persidengiantys balsai yra sunkiausi atvejai.

Interviu tipo turiniui su įžangine muzika dažniausiai pamatysi, kad muzika transkribuojama kaip nesąmonė arba praleidžiama, o tikslumas grįžta prasidėjus kalbai. Jei gali įrašyti tik kalbos versiją (arba prieš tai pašalinti muziką su tokiu įrankiu kaip Audacity), tikslumas bus pastebimai geresnis.

Vis dar reikia pagalbos?

Neradote atsakymo, kurio ieškote? Išbandykite SoundScript.AI nemokamai — kreditinės kortelės nereikia.

Išbandyti nemokamai

arba parašykite el. paštu [email protected]