Q: Katere jezike lahko prepisujem?

Za prepis podpiramo 99 jezikov , vključno z angleščino, španščino, portugalščino, francoščino, nemščino, italijanščino, japonščino, kitajščino, korejščino, ruščino, arabščino, hindujščino in mnogimi drugimi. Za najboljšo natančnost lahko jezik izrecno izbereš na obrazcu za nalaganje ali pa ga pustiš na Samodejno in ga bomo zaznali namesto tebe. Seznam jezikov je enak kot pri OpenAI Whisper, sam vmesnik SoundScript.AI pa je prav tako na voljo v vseh 99 jezikih — za zamenjavo svojega si oglej Kje posodobim jezik vmesnika? .

Q: Za kaj sta namenjena formata za prenos SRT in TXT?

SRT je standardni format za podnapise — vsebuje časovne oznake, tako da se vsaka vrstica besedila pojavi ob pravem trenutku v tvojem videu. Uporabi ga za YouTube, Vimeo, video urejevalnike, kot sta Premiere ali Final Cut, ali katerikoli predvajalnik, ki podpira podnapise. TXT je navadno besedilo brez časovnih oznak — popolno za dokumente, objave na blogu, prepisane intervjuje ali karkoli, kjer potrebuješ samo besede. Ponujamo tudi DOC (oblikovan Wordov dokument) in PDF (za tisk) — za podrobnosti si oglej Kako prenesem kot TXT, DOC ali PDF? .

Question 1

Kako natančen je prepis?

Accepted Answer

Natančnost za jasen zvok v podprtih jezikih običajno presega 95 %. V ozadju uporabljamo vodilno OpenAI tehnologijo za prepoznavanje govora, isti model, ki poganja mnoga profesionalna orodja za prepis.

Natančnost v praksi je odvisna od treh stvari: jasnosti zvoka (šum v ozadju škoduje), naglasov govorcev (močni regionalni naglasi lahko znižajo nekaj točk) in samega jezika (angleščina in španščina običajno dosegata najvišje rezultate). Če želiš največjo natančnost, si oglej Kakšna kakovost zvoka daje najboljše rezultate? za majhne podrobnosti, ki naredijo veliko razliko.

Question 2

Ali lahko SoundScript.AI v mojem zvoku prepozna različne govorce?

Accepted Answer

Da — prepoznavanje govorcev je vključeno v tvojo naročnino v vsakem paketu. Na obrazcu za nalaganje nastavi Prepoznaj govorce na Da in vsakega govorca v tvojem prepisu bomo samodejno označili kot Speaker 1, Speaker 2 in tako naprej.

Odlično deluje za sestanke, intervjuje, podcaste in vsak pogovor z več osebami. Ni omejitve glede števila govorcev, ki jih bomo zaznali. Prepoznavanje govorcev doda malo več časa za obdelavo, zato ga pri solo posnetkih (predavanja, govorne beležke, vsebine z enim pripovedovalcem) izklopi za hitrejše rezultate.

Question 3

Katere jezike lahko prepisujem?

Accepted Answer

Za prepis podpiramo 99 jezikov, vključno z angleščino, španščino, portugalščino, francoščino, nemščino, italijanščino, japonščino, kitajščino, korejščino, ruščino, arabščino, hindujščino in mnogimi drugimi.

Za najboljšo natančnost lahko jezik izrecno izbereš na obrazcu za nalaganje ali pa ga pustiš na Samodejno in ga bomo zaznali namesto tebe. Seznam jezikov je enak kot pri OpenAI Whisper, sam vmesnik SoundScript.AI pa je prav tako na voljo v vseh 99 jezikih — za zamenjavo svojega si oglej Kje posodobim jezik vmesnika?.

Question 4

Kakšna kakovost zvoka daje najboljše rezultate?

Accepted Answer

Jasni glasovi, posneti blizu mikrofona, z minimalnim šumom v ozadju. To je kratka različica. Tukaj je tisto, kar najbolj pomaga:

Uporabi dober mikrofon — celo cenovno ugoden USB mikrofon ali sodoben telefon je veliko boljši od vgrajenega mikrofona prenosnika.
Snemaj v tihi sobi — zapri okna, izklopi ventilatorje in se izogibaj trdim površinam, ki odmevajo.
Bodi blizu mikrofona — 15-30 cm je idealna razdalja za naraven govor.
Izogibaj se glasbi v ozadju, kadar je to mogoče — kaj pričakovati, ko je glasba neizogibna, si oglej v Kako SoundScript.AI obravnava glasbo ali šum v ozadju?.

Question 5

Kako dolgo običajno traja obdelava?

Accepted Answer

Večina datotek je končana v nekaj sekundah do nekaj minutah. Tipična 10-minutna zvočna datoteka je običajno končana v manj kot 30 sekundah.

Datoteke, večje od 25MB, samodejno razdelimo na kose in jih obdelamo vzporedno, tako da je celo enourni posnetek običajno pripravljen v 2-3 minutah. Omogočanje prepoznavanja govorcev doda malo dodatnega časa. Napredek se posodablja v realnem času — ničesar ni treba osveževati.

Question 6

Kaj se zgodi z datotekami, večjimi od 25MB?

Accepted Answer

Velike datoteke samodejno razdelimo na manjše kose v ozadju, jih vzporedno prepišemo in rezultate spet sestavimo. Ničesar ti ni treba storiti — preprosto naloži datoteko kot običajno.

Največja velikost za nalaganje je 1GB. Vsak kos se obdela samostojno, zato je enourna datoteka lahko pripravljena v samo nekaj minutah. Meje kosov so, kadarkoli je to mogoče, postavljene na naravne tišine, da ne prekinemo besed sredi stavka.

Question 7

Zakaj ima moj prepis napake pri lastnih imenih?

Accepted Answer

Lastna imena — imena, blagovne znamke, tehnični izrazi, kratice — so najtežji del prepisa, ker ne sledijo običajnim jezikovnim vzorcem. Tudi odličen zvok lahko proizvede napačno zapisana imena.

Nekaj stvari, ki pomagajo:

Izrecno izberi jezik namesto samodejnega zaznavanja.
Lastna imena izgovori jasno med snemanjem, z majhnim premorom okoli njih.
Naknadno uredi prepis — besedilo lahko kopiraš v katerikoli urejevalnik in popraviš imena s funkcijo poišči-in-zamenjaj. Trenutno ne podpiramo seznama lastnih izrazov, je pa na našem radarju.

Question 8

Ali lahko urejam besedilo prepisa?

Accepted Answer

Besedilo prepisa lahko kopiraš s strani z rezultati in ga urejaš v katerem koli urejevalniku besedil ali besedilnem procesorju — Google Docs, Microsoft Word, Notepad, kar koli ti najbolj ustreza.

Še nimamo urejevalnika v aplikaciji, zato se spremembe, ki jih narediš zunaj SoundScript.AI, ne shranijo nazaj na naše strežnike. Izvirni prepis ostane v tvoji nadzorni plošči, tako da si lahko vedno preneseš svežo kopijo. Uporabi formata .doc ali .txt, če želiš urejati in ohraniti oblikovanje.

Question 9

Za kaj sta namenjena formata za prenos SRT in TXT?

Accepted Answer

SRT je standardni format za podnapise — vsebuje časovne oznake, tako da se vsaka vrstica besedila pojavi ob pravem trenutku v tvojem videu. Uporabi ga za YouTube, Vimeo, video urejevalnike, kot sta Premiere ali Final Cut, ali katerikoli predvajalnik, ki podpira podnapise.

TXT je navadno besedilo brez časovnih oznak — popolno za dokumente, objave na blogu, prepisane intervjuje ali karkoli, kjer potrebuješ samo besede. Ponujamo tudi DOC (oblikovan Wordov dokument) in PDF (za tisk) — za podrobnosti si oglej Kako prenesem kot TXT, DOC ali PDF?.

Question 10

Kako SoundScript.AI obravnava glasbo ali šum v ozadju?

Accepted Answer

Trudimo se po najboljših močeh, vendar bo močna glasba ali šum v ozadju zmanjšala natančnost. Rahel ambientalni šum (mirna kavarna, ventilator) običajno ne povzroča težav. Najtežji primeri so glasna glasba ali tekmujoči glasovi.

Za vsebine v slogu intervjuja z uvodno glasbo bo glasba običajno prepisana kot nesmisel ali preskočena, nato pa se natančnost povrne, ko se začne govor. Če lahko posnameš različico zvoka samo z govorom (ali pred tem odstraniš glasbo z orodjem, kot je Audacity), bo natančnost opazno boljša.

Prepis

Vašemu iskanju ne ustreza nobeno vprašanje.