Átírás

Hogyan működik az átírás, pontosság, nyelvek, feldolgozási idő és hangminőségi tippek.

Mennyire pontos az átírás?

A pontosság tiszta hangnál a támogatott nyelveken jellemzően meghaladja a 95%-ot. A háttérben az OpenAI iparágvezető beszédfelismerőjét használjuk, ugyanazt a modellt, amely számos professzionális átírási eszközt működtet.

A valós pontosság három dologtól függ: a hang tisztaságától (a háttérzaj ront), a beszélők akcentusától (erős regionális akcentusok néhány pontot levonhatnak) és magától a nyelvtől (az angol és a spanyol általában a legmagasabb pontszámot éri el). Ha maximális pontosságot szeretnél, nézd meg: Milyen hangminőség adja a legjobb eredményt? az apró dolgokért, amelyek nagy különbséget tesznek.

Képes a SoundScript.AI különböző beszélőket azonosítani a hangomban?

Igen — a beszélőazonosítás minden csomagban elérhető, beleértve az Ingyenes csomagot is. A feltöltési űrlapon állítsd a Beszélők azonosítása értékét Igen-re, és automatikusan címkézzük az átírásban minden beszélőt mint Beszélő 1, Beszélő 2 és így tovább.

Remekül működik megbeszélésekhez, interjúkhoz, podcastokhoz és bármilyen több résztvevős beszélgetéshez. Nincs korlát a felismerhető beszélők számában. A beszélőazonosítás egy kis feldolgozási időt hozzáad, ezért szóló felvételeknél (előadások, hangjegyzetek, egyetlen narrátoros tartalom) hagyd kikapcsolva a gyorsabb eredmény érdekében.

Milyen nyelveket írhatok át?

99 nyelvet támogatunk az átíráshoz, beleértve az angolt, spanyolt, portugált, franciát, németet, olaszt, japánt, kínait, koreait, oroszt, arabot, hindit és sok mást.

A feltöltési űrlapon explicit módon kiválaszthatod a nyelvet a legjobb pontosság érdekében, vagy hagyhatod Automatikus beállításon és felismerjük helyetted. A nyelvi lista megegyezik az OpenAI Whisper által támogatott készlettel, és maga a SoundScript.AI felület is elérhető mind a 99 nyelven — lásd: Hol frissíthetem a felület nyelvét? a sajátod megváltoztatásához.

Milyen hangminőség adja a legjobb eredményt?

Tiszta hangok, mikrofonhoz közel rögzítve, minimális háttérzajjal. Ez a rövid válasz. Íme, mi segít a legjobban:

  • Használj rendes mikrofont — még egy belépőszintű USB-mikrofon vagy modern telefon is sokkal jobb, mint egy laptop beépített mikrofonja.
  • Csendes szobában rögzíts — csukd be az ablakokat, kapcsold ki a ventilátorokat és kerüld a visszhangzó kemény felületeket.
  • Menj közel a mikrofonhoz — 15-30 cm a megfelelő távolság a természetes beszédhez.
  • Kerüld a háttérzenét, amikor csak lehetséges — lásd: Hogyan kezeli a SoundScript.AI a háttérzenét vagy zajt? arról, mire számíthatsz, ha a zene elkerülhetetlen.

Mennyi időt vesz igénybe általában a feldolgozás?

A legtöbb fájl másodpercek vagy néhány perc alatt elkészül. Egy tipikus 10 perces hangfájl általában 30 másodperc alatt befejeződik.

A 25MB-nál nagyobb fájlokat automatikusan darabokra osztjuk és párhuzamosan dolgozzuk fel, így még egy egyórás felvétel is általában 2-3 perc alatt kész. A beszélőazonosítás bekapcsolása egy kis extra időt hozzáad. A folyamatjelző sáv valós időben frissül — nincs mit frissíteni.

Mi történik a 25MB-nál nagyobb fájlokkal?

A nagy fájlokat automatikusan kisebb darabokra osztjuk a háttérben, párhuzamosan átírjuk őket és összefűzzük az eredményeket. Nincs semmi teendőd — csak töltsd fel a fájlt a szokásos módon.

A maximális feltöltési méret 1GB. Minden darabot függetlenül dolgozunk fel, ezért lehet egy egyórás fájl mindössze néhány perc alatt kész. A darabhatárokat lehetőség szerint természetes szünetekre helyezzük, hogy elkerüljük a szavak közepén történő vágást.

Miért tartalmaz hibákat az átírásom a tulajdonnevekben?

A tulajdonnevek — nevek, márkanevek, szakkifejezések, rövidítések — az átírás legnehezebb részét képezik, mert nem követik a normál nyelvi mintákat. Még a kiváló hang is hibás neveket eredményezhet.

Néhány dolog, ami segít:

  • Válaszd ki explicit módon a nyelvet az automatikus felismerés használata helyett.
  • A tulajdonneveket tisztán mondd ki felvétel közben, egy kis szünettel körülöttük.
  • Szerkeszd az átírást utólag — átmásolhatod a szöveget bármilyen szerkesztőbe és kereséssel-cserével javíthatod a neveket. Jelenleg nem támogatunk egyéni szótárat, de szem előtt tartjuk.

Szerkeszthetem az átírás szövegét?

Lemásolhatod az átírás szövegét az eredményoldalról és szerkesztheted bármilyen szövegszerkesztőben — Google Docs, Microsoft Word, Jegyzettömb, amit csak szeretnél.

Még nincs alkalmazáson belüli szerkesztőnk, így a SoundScript.AI-on kívül végzett módosítások nem mentődnek vissza a szervereinkre. Az eredeti átírás megmarad az irányítópultodon, így mindig letölthetsz egy friss példányt. Használd a .doc vagy .txt letöltési formátumokat, ha szerkeszteni és megőrizni szeretnéd a formázást.

Mire valók az SRT és TXT letöltési formátumok?

Az SRT a szabványos feliratformátum — időbélyegeket tartalmaz, így minden szövegsor a megfelelő pillanatban jelenik meg a videódban. Használd YouTube-hoz, Vimeóhoz, videoszerkesztőkhöz, mint a Premiere vagy Final Cut, vagy bármely feliratot támogató lejátszóhoz.

A TXT egyszerű szöveg időbélyegek nélkül — tökéletes dokumentumokhoz, blogbejegyzésekhez, átírt interjúkhoz vagy bármihez, ahol csak a szavakat szeretnéd. DOC-ot (formázott Word-dokumentum) és PDF-et (nyomtatható) is kínálunk — lásd: Hogyan tölthetek le TXT, DOC vagy PDF formátumban? a részletekért.

Hogyan kezeli a SoundScript.AI a háttérzenét vagy zajt?

Minden tőlünk telhetőt megteszünk, de az erős háttérzene vagy zaj csökkenti a pontosságot. A halk környezeti zaj (csendes kávézó, működő ventilátor) általában nem okoz problémát. A hangos zene vagy versengő hangok a legnehezebb esetek.

Interjú jellegű tartalomnál bevezető zenével általában azt látod majd, hogy a zenét értelmetlen szavakként írjuk át vagy kihagyjuk, majd a beszéd kezdetével visszatér a pontosság. Ha rögzíthetsz csak beszédet tartalmazó verziót a hangodból (vagy előzetesen eltávolíthatod a zenét egy olyan eszközzel, mint az Audacity), a pontosság észrevehetően jobb lesz.

Még segítségre van szükséged?

Nem találod a választ, amit keresel? Próbáld ki a SoundScript.AI-t ingyen — bankkártya nem szükséges.

Próbáld ki ingyen

vagy írj nekünk a [email protected] címre