Q: Колку е точна транскрипцијата?

Точноста обично надминува 95% за јасно аудио на поддржани јазици. Под капакот користиме водечко препознавање на говор од OpenAI, истиот модел кој ги напојува многу професионални алатки за транскрипција. Точноста во реалниот свет зависи од три работи: јасноста на аудиото (позадинската бучава штети), акцентите на говорниците (силните регионални акценти може да паднат неколку поени) и самиот јазик (англискиот и шпанскиот обично имаат највисоки резултати). Ако сакаш максимална точност, види Кој аудио квалитет дава најдобри резултати? за малите работи што прават голема разлика.

Q: Кои јазици можам да транскрибирам?

Поддржуваме 99 јазици за транскрипција, вклучително англиски, шпански, португалски, француски, германски, италијански, јапонски, кинески, корејски, руски, арапски, хинди и многу повеќе. Можеш експлицитно да го избереш јазикот на формуларот за прикачување за најдобра точност, или да го оставиш на Авто и ние ќе го откриеме. Листата на јазици е иста како поддржаната група на OpenAI Whisper, а самиот интерфејс на SoundScript.AI е исто така достапен на сите 99 јазици — види Каде го ажурирам јазикот на интерфејсот? за да го промениш твојот.

Q: За што служат форматите за преземање SRT и TXT?

SRT е стандардниот формат за титли — вклучува временски ознаки за секоја линија на текст да се појави во вистинскиот момент во твоето видео. Користи го за YouTube, Vimeo, видео уредници како Premiere или Final Cut, или кој било плеер што поддржува титли. TXT е обичен текст без временски ознаки — совршен за документи, блог постови, транскрибирани интервјуа или сè каде што само сакаш зборови. Нудиме и DOC (форматиран Word документ) и PDF (за печатење) — види Како да преземам како TXT, DOC или PDF? за детали.

Question 1

Колку е точна транскрипцијата?

Accepted Answer

Точноста обично надминува 95% за јасно аудио на поддржани јазици. Под капакот користиме водечко препознавање на говор од OpenAI, истиот модел кој ги напојува многу професионални алатки за транскрипција.

Точноста во реалниот свет зависи од три работи: јасноста на аудиото (позадинската бучава штети), акцентите на говорниците (силните регионални акценти може да паднат неколку поени) и самиот јазик (англискиот и шпанскиот обично имаат највисоки резултати). Ако сакаш максимална точност, види Кој аудио квалитет дава најдобри резултати? за малите работи што прават голема разлика.

Question 2

Може ли SoundScript.AI да идентификува различни говорници во моето аудио?

Accepted Answer

Да — идентификацијата на говорници е вклучена во твојата претплата на секој план. На формуларот за прикачување, постави Идентифицирај говорници на Да и автоматски ќе го означиме секој говорник во твојата транскрипција како Speaker 1, Speaker 2 итн.

Одлично функционира за состаноци, интервјуа, подкасти и секаков разговор со повеќе лица. Нема ограничување на бројот на говорници што ќе ги откриеме. Идентификацијата на говорници додава малку време за обработка, па остави ја исклучена за самостојни снимања (предавања, гласовни пораки, содржина со еден наратор) за побрзи резултати.

Question 3

Кои јазици можам да транскрибирам?

Accepted Answer

Поддржуваме 99 јазици за транскрипција, вклучително англиски, шпански, португалски, француски, германски, италијански, јапонски, кинески, корејски, руски, арапски, хинди и многу повеќе.

Можеш експлицитно да го избереш јазикот на формуларот за прикачување за најдобра точност, или да го оставиш на Авто и ние ќе го откриеме. Листата на јазици е иста како поддржаната група на OpenAI Whisper, а самиот интерфејс на SoundScript.AI е исто така достапен на сите 99 јазици — види Каде го ажурирам јазикот на интерфејсот? за да го промениш твојот.

Question 4

Кој аудио квалитет дава најдобри резултати?

Accepted Answer

Јасни гласови снимени блиску до микрофон, со минимална позадинска бучава. Тоа е кратката верзија. Еве што помага најмногу:

Користи пристоен микрофон — дури и почетен USB микрофон или модерен телефон е многу подобар од вградениот микрофон на лаптопот.
Снимај во тивка соба — затвори прозорци, исклучи вентилатори и избегнувај тврди површини што прават ехо.
Биди блиску до микрофонот — 15–30 см е најдобрата дистанца за природен говор.
Избегнувај позадинска музика кога е можно — види Како SoundScript.AI се справува со позадинска музика или бучава? за тоа што да очекуваш кога музиката е неизбежна.

Question 5

Колку време обично трае обработката?

Accepted Answer

Повеќето датотеки се готови за секунди до неколку минути. Типична десетминутна аудио датотека обично завршува за помалку од 30 секунди.

Датотеки поголеми од 25MB автоматски се делат на парчиња и се обработуваат паралелно, така што дури и едночасовно снимање обично е готово за 2–3 минути. Овозможувањето на идентификација на говорници додава малку повеќе време. Лентата за напредок се ажурира во реално време — нема ништо за освежување.

Question 6

Што се случува со датотеки поголеми од 25MB?

Accepted Answer

Автоматски ги делиме големите датотеки на помали парчиња во позадина, ги транскрибираме паралелно и ги составуваме резултатите назад. Не треба да правиш ништо — само прикачи ја датотеката како нормално.

Максималната големина за прикачување е 1GB. Секое парче се обработува независно, и затоа едночасовна датотека може да биде готова за само неколку минути. Границите на парчињата се поставуваат на природни тишини секогаш кога е можно за да се избегне сечење на зборови среде реченица.

Question 7

Зошто транскрипцијата ми има грешки во сопствените именки?

Accepted Answer

Сопствените именки — имиња, брендови, технички термини, акроними — се најтешкиот дел од транскрипцијата затоа што не следат нормални јазични шеми. Дури и одлично аудио може да произведе погрешно напишани имиња.

Неколку работи што помагаат:

Избери го јазикот експлицитно наместо да користиш авто-откривање.
Изговарај ги сопствените именки јасно при снимање, со мала пауза околу нив.
Уреди ја транскрипцијата потоа — можеш да го копираш текстот во кој било уредник и да ги поправиш имињата со „најди и замени". Моментално не поддржуваме сопствен речник, но е на нашиот радар.

Question 8

Можам ли да го уредувам текстот на транскрипцијата?

Accepted Answer

Можеш да го копираш текстот на транскрипцијата од страницата со резултати и да го уредуваш во кој било уредник на текст или процесор за зборови — Google Docs, Microsoft Word, Notepad, кој било што сакаш.

Сè уште немаме уредник во апликацијата, така што промените што ги правиш надвор од SoundScript.AI не се зачувуваат назад на нашите сервери. Оригиналната транскрипција останува во твојата контролна табла за да можеш секогаш да преземеш свежа копија. Користи ги форматите за преземање .doc или .txt ако сакаш да уредуваш и да го задржиш форматирањето.

Question 9

За што служат форматите за преземање SRT и TXT?

Accepted Answer

SRT е стандардниот формат за титли — вклучува временски ознаки за секоја линија на текст да се појави во вистинскиот момент во твоето видео. Користи го за YouTube, Vimeo, видео уредници како Premiere или Final Cut, или кој било плеер што поддржува титли.

TXT е обичен текст без временски ознаки — совршен за документи, блог постови, транскрибирани интервјуа или сè каде што само сакаш зборови. Нудиме и DOC (форматиран Word документ) и PDF (за печатење) — види Како да преземам како TXT, DOC или PDF? за детали.

Question 10

Како SoundScript.AI се справува со позадинска музика или бучава?

Accepted Answer

Се трудиме најдобро што можеме, но силната позадинска музика или бучава ќе ја намалат точноста. Лесната амбиентална бучава (тивко кафуле, вентилатор што работи) обично не предизвикува проблем. Гласна музика или конкурентни гласови се најтешките случаи.

За содржина во стил на интервју со воведна музика, обично ќе ја видиш музиката транскрибирана како бесмисленост или прескокната, а потоа точноста се враќа кога ќе почне говорот. Ако можеш да го снимиш аудиото само со говор (или да ја отстраниш музиката со алатка како Audacity претходно), точноста ќе биде забележливо подобра.

Транскрипција

Ниту едно прашање не одговара на вашето пребарување.