Q: Наскільки точна транскрипція?

Точність зазвичай перевищує 95% для чистого аудіо підтримуваними мовами. Під капотом ми використовуємо провідне у галузі розпізнавання мовлення від OpenAI — ту саму модель, що працює в багатьох професійних інструментах транскрипції. Реальна точність залежить від трьох речей: чистоти аудіо (фоновий шум шкодить), акцентів мовців (сильні регіональні акценти можуть знизити точність на кілька пунктів) та самої мови (англійська та іспанська зазвичай отримують найвищі оцінки). Якщо ви хочете максимальної точності, див. Яка якість аудіо дає найкращі результати? , щоб дізнатися про дрібниці, які мають велике значення.

Q: Які мови я можу транскрибувати?

Ми підтримуємо 99 мов для транскрипції, зокрема англійську, іспанську, португальську, французьку, німецьку, італійську, японську, китайську, корейську, російську, арабську, гінді та багато інших. Ви можете явно вибрати мову у формі завантаження для найкращої точності або залишити Авто , і ми визначимо її за вас. Список мов збігається з підтримуваним набором OpenAI Whisper, а сам інтерфейс SoundScript.AI також доступний усіма 99 мовами — див. Де змінити мову інтерфейсу? , щоб змінити свою.

Q: Для чого потрібні формати завантаження SRT і TXT?

SRT — це стандартний формат субтитрів — він містить часові мітки, тож кожен рядок тексту з’являється у потрібний момент у вашому відео. Використовуйте його для YouTube, Vimeo, відеоредакторів, як-от Premiere чи Final Cut, або будь-якого плеєра з підтримкою субтитрів. TXT — це звичайний текст без часових міток — ідеально для документів, дописів у блозі, транскрибованих інтерв’ю або всього, де вам потрібні лише слова. Ми також пропонуємо DOC (форматований документ Word) і PDF (для друку) — див. Як завантажити у форматі TXT, DOC або PDF? для деталей.

Question 1

Наскільки точна транскрипція?

Accepted Answer

Точність зазвичай перевищує 95% для чистого аудіо підтримуваними мовами. Під капотом ми використовуємо провідне у галузі розпізнавання мовлення від OpenAI — ту саму модель, що працює в багатьох професійних інструментах транскрипції.

Реальна точність залежить від трьох речей: чистоти аудіо (фоновий шум шкодить), акцентів мовців (сильні регіональні акценти можуть знизити точність на кілька пунктів) та самої мови (англійська та іспанська зазвичай отримують найвищі оцінки). Якщо ви хочете максимальної точності, див. Яка якість аудіо дає найкращі результати?, щоб дізнатися про дрібниці, які мають велике значення.

Question 2

Чи може SoundScript.AI розрізняти різних спікерів у моєму аудіо?

Accepted Answer

Так — ідентифікація спікерів включена до вашої підписки на кожному тарифі. У формі завантаження встановіть Ідентифікувати спікерів у значення Так, і ми автоматично позначимо кожного мовця у вашій транскрипції як Speaker 1, Speaker 2 тощо.

Це чудово працює для нарад, інтерв’ю, подкастів і будь-яких багатоосібних розмов. Немає обмежень на кількість мовців, яких ми можемо виявити. Ідентифікація спікерів додає трохи часу на обробку, тому залишайте її вимкненою для сольних записів (лекції, голосові нотатки, контент із одним диктором), щоб отримати швидші результати.

Question 3

Які мови я можу транскрибувати?

Accepted Answer

Ми підтримуємо 99 мов для транскрипції, зокрема англійську, іспанську, португальську, французьку, німецьку, італійську, японську, китайську, корейську, російську, арабську, гінді та багато інших.

Ви можете явно вибрати мову у формі завантаження для найкращої точності або залишити Авто, і ми визначимо її за вас. Список мов збігається з підтримуваним набором OpenAI Whisper, а сам інтерфейс SoundScript.AI також доступний усіма 99 мовами — див. Де змінити мову інтерфейсу?, щоб змінити свою.

Question 4

Яка якість аудіо дає найкращі результати?

Accepted Answer

Чисті голоси, записані близько до мікрофона, з мінімальним фоновим шумом. Це коротка версія. Ось що допомагає найбільше:

Використовуйте пристойний мікрофон — навіть USB-мікрофон початкового рівня або сучасний телефон значно кращий за вбудований мікрофон ноутбука.
Записуйте в тихій кімнаті — закрийте вікна, вимкніть вентилятори та уникайте твердих поверхонь, що дають луну.
Підійдіть ближче до мікрофона — 15–30 см — оптимальна відстань для природного мовлення.
Уникайте фонової музики, коли це можливо — див. Як SoundScript.AI обробляє фонову музику чи шум?, щоб дізнатися, чого очікувати, коли музики не уникнути.

Question 5

Скільки зазвичай триває обробка?

Accepted Answer

Більшість файлів готові за лічені секунди або кілька хвилин. Типовий 10-хвилинний аудіофайл зазвичай завершується менше ніж за 30 секунд.

Файли, більші за 25MB, автоматично розбиваються на частини та обробляються паралельно, тож навіть годинний запис зазвичай готовий за 2–3 хвилини. Увімкнення ідентифікації спікерів додає трохи додаткового часу. Індикатор прогресу оновлюється в реальному часі — нічого не потрібно перезавантажувати.

Question 6

Що відбувається з файлами, більшими за 25MB?

Accepted Answer

Ми автоматично розбиваємо великі файли на менші частини за лаштунками, транскрибуємо їх паралельно та зшиваємо результати разом. Вам нічого не потрібно робити — просто завантажуйте файл як зазвичай.

Максимальний розмір завантаження — 1GB. Кожна частина обробляється незалежно, тому годинний файл може бути готовий лише за кілька хвилин. Межі частин по можливості розміщуються на природних паузах, щоб не розривати слова посеред речення.

Question 7

Чому в моїй транскрипції є помилки у власних назвах?

Accepted Answer

Власні назви — імена, бренди, технічні терміни, абревіатури — є найскладнішою частиною транскрипції, оскільки вони не підкоряються звичайним мовним закономірностям. Навіть якісне аудіо може давати імена з помилками.

Кілька речей, які допомагають:

Явно вибирайте мову замість автовизначення.
Чітко вимовляйте власні назви під час запису, з невеликою паузою навколо них.
Редагуйте транскрипцію згодом — ви можете скопіювати текст у будь-який редактор і виправити імена за допомогою пошуку й заміни. Зараз ми не підтримуємо користувацький словник, але це у нас на радарі.

Question 8

Чи можу я редагувати текст транскрипції?

Accepted Answer

Ви можете скопіювати текст транскрипції зі сторінки результату та редагувати його в будь-якому текстовому редакторі чи текстовому процесорі — Google Docs, Microsoft Word, Блокнот — у тому, що вам зручніше.

Вбудованого редактора у нас поки немає, тому зміни, які ви робите поза SoundScript.AI, не зберігаються назад на наші сервери. Оригінальна транскрипція залишається у вашій панелі, тож ви завжди можете завантажити свіжу копію. Використовуйте формати завантаження .doc чи .txt, якщо хочете редагувати й зберегти форматування.

Question 9

Для чого потрібні формати завантаження SRT і TXT?

Accepted Answer

SRT — це стандартний формат субтитрів — він містить часові мітки, тож кожен рядок тексту з’являється у потрібний момент у вашому відео. Використовуйте його для YouTube, Vimeo, відеоредакторів, як-от Premiere чи Final Cut, або будь-якого плеєра з підтримкою субтитрів.

TXT — це звичайний текст без часових міток — ідеально для документів, дописів у блозі, транскрибованих інтерв’ю або всього, де вам потрібні лише слова. Ми також пропонуємо DOC (форматований документ Word) і PDF (для друку) — див. Як завантажити у форматі TXT, DOC або PDF? для деталей.

Question 10

Як SoundScript.AI обробляє фонову музику чи шум?

Accepted Answer

Ми робимо все можливе, але інтенсивна фонова музика чи шум знижуватимуть точність. Легкий навколишній шум (тихе кафе, працюючий вентилятор) зазвичай не створює проблем. Гучна музика або конкуруючі голоси — найскладніші випадки.

Для вмісту у стилі інтерв’ю зі вступною музикою ви зазвичай побачите, що музика транскрибована як нісенітниця або пропущена, а потім точність повертається, коли починається мовлення. Якщо ви можете записати версію свого аудіо лише з мовленням (або заздалегідь видалити музику інструментом на кшталт Audacity), точність буде помітно вищою.

Транскрипція

Жодне питання не відповідає вашому пошуку.