Транскрипція
Як працює транскрипція, точність, мови, час обробки та поради щодо якості аудіо.
Жодне питання не відповідає вашому пошуку.
Спробуйте інше ключове слово або зв'яжіться з нами, і ми допоможемо. Електронна пошта [email protected] або створіть безкоштовний обліковий запис, щоб поспілкуватися з AI про вашу транскрипцію.
Наскільки точна транскрипція?
Точність зазвичай перевищує 95% для чистого аудіо підтримуваними мовами. Під капотом ми використовуємо провідне у галузі розпізнавання мовлення від OpenAI — ту саму модель, що працює в багатьох професійних інструментах транскрипції.
Реальна точність залежить від трьох речей: чистоти аудіо (фоновий шум шкодить), акцентів мовців (сильні регіональні акценти можуть знизити точність на кілька пунктів) та самої мови (англійська та іспанська зазвичай отримують найвищі оцінки). Якщо ви хочете максимальної точності, див. Яка якість аудіо дає найкращі результати?, щоб дізнатися про дрібниці, які мають велике значення.
Чи може SoundScript.AI розрізняти різних спікерів у моєму аудіо?
Так — ідентифікація спікерів доступна на кожному тарифі, включно з Безкоштовним тарифом. У формі завантаження встановіть Ідентифікувати спікерів у значення Так, і ми автоматично позначимо кожного мовця у вашій транскрипції як Speaker 1, Speaker 2 тощо.
Це чудово працює для нарад, інтерв’ю, подкастів і будь-яких багатоосібних розмов. Немає обмежень на кількість мовців, яких ми можемо виявити. Ідентифікація спікерів додає трохи часу на обробку, тому залишайте її вимкненою для сольних записів (лекції, голосові нотатки, контент із одним диктором), щоб отримати швидші результати.
Які мови я можу транскрибувати?
Ми підтримуємо 99 мов для транскрипції, зокрема англійську, іспанську, португальську, французьку, німецьку, італійську, японську, китайську, корейську, російську, арабську, гінді та багато інших.
Ви можете явно вибрати мову у формі завантаження для найкращої точності або залишити Авто, і ми визначимо її за вас. Список мов збігається з підтримуваним набором OpenAI Whisper, а сам інтерфейс SoundScript.AI також доступний усіма 99 мовами — див. Де змінити мову інтерфейсу?, щоб змінити свою.
Яка якість аудіо дає найкращі результати?
Чисті голоси, записані близько до мікрофона, з мінімальним фоновим шумом. Це коротка версія. Ось що допомагає найбільше:
- Використовуйте пристойний мікрофон — навіть USB-мікрофон початкового рівня або сучасний телефон значно кращий за вбудований мікрофон ноутбука.
- Записуйте в тихій кімнаті — закрийте вікна, вимкніть вентилятори та уникайте твердих поверхонь, що дають луну.
- Підійдіть ближче до мікрофона — 15–30 см — оптимальна відстань для природного мовлення.
- Уникайте фонової музики, коли це можливо — див. Як SoundScript.AI обробляє фонову музику чи шум?, щоб дізнатися, чого очікувати, коли музики не уникнути.
Скільки зазвичай триває обробка?
Більшість файлів готові за лічені секунди або кілька хвилин. Типовий 10-хвилинний аудіофайл зазвичай завершується менше ніж за 30 секунд.
Файли, більші за 25MB, автоматично розбиваються на частини та обробляються паралельно, тож навіть годинний запис зазвичай готовий за 2–3 хвилини. Увімкнення ідентифікації спікерів додає трохи додаткового часу. Індикатор прогресу оновлюється в реальному часі — нічого не потрібно перезавантажувати.
Що відбувається з файлами, більшими за 25MB?
Ми автоматично розбиваємо великі файли на менші частини за лаштунками, транскрибуємо їх паралельно та зшиваємо результати разом. Вам нічого не потрібно робити — просто завантажуйте файл як зазвичай.
Максимальний розмір завантаження — 1GB. Кожна частина обробляється незалежно, тому годинний файл може бути готовий лише за кілька хвилин. Межі частин по можливості розміщуються на природних паузах, щоб не розривати слова посеред речення.
Чому в моїй транскрипції є помилки у власних назвах?
Власні назви — імена, бренди, технічні терміни, абревіатури — є найскладнішою частиною транскрипції, оскільки вони не підкоряються звичайним мовним закономірностям. Навіть якісне аудіо може давати імена з помилками.
Кілька речей, які допомагають:
- Явно вибирайте мову замість автовизначення.
- Чітко вимовляйте власні назви під час запису, з невеликою паузою навколо них.
- Редагуйте транскрипцію згодом — ви можете скопіювати текст у будь-який редактор і виправити імена за допомогою пошуку й заміни. Зараз ми не підтримуємо користувацький словник, але це у нас на радарі.
Чи можу я редагувати текст транскрипції?
Ви можете скопіювати текст транскрипції зі сторінки результату та редагувати його в будь-якому текстовому редакторі чи текстовому процесорі — Google Docs, Microsoft Word, Блокнот — у тому, що вам зручніше.
Вбудованого редактора у нас поки немає, тому зміни, які ви робите поза SoundScript.AI, не зберігаються назад на наші сервери. Оригінальна транскрипція залишається у вашій панелі, тож ви завжди можете завантажити свіжу копію. Використовуйте формати завантаження .doc чи .txt, якщо хочете редагувати й зберегти форматування.
Для чого потрібні формати завантаження SRT і TXT?
SRT — це стандартний формат субтитрів — він містить часові мітки, тож кожен рядок тексту з’являється у потрібний момент у вашому відео. Використовуйте його для YouTube, Vimeo, відеоредакторів, як-от Premiere чи Final Cut, або будь-якого плеєра з підтримкою субтитрів.
TXT — це звичайний текст без часових міток — ідеально для документів, дописів у блозі, транскрибованих інтерв’ю або всього, де вам потрібні лише слова. Ми також пропонуємо DOC (форматований документ Word) і PDF (для друку) — див. Як завантажити у форматі TXT, DOC або PDF? для деталей.
Як SoundScript.AI обробляє фонову музику чи шум?
Ми робимо все можливе, але інтенсивна фонова музика чи шум знижуватимуть точність. Легкий навколишній шум (тихе кафе, працюючий вентилятор) зазвичай не створює проблем. Гучна музика або конкуруючі голоси — найскладніші випадки.
Для вмісту у стилі інтерв’ю зі вступною музикою ви зазвичай побачите, що музика транскрибована як нісенітниця або пропущена, а потім точність повертається, коли починається мовлення. Якщо ви можете записати версію свого аудіо лише з мовленням (або заздалегідь видалити музику інструментом на кшталт Audacity), точність буде помітно вищою.
Все ще потрібна допомога?
Не можете знайти відповідь, яку шукаєте? Спробуйте SoundScript.AI безкоштовно — кредитна картка не потрібна.
Спробувати безкоштовноабо напишіть нам: [email protected]