Транскрипция
Как работи транскрипцията, точност, езици, времe за обработка и съвети за аудио качество.
Няма въпроси, които да съответстват на търсенето ви.
Опитайте с друга ключова дума или се свържете с нас и ще ви помогнем. Имейл [email protected] или създайте безплатен акаунт, за да разговаряте с AI относно вашата транскрипция.
Колко точна е транскрипцията?
Точността обикновено надвишава 95% за ясно аудио на поддържани езици. Използваме водещото в индустрията разпознаване на реч от OpenAI, същия модел, който захранва много професионални инструменти за транскрипция.
Реалната точност зависи от три неща: яснотата на аудиото (фоновият шум вреди), акцентите на говорещите (силните регионални акценти може да намалят резултата с няколко точки) и самия език (английски и испански обикновено се справят най-добре). Ако искаш максимална точност, вж. Каква аудио качество дава най-добри резултати? за малките неща, които правят голяма разлика.
Може ли SoundScript.AI да разпознава различни говорещи в аудиото ми?
Да — разпознаването на говорещите е налично за всеки план, включително Free. В формуляра за качване задай Разпознаване на говорещи на Да и ние автоматично ще маркираме всеки говорещ в транскрипцията ти като Speaker 1, Speaker 2 и т.н.
Работи отлично за срещи, интервюта, подкасти и всякакви разговори с повече от един човек. Няма ограничение за броя говорещи, които ще разпознаем. Разпознаването на говорещите добавя малко повече времe за обработка, затова го изключи за самостоятелни записи (лекции, гласови бележки, съдържание с един разказвач), за да получиш по-бърз резултат.
Какви езици мога да транскрибирам?
Поддържаме 99 езика за транскрипция, включително английски, испански, португалски, френски, немски, италиански, японски, китайски, корейски, руски, арабски, хинди и много други.
Можеш да избереш езика изрично в формуляра за качване за най-добра точност, или да го оставиш на Автоматично и ние ще го открием вместо теб. Списъкът с езици е същият като поддържания набор на OpenAI Whisper, а интерфейсът на SoundScript.AI е достъпен на всичките 99 езика — вж. Как да актуализирам езика на интерфейса? за смяна.
Каква аудио качество дава най-добри резултати?
Ясни гласове, записани близо до микрофон, с минимален фонов шум. Това е краткото. Ето какво помага най-много:
- Използвай приличен микрофон — дори начален USB микрофон или съвременен телефон е много по-добър от вградения микрофон на лаптоп.
- Запиши в тиха стая — затвори прозорците, изключи вентилаторите и избягвай твърди повърхности, от които се отразява звук.
- Бъди близо до микрофона — 15-30 см е идеалното разстояние за естествена реч.
- Избягвай фонова музика когато е възможно — вж. Как SoundScript.AI обработва фонова музика или шум? за какво да очакваш, когато музиката е неизбежна.
Колко дълго отнема обработката обикновено?
Повечето файлове са готови за секунди до няколко минути. Типичен 10-минутен аудио файл обикновено завършва за по-малко от 30 секунди.
Файлове, по-големи от 25MB, се разделят автоматично на части и се обработват паралелно, така че дори запис с дължина час обикновено е готов за 2-3 минути. Активирането на разпознаване на говорещи добавя малко допълнително времe. Лентата за напредък се обновява в реално время — не е нужно да опресняваш.
Какво се случва с файлове, по-големи от 25MB?
Автоматично разделяме големите файлове на по-малки части зад кулисите, транскрибираме ги паралелно и сглобяваме резултатите обратно. Не е нужно да правиш нищо — просто качи файла си нормално.
Максималният размер при качване е 1GB. Всяка част се обработва независимо, поради което файл с дължина час може да е готов само за няколко минути. Разделянето на части се извършва при естествени паузи винаги когато е възможно, за да се избегне прекъсване на думи в средата на изречение.
Защо транскрипцията ми има грешки при собствените имена?
Собствените имена — лични имена, търговски марки, технически термини, акроними — са най-трудната część на транскрипцията, тъй като не следват нормалните езикови модели. Дори при отлично аудио могат да се появят сгрешени имена.
Няколко неща, които помагат:
- Избери езика изрично вместо да използваш автоматично разпознаване.
- Произнасяй собствените имена ясно при записване, с кратка пауза около тях.
- Редактирай транскрипцията след това — можеш да копираш текста в произволен редактор и да поправиш имената с търсене и замяна. Засега не поддържаме потребителски речник, но го имаме предвид.
Мога ли да редактирам текста на транскрипцията?
Можеш да копираш текста на транскрипцията от страницата с резултати и да го редактираш в произволен текстов редактор или текстообработваща програма — Google Docs, Microsoft Word, Notepad, или каквото предпочиташ.
Засега нямаме вграден редактор, така че промените, направени извън SoundScript.AI, не се запазват обратно на нашите сървъри. Оригиналната транскрипция остава в таблото, така че винаги можеш да изтеглиш нов екземпляр. Използвай форматите .doc или .txt при изтегляне, ако искаш да редактираш и запазиш форматирането.
За какво служат форматите SRT и TXT при изтегляне?
SRT е стандартният формат за субтитри — включва времеви маркери, за да се показва всеки ред текст в правилния момент от видеото ти. Използвай го за YouTube, Vimeo, видео редактори като Premiere или Final Cut, или всеки плейър, поддържащ субтитри.
TXT е обикновен текст без времеви маркери — идеален за документи, публикации в блог, транскрибирани интервюта или всичко, за което искаш само думите. Предлагаме и DOC (форматиран Word документ) и PDF (за печат) — вж. Как да изтегля като TXT, DOC или PDF? за подробности.
Как SoundScript.AI обработва фонова музика или шум?
Правим всичко възможно, но силна фонова музика или шум ще намали точността. Лекият фонов шум (тихо кафене, работещ вентилатор) обикновено не е проблем. Силната музика или конкуриращите се гласове са най-трудните случаи.
При съдържание в стил интервю с уводна музика обикновено ще видиш музиката транскрибирана като безсмислици или прескочена, след което точността се възстановява, когато започне речта. Ако можеш да запишеш версия само с речта (или да премахнеш музиката предварително с инструмент като Audacity), точността ще бъде значително по-добра.
Все още имате нужда от помощ?
Не можете да намерите отговора, който търсите? Опитайте SoundScript.AI безплатно — не е необходима кредитна карта.
Опитайте безплатноили ни пишете на [email protected]