Transcrición
Como funciona a transcrición, precisión, idiomas, tempo de procesamento e consellos sobre calidade de audio.
Ningunha pregunta coincide coa túa busca.
Proba outra palabra clave, ou contáctanos e axudarémosche. Correo [email protected] ou crea unha conta gratuíta para conversar coa IA sobre a túa transcrición.
Que precisión ten a transcrición?
A precisión adoita superar o 95% cun audio claro en idiomas admitidos. Por baixo usamos o recoñecemento de voz líder do sector de OpenAI, o mesmo modelo que impulsa moitas ferramentas profesionais de transcrición.
A precisión real depende de tres cousas: a claridade do audio (o ruído de fondo prexudica), os acentos dos falantes (acentos rexionais moi marcados poden baixar uns puntos) e o propio idioma (o inglés e o español adoitan obter as puntuacións máis altas). Se queres a máxima precisión, consulta Que calidade de audio dá os mellores resultados? para descubrir os pequenos detalles que marcan a diferenza.
Pode SoundScript.AI identificar diferentes falantes no meu audio?
Si — a identificación de falantes está dispoñible en todos os plans, incluído o plan Free. No formulario de subida, pon Identificar falantes en Si e etiquetaremos automaticamente cada falante na túa transcrición como Speaker 1, Speaker 2, e así sucesivamente.
Funciona moi ben para reunións, entrevistas, podcasts e calquera conversa entre varias persoas. Non hai límite no número de falantes que detectamos. A identificación de falantes engade un pouco de tempo de procesamento, así que déixaa desactivada para gravacións dunha soa persoa (clases, notas de voz, contido cun único narrador) e obterás resultados máis rápidos.
Que idiomas podo transcribir?
Admitimos 99 idiomas para transcrición, incluíndo inglés, español, portugués, francés, alemán, italiano, xaponés, chinés, coreano, ruso, árabe, hindi e moitos máis.
Podes escoller o idioma explicitamente no formulario de subida para obter a mellor precisión, ou deixalo en Auto e detectarémolo por ti. A lista de idiomas é a mesma que o conxunto admitido por OpenAI Whisper, e a interface de SoundScript.AI tamén está dispoñible nos 99 idiomas — consulta Onde podo actualizar o idioma da interface? para cambialo.
Que calidade de audio dá os mellores resultados?
Voces claras gravadas preto do micrófono, con pouco ruído de fondo. Esa é a versión curta. O que máis axuda é:
- Usa un micrófono decente — incluso un micrófono USB básico ou un móbil moderno é moito mellor que o micrófono integrado dun portátil.
- Grava nunha sala silenciosa — pecha as fiestras, apaga os ventiladores e evita as superficies duras que producen eco.
- Achégate ao micrófono — entre 15 e 30 cm é a distancia ideal para unha fala natural.
- Evita a música de fondo sempre que sexa posible — consulta Como xestiona SoundScript.AI a música ou o ruído de fondo? para saber que esperar cando a música é inevitable.
Canto adoita tardar o procesamento?
A maioría dos ficheiros están listos en segundos ou nun par de minutos. Un ficheiro de audio típico de 10 minutos adoita rematar en menos de 30 segundos.
Os ficheiros maiores que 25MB divídense automaticamente en partes e procésanse en paralelo, polo que mesmo unha gravación dunha hora adoita estar lista en 2-3 minutos. Activar a identificación de falantes engade algo de tempo extra. A barra de progreso actualízase en tempo real — non hai nada que recargar.
Que ocorre cos ficheiros maiores de 25MB?
Dividimos automaticamente os ficheiros grandes en partes máis pequenas entre bastidores, transcribímolos en paralelo e xuntamos os resultados de novo. Non tes que facer nada — simplemente sobe o teu ficheiro como sempre.
O tamaño máximo de subida é 1GB. Cada parte procésase de xeito independente, polo que un ficheiro dunha hora pode estar listo en só uns minutos. Os límites das partes colócanse nos silencios naturais sempre que é posible para evitar cortar palabras a medias.
Por que a miña transcrición ten erros nos nomes propios?
Os nomes propios — nomes de persoas, marcas, termos técnicos, acrónimos — son a parte máis difícil da transcrición porque non seguen os patróns normais da lingua. Mesmo un audio excelente pode producir nomes mal escritos.
Algunhas cousas que axudan:
- Escolle o idioma explicitamente en vez de usar a detección automática.
- Pronuncia os nomes propios con claridade ao gravar, cunha pequena pausa ao redor.
- Edita a transcrición despois — podes copiar o texto en calquera editor e corrixir os nomes con buscar e substituír. De momento non admitimos unha lista de vocabulario personalizado, pero témolo no radar.
Podo editar o texto da transcrición?
Podes copiar o texto da transcrición desde a páxina de resultados e editalo en calquera editor de texto ou procesador de textos — Google Docs, Microsoft Word, Bloc de notas, o que prefiras.
Aínda non temos un editor dentro da app, polo que os cambios que fagas fóra de SoundScript.AI non se gardan de volta nos nosos servidores. A transcrición orixinal permanece no teu panel para que sempre poidas descargar unha copia nova. Usa os formatos de descarga .doc ou .txt se queres editar e manter o formato.
Para que serven os formatos de descarga SRT e TXT?
SRT é o formato estándar de subtítulos — inclúe marcas de tempo para que cada liña de texto apareza no momento axeitado do teu vídeo. Úsao para YouTube, Vimeo, editores de vídeo como Premiere ou Final Cut, ou calquera reprodutor compatible con subtítulos.
TXT é texto simple sen marcas de tempo — perfecto para documentos, publicacións de blog, entrevistas transcritas ou calquera cousa onde só queiras as palabras. Tamén ofrecemos DOC (documento Word con formato) e PDF (imprimible) — consulta Como descargo como TXT, DOC ou PDF? para máis detalles.
Como xestiona SoundScript.AI a música ou o ruído de fondo?
Facemos o noso mellor, pero a música ou o ruído de fondo intensos reducirán a precisión. O ruído ambiental lixeiro (unha cafetería tranquila, un ventilador en marcha) adoita non causar problemas. A música alta ou as voces que compiten son os casos máis difíciles.
No caso de contido tipo entrevista cunha música de introdución, adoitarás ver a música transcrita como texto sen sentido ou omitida, e logo a precisión recupérase cando comeza a fala. Se podes gravar a versión só de voz do teu audio (ou eliminar a música cunha ferramenta como Audacity de antemán), a precisión mellorará notablemente.
Aínda necesitas axuda?
Non atopas a resposta que buscas? Proba SoundScript.AI gratis — sen tarxeta de crédito.
Próbao gratisou escríbenos a [email protected]