Q: Quina es la precision de la transcripcion?

La precision dépassa generalament los 95% per d'àudio clar dins las lengas acceptadas. Utilizam la reconeissença vocala leader del mercat d'OpenAI, lo meteis modèl qu'aliments fòrça esplechs professionals de transcripcion. La precision reala depend de tres causas: la claretat de l'àudio (lo bruch de fons damaja), los accents dels locutors (los accents regionals fòrça marcats pòdon davalar de qualques punts) e la lenga ela meteissa (l'anglés e l'espanhòl tendon a aver las notas mai nautas). Se vòls un maximum de precision, vejatz Quala qualitat àudio dona los melhors resultats? per los pichons detalhs que fan una granda diferéncia.

Q: Quinas lengas pòdi transcriure?

Prenèm en carga 99 lengas per la transcripcion, includent l'anglés, l'espanhòl, lo portugués, lo francés, l'alemand, l'italian, lo japonés, lo chinés, lo corean, lo rus, l'arab, l'indi e fòrça d'autras. Pòdes causir la lenga explicitament sul formulari de mandadís per la melhora precision, o daissar sus Auto e la detectarem per tu. La lista de las lengas es la meteissa que lo conjunt acceptat per OpenAI Whisper, e l'interfàcia SoundScript.AI ela meteissa es tanben disponibla dins las 99 lengas — vejatz Ont actualizi ma lenga d'interfàcia? per cambiar la teu.

Q: Per que servisson los formats de telecargament SRT e TXT?

SRT es lo format estandard de sostítols — inclutz d'estampilhas oràrias per que cada linha de tèxte aparesca al bon moment dins ta vidèo. Utiliza-lo per YouTube, Vimeo, los editors vidèo coma Premiere o Final Cut, o qualque lector que pren en carga los sostítols. TXT es de tèxte simple sens estampilhas oràrias — perfècte pels documents, los articles de blog, las entrevistas transcritas o qualquaren ont vòls solament las paraulas. Ofrissèm tanben DOC (document Word formatat) e PDF (imprimible) — vejatz Cossí telecargi en TXT, DOC o PDF? pels detalhs.

Question 1

Quina es la precision de la transcripcion?

Accepted Answer

La precision dépassa generalament los 95% per d'àudio clar dins las lengas acceptadas. Utilizam la reconeissença vocala leader del mercat d'OpenAI, lo meteis modèl qu'aliments fòrça esplechs professionals de transcripcion.

La precision reala depend de tres causas: la claretat de l'àudio (lo bruch de fons damaja), los accents dels locutors (los accents regionals fòrça marcats pòdon davalar de qualques punts) e la lenga ela meteissa (l'anglés e l'espanhòl tendon a aver las notas mai nautas). Se vòls un maximum de precision, vejatz Quala qualitat àudio dona los melhors resultats? per los pichons detalhs que fan una granda diferéncia.

Question 2

SoundScript.AI pòt identificar diferents locutors dins mon àudio?

Accepted Answer

Òc — l'identificacion dels locutors es disponibla sus cada plan, inclosa amb ton abonament. Sul formulari de mandadís, met Identificar los locutors sus Òc e etiquetarem automaticament cada locutor dins ta transcripcion coma Locutor 1, Locutor 2, e atal de seguida.

Marcha plan per las reünions, las entrevistas, los podcasts e qualque conversacion a mai d'una persona. I a pas de limit sul nombre de locutors que detectarem. L'identificacion dels locutors apond un pauc de temps de tractament, doncas daissa-la desactivada pels enregistraments en sòla (cors, nòtas vocalas, contengut amb un sol narrator) per obténer de resultats mai rapids.

Question 3

Quinas lengas pòdi transcriure?

Accepted Answer

Prenèm en carga 99 lengas per la transcripcion, includent l'anglés, l'espanhòl, lo portugués, lo francés, l'alemand, l'italian, lo japonés, lo chinés, lo corean, lo rus, l'arab, l'indi e fòrça d'autras.

Pòdes causir la lenga explicitament sul formulari de mandadís per la melhora precision, o daissar sus Auto e la detectarem per tu. La lista de las lengas es la meteissa que lo conjunt acceptat per OpenAI Whisper, e l'interfàcia SoundScript.AI ela meteissa es tanben disponibla dins las 99 lengas — vejatz Ont actualizi ma lenga d'interfàcia? per cambiar la teu.

Question 4

Quala qualitat àudio dona los melhors resultats?

Accepted Answer

De vòtz claras enregistradas a costat d'un microfòn, amb un bruch de fons minimal. Aquò es la version corta. Vaquí çò qu'ajuda mai:

Utiliza un microfòn corrècte — quitament un micro USB d'entrada de gamma o un telefòn modèrne es plan melhor que lo micro integrat d'un ordenador portable.
Enregistra dins una sala silenciosa — tampa las fenèstras, atudà los ventiladors e evita las susfàcias duras que fan ressòn.
Apròcha-te del micro — 15 a 30 cm es la distància ideala per la paraula naturala.
Evita la musica de fons quand es possible — vejatz Cossí SoundScript.AI gerís la musica o lo bruch de fons? per saber çò que pòts esperar quand la musica es inevitabla.

Question 5

Quant de temps pren generalament lo tractament?

Accepted Answer

La majoritat dels fichièrs son acabats en qualques segondas a unas minutas. Un fichièr àudio tipic de 10 minutas s'acaba generalament en mens de 30 segondas.

Los fichièrs mai grands que 25MB son partejats automaticament en troces e tractats en parallèl, doncas quitament un enregistrament d'una ora es generalament prèst en 2-3 minutas. Activar l'identificacion dels locutors apond un pauc de temps en mai. La barra de progression s'actualiza en temps real — i a pas res a actualizar.

Question 6

Çò que se passa amb los fichièrs mai grands que 25MB?

Accepted Answer

Partegèm automaticament los grands fichièrs en troces mai pichons en rèireplan, los transcrivèm en parallèl e tornam acordar los resultats. As pas besonh de far quicòm — manda simplament ton fichièr coma de costuma.

La talha maximala de mandadís es de 1GB. Cada tròç es tractat independentament, e es per aquò qu'un fichièr d'una ora pòt èsser prèst en qualques minutas. Las limits dels troces son plaçadas suls silencis naturals quand es possible per evitar de copar las paraulas al mitan d'una frasa.

Question 7

Perqué ma transcripcion a d'errors dins los noms pròpris?

Accepted Answer

Los noms pròpris — noms de personas, noms de marca, tèrmes tecnics, acronims — son la partida mai dificila de la transcripcion perqué seguisson pas los esquèmas de lenga normals. Quitament un àudio bon pòt produire de noms mal ortografiats.

Qualques causas qu'ajudan:

Causís la lenga explicitament al luòc d'utilizar la deteccion automatica.
Prononciá los noms pròpris clarament en enregistrant, amb una pichona pausa a l'entorn.
Edita la transcripcion aprèp — pòdes copiar lo tèxte dins qualque editor e corregir los noms amb cèrca-e-remplaça. Sostenèm pas encara una lista de vocabulari personalizat, mas es sus nòstre radar.

Question 8

Pòdi editar lo tèxte de la transcripcion?

Accepted Answer

Pòdes copiar lo tèxte de la transcripcion dempuèi la pagina de resultats e l'editar dins qualque editor de tèxte o tractament de tèxte — Google Docs, Microsoft Word, Bloc-nòtas, çò que prefierissès.

Avèm pas encara un editor integrat, doncas los cambiaments que fas en defòra de SoundScript.AI son pas salvats sus nòstres servidors. La transcripcion originala demòra dins ton tablèu de bòrd per que pòsques totjorn telecargar una còpia frescha. Utiliza los formats de telecargament .doc o .txt se vòls editar e gardar la forma.

Question 9

Per que servisson los formats de telecargament SRT e TXT?

Accepted Answer

SRT es lo format estandard de sostítols — inclutz d'estampilhas oràrias per que cada linha de tèxte aparesca al bon moment dins ta vidèo. Utiliza-lo per YouTube, Vimeo, los editors vidèo coma Premiere o Final Cut, o qualque lector que pren en carga los sostítols.

TXT es de tèxte simple sens estampilhas oràrias — perfècte pels documents, los articles de blog, las entrevistas transcritas o qualquaren ont vòls solament las paraulas. Ofrissèm tanben DOC (document Word formatat) e PDF (imprimible) — vejatz Cossí telecargi en TXT, DOC o PDF? pels detalhs.

Question 10

Cossí SoundScript.AI gerís la musica o lo bruch de fons?

Accepted Answer

Fasèm de nòstre melhor, mas una musica de fons fòrta o de bruch redusirà la precision. Un bruch d'ambient leugièr (un cafè silenciós, un ventilator que tòrna) pausarà generalament pas de problèma. La musica fòrta o las vòtz qu'entrebardan son los cases mai dificils.

Pel contengut d'entrevista amb una musica d'introduccion, veiràs generalament la musica transcrita coma de tèxte sens sens o ignorada, puèi la precision torna quand la paraula comença. Se pòdes enregistrar la version solament-paraula de ton àudio (o levar la musica amb un esplech coma Audacity abans), la precision serà clarament melhora.

Transcripcion

Cap de question correspond pas a vòstra recèrca.