Q: Quelle est la précision de la transcription ?

La précision dépasse généralement 95 % pour les audios clairs dans les langues prises en charge. Nous utilisons la reconnaissance vocale de pointe d'OpenAI sous le capot, le même modèle qui alimente de nombreux outils professionnels de transcription. La précision dans le monde réel dépend de trois choses : la clarté de l'audio (le bruit de fond nuit), les accents des locuteurs (les accents régionaux marqués peuvent faire perdre quelques points) et la langue elle-même (l'anglais et l'espagnol ont tendance à obtenir les meilleurs scores). Si tu veux une précision maximale, voir Quelle qualité audio donne les meilleurs résultats ? pour les petits détails qui font une grande différence.

Q: Quelles langues puis-je transcrire ?

Nous prenons en charge 99 langues pour la transcription, dont l'anglais, l'espagnol, le portugais, le français, l'allemand, l'italien, le japonais, le chinois, le coréen, le russe, l'arabe, l'hindi et bien d'autres. Tu peux choisir la langue explicitement sur le formulaire de téléversement pour une meilleure précision, ou laisser sur Auto et nous la détecterons pour toi. La liste des langues est la même que celle prise en charge par OpenAI Whisper, et l'interface de SoundScript.AI est également disponible dans les 99 langues — voir Où mettre à jour la langue de mon interface ? pour changer la tienne.

Q: À quoi servent les formats de téléchargement SRT et TXT ?

SRT est le format de sous-titre standard — il inclut des horodatages pour que chaque ligne de texte apparaisse au bon moment dans ta vidéo. Utilise-le pour YouTube, Vimeo, les éditeurs vidéo comme Premiere ou Final Cut, ou tout lecteur compatible sous-titres. TXT est du texte brut sans horodatages — parfait pour des documents, des articles de blog, des interviews transcrites, ou tout ce où tu veux juste les mots. Nous proposons aussi DOC (document Word formaté) et PDF (imprimable) — voir Comment télécharger en TXT, DOC ou PDF ? pour les détails.

Question 1

Quelle est la précision de la transcription ?

Accepted Answer

La précision dépasse généralement 95 % pour les audios clairs dans les langues prises en charge. Nous utilisons la reconnaissance vocale de pointe d'OpenAI sous le capot, le même modèle qui alimente de nombreux outils professionnels de transcription.

La précision dans le monde réel dépend de trois choses : la clarté de l'audio (le bruit de fond nuit), les accents des locuteurs (les accents régionaux marqués peuvent faire perdre quelques points) et la langue elle-même (l'anglais et l'espagnol ont tendance à obtenir les meilleurs scores). Si tu veux une précision maximale, voir Quelle qualité audio donne les meilleurs résultats ? pour les petits détails qui font une grande différence.

Question 2

SoundScript.AI peut-il identifier différents locuteurs dans mon audio ?

Accepted Answer

Oui — l'identification des locuteurs est incluse avec ton abonnement sur tous les forfaits. Sur le formulaire de téléversement, mets Identifier les locuteurs sur Oui et nous étiquetterons automatiquement chaque locuteur dans ta transcription par Speaker 1, Speaker 2, et ainsi de suite.

Ça marche super pour les réunions, les interviews, les podcasts et toute conversation à plusieurs. Pas de limite sur le nombre de locuteurs détectés. L'identification des locuteurs ajoute un peu de temps de traitement, donc laisse-la désactivée pour les enregistrements solo (cours magistraux, mémos vocaux, contenu mono-narrateur) pour des résultats plus rapides.

Question 3

Quelles langues puis-je transcrire ?

Accepted Answer

Nous prenons en charge 99 langues pour la transcription, dont l'anglais, l'espagnol, le portugais, le français, l'allemand, l'italien, le japonais, le chinois, le coréen, le russe, l'arabe, l'hindi et bien d'autres.

Tu peux choisir la langue explicitement sur le formulaire de téléversement pour une meilleure précision, ou laisser sur Auto et nous la détecterons pour toi. La liste des langues est la même que celle prise en charge par OpenAI Whisper, et l'interface de SoundScript.AI est également disponible dans les 99 langues — voir Où mettre à jour la langue de mon interface ? pour changer la tienne.

Question 4

Quelle qualité audio donne les meilleurs résultats ?

Accepted Answer

Des voix claires enregistrées près d'un micro, avec un minimum de bruit de fond. Voilà la version courte. Voici ce qui aide le plus :

Utilise un micro correct — même un micro USB d'entrée de gamme ou un téléphone moderne est bien mieux que le micro intégré d'un ordinateur portable.
Enregistre dans une pièce calme — ferme les fenêtres, éteins les ventilateurs et évite les surfaces dures qui résonnent.
Approche-toi du micro — 15-30 cm est l'idéal pour une parole naturelle.
Évite la musique de fond quand c'est possible — voir Comment SoundScript.AI gère-t-il la musique de fond ou le bruit ? pour savoir à quoi t'attendre quand la musique est inévitable.

Question 5

Combien de temps prend généralement le traitement ?

Accepted Answer

La plupart des fichiers sont prêts en quelques secondes à quelques minutes. Un fichier audio classique de 10 minutes se termine généralement en moins de 30 secondes.

Les fichiers plus gros que 25MB sont automatiquement découpés en segments et traités en parallèle, donc même un enregistrement d'une heure est généralement prêt en 2-3 minutes. Activer l'identification des locuteurs ajoute un peu de temps. La barre de progression se met à jour en temps réel — rien à rafraîchir.

Question 6

Que se passe-t-il avec les fichiers plus gros que 25MB ?

Accepted Answer

Nous découpons automatiquement les gros fichiers en segments plus petits en coulisses, les transcrivons en parallèle et recollons les résultats. Tu n'as rien à faire — téléverse simplement ton fichier comme d'habitude.

La taille maximale de téléversement est de 1GB. Chaque segment est traité indépendamment, c'est pour ça qu'un fichier d'une heure peut être prêt en quelques minutes seulement. Les limites des segments sont placées sur des silences naturels quand c'est possible, pour éviter de couper des mots en plein milieu d'une phrase.

Question 7

Pourquoi ma transcription contient-elle des erreurs sur les noms propres ?

Accepted Answer

Les noms propres — noms de personnes, marques, termes techniques, acronymes — sont la partie la plus difficile de la transcription car ils ne suivent pas les schémas linguistiques normaux. Même un excellent audio peut produire des noms mal orthographiés.

Quelques astuces qui aident :

Choisis la langue explicitement au lieu d'utiliser la détection automatique.
Prononce les noms propres clairement lors de l'enregistrement, avec une petite pause autour.
Édite la transcription après coup — tu peux copier le texte dans n'importe quel éditeur et corriger les noms avec un chercher-remplacer. Nous ne prenons pas encore en charge une liste de vocabulaire personnalisée, mais c'est sur notre radar.

Question 8

Puis-je éditer le texte de la transcription ?

Accepted Answer

Tu peux copier le texte de la transcription depuis la page de résultat et l'éditer dans n'importe quel éditeur de texte ou traitement de texte — Google Docs, Microsoft Word, le Bloc-notes, comme tu préfères.

Nous n'avons pas encore d'éditeur intégré, donc les modifications faites en dehors de SoundScript.AI ne sont pas renvoyées sur nos serveurs. La transcription d'origine reste dans ton tableau de bord pour que tu puisses toujours télécharger une nouvelle copie. Utilise les formats de téléchargement .doc ou .txt si tu veux éditer en gardant le formatage.

Question 9

À quoi servent les formats de téléchargement SRT et TXT ?

Accepted Answer

SRT est le format de sous-titre standard — il inclut des horodatages pour que chaque ligne de texte apparaisse au bon moment dans ta vidéo. Utilise-le pour YouTube, Vimeo, les éditeurs vidéo comme Premiere ou Final Cut, ou tout lecteur compatible sous-titres.

TXT est du texte brut sans horodatages — parfait pour des documents, des articles de blog, des interviews transcrites, ou tout ce où tu veux juste les mots. Nous proposons aussi DOC (document Word formaté) et PDF (imprimable) — voir Comment télécharger en TXT, DOC ou PDF ? pour les détails.

Question 10

Comment SoundScript.AI gère-t-il la musique de fond ou le bruit ?

Accepted Answer

Nous faisons de notre mieux, mais une musique de fond ou un bruit important réduira la précision. Un léger bruit ambiant (un café calme, un ventilateur qui tourne) ne pose généralement pas de problème. La musique forte ou les voix concurrentes sont les cas les plus difficiles.

Pour un contenu de type interview avec une musique d'intro, tu verras généralement la musique transcrite comme du charabia ou ignorée, puis la précision revient quand la parole commence. Si tu peux enregistrer la version vocale seule de ton audio (ou retirer la musique au préalable avec un outil comme Audacity), la précision sera nettement meilleure.

Transcription

Aucune question ne correspond à votre recherche.