Transskription

Sådan fungerer transskription, nøjagtighed, sprog, behandlingstid og tips til lydkvalitet.

Hvor nøjagtig er transskriptionen?

Nøjagtigheden overstiger typisk 95% for klar lyd på understøttede sprog. Vi bruger OpenAIs brancheledende talegenkendelse i baggrunden — den samme model, der driver mange professionelle transskriptionsværktøjer.

Den faktiske nøjagtighed afhænger af tre ting: lydklarhed (baggrundsstøj er skadelig), talerakcenterne (kraftige regionale accenter kan koste nogle point) og selve sproget (engelsk og spansk scorer typisk højest). Hvis du ønsker maksimal nøjagtighed, se Hvilken lydkvalitet giver de bedste resultater? for de små ting, der gør en stor forskel.

Kan SoundScript.AI identificere forskellige talere i min lyd?

Ja — taler-identifikation er tilgængelig på alle abonnementer, inklusive Free-planen. I uploadformularen skal du sætte Identificer talere til Ja, og vi mærker automatisk hver taler i din transskription som Speaker 1, Speaker 2 og så videre.

Det fungerer godt til møder, interviews, podcasts og enhver samtale med flere personer. Der er ingen grænse for antallet af talere, vi registrerer. Taler-identifikation tilføjer lidt behandlingstid, så slå den fra for solooptagelser (forelæsninger, stemmememoer, enkelt-narratorindhold) for at få hurtigere resultater.

Hvilke sprog kan jeg transskribere?

Vi understøtter 99 sprog til transskription, herunder engelsk, spansk, portugisisk, fransk, tysk, italiensk, japansk, kinesisk, koreansk, russisk, arabisk, hindi og mange flere.

Du kan vælge sproget eksplicit i uploadformularen for den bedste nøjagtighed, eller lade det stå på Auto, og vi registrerer det for dig. Sproglisten er den samme som OpenAI Whispers understøttede sæt, og SoundScript.AI-grænsefladen er også tilgængelig på alle 99 sprog — se Hvor opdaterer jeg mit grænsefladesprog? for at skifte dit.

Hvilken lydkvalitet giver de bedste resultater?

Klare stemmer optaget tæt på en mikrofon med minimal baggrundsstøj. Det er den korte version. Her er hvad der hjælper mest:

  • Brug en anstændig mikrofon — selv en budget-USB-mikrofon eller en moderne telefon er meget bedre end en bærbar computers indbyggede mikrofon.
  • Optag i et roligt rum — luk vinduer, sluk ventilatorer og undgå hårde overflader, der skaber ekko.
  • Kom tæt på mikrofonen — 15-30 cm er det optimale til naturlig tale.
  • Undgå baggrundmusik hvis muligt — se Hvordan håndterer SoundScript.AI baggrundmusik eller støj? for hvad du kan forvente, når musik er uundgåelig.

Hvor lang tid tager behandlingen typisk?

De fleste filer er færdige på sekunder til et par minutter. En typisk 10-minutters lydfil er som regel klar på under 30 sekunder.

Filer større end 25MB opdeles automatisk i bidder og behandles parallelt, så selv en times optagelse er som regel klar på 2-3 minutter. Aktivering af taler-identifikation tilføjer lidt ekstra tid. Statuslinjen opdateres i realtid — der er intet at opdatere.

Hvad sker der med filer større end 25MB?

Vi opdeler automatisk store filer i mindre bidder i baggrunden, transskriberer dem parallelt og syr resultaterne sammen igen. Du behøver ikke gøre noget — upload blot din fil som normalt.

Den maksimale uploadstørrelse er 1GB. Hver bid behandles uafhængigt, og det er derfor en times fil kan være klar på blot få minutter. Bidgrænserne placeres ved naturlige pauser, når det er muligt, for at undgå at skære ord midt i en sætning.

Hvorfor har min transskription fejl i egennavne?

Egennavne — personnavne, brandnavne, fagtermer og forkortelser — er den sværeste del af transskription, fordi de ikke følger normale sprogmønstre. Selv god lyd kan give fejlstavede navne.

Nogle ting, der hjælper:

  • Vælg sproget eksplicit i stedet for at bruge automatisk registrering.
  • Udtale egennavne tydeligt under optagelse med en lille pause omkring dem.
  • Rediger transskriptionen efterfølgende — du kan kopiere teksten til et vilkårligt redigeringsprogram og rette navne med søg og erstat. Vi understøtter ikke en brugerdefineret ordliste i øjeblikket, men det er på vores liste.

Kan jeg redigere transskriptionsteksten?

Du kan kopiere transskriptionsteksten fra resultatsiden og redigere den i et vilkårligt tekstredigeringsprogram eller tekstbehandlingsprogram — Google Docs, Microsoft Word, Notesblok eller hvad du foretrækker.

Vi har ikke en indbygget editor endnu, så ændringer, du foretager uden for SoundScript.AI, gemmes ikke tilbage til vores servere. Den originale transskription forbliver i dit dashboard, så du altid kan downloade en ny kopi. Brug .doc- eller .txt-downloadformaterne, hvis du vil redigere og bevare formatering.

Hvad bruges SRT- og TXT-downloadformaterne til?

SRT er standardformatet for undertekster — det inkluderer tidsstempler, så hver tekstlinje vises på det rigtige tidspunkt i din video. Brug det til YouTube, Vimeo, videoredigeringsprogrammer som Premiere eller Final Cut eller enhver undertekstkompatibel afspiller.

TXT er ren tekst uden tidsstempler — perfekt til dokumenter, blogindlæg, transskriberede interviews eller alt, hvor du blot vil have ordene. Vi tilbyder også DOC (formateret Word-dokument) og PDF (printbar) — se Hvordan downloader jeg som TXT, DOC eller PDF? for detaljer.

Hvordan håndterer SoundScript.AI baggrundmusik eller støj?

Vi gør vores bedste, men kraftig baggrundmusik eller støj vil reducere nøjagtigheden. Let omgivende støj (en stille café, en ventilator der kører) er normalt intet problem. Høj musik eller konkurrerende stemmer er de sværeste tilfælde.

For interviewindhold med intromusik vil musikken typisk blive transskriberet som uforståelig tekst eller springes over, og nøjagtigheden genoprettes, når talen begynder. Hvis du kan optage den rene taleversion af din lyd (eller fjerne musik med et værktøj som Audacity på forhånd), vil nøjagtigheden være mærkbart bedre.

Har du stadig brug for hjælp?

Kan du ikke finde det svar, du leder efter? Prøv SoundScript.AI gratis — intet kreditkort påkrævet.

Prøv det gratis

eller send en mail til [email protected]