Q: Hvor nøjagtig er transskriptionen?

Nøjagtigheden overstiger typisk 95% for klar lyd på understøttede sprog. Vi bruger OpenAIs brancheledende talegenkendelse i baggrunden — den samme model, der driver mange professionelle transskriptionsværktøjer. Den faktiske nøjagtighed afhænger af tre ting: lydklarhed (baggrundsstøj er skadelig), talerakcenterne (kraftige regionale accenter kan koste nogle point) og selve sproget (engelsk og spansk scorer typisk højest). Hvis du ønsker maksimal nøjagtighed, se Hvilken lydkvalitet giver de bedste resultater? for de små ting, der gør en stor forskel.

Q: Hvilke sprog kan jeg transskribere?

Vi understøtter 99 sprog til transskription, herunder engelsk, spansk, portugisisk, fransk, tysk, italiensk, japansk, kinesisk, koreansk, russisk, arabisk, hindi og mange flere. Du kan vælge sproget eksplicit i uploadformularen for den bedste nøjagtighed, eller lade det stå på Auto , og vi registrerer det for dig. Sproglisten er den samme som OpenAI Whispers understøttede sæt, og SoundScript.AI-grænsefladen er også tilgængelig på alle 99 sprog — se Hvor opdaterer jeg mit grænsefladesprog? for at skifte dit.

Q: Hvad bruges SRT- og TXT-downloadformaterne til?

SRT er standardformatet for undertekster — det inkluderer tidsstempler, så hver tekstlinje vises på det rigtige tidspunkt i din video. Brug det til YouTube, Vimeo, videoredigeringsprogrammer som Premiere eller Final Cut eller enhver undertekstkompatibel afspiller. TXT er ren tekst uden tidsstempler — perfekt til dokumenter, blogindlæg, transskriberede interviews eller alt, hvor du blot vil have ordene. Vi tilbyder også DOC (formateret Word-dokument) og PDF (printbar) — se Hvordan downloader jeg som TXT, DOC eller PDF? for detaljer.

Question 1

Hvor nøjagtig er transskriptionen?

Accepted Answer

Nøjagtigheden overstiger typisk 95% for klar lyd på understøttede sprog. Vi bruger OpenAIs brancheledende talegenkendelse i baggrunden — den samme model, der driver mange professionelle transskriptionsværktøjer.

Den faktiske nøjagtighed afhænger af tre ting: lydklarhed (baggrundsstøj er skadelig), talerakcenterne (kraftige regionale accenter kan koste nogle point) og selve sproget (engelsk og spansk scorer typisk højest). Hvis du ønsker maksimal nøjagtighed, se Hvilken lydkvalitet giver de bedste resultater? for de små ting, der gør en stor forskel.

Question 2

Kan SoundScript.AI identificere forskellige talere i min lyd?

Accepted Answer

Ja — taler-identifikation er inkluderet med dit abonnement på alle planer. I uploadformularen skal du sætte Identificer talere til Ja, og vi mærker automatisk hver taler i din transskription som Speaker 1, Speaker 2 og så videre.

Det fungerer godt til møder, interviews, podcasts og enhver samtale med flere personer. Der er ingen grænse for antallet af talere, vi registrerer. Taler-identifikation tilføjer lidt behandlingstid, så slå den fra for solooptagelser (forelæsninger, stemmememoer, enkelt-narratorindhold) for at få hurtigere resultater.

Question 3

Hvilke sprog kan jeg transskribere?

Accepted Answer

Vi understøtter 99 sprog til transskription, herunder engelsk, spansk, portugisisk, fransk, tysk, italiensk, japansk, kinesisk, koreansk, russisk, arabisk, hindi og mange flere.

Du kan vælge sproget eksplicit i uploadformularen for den bedste nøjagtighed, eller lade det stå på Auto, og vi registrerer det for dig. Sproglisten er den samme som OpenAI Whispers understøttede sæt, og SoundScript.AI-grænsefladen er også tilgængelig på alle 99 sprog — se Hvor opdaterer jeg mit grænsefladesprog? for at skifte dit.

Question 4

Hvilken lydkvalitet giver de bedste resultater?

Accepted Answer

Klare stemmer optaget tæt på en mikrofon med minimal baggrundsstøj. Det er den korte version. Her er hvad der hjælper mest:

Brug en anstændig mikrofon — selv en budget-USB-mikrofon eller en moderne telefon er meget bedre end en bærbar computers indbyggede mikrofon.
Optag i et roligt rum — luk vinduer, sluk ventilatorer og undgå hårde overflader, der skaber ekko.
Kom tæt på mikrofonen — 15-30 cm er det optimale til naturlig tale.
Undgå baggrundmusik hvis muligt — se Hvordan håndterer SoundScript.AI baggrundmusik eller støj? for hvad du kan forvente, når musik er uundgåelig.

Question 5

Hvor lang tid tager behandlingen typisk?

Accepted Answer

De fleste filer er færdige på sekunder til et par minutter. En typisk 10-minutters lydfil er som regel klar på under 30 sekunder.

Filer større end 25MB opdeles automatisk i bidder og behandles parallelt, så selv en times optagelse er som regel klar på 2-3 minutter. Aktivering af taler-identifikation tilføjer lidt ekstra tid. Statuslinjen opdateres i realtid — der er intet at opdatere.

Question 6

Hvad sker der med filer større end 25MB?

Accepted Answer

Vi opdeler automatisk store filer i mindre bidder i baggrunden, transskriberer dem parallelt og syr resultaterne sammen igen. Du behøver ikke gøre noget — upload blot din fil som normalt.

Den maksimale uploadstørrelse er 1GB. Hver bid behandles uafhængigt, og det er derfor en times fil kan være klar på blot få minutter. Bidgrænserne placeres ved naturlige pauser, når det er muligt, for at undgå at skære ord midt i en sætning.

Question 7

Hvorfor har min transskription fejl i egennavne?

Accepted Answer

Egennavne — personnavne, brandnavne, fagtermer og forkortelser — er den sværeste del af transskription, fordi de ikke følger normale sprogmønstre. Selv god lyd kan give fejlstavede navne.

Nogle ting, der hjælper:

Vælg sproget eksplicit i stedet for at bruge automatisk registrering.
Udtale egennavne tydeligt under optagelse med en lille pause omkring dem.
Rediger transskriptionen efterfølgende — du kan kopiere teksten til et vilkårligt redigeringsprogram og rette navne med søg og erstat. Vi understøtter ikke en brugerdefineret ordliste i øjeblikket, men det er på vores liste.

Question 8

Kan jeg redigere transskriptionsteksten?

Accepted Answer

Du kan kopiere transskriptionsteksten fra resultatsiden og redigere den i et vilkårligt tekstredigeringsprogram eller tekstbehandlingsprogram — Google Docs, Microsoft Word, Notesblok eller hvad du foretrækker.

Vi har ikke en indbygget editor endnu, så ændringer, du foretager uden for SoundScript.AI, gemmes ikke tilbage til vores servere. Den originale transskription forbliver i dit dashboard, så du altid kan downloade en ny kopi. Brug .doc- eller .txt-downloadformaterne, hvis du vil redigere og bevare formatering.

Question 9

Hvad bruges SRT- og TXT-downloadformaterne til?

Accepted Answer

SRT er standardformatet for undertekster — det inkluderer tidsstempler, så hver tekstlinje vises på det rigtige tidspunkt i din video. Brug det til YouTube, Vimeo, videoredigeringsprogrammer som Premiere eller Final Cut eller enhver undertekstkompatibel afspiller.

TXT er ren tekst uden tidsstempler — perfekt til dokumenter, blogindlæg, transskriberede interviews eller alt, hvor du blot vil have ordene. Vi tilbyder også DOC (formateret Word-dokument) og PDF (printbar) — se Hvordan downloader jeg som TXT, DOC eller PDF? for detaljer.

Question 10

Hvordan håndterer SoundScript.AI baggrundmusik eller støj?

Accepted Answer

Vi gør vores bedste, men kraftig baggrundmusik eller støj vil reducere nøjagtigheden. Let omgivende støj (en stille café, en ventilator der kører) er normalt intet problem. Høj musik eller konkurrerende stemmer er de sværeste tilfælde.

For interviewindhold med intromusik vil musikken typisk blive transskriberet som uforståelig tekst eller springes over, og nøjagtigheden genoprettes, når talen begynder. Hvis du kan optage den rene taleversion af din lyd (eller fjerne musik med et værktøj som Audacity på forhånd), vil nøjagtigheden være mærkbart bedre.

Transskription

Ingen spørgsmål matcher din søgning.