Q: Sejauh mana ketepatan transkripsi?

Ketepatan biasanya melebihi 95% untuk audio yang jelas dalam bahasa yang disokong. Kami menggunakan pengecaman pertuturan terkemuka industri OpenAI di sebalik tabir, model yang sama yang menggerakkan banyak alat transkripsi profesional. Ketepatan dunia sebenar bergantung pada tiga perkara: kejelasan audio (bunyi latar mengurangkannya), loghat pembicara (loghat serantau yang berat mungkin menjatuhkan beberapa mata), dan bahasa itu sendiri (Inggeris dan Sepanyol cenderung mendapat skor tertinggi). Jika anda mahukan ketepatan maksimum, lihat Kualiti audio apa yang memberikan hasil terbaik? untuk perkara kecil yang membuat perbezaan besar.

Q: Bahasa apa yang boleh saya transkripsi?

Kami menyokong 99 bahasa untuk transkripsi, termasuk Inggeris, Sepanyol, Portugis, Perancis, Jerman, Itali, Jepun, Cina, Korea, Rusia, Arab, Hindi dan banyak lagi. Anda boleh memilih bahasa secara eksplisit pada borang muat naik untuk ketepatan terbaik, atau biarkan pada Auto dan kami akan mengesannya untuk anda. Senarai bahasa adalah sama dengan set yang disokong oleh OpenAI Whisper, dan antara muka SoundScript.AI itu sendiri juga tersedia dalam kesemua 99 bahasa — lihat Di mana saya mengemas kini bahasa antara muka saya? untuk menukar bahasa anda.

Q: Apakah kegunaan format muat turun SRT dan TXT?

SRT ialah format sari kata standard — ia termasuk cap masa supaya setiap baris teks muncul pada saat yang tepat dalam video anda. Gunakannya untuk YouTube, Vimeo, editor video seperti Premiere atau Final Cut, atau mana-mana pemain yang menyokong sari kata. TXT ialah teks biasa tanpa cap masa — sempurna untuk dokumen, catatan blog, temu bual yang ditranskripsi, atau apa-apa yang anda hanya mahukan perkataan. Kami juga menawarkan DOC (dokumen Word berformat) dan PDF (boleh dicetak) — lihat Bagaimana saya memuat turun sebagai TXT, DOC atau PDF? untuk butiran.

Question 1

Sejauh mana ketepatan transkripsi?

Accepted Answer

Ketepatan biasanya melebihi 95% untuk audio yang jelas dalam bahasa yang disokong. Kami menggunakan pengecaman pertuturan terkemuka industri OpenAI di sebalik tabir, model yang sama yang menggerakkan banyak alat transkripsi profesional.

Ketepatan dunia sebenar bergantung pada tiga perkara: kejelasan audio (bunyi latar mengurangkannya), loghat pembicara (loghat serantau yang berat mungkin menjatuhkan beberapa mata), dan bahasa itu sendiri (Inggeris dan Sepanyol cenderung mendapat skor tertinggi). Jika anda mahukan ketepatan maksimum, lihat Kualiti audio apa yang memberikan hasil terbaik? untuk perkara kecil yang membuat perbezaan besar.

Question 2

Bolehkah SoundScript.AI mengenal pasti pembicara yang berbeza dalam audio saya?

Accepted Answer

Ya — pengenalan pembicara disertakan dengan langganan anda pada setiap pelan. Pada borang muat naik, tetapkan Kenal Pasti Pembicara kepada Ya dan kami akan melabel setiap pembicara dalam transkripsi anda secara automatik sebagai Speaker 1, Speaker 2 dan seterusnya.

Ia berfungsi dengan hebat untuk mesyuarat, temu bual, podcast, dan sebarang perbualan berbilang orang. Tiada had pada bilangan pembicara yang akan kami kesan. Pengenalan pembicara menambah sedikit masa pemprosesan, jadi matikannya untuk rakaman solo (kuliah, memo suara, kandungan pencerita tunggal) untuk hasil yang lebih cepat.

Question 3

Bahasa apa yang boleh saya transkripsi?

Accepted Answer

Kami menyokong 99 bahasa untuk transkripsi, termasuk Inggeris, Sepanyol, Portugis, Perancis, Jerman, Itali, Jepun, Cina, Korea, Rusia, Arab, Hindi dan banyak lagi.

Anda boleh memilih bahasa secara eksplisit pada borang muat naik untuk ketepatan terbaik, atau biarkan pada Auto dan kami akan mengesannya untuk anda. Senarai bahasa adalah sama dengan set yang disokong oleh OpenAI Whisper, dan antara muka SoundScript.AI itu sendiri juga tersedia dalam kesemua 99 bahasa — lihat Di mana saya mengemas kini bahasa antara muka saya? untuk menukar bahasa anda.

Question 4

Kualiti audio apa yang memberikan hasil terbaik?

Accepted Answer

Suara jelas yang dirakam dekat dengan mikrofon, dengan bunyi latar yang minimum. Itulah versi pendeknya. Berikut adalah perkara yang paling membantu:

Gunakan mikrofon yang baik — walaupun mikrofon USB peringkat permulaan atau telefon moden jauh lebih baik daripada mikrofon terbina dalam komputer riba.
Rakam dalam bilik yang sunyi — tutup tingkap, matikan kipas, dan elakkan permukaan keras yang menggema.
Dekat dengan mikrofon — 6-12 inci adalah jarak terbaik untuk pertuturan semula jadi.
Elakkan muzik latar apabila boleh — lihat Bagaimana SoundScript.AI mengendalikan muzik latar atau bunyi? untuk apa yang boleh dijangka apabila muzik tidak dapat dielakkan.

Question 5

Berapa lama pemprosesan biasanya mengambil masa?

Accepted Answer

Kebanyakan fail siap dalam beberapa saat hingga beberapa minit. Fail audio biasa 10 minit biasanya selesai dalam masa kurang daripada 30 saat.

Fail yang lebih besar daripada 25MB dibahagikan secara automatik kepada cebisan dan diproses secara selari, jadi rakaman selama sejam pun biasanya siap dalam 2-3 minit. Mengaktifkan pengenalan pembicara menambah sedikit masa tambahan. Bar kemajuan dikemas kini dalam masa nyata — tiada apa-apa untuk disegarkan semula.

Question 6

Apa yang berlaku dengan fail yang lebih besar daripada 25MB?

Accepted Answer

Kami membahagikan fail besar secara automatik kepada cebisan yang lebih kecil di sebalik tabir, mentranskripsinya secara selari, dan menyambungkan semula hasilnya. Anda tidak perlu buat apa-apa — hanya muat naik fail anda seperti biasa.

Saiz muat naik maksimum ialah 1GB. Setiap cebisan diproses secara berasingan, sebab itulah fail satu jam boleh siap hanya dalam beberapa minit. Sempadan cebisan diletakkan pada kesunyian semula jadi apabila boleh untuk mengelakkan pemotongan perkataan di tengah ayat.

Question 7

Mengapa transkripsi saya mempunyai ralat dalam kata nama khas?

Accepted Answer

Kata nama khas — nama orang, jenama, istilah teknikal, akronim — adalah bahagian paling sukar dalam transkripsi kerana ia tidak mengikut corak bahasa biasa. Walaupun audio yang baik boleh menghasilkan nama yang salah dieja.

Beberapa perkara yang membantu:

Pilih bahasa secara eksplisit dan bukan menggunakan auto-kesan.
Sebut kata nama khas dengan jelas semasa merakam, dengan sedikit jeda di sekitarnya.
Edit transkripsi selepas itu — anda boleh menyalin teks ke mana-mana editor dan membetulkan nama dengan cari-dan-ganti. Kami tidak menyokong senarai kosa kata tersuai pada masa ini, tetapi ia berada dalam pemerhatian kami.

Question 8

Bolehkah saya mengedit teks transkripsi?

Accepted Answer

Anda boleh menyalin teks transkripsi daripada halaman hasil dan mengeditnya dalam mana-mana editor teks atau pemproses kata — Google Docs, Microsoft Word, Notepad, apa sahaja yang anda suka.

Kami belum mempunyai editor dalam aplikasi, jadi perubahan yang anda buat di luar SoundScript.AI tidak disimpan semula ke pelayan kami. Transkripsi asal kekal dalam papan pemuka anda supaya anda sentiasa boleh memuat turun salinan baharu. Gunakan format muat turun .doc atau .txt jika anda ingin mengedit dan mengekalkan pemformatan.

Question 9

Apakah kegunaan format muat turun SRT dan TXT?

Accepted Answer

SRT ialah format sari kata standard — ia termasuk cap masa supaya setiap baris teks muncul pada saat yang tepat dalam video anda. Gunakannya untuk YouTube, Vimeo, editor video seperti Premiere atau Final Cut, atau mana-mana pemain yang menyokong sari kata.

TXT ialah teks biasa tanpa cap masa — sempurna untuk dokumen, catatan blog, temu bual yang ditranskripsi, atau apa-apa yang anda hanya mahukan perkataan. Kami juga menawarkan DOC (dokumen Word berformat) dan PDF (boleh dicetak) — lihat Bagaimana saya memuat turun sebagai TXT, DOC atau PDF? untuk butiran.

Question 10

Bagaimana SoundScript.AI mengendalikan muzik latar atau bunyi?

Accepted Answer

Kami melakukan yang terbaik, tetapi muzik latar atau bunyi yang berat akan mengurangkan ketepatan. Bunyi ambien yang ringan (kafe yang sunyi, kipas yang berputar) biasanya tidak menjadi masalah. Muzik kuat atau suara yang bersaing adalah kes yang paling sukar.

Untuk kandungan bergaya temu bual dengan muzik intro, anda biasanya akan melihat muzik ditranskripsi sebagai sampah atau dilangkau, kemudian ketepatan kembali apabila pertuturan bermula. Jika anda boleh merakam versi audio anda yang hanya pertuturan (atau menanggalkan muzik dengan alat seperti Audacity terlebih dahulu), ketepatan akan jauh lebih baik.

Transkripsi

Tiada soalan yang sepadan dengan carian anda.