Unukuzi

Jinsi unukuzi unavyofanya kazi, usahihi, lugha, muda wa kuchakata na vidokezo vya ubora wa sauti.

Unukuzi una usahihi kiasi gani?

Usahihi kwa kawaida huzidi 95% kwa sauti safi katika lugha zinazotumika. Tunatumia utambuzi wa hotuba unaoongoza tasnia wa OpenAI ndani, mfano huo huo unaoendesha zana nyingi za kitaalamu za unukuzi.

Usahihi wa ulimwengu halisi unategemea mambo matatu: uwazi wa sauti (kelele ya nyuma huumiza), lafudhi za wazungumzaji (lafudhi nzito za kikanda zinaweza kushuka pointi chache), na lugha yenyewe (Kiingereza na Kihispania huelekea kupata alama za juu). Ikiwa unataka usahihi wa juu, angalia Ubora gani wa sauti unatoa matokeo bora? kwa mambo madogo yanayofanya tofauti kubwa.

Je, SoundScript.AI inaweza kutambua wazungumzaji tofauti kwenye sauti yangu?

Ndiyo — utambuzi wa wazungumzaji unapatikana kwenye kila mpango, ikiwa ni pamoja na Mpango wa Bure. Kwenye fomu ya upakiaji, weka Tambua Wazungumzaji kuwa Ndiyo na tutaweka lebo ya kila mzungumzaji kwenye unukuzi wako kama Mzungumzaji 1, Mzungumzaji 2, na kadhalika.

Inafanya kazi vizuri kwa mikutano, mahojiano, podikasti, na mazungumzo yoyote ya watu wengi. Hakuna kikomo cha idadi ya wazungumzaji tunaowatambua. Utambuzi wa wazungumzaji huongeza muda kidogo wa kuchakata, kwa hivyo uzime kwa rekodi za mtu mmoja (mihadhara, kumbukumbu za sauti, maudhui ya msimulizi mmoja) ili kupata matokeo haraka.

Ni lugha zipi ninaweza kunukuu?

Tunashughulikia lugha 99 kwa unukuzi, ikiwa ni pamoja na Kiingereza, Kihispania, Kireno, Kifaransa, Kijerumani, Kiitaliano, Kijapani, Kichina, Kikorea, Kirusi, Kiarabu, Kihindi, na nyingine nyingi.

Unaweza kuchagua lugha waziwazi kwenye fomu ya upakiaji kwa usahihi bora, au iache kwenye Otomatiki na tutaitambua kwa ajili yako. Orodha ya lugha ni sawa na seti inayotumika ya OpenAI Whisper, na kiolesura cha SoundScript.AI chenyewe pia kinapatikana katika lugha zote 99 — angalia Ninaisasishaje lugha ya kiolesura changu? kuibadilisha yako.

Ubora gani wa sauti unatoa matokeo bora?

Sauti safi zilizorekodiwa karibu na maikrofoni, zenye kelele kidogo ya nyuma. Hiyo ndiyo toleo fupi. Hivi ndivyo vinavyosaidia zaidi:

  • Tumia maikrofoni nzuri — hata maikrofoni rahisi ya USB au simu ya kisasa ni bora zaidi kuliko maikrofoni iliyojengwa ndani ya kompyuta ndogo.
  • Rekodi katika chumba kimya — funga madirisha, zima feni, na epuka nyuso ngumu zinazotoa mwangwi.
  • Karibu na maikrofoni — inchi 6-12 ni eneo bora kwa hotuba ya asili.
  • Epuka muziki wa nyuma inapowezekana — angalia SoundScript.AI inashughulikiaje muziki au kelele za nyuma? kwa kile cha kutarajia muziki unapokuwa hauwezi kuepukika.

Kuchakata kwa kawaida huchukua muda gani?

Faili nyingi humalizika kwa sekunde hadi dakika chache. Faili la kawaida la sauti la dakika 10 kwa kawaida humalizika ndani ya sekunde 30.

Faili kubwa kuliko 25MB hugawanywa kiotomatiki kuwa vipande na kuchakatwa kwa sambamba, kwa hivyo hata rekodi ya saa moja kwa kawaida iko tayari kwa dakika 2-3. Kuwasha utambuzi wa wazungumzaji huongeza muda kidogo wa ziada. Kipima maendeleo husasishwa kwa wakati halisi — hakuna kitu cha kuonyesha upya.

Nini hutokea kwa faili kubwa kuliko 25MB?

Tunagawanya kiotomatiki faili kubwa kuwa vipande vidogo nyuma ya pazia, kuvinukuu kwa sambamba, na kuunganisha matokeo pamoja tena. Huhitaji kufanya chochote — pakia tu faili lako kama kawaida.

Ukubwa wa juu wa upakiaji ni 1GB. Kila kipande huchakatwa kwa kujitegemea, ndio sababu faili la saa moja linaweza kuwa tayari kwa dakika chache tu. Mipaka ya vipande huwekwa kwenye kimya cha asili inapowezekana ili kuepuka kukata maneno katikati ya sentensi.

Kwa nini unukuzi wangu una makosa kwenye majina ya kibinafsi?

Majina ya kibinafsi — majina ya watu, majina ya chapa, maneno ya kiufundi, vifupisho — ndiyo sehemu ngumu zaidi ya unukuzi kwa sababu hayafuati mifumo ya kawaida ya lugha. Hata sauti nzuri inaweza kutoa majina yaliyoandikwa vibaya.

Mambo machache yanayosaidia:

  • Chagua lugha waziwazi badala ya kutumia utambuzi wa kiotomatiki.
  • Sema majina ya kibinafsi kwa uwazi unaporekodi, na kitulizo kidogo karibu nayo.
  • Hariri unukuzi baadaye — unaweza kunakili maandishi kwenye mhariri yeyote na kurekebisha majina kwa tafuta-na-badilisha. Kwa sasa hatushughulikii orodha maalum ya msamiati, lakini iko kwenye rada yetu.

Je, ninaweza kuhariri maandishi ya unukuzi?

Unaweza kunakili maandishi ya unukuzi kutoka kwenye ukurasa wa matokeo na kuyahariri katika mhariri wowote wa maandishi au kichakataji cha maneno — Google Docs, Microsoft Word, Notepad, chochote unachopendelea.

Hatuna mhariri ndani ya programu bado, kwa hivyo mabadiliko unayofanya nje ya SoundScript.AI hayahifadhiwi tena kwenye seva zetu. Unukuzi wa asili unabaki kwenye dashibodi yako ili uweze kupakua nakala mpya kila wakati. Tumia fomati za upakuaji za .doc au .txt ikiwa unataka kuhariri na kuweka muundo.

Fomati za upakuaji za SRT na TXT ni za nini?

SRT ni fomati ya kawaida ya manukuu — inajumuisha alama za muda ili kila mstari wa maandishi uonekane kwa wakati sahihi kwenye video yako. Itumie kwa YouTube, Vimeo, vihariri vya video kama Premiere au Final Cut, au kichezeshi chochote kinachofahamu manukuu.

TXT ni maandishi rahisi bila alama za muda — kamili kwa hati, machapisho ya blogu, mahojiano yaliyonukuliwa, au chochote ambapo unataka maneno tu. Pia tunatoa DOC (hati ya Word iliyoundwa) na PDF (inayoweza kuchapishwa) — angalia Ninapakuaje kama TXT, DOC, au PDF? kwa maelezo.

SoundScript.AI inashughulikiaje muziki au kelele za nyuma?

Tunafanya yetu bora, lakini muziki mzito wa nyuma au kelele itapunguza usahihi. Kelele nyepesi za mazingira (mkahawa kimya, feni inayofanya kazi) kwa kawaida hazileti tatizo. Muziki wa sauti kubwa au sauti zinazoshindana ndizo kesi ngumu zaidi.

Kwa maudhui ya mtindo wa mahojiano yenye muziki wa utangulizi, kwa kawaida utaona muziki ukinukuliwa kama upuuzi au kurukwa, kisha usahihi unarudi hotuba inapoanza. Ikiwa unaweza kurekodi toleo la hotuba pekee la sauti yako (au kuondoa muziki kwa zana kama Audacity kabla), usahihi utakuwa bora zaidi kwa kuonekana.

Bado unahitaji msaada?

Hujapata jibu unalolitafuta? Jaribu SoundScript.AI bila malipo — hakuna kadi ya mkopo inayohitajika.

Jaribu bila malipo

au tuma barua pepe kwa [email protected]