رونویسی

نحوه کار رونویسی، دقت، زبان‌ها، زمان پردازش و نکاتی درباره کیفیت صدا.

دقت رونویسی چقدر است؟

دقت معمولاً برای صدای واضح در زبان‌های پشتیبانی‌شده از ۹۵٪ فراتر می‌رود. ما در پشت صحنه از سیستم تشخیص گفتار پیشتاز OpenAI استفاده می‌کنیم — همان مدلی که نیروی محرک بسیاری از ابزارهای حرفه‌ای رونویسی است.

دقت در دنیای واقعی به سه چیز بستگی دارد: شفافیت صدا (نویز پس‌زمینه آسیب می‌زند)، لهجه‌های گوینده (لهجه‌های منطقه‌ای سنگین ممکن است چند درصد افت ایجاد کنند) و خود زبان (انگلیسی و اسپانیایی معمولاً بالاترین امتیاز را می‌گیرند). برای رسیدن به حداکثر دقت، چه کیفیت صوتی بهترین نتیجه را می‌دهد؟ را ببینید — همان نکات کوچکی که تفاوت بزرگی می‌سازند.

آیا SoundScript.AI می‌تواند گویندگان مختلف فایل صوتی‌ام را تشخیص دهد؟

بله — شناسایی گوینده در همه طرح‌ها، از جمله طرح Free، در دسترس است. در فرم بارگذاری، Identify Speakers را روی Yes بگذارید و ما به‌طور خودکار هر گوینده را در رونویسی‌تان به‌عنوان Speaker 1، Speaker 2 و به همین ترتیب برچسب‌گذاری می‌کنیم.

برای جلسات، مصاحبه‌ها، پادکست‌ها و هر گفت‌وگوی چندنفره عالی عمل می‌کند. محدودیتی در تعداد گوینده‌هایی که تشخیص می‌دهیم وجود ندارد. شناسایی گوینده کمی به زمان پردازش اضافه می‌کند، پس برای ضبط‌های تک‌نفره (سخنرانی‌ها، یادداشت‌های صوتی، محتوای تک‌راوی) آن را خاموش بگذارید تا نتایج سریع‌تری بگیرید.

چه زبان‌هایی را می‌توانم رونویسی کنم؟

ما از 99 زبان برای رونویسی پشتیبانی می‌کنیم، از جمله انگلیسی، اسپانیایی، پرتغالی، فرانسوی، آلمانی، ایتالیایی، ژاپنی، چینی، کره‌ای، روسی، عربی، هندی و بسیاری دیگر.

می‌توانید زبان را به‌صراحت در فرم بارگذاری برای بهترین دقت انتخاب کنید، یا روی Auto بگذارید تا ما تشخیص دهیم. فهرست زبان‌ها همان مجموعه پشتیبانی‌شده OpenAI Whisper است و رابط کاربری SoundScript.AI نیز در هر 99 زبان در دسترس است — برای تغییر زبان خودتان به زبان رابط کاربری‌ام را کجا به‌روزرسانی کنم؟ سر بزنید.

چه کیفیت صوتی بهترین نتیجه را می‌دهد؟

صداهای واضحی که نزدیک به میکروفون ضبط شده‌اند و کمترین نویز پس‌زمینه را دارند. این نسخه کوتاه است. آنچه بیشتر کمک می‌کند:

  • از یک میکروفون مناسب استفاده کنید — حتی یک میکروفون USB ساده یا یک گوشی مدرن بسیار بهتر از میکروفون داخلی لپ‌تاپ است.
  • در اتاق ساکت ضبط کنید — پنجره‌ها را ببندید، پنکه‌ها را خاموش کنید و از سطوح سختی که اکو می‌سازند دوری کنید.
  • به میکروفون نزدیک شوید — ۶ تا ۱۲ اینچ نقطه شیرین برای گفتار طبیعی است.
  • در صورت امکان از موسیقی پس‌زمینه پرهیز کنید — برای دانستن این‌که وقتی موسیقی اجتناب‌ناپذیر است چه انتظاری داشته باشید، SoundScript.AI با موسیقی یا نویز پس‌زمینه چطور برخورد می‌کند؟ را ببینید.

پردازش معمولاً چقدر طول می‌کشد؟

بیشتر فایل‌ها در چند ثانیه تا چند دقیقه آماده می‌شوند. یک فایل صوتی معمولی ۱۰ دقیقه‌ای معمولاً در کمتر از ۳۰ ثانیه به پایان می‌رسد.

فایل‌های بزرگ‌تر از 25MB به‌طور خودکار به قطعات تقسیم و به‌صورت موازی پردازش می‌شوند، پس حتی یک ضبط یک‌ساعته معمولاً در ۲ تا ۳ دقیقه آماده است. روشن کردن شناسایی گوینده کمی زمان بیشتر می‌برد. نوار پیشرفت در لحظه به‌روزرسانی می‌شود — نیازی به تازه‌سازی نیست.

با فایل‌های بزرگ‌تر از 25MB چه می‌کنید؟

ما به‌طور خودکار فایل‌های بزرگ را در پشت صحنه به قطعات کوچک‌تر تقسیم می‌کنیم، آن‌ها را به‌صورت موازی رونویسی می‌کنیم و سپس نتایج را به هم می‌دوزیم. لازم نیست شما کاری انجام دهید — فقط فایل‌تان را مثل همیشه بارگذاری کنید.

حداکثر اندازه بارگذاری 1GB است. هر قطعه به‌طور مستقل پردازش می‌شود، و به همین دلیل یک فایل یک‌ساعته در چند دقیقه آماده می‌شود. مرز قطعه‌ها هرگاه ممکن باشد روی سکوت‌های طبیعی قرار داده می‌شود تا کلمات وسط جمله بریده نشوند.

چرا رونویسی من در اسامی خاص خطا دارد؟

اسامی خاص — نام‌ها، نام برندها، اصطلاحات فنی، مخفف‌ها — سخت‌ترین بخش رونویسی هستند چون از الگوهای عادی زبان پیروی نمی‌کنند. حتی صدای فوق‌العاده هم می‌تواند نام‌های نادرست تولید کند.

چند نکته که کمک می‌کند:

  • زبان را به‌صراحت انتخاب کنید و به جای تشخیص خودکار استفاده نکنید.
  • اسامی خاص را هنگام ضبط شفاف بگویید، با یک مکث کوتاه پیش و پس از آن‌ها.
  • رونویسی را پس از انجام ویرایش کنید — می‌توانید متن را در هر ویرایشگری کپی کرده و با جست‌وجو و جایگزینی نام‌ها را اصلاح کنید. در حال حاضر از فهرست واژگان سفارشی پشتیبانی نمی‌کنیم، اما این موضوع روی نقشه راه ما است.

آیا می‌توانم متن رونویسی را ویرایش کنم؟

می‌توانید متن رونویسی را از صفحه نتیجه کپی کنید و در هر ویرایشگر متن یا نرم‌افزار پردازش کلمه‌ای ویرایش کنید — Google Docs، Microsoft Word، Notepad یا هر چیزی که ترجیح می‌دهید.

ما هنوز ویرایشگر درون‌برنامه‌ای نداریم، پس تغییراتی که خارج از SoundScript.AI اعمال می‌کنید روی سرورهای ما ذخیره نمی‌شود. رونویسی اصلی در داشبورد شما می‌ماند و همیشه می‌توانید نسخه‌ای تازه دانلود کنید. اگر می‌خواهید با حفظ قالب‌بندی ویرایش کنید، از فرمت‌های دانلود .doc یا .txt استفاده کنید.

فرمت‌های دانلود SRT و TXT برای چه کاری هستند؟

SRT فرمت استاندارد زیرنویس است — شامل برچسب‌های زمانی است تا هر خط متن در لحظه درست در ویدئو ظاهر شود. آن را برای YouTube، Vimeo، ویرایشگرهای ویدئو مانند Premiere یا Final Cut، یا هر پخش‌کننده‌ای که زیرنویس را می‌فهمد استفاده کنید.

TXT متن ساده بدون برچسب زمانی است — برای اسناد، پست‌های وبلاگ، مصاحبه‌های رونویسی‌شده یا هر جایی که فقط کلمات را می‌خواهید عالی است. ما DOC (سند Word قالب‌بندی‌شده) و PDF (قابل چاپ) را هم ارائه می‌کنیم — برای جزئیات چطور به‌صورت TXT، DOC یا PDF دانلود کنم؟ را ببینید.

SoundScript.AI با موسیقی یا نویز پس‌زمینه چطور برخورد می‌کند؟

تمام تلاش‌مان را می‌کنیم، اما موسیقی یا نویز پس‌زمینه سنگین دقت را کاهش می‌دهد. نویز محیطی سبک (یک کافه ساکت، صدای یک پنکه) معمولاً مشکلی ایجاد نمی‌کند. موسیقی بلند یا صداهای رقیب سخت‌ترین موارد هستند.

برای محتوای مصاحبه‌ای با موسیقی مقدماتی، معمولاً موسیقی به‌صورت متنی نامفهوم رونویسی می‌شود یا نادیده گرفته می‌شود، و وقتی گفتار شروع شود دقت برمی‌گردد. اگر بتوانید نسخه‌ای فقط-گفتار از صدا را ضبط کنید (یا پیش از آن موسیقی را با ابزاری مثل Audacity جدا کنید)، دقت به‌طور محسوسی بهتر خواهد بود.

هنوز به کمک نیاز دارید؟

پاسخی که به دنبالش هستید پیدا نمی‌کنید؟ SoundScript.AI را به‌صورت رایگان امتحان کنید — نیازی به کارت اعتباری نیست.

رایگان امتحان کنید

یا ایمیل بزنید به [email protected]