رونویسی
نحوه کار رونویسی، دقت، زبانها، زمان پردازش و نکاتی درباره کیفیت صدا.
هیچ سؤالی با جستجوی شما مطابقت ندارد.
کلمه کلیدی دیگری را امتحان کنید، یا با ما تماس بگیرید تا کمک کنیم. ایمیل [email protected] یا یک حساب رایگان ایجاد کنید تا با AI درباره رونویسی خود گفتگو کنید.
دقت رونویسی چقدر است؟
دقت معمولاً برای صدای واضح در زبانهای پشتیبانیشده از ۹۵٪ فراتر میرود. ما در پشت صحنه از سیستم تشخیص گفتار پیشتاز OpenAI استفاده میکنیم — همان مدلی که نیروی محرک بسیاری از ابزارهای حرفهای رونویسی است.
دقت در دنیای واقعی به سه چیز بستگی دارد: شفافیت صدا (نویز پسزمینه آسیب میزند)، لهجههای گوینده (لهجههای منطقهای سنگین ممکن است چند درصد افت ایجاد کنند) و خود زبان (انگلیسی و اسپانیایی معمولاً بالاترین امتیاز را میگیرند). برای رسیدن به حداکثر دقت، چه کیفیت صوتی بهترین نتیجه را میدهد؟ را ببینید — همان نکات کوچکی که تفاوت بزرگی میسازند.
آیا SoundScript.AI میتواند گویندگان مختلف فایل صوتیام را تشخیص دهد؟
بله — شناسایی گوینده در همه طرحها، از جمله طرح Free، در دسترس است. در فرم بارگذاری، Identify Speakers را روی Yes بگذارید و ما بهطور خودکار هر گوینده را در رونویسیتان بهعنوان Speaker 1، Speaker 2 و به همین ترتیب برچسبگذاری میکنیم.
برای جلسات، مصاحبهها، پادکستها و هر گفتوگوی چندنفره عالی عمل میکند. محدودیتی در تعداد گویندههایی که تشخیص میدهیم وجود ندارد. شناسایی گوینده کمی به زمان پردازش اضافه میکند، پس برای ضبطهای تکنفره (سخنرانیها، یادداشتهای صوتی، محتوای تکراوی) آن را خاموش بگذارید تا نتایج سریعتری بگیرید.
چه زبانهایی را میتوانم رونویسی کنم؟
ما از 99 زبان برای رونویسی پشتیبانی میکنیم، از جمله انگلیسی، اسپانیایی، پرتغالی، فرانسوی، آلمانی، ایتالیایی، ژاپنی، چینی، کرهای، روسی، عربی، هندی و بسیاری دیگر.
میتوانید زبان را بهصراحت در فرم بارگذاری برای بهترین دقت انتخاب کنید، یا روی Auto بگذارید تا ما تشخیص دهیم. فهرست زبانها همان مجموعه پشتیبانیشده OpenAI Whisper است و رابط کاربری SoundScript.AI نیز در هر 99 زبان در دسترس است — برای تغییر زبان خودتان به زبان رابط کاربریام را کجا بهروزرسانی کنم؟ سر بزنید.
چه کیفیت صوتی بهترین نتیجه را میدهد؟
صداهای واضحی که نزدیک به میکروفون ضبط شدهاند و کمترین نویز پسزمینه را دارند. این نسخه کوتاه است. آنچه بیشتر کمک میکند:
- از یک میکروفون مناسب استفاده کنید — حتی یک میکروفون USB ساده یا یک گوشی مدرن بسیار بهتر از میکروفون داخلی لپتاپ است.
- در اتاق ساکت ضبط کنید — پنجرهها را ببندید، پنکهها را خاموش کنید و از سطوح سختی که اکو میسازند دوری کنید.
- به میکروفون نزدیک شوید — ۶ تا ۱۲ اینچ نقطه شیرین برای گفتار طبیعی است.
- در صورت امکان از موسیقی پسزمینه پرهیز کنید — برای دانستن اینکه وقتی موسیقی اجتنابناپذیر است چه انتظاری داشته باشید، SoundScript.AI با موسیقی یا نویز پسزمینه چطور برخورد میکند؟ را ببینید.
پردازش معمولاً چقدر طول میکشد؟
بیشتر فایلها در چند ثانیه تا چند دقیقه آماده میشوند. یک فایل صوتی معمولی ۱۰ دقیقهای معمولاً در کمتر از ۳۰ ثانیه به پایان میرسد.
فایلهای بزرگتر از 25MB بهطور خودکار به قطعات تقسیم و بهصورت موازی پردازش میشوند، پس حتی یک ضبط یکساعته معمولاً در ۲ تا ۳ دقیقه آماده است. روشن کردن شناسایی گوینده کمی زمان بیشتر میبرد. نوار پیشرفت در لحظه بهروزرسانی میشود — نیازی به تازهسازی نیست.
با فایلهای بزرگتر از 25MB چه میکنید؟
ما بهطور خودکار فایلهای بزرگ را در پشت صحنه به قطعات کوچکتر تقسیم میکنیم، آنها را بهصورت موازی رونویسی میکنیم و سپس نتایج را به هم میدوزیم. لازم نیست شما کاری انجام دهید — فقط فایلتان را مثل همیشه بارگذاری کنید.
حداکثر اندازه بارگذاری 1GB است. هر قطعه بهطور مستقل پردازش میشود، و به همین دلیل یک فایل یکساعته در چند دقیقه آماده میشود. مرز قطعهها هرگاه ممکن باشد روی سکوتهای طبیعی قرار داده میشود تا کلمات وسط جمله بریده نشوند.
چرا رونویسی من در اسامی خاص خطا دارد؟
اسامی خاص — نامها، نام برندها، اصطلاحات فنی، مخففها — سختترین بخش رونویسی هستند چون از الگوهای عادی زبان پیروی نمیکنند. حتی صدای فوقالعاده هم میتواند نامهای نادرست تولید کند.
چند نکته که کمک میکند:
- زبان را بهصراحت انتخاب کنید و به جای تشخیص خودکار استفاده نکنید.
- اسامی خاص را هنگام ضبط شفاف بگویید، با یک مکث کوتاه پیش و پس از آنها.
- رونویسی را پس از انجام ویرایش کنید — میتوانید متن را در هر ویرایشگری کپی کرده و با جستوجو و جایگزینی نامها را اصلاح کنید. در حال حاضر از فهرست واژگان سفارشی پشتیبانی نمیکنیم، اما این موضوع روی نقشه راه ما است.
آیا میتوانم متن رونویسی را ویرایش کنم؟
میتوانید متن رونویسی را از صفحه نتیجه کپی کنید و در هر ویرایشگر متن یا نرمافزار پردازش کلمهای ویرایش کنید — Google Docs، Microsoft Word، Notepad یا هر چیزی که ترجیح میدهید.
ما هنوز ویرایشگر درونبرنامهای نداریم، پس تغییراتی که خارج از SoundScript.AI اعمال میکنید روی سرورهای ما ذخیره نمیشود. رونویسی اصلی در داشبورد شما میماند و همیشه میتوانید نسخهای تازه دانلود کنید. اگر میخواهید با حفظ قالببندی ویرایش کنید، از فرمتهای دانلود .doc یا .txt استفاده کنید.
فرمتهای دانلود SRT و TXT برای چه کاری هستند؟
SRT فرمت استاندارد زیرنویس است — شامل برچسبهای زمانی است تا هر خط متن در لحظه درست در ویدئو ظاهر شود. آن را برای YouTube، Vimeo، ویرایشگرهای ویدئو مانند Premiere یا Final Cut، یا هر پخشکنندهای که زیرنویس را میفهمد استفاده کنید.
TXT متن ساده بدون برچسب زمانی است — برای اسناد، پستهای وبلاگ، مصاحبههای رونویسیشده یا هر جایی که فقط کلمات را میخواهید عالی است. ما DOC (سند Word قالببندیشده) و PDF (قابل چاپ) را هم ارائه میکنیم — برای جزئیات چطور بهصورت TXT، DOC یا PDF دانلود کنم؟ را ببینید.
SoundScript.AI با موسیقی یا نویز پسزمینه چطور برخورد میکند؟
تمام تلاشمان را میکنیم، اما موسیقی یا نویز پسزمینه سنگین دقت را کاهش میدهد. نویز محیطی سبک (یک کافه ساکت، صدای یک پنکه) معمولاً مشکلی ایجاد نمیکند. موسیقی بلند یا صداهای رقیب سختترین موارد هستند.
برای محتوای مصاحبهای با موسیقی مقدماتی، معمولاً موسیقی بهصورت متنی نامفهوم رونویسی میشود یا نادیده گرفته میشود، و وقتی گفتار شروع شود دقت برمیگردد. اگر بتوانید نسخهای فقط-گفتار از صدا را ضبط کنید (یا پیش از آن موسیقی را با ابزاری مثل Audacity جدا کنید)، دقت بهطور محسوسی بهتر خواهد بود.
هنوز به کمک نیاز دارید؟
پاسخی که به دنبالش هستید پیدا نمیکنید؟ SoundScript.AI را بهصورت رایگان امتحان کنید — نیازی به کارت اعتباری نیست.
رایگان امتحان کنیدیا ایمیل بزنید به [email protected]