Q: دقت رونویسی چقدر است؟

دقت معمولاً برای صدای واضح در زبانهای پشتیبانیشده از ۹۵٪ فراتر میرود. ما در پشت صحنه از سیستم تشخیص گفتار پیشتاز OpenAI استفاده میکنیم — همان مدلی که نیروی محرک بسیاری از ابزارهای حرفهای رونویسی است. دقت در دنیای واقعی به سه چیز بستگی دارد: شفافیت صدا (نویز پسزمینه آسیب میزند)، لهجههای گوینده (لهجههای منطقهای سنگین ممکن است چند درصد افت ایجاد کنند) و خود زبان (انگلیسی و اسپانیایی معمولاً بالاترین امتیاز را میگیرند). برای رسیدن به حداکثر دقت، چه کیفیت صوتی بهترین نتیجه را میدهد؟ را ببینید — همان نکات کوچکی که تفاوت بزرگی میسازند.

Q: آیا SoundScript.AI میتواند گویندگان مختلف فایل صوتیام را تشخیص دهد؟

بله — شناسایی گوینده در همه طرحها با اشتراکتان گنجانده شده است. در فرم بارگذاری، Identify Speakers را روی Yes بگذارید و ما بهطور خودکار هر گوینده را در رونویسیتان بهعنوان Speaker 1 ، Speaker 2 و به همین ترتیب برچسبگذاری میکنیم. برای جلسات، مصاحبهها، پادکستها و هر گفتوگوی چندنفره عالی عمل میکند. محدودیتی در تعداد گویندههایی که تشخیص میدهیم وجود ندارد. شناسایی گوینده کمی به زمان پردازش اضافه میکند، پس برای ضبطهای تکنفره (سخنرانیها، یادداشتهای صوتی، محتوای تکراوی) آن را خاموش بگذارید تا نتایج سریعتری بگیرید.

Q: چه زبانهایی را میتوانم رونویسی کنم؟

ما از 99 زبان برای رونویسی پشتیبانی میکنیم، از جمله انگلیسی، اسپانیایی، پرتغالی، فرانسوی، آلمانی، ایتالیایی، ژاپنی، چینی، کرهای، روسی، عربی، هندی و بسیاری دیگر. میتوانید زبان را بهصراحت در فرم بارگذاری برای بهترین دقت انتخاب کنید، یا روی Auto بگذارید تا ما تشخیص دهیم. فهرست زبانها همان مجموعه پشتیبانیشده OpenAI Whisper است و رابط کاربری SoundScript.AI نیز در هر 99 زبان در دسترس است — برای تغییر زبان خودتان به زبان رابط کاربریام را کجا بهروزرسانی کنم؟ سر بزنید.

Q: چه کیفیت صوتی بهترین نتیجه را میدهد؟

صداهای واضحی که نزدیک به میکروفون ضبط شدهاند و کمترین نویز پسزمینه را دارند. این نسخه کوتاه است. آنچه بیشتر کمک میکند: از یک میکروفون مناسب استفاده کنید — حتی یک میکروفون USB ساده یا یک گوشی مدرن بسیار بهتر از میکروفون داخلی لپتاپ است. در اتاق ساکت ضبط کنید — پنجرهها را ببندید، پنکهها را خاموش کنید و از سطوح سختی که اکو میسازند دوری کنید. به میکروفون نزدیک شوید — ۶ تا ۱۲ اینچ نقطه شیرین برای گفتار طبیعی است. در صورت امکان از موسیقی پسزمینه پرهیز کنید — برای دانستن اینکه وقتی موسیقی اجتنابناپذیر است چه انتظاری داشته باشید، SoundScript.AI با موسیقی یا نویز پسزمینه چطور برخورد میکند؟ را ببینید.

Q: پردازش معمولاً چقدر طول میکشد؟

بیشتر فایلها در چند ثانیه تا چند دقیقه آماده میشوند. یک فایل صوتی معمولی ۱۰ دقیقهای معمولاً در کمتر از ۳۰ ثانیه به پایان میرسد. فایلهای بزرگتر از 25MB بهطور خودکار به قطعات تقسیم و بهصورت موازی پردازش میشوند، پس حتی یک ضبط یکساعته معمولاً در ۲ تا ۳ دقیقه آماده است. روشن کردن شناسایی گوینده کمی زمان بیشتر میبرد. نوار پیشرفت در لحظه بهروزرسانی میشود — نیازی به تازهسازی نیست.

Q: با فایلهای بزرگتر از 25MB چه میکنید؟

ما بهطور خودکار فایلهای بزرگ را در پشت صحنه به قطعات کوچکتر تقسیم میکنیم، آنها را بهصورت موازی رونویسی میکنیم و سپس نتایج را به هم میدوزیم. لازم نیست شما کاری انجام دهید — فقط فایلتان را مثل همیشه بارگذاری کنید. حداکثر اندازه بارگذاری 1GB است. هر قطعه بهطور مستقل پردازش میشود، و به همین دلیل یک فایل یکساعته در چند دقیقه آماده میشود. مرز قطعهها هرگاه ممکن باشد روی سکوتهای طبیعی قرار داده میشود تا کلمات وسط جمله بریده نشوند.

Q: چرا رونویسی من در اسامی خاص خطا دارد؟

اسامی خاص — نامها، نام برندها، اصطلاحات فنی، مخففها — سختترین بخش رونویسی هستند چون از الگوهای عادی زبان پیروی نمیکنند. حتی صدای فوقالعاده هم میتواند نامهای نادرست تولید کند. چند نکته که کمک میکند: زبان را بهصراحت انتخاب کنید و به جای تشخیص خودکار استفاده نکنید. اسامی خاص را هنگام ضبط شفاف بگویید ، با یک مکث کوتاه پیش و پس از آنها. رونویسی را پس از انجام ویرایش کنید — میتوانید متن را در هر ویرایشگری کپی کرده و با جستوجو و جایگزینی نامها را اصلاح کنید. در حال حاضر از فهرست واژگان سفارشی پشتیبانی نمیکنیم، اما این موضوع روی نقشه راه ما است.

Q: آیا میتوانم متن رونویسی را ویرایش کنم؟

میتوانید متن رونویسی را از صفحه نتیجه کپی کنید و در هر ویرایشگر متن یا نرمافزار پردازش کلمهای ویرایش کنید — Google Docs، Microsoft Word، Notepad یا هر چیزی که ترجیح میدهید. ما هنوز ویرایشگر درونبرنامهای نداریم، پس تغییراتی که خارج از SoundScript.AI اعمال میکنید روی سرورهای ما ذخیره نمیشود. رونویسی اصلی در داشبورد شما میماند و همیشه میتوانید نسخهای تازه دانلود کنید. اگر میخواهید با حفظ قالببندی ویرایش کنید، از فرمتهای دانلود .doc یا .txt استفاده کنید.

Q: فرمتهای دانلود SRT و TXT برای چه کاری هستند؟

SRT فرمت استاندارد زیرنویس است — شامل برچسبهای زمانی است تا هر خط متن در لحظه درست در ویدئو ظاهر شود. آن را برای YouTube، Vimeo، ویرایشگرهای ویدئو مانند Premiere یا Final Cut، یا هر پخشکنندهای که زیرنویس را میفهمد استفاده کنید. TXT متن ساده بدون برچسب زمانی است — برای اسناد، پستهای وبلاگ، مصاحبههای رونویسیشده یا هر جایی که فقط کلمات را میخواهید عالی است. ما DOC (سند Word قالببندیشده) و PDF (قابل چاپ) را هم ارائه میکنیم — برای جزئیات چطور بهصورت TXT، DOC یا PDF دانلود کنم؟ را ببینید.

Q: SoundScript.AI با موسیقی یا نویز پسزمینه چطور برخورد میکند؟

تمام تلاشمان را میکنیم، اما موسیقی یا نویز پسزمینه سنگین دقت را کاهش میدهد. نویز محیطی سبک (یک کافه ساکت، صدای یک پنکه) معمولاً مشکلی ایجاد نمیکند. موسیقی بلند یا صداهای رقیب سختترین موارد هستند. برای محتوای مصاحبهای با موسیقی مقدماتی، معمولاً موسیقی بهصورت متنی نامفهوم رونویسی میشود یا نادیده گرفته میشود، و وقتی گفتار شروع شود دقت برمیگردد. اگر بتوانید نسخهای فقط-گفتار از صدا را ضبط کنید (یا پیش از آن موسیقی را با ابزاری مثل Audacity جدا کنید)، دقت بهطور محسوسی بهتر خواهد بود.

Question 1

دقت رونویسی چقدر است؟

Accepted Answer

دقت معمولاً برای صدای واضح در زبان‌های پشتیبانی‌شده از ۹۵٪ فراتر می‌رود. ما در پشت صحنه از سیستم تشخیص گفتار پیشتاز OpenAI استفاده می‌کنیم — همان مدلی که نیروی محرک بسیاری از ابزارهای حرفه‌ای رونویسی است.

دقت در دنیای واقعی به سه چیز بستگی دارد: شفافیت صدا (نویز پس‌زمینه آسیب می‌زند)، لهجه‌های گوینده (لهجه‌های منطقه‌ای سنگین ممکن است چند درصد افت ایجاد کنند) و خود زبان (انگلیسی و اسپانیایی معمولاً بالاترین امتیاز را می‌گیرند). برای رسیدن به حداکثر دقت، چه کیفیت صوتی بهترین نتیجه را می‌دهد؟ را ببینید — همان نکات کوچکی که تفاوت بزرگی می‌سازند.

Question 2

آیا SoundScript.AI می‌تواند گویندگان مختلف فایل صوتی‌ام را تشخیص دهد؟

Accepted Answer

بله — شناسایی گوینده در همه طرح‌ها با اشتراک‌تان گنجانده شده است. در فرم بارگذاری، Identify Speakers را روی Yes بگذارید و ما به‌طور خودکار هر گوینده را در رونویسی‌تان به‌عنوان Speaker 1، Speaker 2 و به همین ترتیب برچسب‌گذاری می‌کنیم.

برای جلسات، مصاحبه‌ها، پادکست‌ها و هر گفت‌وگوی چندنفره عالی عمل می‌کند. محدودیتی در تعداد گوینده‌هایی که تشخیص می‌دهیم وجود ندارد. شناسایی گوینده کمی به زمان پردازش اضافه می‌کند، پس برای ضبط‌های تک‌نفره (سخنرانی‌ها، یادداشت‌های صوتی، محتوای تک‌راوی) آن را خاموش بگذارید تا نتایج سریع‌تری بگیرید.

Question 3

چه زبان‌هایی را می‌توانم رونویسی کنم؟

Accepted Answer

ما از 99 زبان برای رونویسی پشتیبانی می‌کنیم، از جمله انگلیسی، اسپانیایی، پرتغالی، فرانسوی، آلمانی، ایتالیایی، ژاپنی، چینی، کره‌ای، روسی، عربی، هندی و بسیاری دیگر.

می‌توانید زبان را به‌صراحت در فرم بارگذاری برای بهترین دقت انتخاب کنید، یا روی Auto بگذارید تا ما تشخیص دهیم. فهرست زبان‌ها همان مجموعه پشتیبانی‌شده OpenAI Whisper است و رابط کاربری SoundScript.AI نیز در هر 99 زبان در دسترس است — برای تغییر زبان خودتان به زبان رابط کاربری‌ام را کجا به‌روزرسانی کنم؟ سر بزنید.

Question 4

چه کیفیت صوتی بهترین نتیجه را می‌دهد؟

Accepted Answer

صداهای واضحی که نزدیک به میکروفون ضبط شده‌اند و کمترین نویز پس‌زمینه را دارند. این نسخه کوتاه است. آنچه بیشتر کمک می‌کند:

از یک میکروفون مناسب استفاده کنید — حتی یک میکروفون USB ساده یا یک گوشی مدرن بسیار بهتر از میکروفون داخلی لپ‌تاپ است.
در اتاق ساکت ضبط کنید — پنجره‌ها را ببندید، پنکه‌ها را خاموش کنید و از سطوح سختی که اکو می‌سازند دوری کنید.
به میکروفون نزدیک شوید — ۶ تا ۱۲ اینچ نقطه شیرین برای گفتار طبیعی است.
در صورت امکان از موسیقی پس‌زمینه پرهیز کنید — برای دانستن این‌که وقتی موسیقی اجتناب‌ناپذیر است چه انتظاری داشته باشید، SoundScript.AI با موسیقی یا نویز پس‌زمینه چطور برخورد می‌کند؟ را ببینید.

Question 5

پردازش معمولاً چقدر طول می‌کشد؟

Accepted Answer

بیشتر فایل‌ها در چند ثانیه تا چند دقیقه آماده می‌شوند. یک فایل صوتی معمولی ۱۰ دقیقه‌ای معمولاً در کمتر از ۳۰ ثانیه به پایان می‌رسد.

فایل‌های بزرگ‌تر از 25MB به‌طور خودکار به قطعات تقسیم و به‌صورت موازی پردازش می‌شوند، پس حتی یک ضبط یک‌ساعته معمولاً در ۲ تا ۳ دقیقه آماده است. روشن کردن شناسایی گوینده کمی زمان بیشتر می‌برد. نوار پیشرفت در لحظه به‌روزرسانی می‌شود — نیازی به تازه‌سازی نیست.

Question 6

با فایل‌های بزرگ‌تر از 25MB چه می‌کنید؟

Accepted Answer

ما به‌طور خودکار فایل‌های بزرگ را در پشت صحنه به قطعات کوچک‌تر تقسیم می‌کنیم، آن‌ها را به‌صورت موازی رونویسی می‌کنیم و سپس نتایج را به هم می‌دوزیم. لازم نیست شما کاری انجام دهید — فقط فایل‌تان را مثل همیشه بارگذاری کنید.

حداکثر اندازه بارگذاری 1GB است. هر قطعه به‌طور مستقل پردازش می‌شود، و به همین دلیل یک فایل یک‌ساعته در چند دقیقه آماده می‌شود. مرز قطعه‌ها هرگاه ممکن باشد روی سکوت‌های طبیعی قرار داده می‌شود تا کلمات وسط جمله بریده نشوند.

Question 7

چرا رونویسی من در اسامی خاص خطا دارد؟

Accepted Answer

اسامی خاص — نام‌ها، نام برندها، اصطلاحات فنی، مخفف‌ها — سخت‌ترین بخش رونویسی هستند چون از الگوهای عادی زبان پیروی نمی‌کنند. حتی صدای فوق‌العاده هم می‌تواند نام‌های نادرست تولید کند.

چند نکته که کمک می‌کند:

زبان را به‌صراحت انتخاب کنید و به جای تشخیص خودکار استفاده نکنید.
اسامی خاص را هنگام ضبط شفاف بگویید، با یک مکث کوتاه پیش و پس از آن‌ها.
رونویسی را پس از انجام ویرایش کنید — می‌توانید متن را در هر ویرایشگری کپی کرده و با جست‌وجو و جایگزینی نام‌ها را اصلاح کنید. در حال حاضر از فهرست واژگان سفارشی پشتیبانی نمی‌کنیم، اما این موضوع روی نقشه راه ما است.

Question 8

آیا می‌توانم متن رونویسی را ویرایش کنم؟

Accepted Answer

می‌توانید متن رونویسی را از صفحه نتیجه کپی کنید و در هر ویرایشگر متن یا نرم‌افزار پردازش کلمه‌ای ویرایش کنید — Google Docs، Microsoft Word، Notepad یا هر چیزی که ترجیح می‌دهید.

ما هنوز ویرایشگر درون‌برنامه‌ای نداریم، پس تغییراتی که خارج از SoundScript.AI اعمال می‌کنید روی سرورهای ما ذخیره نمی‌شود. رونویسی اصلی در داشبورد شما می‌ماند و همیشه می‌توانید نسخه‌ای تازه دانلود کنید. اگر می‌خواهید با حفظ قالب‌بندی ویرایش کنید، از فرمت‌های دانلود .doc یا .txt استفاده کنید.

Question 9

فرمت‌های دانلود SRT و TXT برای چه کاری هستند؟

Accepted Answer

SRT فرمت استاندارد زیرنویس است — شامل برچسب‌های زمانی است تا هر خط متن در لحظه درست در ویدئو ظاهر شود. آن را برای YouTube، Vimeo، ویرایشگرهای ویدئو مانند Premiere یا Final Cut، یا هر پخش‌کننده‌ای که زیرنویس را می‌فهمد استفاده کنید.

TXT متن ساده بدون برچسب زمانی است — برای اسناد، پست‌های وبلاگ، مصاحبه‌های رونویسی‌شده یا هر جایی که فقط کلمات را می‌خواهید عالی است. ما DOC (سند Word قالب‌بندی‌شده) و PDF (قابل چاپ) را هم ارائه می‌کنیم — برای جزئیات چطور به‌صورت TXT، DOC یا PDF دانلود کنم؟ را ببینید.

Question 10

SoundScript.AI با موسیقی یا نویز پس‌زمینه چطور برخورد می‌کند؟

Accepted Answer

تمام تلاش‌مان را می‌کنیم، اما موسیقی یا نویز پس‌زمینه سنگین دقت را کاهش می‌دهد. نویز محیطی سبک (یک کافه ساکت، صدای یک پنکه) معمولاً مشکلی ایجاد نمی‌کند. موسیقی بلند یا صداهای رقیب سخت‌ترین موارد هستند.

برای محتوای مصاحبه‌ای با موسیقی مقدماتی، معمولاً موسیقی به‌صورت متنی نامفهوم رونویسی می‌شود یا نادیده گرفته می‌شود، و وقتی گفتار شروع شود دقت برمی‌گردد. اگر بتوانید نسخه‌ای فقط-گفتار از صدا را ضبط کنید (یا پیش از آن موسیقی را با ابزاری مثل Audacity جدا کنید)، دقت به‌طور محسوسی بهتر خواهد بود.

رونویسی

هیچ سؤالی با جستجوی شما مطابقت ندارد.