معرفی ابزار Adobe Speech to Text؛ تبدیل صدا به متن در Premiere Pro

تبدیل صدا به متن، یکی از نیازهای مهم تدوین‌گران و تولیدکنندگان محتواست؛ مخصوصاً برای زیرنویس‌گذاری خودکار یا جست‌وجوی دقیق در محتوای ویدیویی. شرکت ادوبی با معرفی ابزار Speech to Text در نرم‌افزار Premiere Pro، گامی بزرگ در جهت ساده‌سازیاین فرایند برداشته است. این ابزار با استفاده از هوش مصنوعی، گفتار موجود در ویدیو را به‌صورت خودکار به متن تبدیل می‌کند و امکان ایجاد زیرنویس دقیق و هماهنگ با تصویر را فراهم می‌سازد.

در این مقاله با قابلیت‌ها، کاربردها و نحوه استفاده از ابزار Adobe Speech to Text آشنا می‌شویم و بررسی می‌کنیم که چگونه می‌توان با کمک آن، زمان تدوین را کاهش داد و کیفیت خروجی نهایی را ارتقا بخشید.

Adobe Speech-to-Text چیست؟

ابزار Adobe Speech-to-Text فرایند تبدیل صدا به متن را در ویدیوهای شما در نرم‌افزار Premiere Pro ساده می‌کند. این قابلیت مبتنی بر هوش مصنوعی، دیالوگ‌ها و نریشن‌ها را به فایل متنی زمان‌بندی‌شده تبدیل می‌کند. دقت بالای این ابزار در انجام خودکار زیرنویس‌گذاری می‌تواند ساعت‌ها در زمان شما صرفه‌جویی کند.

این ابزار از چه زبان‌هایی پشتیبانی می‌کند؟

Adobe Speech-to-Text از زبان‌های مختلفی پشتیبانی می‌کند و به‌روزرسانی زبان‌ها نیز به‌صورت منظم انجام می‌شود. زبان‌هایی که در حال حاضر پشتیبانی می‌شوند عبارت‌اند از:

انگلیسی (آمریکایی و بریتانیایی)
چینی ساده‌شده و سنتی (ماندارین)
کانتونی سنتی
اسپانیایی
آلمانی
فرانسوی
ژاپنی
پرتغالی
کره‌ای
ایتالیایی
روسی
هندی
هلندی
نروژی
سوئدی
دانمارکی

اگرچه این نرم‌افزار هنوز از زبان فارسی پشتیبانی نمی‌کند، اما Adobe به‌طور مداوم پکیج‌های زبانی جدید منتشر می‌کند و می‌توانیم امیدوار باشیم، زبان فارسی به‌زودی در پکیج‌های آن قرار گیرد. برای مشاهده جزئیات و مراحل نصب، به راهنمای نصب پکیج‌های زبانی در وب‌سایت رسمی Adobe مراجعه کنید.

تفاوت میان زیرنویس خودکار و Adobe Speech-to-Text

بسیاری از تولیدکنندگان محتوا از زیرنویس‌گذاری خودکار در پلتفرم‌های مختلف استفاده می‌کنند. اگرچه این روش کاربردی است، اما کنترل محدودی به کاربر می‌دهد، زیرا معمولا امکان ویرایش سبک و قالب زیرنویس وجود ندارد. در مقابل، با استفاده از قابلیت transcription در Premiere Pro، شما می‌توانید فرآیند زیرنویس‌گذاری را وارد مرحله تدوین کرده و کنترل کامل روی متن، سبک، فونت و ساختار زیرنویس داشته باشید، آن هم بدون اینکه مجبور به تایپ دستی شوید.

مراحل ایجاد کپشن (زیرنویس) در Premiere Pro

برای استفاده درست از قابلیت تبدیل صدا به متن، باید مطمئن شوید سیستم عامل شما و برنامه Premiere Pro به‌روز هستند؛ زیرا نسخه‌های 15.4، 22.0 و 22.1 از این قابلیت پشتیبانی نمی‌کنند. علاوه‌بر این، لازم است هنگام تبدیل صدا به متن، به اینترنت متصل باشید.

برای ایجاد کپشن، مراحل زیر را به‌ترتیب دنبال کنید:

ویرایش ویدیو را در تایم‌لاین انجام دهید تا به مرحله افزودن کپشن برسید.
نقاط In و Out را برای بخشی که نیاز به زیرنویس دارد مشخص کنید.
از منوی Window گزینه Text را انتخاب کرده و در بخش Captions روی گزینه Transcribe Sequence کلیک کنید.
در پنجره بازشده، ترک صوتی هدف را مشخص کرده، زبان موردنظر را انتخاب و در صورت نیاز گزینه «فقط در محدوده In و Out» را فعال کنید.
در صورت وجود چند گوینده، آن‌ها را نیز اضافه کنید و سپس روی Create کلیک نمایید.
پس از اتمام تبدیل، متن را مرور و در صورت نیاز ویرایش کنید.
سپس روی Create Captions کلیک کرده و تنظیمات نهایی را انجام دهید.

پس از این مراحل، کپشن‌ها در تایم‌لاین اضافه خواهند شد. برای تغییر ظاهر آن‌ها، به تب Essential Graphics بروید و فونت، اندازه و سبک دل‌خواه را اعمال کنید.

تبدیل کپشن‌ها به تایتل (Title) برای ویدیوهای کوتاه

اگر بخواهید کپشن‌ها را با جلوه‌های بصری جذاب‌تری همراه کنید، بهتر است آن‌ها را به Title تبدیل کنید. برای این کار، مراحل زیر را دنبال نمایید:

با کلیدهای میان‌بر Cmd+T یا Ctrl+T یک لایه متنی جدید بسازید و به‌اندازه طول کپشن‌ها گسترش دهید.
از ابزار Blade برای برش این لایه در نقاطی استفاده کنید که کپشن‌ها قطع می‌شوند.
متن هر کپشن را کپی کرده و در بخش مربوط به لایه عنوان، جای‌گذاری کنید.

تبدیل کپشن‌ها به تایتل (Title) برای ویدیوهای بلند

در ویدیوهای طولانی، کپی و جای‌گذاری دستی چندان کارآمد نیست، به همین دلیل لازم است از روش دیگری استفاده کنید که ما در ادامه مراحل آن را آورده‌ایم.

پس از پایان کپشن‌گذاری، از منوی سه‌نقطه در پنل Text گزینه Export as SRT را انتخاب و فایل را ذخیره کنید.
با استفاده از وب‌سایت‌هایی مانند Transcribe Files، فایل SRT را به فرمت Final Cut Pro XML تبدیل کنید.
فایل XML را در Premiere وارد کرده و کپشن‌ها را به‌صورت لایه‌های عنوان در پروژه قرار دهید.

نکات و مشکلات احتمالی تبدیل صدا به متن در Premiere Pro

گاهی اوقات تبدیل صدا به متن در Premiere Pro به‌درستی انجام نمی‌شود. در این بخش، چند ترفند کاربردی معرفی می‌کنیم تا هنگام بروز خطا یا مشکلات غیرمنتظره در فرآیند کپشن‌گذاری، بتوانید سریع‌تر و بهتر عمل کنید.

بهبود کیفیت صدا

کیفیت کپشن‌هایی که تولید می‌کنید، کاملاً به کیفیت صدای اولیه شما وابسته است. هرچند ابزار تبدیل صدا به متن در Premiere Pro عملکرد دقیقی دارد، اما برای تشخیص صحیح، باید صدای گفت‌وگو کاملا واضح باشد. اگر صدا را خودتان ضبط می‌کنید، نکات زیر را در نظر بگیرید:

از میکروفون باکیفیت استفاده کنید
در جایی ساکت ضبط را انجام دهید

برای بهبود کیفیت صداهایی که ضبط می‌کنید، می‌توانید مقاله « نکاتی برای تبدیل صدا به متن در محیط‌های شلوغ» را بخوانید.

برای فایل‌های صوتی ازپیش‌ ضبط‌شده نیز ابزارهایی برای بهبود کیفیت صدا در دسترس است. به هر حال لازم است قبل از تبدیل صدا به متن در Premiere Pro کیفیت آن را بهبود دهید.

بررسی و بازبینی متن

با اینکه هوش مصنوعی Adobe عملکرد خوبی در تبدیل صدا به متن دارد، بی‌نقص نیست. مانند سایر ابزارهای خودکار، ممکن است در تشخیص نام افراد، مکان‌ها یا برندها دچار خطا شود.

بنابراین حتماً بخش‌هایی از متن که دارای تلفظ یا املای خاص هستند را به‌صورت دستی بررسی و اصلاح کنید. البته Adobe هم بیکار ننشسته و به‌طور پیوسته در حال بهبود این سیستم هوشمند است. نسخه‌های جدید از طریق آپدیت‌های منظم منتشر می‌شوند.

افزودن مکث‌های دستی در متن

پس از ساخت نسخه اولیه کپشن‌، می‌توانید به‌صورت دستی تغییراتی اعمال کنید. یکی از این تغییرات، افزودن مکث بین بخش‌های مختلف متن است. اگر احساس کردید زمان‌بندی کپشن‌ها دقیق نیست، با افزودن مکث‌ها می‌توانید Premiere Pro را وادار کنید که در زمان نمایش کپشن‌ها فاصله‌هایی ایجاد کند تا متن به‌موقع نمایش داده شود.

جایگزینی فونت‌ها در پروژه

گاهی هنگام واردکردن فایل SRT، فونت به‌طور ناخواسته تغییر می‌کند. رایج‌ترین دلیل این مشکل، نصب‌نبودن فونت اصلی روی سیستم شماست. برای رفع سریع این مشکل، به مسیر Graphics > Replace Fonts in Project بروید. در این قسمت می‌توانید فونت فعلی و فونت جایگزین را انتخاب کرده و تغییرات را به کل پروژه اعمال کنید.

تنظیم ویژگی‌های کپشن

اگرچه بعد از ساخت کپشن‌ها می‌توانید برخی از ویژگی‌ها مثل اندازه، موقعیت یا قالب را تغییر دهید، اما این کار می‌تواند زمان‌بر باشد. بهترین روش، تنظیم همه موارد در ابتدای فرایند از طریق پنجره Create Captions است. در این بخش می‌توانید مواردی مثل حداکثر تعداد کاراکتر در هر خط و انتخاب کپشن‌های یک‌خطی یا دوسطری را مشخص کنید.

سخن آخر

ابزار Adobe Speech to Text در Premiere Pro، راهکاری پیشرفته برای تبدیل صدا به متن ارائه می‌دهد. دقت بالا، امکان ویرایش دستی و قابلیت‌های متنوع مانند تنظیم فونت، افزودن مکث و خروجی‌گرفتن به‌صورت فایل زیرنویس از جمله ویژگی‌هایی تبدیل صدا به متن در Premiere Pro است. این ابزار از زبان‌های متعددی پشتیبانی می‌کند (که فعلا فارسی جزء آن‌ها نیست) و برای استفاده به اتصال اینترنت و نسخه به‌روز نرم‌افزار نیاز دارد.

اگرچه گاهی خطاهایی در تشخیص نام‌ها یا تلفظ‌ها وجود دارد، اما امکان بازبینی و اصلاح متن این مشکل را حل می‌کند. در نهایت، تبدیل صدا به متن با Adobe Speech to Text تا حد زیادی در زمان تدوین‌گر صرفه‌جویی کرده و کیفیت خروجی را افزایش می‌دهد.

https://motionarray.com/learn/premiere-pro/speech-to-text-premiere-pro