گوگل Ai Studio

آموزش تبدیل گفتار به نوشتار با گوگل Ai Studio برای مبتدی‌ها

تبدیل گفتار به نوشتار یکی از مهارت‌های کاربردی در دنیای دیجیتال امروز است که می‌تواند سرعت تولید محتوا، یادداشت‌برداری و حتی برنامه‌نویسی را متحول کند. گوگل AI Studio با ابزارهای هوش مصنوعی پیشرفته خود امکان تبدیل سریع و دقیق صدا به متن را فراهم کرده است. در این مقاله، قصد داریم شما را قدم‌به‌قدم با فرآیند تبدیل گفتار به نوشتار با گوگل Ai Studio آشنا کنیم؛ از آپلود صدا تا پرامپت‌نویسی و دریافت متن نهایی برای کاربردهای مختلف. 

با دنبال‌کردن این مراحل، حتی اگر پیش‌زمینه فنی خاصی نداشته باشید، می‌توانید به‌راحتی فایل صوتی خود را به نوشتار تبدیل کرده و از امکانات هوش مصنوعی گوگل بهره‌مند شوید.

گوگل Ai Studio

Google AI Studio چیست و چه می‌کند؟

Google AI Studio یک محیط توسعه تحت وب است که توسط Google عرضه شده و هدفش ارائه ابزارهای هوش مصنوعی (شامل متن، تصویر، صدا و ویدیو) به‌صورت یکپارچه و قابل استفاده برای کاربران غیرتخصصی و کاربران حرفه‌ای است. 

این پلتفرم در ۱۳ دسامبر ۲۰۲۳ به‌صورت رسمی منتشر شد و جانشین Google MakerSuite محسوب می‌شود؛ ابزاری که پیش‌تر برای کار با مدل‌های زبانی گوگل عرضه شده بود. 

گوگل Ai Studio می‌تواند اقدامات زیر را انجام دهد:

  1. تبدیل فایل صوتی یا گفتار به متن: صدا را ضبط می‌کنید و متن می‌گیرید.
  2. تولید متن: نوشتن متن با کمک هوش مصنوعی، مثل نوشتن مقاله یا ایمیل.
  3. ترجمه: متن‌ها را به زبان‌های مختلف ترجمه می‌کند.
  4. تولید تصویر: می‌توانید با استفاده از آن، از متن، تصویر بسازید.
  5. تحلیل داده ساده: داده‌ها و اطلاعات را بررسی و خلاصه می‌کند.
  6. حل مسائل ریاضی و علمی با استدلال گام‌به‌گام

کارهای پیشرفته‌تر:

  1. تمرین و آزمایش مدل‌ها: می‌توانید مدل‌های هوش مصنوعی را بدون کدنویسی تست کنید.
  2. ساخت ربات مکالمه‌ای ساده: می‌توان با کمک آن یک چت‌بات آماده برای پرسش و پاسخ ساخت.
  3. تولید ویدیو از متن (با مدل Veo 2 – فعلاً محدود و در حال گسترش)
  4. تولید کد و توضیح کد (خیلی قوی در کدنویسی)
  5. ساخت Agentهای ساده (با ابزارهای خارجی مثل Google Search یا کد پایتون)
  6. اتصال به Google Sheets و Google Drive برای تحلیل خودکار

ما در این مقاله بر تبدیل گفتار به نوشتار با Google AI Studio متمرکز هستیم و به بقیه قابلیت‌های آن نمی‌پردازیم. 

آیا تبدیل گفتار به نوشتار با گوگل Ai Studio رایگان است؟

Google AI Studio به‌صورت رابط وب اجازه استفاده از بعضی مدل‌های Gemini را بدون پرداخت می‌دهد. یعنی اگر فقط داخل سایت Studio باشید و از مدل‌های ارائه‌شده استفاده کنید (مثل نوشتن متن، چت، تولید ساده محتوا)، ورودی و خروجی برای شما رایگان است. 

برای مدل‌هایی مثل “Flash” یا “Flash‑Lite” اگر استفاده‌تان سبک باشد (مثلاً متن کوتاه، تعداد درخواست کم)، معمولاً داخل سهمیه رایگان می‌مانید. به این معنی که برای کارهای روزمره— تست، نوشتن مقاله کوتاه، ترجمه یا تولید ایده — معمولا نیاز به پرداخت پول ندارید. 

اما اگر از API بیرونی (نه فقط رابط وب Studio) استفاده کنید، یعنی بخواهید مدل را داخل نرم‌افزار یا وب‌سایت خودتان به کار بگیرید، هزینه اعمال می‌شود. 

اگر پردازش‌ها سنگین‌تر باشد (متن طولانی، تصویر، محاسبات زیاد، یا تعداد درخواست زیاد) خیلی سریع از سهمیه رایگان عبور می‌کنید و هزینه شروع می‌شود.

به‌طور کلی و مختصر، بله! استفاده از Google AI Studio برای کارهای روزانه مانند تبدیل گفتار به متن رایگان است.

آماده‌سازی‌های لازم قبلی

قبل از شروع تبدیل گفتار به نوشتار با Google AI Studio، لازم است برخی آماده‌سازی‌ها انجام شود تا تجربه شما بدون مشکل پیش برود. این مراحل برای افرادی که با نرم‌افزار و اینترنت حرفه‌ای نیستند نیز قابل اجراست.

آماده‌سازی اول: نصب فیلتر شکن یا VPN

Google AI Studio در ایران بدون استفاده از فیلترشکن یا VPN کار نمی‌کند. اگر از قبل فیلترشکن ندارید یا دسترسی شما محدود است، می‌توانید از اکستنشن رایگان VPN برای مرورگر کروم استفاده کنید. این افزونه‌ به‌راحتی نصب می‌شود و فقط کافی است پس از نصب، آن را روشن کنید تا اتصال به Google AI Studio برقرار شود.

برای نصب اکستنشن رایگان VPN Free روی کروم، مراحل زیر را دنبال کنید:

  1. بازکردن مرورگر کروم: ابتدا مرورگر کروم را روی کامپیوتر خود باز کنید.
  2. رفتن به فروشگاه وب کروم (Chrome Web Store): در نوار آدرس بالای مرورگر، عبارت زیر را تایپ کنید و Enter بزنید: chrome.google.com/webstore همچنین می‌توانید روی همین عبارت در همین‌جا کلیک کنید تا باز شود. 
  3. جست‌وجوی VPN Free: در کادر جست‌وجوی بالای فروشگاه وب کروم، عبارت VPN Free را تایپ کنید و Enter بزنید.

4.انتخاب اکستنشن مناسب: از بین نتایج جست‌وجو، اکستنشن مناسب را انتخاب کنید و روی آن کلیک کنید. اگر نمی‌دانید کدام بهتر است، Free VPN for Chrome – VPN Proxy VeePN را انتخاب کنید. حتی می‌توانید با کلیک روی این عبارت در همین‌ متن، به نرم‌افزار هدایت شوید.

گوگل Ai Studio

5.افزودن به کروم: در صفحه جدیدی که باز می‌شود، روی دکمه Add to Chrome کلیک کنید و سپس Add Extension را بزنید تا نرم‌افزار نصب شود.

6.فعال‌کردن اکستنشن: بعد از نصب، مطابق عکس زیر در بالای مرورگر کروم و روی شماره 1 کلیک کنید. سپس در بخش بازشده، روی شماره 2 کلیک نمایید. 

گوگل Ai Studio

7. حالا روی دایره بزرگ که در عکس نشان داده شده است کلیک کنید تا وی پی ان نصب شود. وقتی نصب شد، دایره به رنگ سبز در خواهد آمد.

گوگل Ai Studio

حالا وی‌پی‌ان شما وصل است و در محدوده کروم کار می‌کند. 

آماده‌سازی دوم: فعال‌سازی حساب کاربری

برای استفاده از Google AI Studio باید حساب Google خود را داشته باشید. اگر ندارید، باید بسازید و وارد آن شوید. ازآنجا‌که آموزش این کار مربوط به این مقاله نیست، ما در اینجا به آن نمی‌پردازیم.

آماده‌سازی سوم: آماده‌کردن فایل صوتی

قبل از آپلود فایل، لازم است فایل صوتی مورد نظر خود را آماده کنید. فرمت‌های رایج شامل MP3، WAV یا M4A هستند. مطمئن شوید کیفیت فایل خوب است و صدای شما واضح ضبط شده باشد، چون کیفیت صدا روی دقت تبدیل گفتار به نوشتار تاثیر دارد.

آماده‌سازی چهارم: اتصال مطمئن به اینترنت

یک اتصال پایدار به اینترنت ضروری است. سرعت بالا باعث می‌شود فرآیند تبدیل، سریع‌تر و بدون قطعی انجام شود. اگر از Wi-Fi استفاده می‌کنید، بهتر است نزدیک مودم باشید یا از اتصال کابلی (LAN) بهره ببرید.

مراحل تبدیل گفتار به نوشتار با Google AI Studio 

اکنون که همه‌چیز آماده است، می‌توانید تبدیل گفتار به نوشتار با Google AI Studio را شروع کنید. در ادامه مراحل را به‌شکل مرحله‌به‌مرحله و با عکس آورده‌ایم.

مرحله اول: ورود به Google AI Studio

وارد سایت Google AI Studio شوید. برای این کار کافی است اینجا کلیک کنید یا نام آن را در گوگل بزنید. در بدو ورود، صفحه زیر را می‌بییند و ممکن است یک پنجره ظاهر شود که لازم است آن را تایید کنید. روی Chat with model که در عکس زیر دور آن خط کشیده شده است، کلیک کنید. 

گوگل Ai Studio

مرحله دوم: نوشتن دستور

پس از ورود به صفحه، در باکس مخصوص (که در عکس زیر نشان داده شده است) درخواست خود را از Google AI Studio بنویسید. این درخواست یا همان «پرامپت» بسیار ساده است. کافی است آنچه می‌خواهید را وارد کنید. اگر نمی‌دانید چه بنویسید، برای تبدیل فایل صوتی به نوشتار با Google AI Studio، متن زیر را کپی کرده و در باکس قرار دهید:

«لطفاً فایل صوتی که برای شما ارسال می‌شود، به متن ساختارمند تبدیل کنید. درصورتی‌که چند گوینده وجود داشته باشد، آن‌ها را از هم متمایز نمایید.»

گوگل Ai Studio


مرحله سوم: آپلود فایل

حالا باید فایل صوتی خود را آپلود کنید. برای این کار:

  1. روی فلش یا علامت + کنار باکس متن کلیک کنید.
  2. از میان گزینه‌ها، Upload را انتخاب کنید.
  3. فایل مورد نظر خود را از هر جایی که در دستگاه ذخیره کرده‌اید پیدا کرده و کلیک کنید تا آپلود شود.

مدت زمان آپلود بستگی به حجم فایل، سرعت اینترنت و وضعیت فیلترشکن دارد. در فایل‌های بزرگ، این زمان ممکن است طولانی شود. برای این مشکل، در انتهای مقاله یک روش جایگزین برای آپلود سریع‌تر فایل (گوگل درایو) ارائه شده است. اما فعلاً با همین روش پیش بروید. 

نکته مهم: اگر پس از انتخاب فایل، با خطا روبه‌رو شدید، باز هم لازم است از روش انتهای مقاله برای آپلود فایل صوتی استفاده نمایید. 

گوگل Ai Studio

مرحله چهار: تبدیل

اکنون کافی است روی عبارت Run که در عکس زیر نمایش داده‌شده است کلیک کنید تا کار تبدیل شروع شود. 

گوگل Ai Studio

مرحله پنجم: استفاده از متن

همان‌طور که در عکس زیر می‌بینید، متن تولیدشده از ویس، داخل پنجره نمایش داده می‌شود. برای استفاده از این متن کافی است آن را انتخاب کرده و در یک فایل کپی کنید. تبدیل گفتار به نوشتار با گوگل Ai Studio در این مرحله تمام شده است. حالا لازم است متن خود را ویرایش کرده و از آن استفاده کنید. 

گوگل Ai Studio

روش مکمل برای آپلود صدا در گوگل Ai Studio 

به‌خاطر محدودیت‌های دسترسی و اختلال‌های مربوط به ابزارهای تغییر IP، بسیاری از کاربران داخل ایران امکان بارگذاری مستقیم فایل صوتی در Google AI Studio را ندارند. یک راه‌حل عملی این است که ابتدا فایل صوتی را در Google Drive ذخیره کنید و سپس همان فایل را از طریق لینک داخلی حساب گوگل خود در AI Studio فراخوانی کنید. در عمل، شما صدا را در فضای ابری حساب کاربری‌تان قرار می‌دهید و اجازه می‌دهید AI Studio آن را مستقیماً از همان مسیر بخواند.

نکته مهم این است که باید در مرورگر Chrome با حساب گوگل خود وارد شده باشید؛ در غیر این صورت، دسترسی بین Drive و AI Studio برقرار نمی‌شود و مراحل بعدی اجرا نخواهد شد.

مرحله اول: ورود به Google Drive

اگر پیش‌تر در مرورگر Chrome با حساب گوگل خود وارد شده باشید، با کلیک روی این لینک Google Drive، مستقیماً به فضای کاربری‌تان منتقل می‌شوید. Google Drive یک محیط ذخیره‌سازی ابری است که کارکردی مشابه پوشه‌های معمولی در رایانه دارد؛ می‌توانید در آن پوشه بسازید، فایل اضافه کنید و آن‌ها را مرتب نگه دارید، با این تفاوت که همه‌چیز روی سرورهای ابری حساب شما قرار می‌گیرد و نه روی سخت‌افزار شخصی‌تان. پس از ورود، صفحه اصلی درایو نمایش داده می‌شود و می‌توانید عملیات آپلود فایل را آغاز کنید.

گوگل Ai Studio

مرحله دوم: آپلود فایل

روی آیکون My Drive از نوار سمت چپ صفحه کلیک کنید تا وارد صفحه زیر شوید. 

گوگل Ai Studio

حالا می‌توانید با راست‌کلیک روی صفحه و انتخاب گزینه Upload File ، فایل صوتی خود را انتخاب کنید تا آپلود شود.

گوگل Ai Studio

پس از آپلود کامل و یکبار رفراش، فایل را در صفحه خواهید دید

تا اینجا نیازی به فیلتر شکن نیست، اما از اینجا به بعد لازم است فیلتر شکن خود را روشن کنید تا به گوگل Ai Studio دسترسی داشته باشید.

مرحله سوم: آپلود در گوگل استودیو

حالا در همان صفحه چت گوگل Ai Studio، پس از نوشتن دستور، روی + کلیک کرده و به جای Upload روی گزینه My drive کلیک کنید گوگل درایو شما باز می‌شود و می‌توانید فایل را به‌جای کامپیوتر از آنجا انتخاب کنید. 


مزیت اصلی این روش این است که می‌توانید فایل صوتی را بدون نیاز به فیلتر شکن و معمولاً با سرعت پایدارتر در Google Drive بارگذاری کنید و سپس همان فایل را از داخل حساب خود به Google AI Studio معرفی کنید. علاوه‌بر این، خطاهایی که هنگام آپلود مستقیم در روش قبلی دیده می‌شد—از قطع ارتباط گرفته تا ناموفق‌بودن بارگذاری- در این شیوه به‌طور معمول رخ نمی‌دهد، چون انتقال فایل در بستر داخلی سرویس‌های گوگل انجام می‌شود.

یک نرم‌افزار جایگزین ایرانی برای تبدیل گفتار به نوشتار

همان‌طور که مشخص است، روش کار با Google AI Studio اگرچه دقت بالایی دارد، اما برای بسیاری از کاربران مبتدی کمی پیچیده است؛ مخصوصاً زمانی که پای مدل‌ها، تنظیمات و بارگذاری فایل از مسیرهای غیرمستقیم مطرح می‌شود. اگر قصد دارید فقط فایل‌های صوتی کوتاه را تبدیل کنید و به‌دنبال یک راه ساده‌تر و بدون درگیری با محدودیت‌های دسترسی باشید، یک گزینه بومی می‌تواند کار شما را راحت‌تر کند.

در این شرایط، نرم‌افزار «نوانویس» انتخاب مناسبی است. نوانویس یک سرویس ایرانی تشخیص گفتار است که تمرکز آن روی تبدیل سریع و خودکار صدای فارسی به متن است. رابط کاربری آن ساده است، نیاز به تنظیمات فنی ندارد و برای فایل‌های صوتی با زمان محدود عملکرد قابل قبولی ارائه می‌دهد. این سرویس از لهجه‌های مختلف فارسی پشتیبانی می‌کند، امکان بارگذاری مستقیم فایل دارد، اما خروجی متن نیاز به ویرایش دستی دارد تا به‌شکل دل‌خواه کاربر تبدیل شود. 

در نتیجه، اگر هدف شما انجام کارهای سریع و کم‌دردسر است، نوانویس می‌تواند جایگزین ساده‌تری نسبت به Google AI Studio باشد، بدون اینکه نیاز باشد درگیر تنظیمات تخصصی شوید.

به بالا بروید