معرفی نرم‌افزار تبدیل صدا به متن گوگل

گوگل مجموعه‌ای از ابزارها و سرویس‌ها را برای تبدیل گفتار به متن ارائه می‌دهد که هرکدام برای کاربردهای خاصی طراحی شده‌اند. این ابزارها می‌توانند مکالمات، یادداشت‌ها یا فایل‌های صوتی شما را به متن تبدیل کنند و در تایپ سریع، تولید محتوا یا ضبط جلسات به کار می‌آیند . به‌عبارت دیگر، «نرم‌افزار تبدیل صدا به متن گوگل» یک برنامه واحد نیست، بلکه مجموعه‌ای از چندین ابزار مرتبط است که همگی توسط گوگل توسعه یافته‌اند.
در ادامه، با هریک از این ابزارها، قابلیت‌ها و روش استفاده از آن‌ها بیشتر آشنا خواهیم شد.

Google Speech-to-Text API 

Google Speech-to-Text API یکی از ابزارهای پیشرفته گوگل برای تبدیل گفتار به متن است که به‌ویژه برای توسعه‌دهندگان و کسب‌وکارها طراحی شده است. این سرویس ابری، با استفاده از مدل‌های یادگیری عمیق، امکان تبدیل صوت به متن را با دقت بالا و در زمان واقعی فراهم می‌کند.

ویژگی‌های کلیدی

ویژگی‌های کلیدی این نرم‌افزار تبدیل صدا به متن گوگل شامل موارد زیر است:

  • پشتیبانی از بیش از ۱۲۵ زبان و لهجه: این API از بیش از ۱۲۵ زبان و لهجه مختلف پشتیبانی می‌کند، از جمله زبان فارسی. این گستردگی زبانی، آن را برای کاربردهای جهانی و چندزبانه مناسب می‌سازد.
  • مدل‌های تشخیص گفتار پیشرفته: Google Speech-to-Text API از مدل‌های پیشرفته‌ای مانند Chirp بهره می‌برد که با استفاده از یادگیری عمیق و پردازش زبان طبیعی، دقت بالایی در تشخیص گفتار حتی در محیط‌های پر سروصدا دارند.
  • امکان تشخیص گویندگان متعدد: این ویژگی، به‌ویژه در جلسات گروهی یا مصاحبه‌ها مفید است، زیرا با استفاده از آن می‌توان گفتار هر گوینده را جداگانه شناسایی و ثبت کرد.
  • قابلیت تنظیم مدل برای دامنه‌های خاص: توسعه‌دهندگان می‌توانند مدل را برای تشخیص بهتر اصطلاحات خاص یک حوزه یا صنعت خاص تنظیم کنند، که این امر دقت تشخیص را در زمینه‌های تخصصی افزایش می‌دهد.
  • امنیت و انطباق با استانداردهای بین‌المللی: این نرم‌افزار تبدیل صدا به متن گوگل با رعایت استانداردهای امنیتی مانند GDPR و HIPAA، داده‌های صوتی کاربران را به‌صورت ایمن پردازش می‌کند.

روش استفاده

نحوه استفاده از این نرم‌افزار تبدیل صدا به متن گوگل به‌شرح زیر است:

  1. به سایت Google Cloud Console بروید و با حساب گوگل خود وارد شوید.
  2. در داشبورد گوگل، روی«Create Project» کلیک کنید و یک نام برای پروژه خود انتخاب کنید.
  3. پس از ایجاد پروژه، سرویس تبدیل صدا به متن را فعال کنید.
  4. گوگل برای استفاده از سرویس‌های ابری نیاز به فعال‌بودن صورت‌حساب دارد. حتی اگر از اعتبار رایگان اولیه استفاده کنید، باید یک روش پرداخت معتبر وارد کنید.
  5. برای ارتباط امن برنامه یا نرم‌افزار شما با API، یک حساب سرویس (Service Account) ایجاد کنید. پس از ایجاد، یک کلید امنیتی دریافت می‌کنید که برنامه شما از آن برای دسترسی به سرویس استفاده می‌کند.
  6. حالا می‌توانید با استفاده از کتاب‌خانه‌های آماده یا REST API، صداها را به متن تبدیل کنید.

Live Transcribe

 Live Transcribeاپلیکیشنی رایگان از گوگل است که برای سیستم‌عامل اندروید طراحی شده و مکالمات و صداهای محیط را به‌صورت زنده به متن تبدیل می‌کند. این نرم‌افزار تبدیل صدا به متن گوگل به‌ویژه برای افراد ناشنوا و کم‌شنوا مفید است و با استفاده از یادگیری ماشین، زیرنویس‌های زنده مشابه آنچه در YouTube می‌بینیم تولید می‌کند. توسعه این اپلیکیشن با همکاری دانشگاه Gallaudet، پیشرو در آموزش ناشنوایان در آمریکا، آغاز شد و نسخه بتای عمومی آن در فوریه ۲۰۱۹ منتشر گشت. این برنامه تا اوایل ۲۰۲۳ بیش از ۵۰۰ میلیون بار دانلود شده و گوگل در سال ۲۰۱۹ آن را به‌صورت متن‌باز عرضه کرد.

ویژگی‌های کلیدی

این نرم‌افزار تبدیل صدا به متن گوگل دارای ویژگی‌های زیر است:

تبدیل زنده صدا به متن: مکالمات و صداهای محیط، با پشتیبانی از ۱۲۰ زبان و لهجه به‌صورت لحظه‌ای به متن تبدیل می‌شوند. کاربران می‌توانند کلمات اختصاصی خود، مثل نام افراد یا اشیاء خانه، را اضافه کنند.

حالت آفلاین: در نسخه‌های اخیر، امکان تبدیل صدا به متن بدون اتصال اینترنت فراهم شده، مشروط بر اینکه بسته زبان مربوطه نصب شده باشد (فقط برای برخی دستگاه‌ها با حداقل ۶ گیگابایت رم)

اعلان صداها :(Sound Notifications) این نرم‌افزار تبدیل صدا به متن گوگل می‌تواند صداهای مهم محیط مثل آلارم، گریه نوزاد یا صدای وسایل خانگی را تشخیص داده و اطلاع دهد. کاربران می‌توانند صداهای سفارشی برای اطلاع‌رسانی اضافه کنند و تاریخچه ۱۲ ساعت گذشته صداها را مرور کنند.

تایپ پاسخ‌ها: امکان تایپ پاسخ در همان مکالمه و استفاده از میکروفن‌های خارجی مانند هدفون سیمی، بلوتوث و USB برای دریافت بهتر صدا وجود دارد.

حفظ حریم خصوصی: صداهای ضبط‌شده، بعد از پردازش ذخیره نمی‌شوند. برنامه به میکروفن و اعلان‌ها دسترسی دارد، اما داده‌ها را حفظ نمی‌کند.

نحوه استفاده

برای استفاده از این نرم‌افزار تبدیل صدا به متن گوگل، مراحل زیر را دنبال کنید.

  • اپلیکیشن را ازGoogle Play Store دانلود کنید (نیاز به اندروید ۱۲ به بالا دارد).
  • برای فعال‌سازی، به Settings → Accessibility بروید و Live Transcribe یا Sound Notifications را انتخاب کنید.

Voice Typing در Google Docs 

ویژگی Voice Typing در Google Docs به شما اجازه می‌دهد تا با استفاده از صدا، متن تایپ کنید و حتی مستقیماً اسناد خود را ویرایش و قالب‌بندی کنید. این قابلیت همچنین در Google Slidesبرای نوشتن یادداشت‌های سخنرانی و زیرنویس‌ها در دسترس است و با مرورگرهای کروم، اج و سافاری کار می‌کند. هنگام فعال‌سازی، مرورگر شما کنترل سرویس تبدیل گفتار به متن را بر عهده دارد و متن را به Google Docs یا Slides ارسال می‌کند.

ویژگی‌های کلیدی

ویژگی‌های این نرم‌افزار تبدیل صدا به متن گوگل، شامل موارد زیر است:

  • پشتیبانی از بیش از ۱۰۰ زبان و لهجه
  • دقت بالا در تایپ صوتی
  • امکان استفاده از دستورات صوتی برای ویرایش و قالب‌بندی
  • کاربرد در Google Docs و Google Slidesبرای تایپ و یادداشت سخنرانی

این قابلیت برای افرادی که می‌خواهند سریع‌تر تایپ کنند یا نیاز به تایپ بدون استفاده از کیبورد دارند، بسیار کاربردی است و تجربه کار با اسناد گوگل را ساده‌تر و سریع‌تر می‌کند.

روش استفاده 

برای استفاده از این نرم‌افزار تبدیل صدا به متن گوگل مراحل زیر را دنبال کنید.

  • روشن‌کردن میکروفن: برای استفاده از تایپ صوتی یا دستورات صوتی، میکروفن کامپیوتر شما باید فعال و آماده باشد. معمولاً تنظیمات میکروفن در System Settingsمک یا Control Panel ویندوز قرار دارد.
  • شروع تایپ صوتی در Google Docs: یک سند Google Docsرا در مرورگر پشتیبانی‌شده باز کنید. به بخش Tools → Voice typing بروید. در این حالت یک جعبه میکروفن نمایش داده می‌شود. برای شروع صحبت، زبان را از بالای میکروفون انتخاب کرده و روی میکروفن کلیک کنید. سپس با صدای واضح و طبیعی صحبت کنید.
  • اتمام تایپ: برای پایان، دوباره روی میکروفن کلیک کنید.

روش استفاده در بخش یادداشت‌های سخنرانی Slides شامل موارد زیر است:

  • در مرورگر خود، یک ارائه Google Slidesباز کنید.
  • به منوی بالا بروید و Tools → Dictate speaker notes را انتخاب کنید.
  • یادداشت‌ها باز می‌شوند و جعبه میکروفن نمایش داده می‌شود. روی میکروفن کلیک کرده و صحبت کنید.

Voice In – Speech-To-Text Dictation

Voice In یک افزونه برای مرورگر Chrome است که به شما امکان می‌دهد با استفاده از صدا در بیش از ۱۰٬۰۰۰ وب‌سایت تایپ کنید. این ابزار برای نوشتن ایمیل‌ها، ارسال پیام‌ها، پاسخ به تکالیف، پرکردن فرم‌ها و حتی تمرین تلفظ زبان‌های مختلف بسیار مناسب است. این نرم‌افزار تبدیل صدا به متن گوگل از بیش از ۵۰ زبان پشتیبانی می‌کند و استفاده از آن بسیار ساده و سریع است.

ویژگی‌های کلیدی

ویژگی‌های کلیدی این نرم‌افزار تبدیل صدا به متن گوگل به‌شرح زیر است:

  • تایپ صوتی در وب‌سایت‌های مختلف: با این افزونه می‌توانید در سایت‌هایی مانند Gmail، Outlook، Slack، WordPress و حتی وب‌اپلیکیشن‌های CRM و EHR با صدا تایپ کنید.
  • پشتیبانی از زبان‌های متعدد: Voice In بیش از ۴۰ زبان، از جمله انگلیسی، فرانسوی، آلمانی، ایتالیایی و پرتغالی را شناسایی می‌کند و امکان تمرین تلفظ را نیز فراهم می‌کند.
  • سازگاری با پلتفرم‌های مختلف: این نرم‌افزار تبدیل صدا به متن گوگل تقریباً در هر وب‌سایتی که جعبه متنی داشته باشد، قابل استفاده است و کاربران می‌توانند بدون محدودیت، متن خود را با صدا وارد کنند.
  • کاربرد جهانی: بیش از ۵۰۰٬۰۰۰ کاربر در بیش از ۵۰ کشور از Voice In استفاده می‌کنند و ماهانه بیش از ۵ میلیون دقیقه مکالمه را به متن تبدیل می‌کنند.

نحوه استفاده 

برای استفاده از این نرم‌افزار تبدیل صدا به متن گوگل مراحل زیر را دنبال کنید:

  • افزونهVoice In را از Chrome Web Store نصب کنید.
  • پس از نصب، در هر جعبه متنی روی وب‌سایت مورد نظر، آیکون Voice In ظاهر می‌شود.
  • روی آیکون کلیک کرده و شروع به صحبت کنید؛ گفتار شما در همان لحظه به متن تبدیل می‌شود.

به بالا بروید