گوگل مجموعهای از ابزارها و سرویسها را برای تبدیل گفتار به متن ارائه میدهد که هرکدام برای کاربردهای خاصی طراحی شدهاند. این ابزارها میتوانند مکالمات، یادداشتها یا فایلهای صوتی شما را به متن تبدیل کنند و در تایپ سریع، تولید محتوا یا ضبط جلسات به کار میآیند . بهعبارت دیگر، «نرمافزار تبدیل صدا به متن گوگل» یک برنامه واحد نیست، بلکه مجموعهای از چندین ابزار مرتبط است که همگی توسط گوگل توسعه یافتهاند.
در ادامه، با هریک از این ابزارها، قابلیتها و روش استفاده از آنها بیشتر آشنا خواهیم شد.

Google Speech-to-Text API
Google Speech-to-Text API یکی از ابزارهای پیشرفته گوگل برای تبدیل گفتار به متن است که بهویژه برای توسعهدهندگان و کسبوکارها طراحی شده است. این سرویس ابری، با استفاده از مدلهای یادگیری عمیق، امکان تبدیل صوت به متن را با دقت بالا و در زمان واقعی فراهم میکند.
ویژگیهای کلیدی
ویژگیهای کلیدی این نرمافزار تبدیل صدا به متن گوگل شامل موارد زیر است:
- پشتیبانی از بیش از ۱۲۵ زبان و لهجه: این API از بیش از ۱۲۵ زبان و لهجه مختلف پشتیبانی میکند، از جمله زبان فارسی. این گستردگی زبانی، آن را برای کاربردهای جهانی و چندزبانه مناسب میسازد.
- مدلهای تشخیص گفتار پیشرفته: Google Speech-to-Text API از مدلهای پیشرفتهای مانند Chirp بهره میبرد که با استفاده از یادگیری عمیق و پردازش زبان طبیعی، دقت بالایی در تشخیص گفتار حتی در محیطهای پر سروصدا دارند.
- امکان تشخیص گویندگان متعدد: این ویژگی، بهویژه در جلسات گروهی یا مصاحبهها مفید است، زیرا با استفاده از آن میتوان گفتار هر گوینده را جداگانه شناسایی و ثبت کرد.
- قابلیت تنظیم مدل برای دامنههای خاص: توسعهدهندگان میتوانند مدل را برای تشخیص بهتر اصطلاحات خاص یک حوزه یا صنعت خاص تنظیم کنند، که این امر دقت تشخیص را در زمینههای تخصصی افزایش میدهد.
- امنیت و انطباق با استانداردهای بینالمللی: این نرمافزار تبدیل صدا به متن گوگل با رعایت استانداردهای امنیتی مانند GDPR و HIPAA، دادههای صوتی کاربران را بهصورت ایمن پردازش میکند.
روش استفاده
نحوه استفاده از این نرمافزار تبدیل صدا به متن گوگل بهشرح زیر است:
- به سایت Google Cloud Console بروید و با حساب گوگل خود وارد شوید.
- در داشبورد گوگل، روی«Create Project» کلیک کنید و یک نام برای پروژه خود انتخاب کنید.
- پس از ایجاد پروژه، سرویس تبدیل صدا به متن را فعال کنید.
- گوگل برای استفاده از سرویسهای ابری نیاز به فعالبودن صورتحساب دارد. حتی اگر از اعتبار رایگان اولیه استفاده کنید، باید یک روش پرداخت معتبر وارد کنید.
- برای ارتباط امن برنامه یا نرمافزار شما با API، یک حساب سرویس (Service Account) ایجاد کنید. پس از ایجاد، یک کلید امنیتی دریافت میکنید که برنامه شما از آن برای دسترسی به سرویس استفاده میکند.
- حالا میتوانید با استفاده از کتابخانههای آماده یا REST API، صداها را به متن تبدیل کنید.

Live Transcribe
Live Transcribeاپلیکیشنی رایگان از گوگل است که برای سیستمعامل اندروید طراحی شده و مکالمات و صداهای محیط را بهصورت زنده به متن تبدیل میکند. این نرمافزار تبدیل صدا به متن گوگل بهویژه برای افراد ناشنوا و کمشنوا مفید است و با استفاده از یادگیری ماشین، زیرنویسهای زنده مشابه آنچه در YouTube میبینیم تولید میکند. توسعه این اپلیکیشن با همکاری دانشگاه Gallaudet، پیشرو در آموزش ناشنوایان در آمریکا، آغاز شد و نسخه بتای عمومی آن در فوریه ۲۰۱۹ منتشر گشت. این برنامه تا اوایل ۲۰۲۳ بیش از ۵۰۰ میلیون بار دانلود شده و گوگل در سال ۲۰۱۹ آن را بهصورت متنباز عرضه کرد.
ویژگیهای کلیدی
این نرمافزار تبدیل صدا به متن گوگل دارای ویژگیهای زیر است:
تبدیل زنده صدا به متن: مکالمات و صداهای محیط، با پشتیبانی از ۱۲۰ زبان و لهجه بهصورت لحظهای به متن تبدیل میشوند. کاربران میتوانند کلمات اختصاصی خود، مثل نام افراد یا اشیاء خانه، را اضافه کنند.
حالت آفلاین: در نسخههای اخیر، امکان تبدیل صدا به متن بدون اتصال اینترنت فراهم شده، مشروط بر اینکه بسته زبان مربوطه نصب شده باشد (فقط برای برخی دستگاهها با حداقل ۶ گیگابایت رم)
اعلان صداها :(Sound Notifications) این نرمافزار تبدیل صدا به متن گوگل میتواند صداهای مهم محیط مثل آلارم، گریه نوزاد یا صدای وسایل خانگی را تشخیص داده و اطلاع دهد. کاربران میتوانند صداهای سفارشی برای اطلاعرسانی اضافه کنند و تاریخچه ۱۲ ساعت گذشته صداها را مرور کنند.
تایپ پاسخها: امکان تایپ پاسخ در همان مکالمه و استفاده از میکروفنهای خارجی مانند هدفون سیمی، بلوتوث و USB برای دریافت بهتر صدا وجود دارد.
حفظ حریم خصوصی: صداهای ضبطشده، بعد از پردازش ذخیره نمیشوند. برنامه به میکروفن و اعلانها دسترسی دارد، اما دادهها را حفظ نمیکند.
نحوه استفاده
برای استفاده از این نرمافزار تبدیل صدا به متن گوگل، مراحل زیر را دنبال کنید.
- اپلیکیشن را ازGoogle Play Store دانلود کنید (نیاز به اندروید ۱۲ به بالا دارد).
- برای فعالسازی، به Settings → Accessibility بروید و Live Transcribe یا Sound Notifications را انتخاب کنید.

Voice Typing در Google Docs
ویژگی Voice Typing در Google Docs به شما اجازه میدهد تا با استفاده از صدا، متن تایپ کنید و حتی مستقیماً اسناد خود را ویرایش و قالببندی کنید. این قابلیت همچنین در Google Slidesبرای نوشتن یادداشتهای سخنرانی و زیرنویسها در دسترس است و با مرورگرهای کروم، اج و سافاری کار میکند. هنگام فعالسازی، مرورگر شما کنترل سرویس تبدیل گفتار به متن را بر عهده دارد و متن را به Google Docs یا Slides ارسال میکند.
ویژگیهای کلیدی
ویژگیهای این نرمافزار تبدیل صدا به متن گوگل، شامل موارد زیر است:
- پشتیبانی از بیش از ۱۰۰ زبان و لهجه
- دقت بالا در تایپ صوتی
- امکان استفاده از دستورات صوتی برای ویرایش و قالببندی
- کاربرد در Google Docs و Google Slidesبرای تایپ و یادداشت سخنرانی
این قابلیت برای افرادی که میخواهند سریعتر تایپ کنند یا نیاز به تایپ بدون استفاده از کیبورد دارند، بسیار کاربردی است و تجربه کار با اسناد گوگل را سادهتر و سریعتر میکند.
روش استفاده
برای استفاده از این نرمافزار تبدیل صدا به متن گوگل مراحل زیر را دنبال کنید.
- روشنکردن میکروفن: برای استفاده از تایپ صوتی یا دستورات صوتی، میکروفن کامپیوتر شما باید فعال و آماده باشد. معمولاً تنظیمات میکروفن در System Settingsمک یا Control Panel ویندوز قرار دارد.
- شروع تایپ صوتی در Google Docs: یک سند Google Docsرا در مرورگر پشتیبانیشده باز کنید. به بخش Tools → Voice typing بروید. در این حالت یک جعبه میکروفن نمایش داده میشود. برای شروع صحبت، زبان را از بالای میکروفون انتخاب کرده و روی میکروفن کلیک کنید. سپس با صدای واضح و طبیعی صحبت کنید.
- اتمام تایپ: برای پایان، دوباره روی میکروفن کلیک کنید.
روش استفاده در بخش یادداشتهای سخنرانی Slides شامل موارد زیر است:
- در مرورگر خود، یک ارائه Google Slidesباز کنید.
- به منوی بالا بروید و Tools → Dictate speaker notes را انتخاب کنید.
- یادداشتها باز میشوند و جعبه میکروفن نمایش داده میشود. روی میکروفن کلیک کرده و صحبت کنید.

Voice In – Speech-To-Text Dictation
Voice In یک افزونه برای مرورگر Chrome است که به شما امکان میدهد با استفاده از صدا در بیش از ۱۰٬۰۰۰ وبسایت تایپ کنید. این ابزار برای نوشتن ایمیلها، ارسال پیامها، پاسخ به تکالیف، پرکردن فرمها و حتی تمرین تلفظ زبانهای مختلف بسیار مناسب است. این نرمافزار تبدیل صدا به متن گوگل از بیش از ۵۰ زبان پشتیبانی میکند و استفاده از آن بسیار ساده و سریع است.
ویژگیهای کلیدی
ویژگیهای کلیدی این نرمافزار تبدیل صدا به متن گوگل بهشرح زیر است:
- تایپ صوتی در وبسایتهای مختلف: با این افزونه میتوانید در سایتهایی مانند Gmail، Outlook، Slack، WordPress و حتی وباپلیکیشنهای CRM و EHR با صدا تایپ کنید.
- پشتیبانی از زبانهای متعدد: Voice In بیش از ۴۰ زبان، از جمله انگلیسی، فرانسوی، آلمانی، ایتالیایی و پرتغالی را شناسایی میکند و امکان تمرین تلفظ را نیز فراهم میکند.
- سازگاری با پلتفرمهای مختلف: این نرمافزار تبدیل صدا به متن گوگل تقریباً در هر وبسایتی که جعبه متنی داشته باشد، قابل استفاده است و کاربران میتوانند بدون محدودیت، متن خود را با صدا وارد کنند.
- کاربرد جهانی: بیش از ۵۰۰٬۰۰۰ کاربر در بیش از ۵۰ کشور از Voice In استفاده میکنند و ماهانه بیش از ۵ میلیون دقیقه مکالمه را به متن تبدیل میکنند.
نحوه استفاده
برای استفاده از این نرمافزار تبدیل صدا به متن گوگل مراحل زیر را دنبال کنید:
- افزونهVoice In را از Chrome Web Store نصب کنید.
- پس از نصب، در هر جعبه متنی روی وبسایت مورد نظر، آیکون Voice In ظاهر میشود.
- روی آیکون کلیک کرده و شروع به صحبت کنید؛ گفتار شما در همان لحظه به متن تبدیل میشود.


