رد کردن پیوندها

سرویس تشخیص فعالیت صوتی و بهبود گفتار ورودی

موضوع پروژه:
تاریخ شروع پروژه:

1402

مدت زمان اجرا:

9 ماه

مجری

معاونت متولی:

راهکارهای دیجیتال و هوشمندسازی

معرفی

امروزه ابزارهای هوشمند مختلفی مبتنی بر تکنیک‌های پردازش گفتار در محصولات اپراتورهای هوشمند در حال راه‌اندازی و یا استفاده است. از آن‌جا که این ابزارها جهت تعامل کاربران و مشترکین اپراتورها با سیستم‌های هوشمند استفاده می‌شوند، وابستگی زیادی به شرایط ضبط گفتار کاربران دارند. در واقع با توجه به اینکه کاربران از میکروفون‌های مختلفی استفاده می‌کنند و یا در محیط‌های مختلفی ضبط گفتاری را انجام می‌دهند تنوع شرایط آکوستیکی مختلفی را دارند و این تفاوت کیفیت می‌تواند تاثیر منفی روی پاسخ‌های سرویس‌های خودکار محصولات مبتنی بر هوش‌مصنوعی و پردازش گفتار داشته باشد. در واقع این پروژه به منظور رفع مشکلات موجود در صوت‌های ورودی ضبط شده توسط منابع مختلف که غالبا با کاهش کیفیت و یا SNR های پایین ضبط شده‌اند تعریف شده است.

هدف

این پروژه در محصولات موتور جستجوی ذره‌بین (تبدیل گفتار به متن، دستیار ذره‌بین) و همچنین محصول خودنویس همراه (سامانه تبدیل گفتار به متن و استخراج تحلیل های متنی مختلف نظیر تولید خلاصه متون، تولید ابر کلمات پرکاربرد و سایر سرویس‌های متنی)  و کلیه محصولاتی که در آینده روی گفتار تعریف شوند مورد استفاده است. این پروژه به منظور بهبود پاسخ سرویس گفتار به متن نسبت به نویزهای محیطی و همچنین تقطیع گفتارهای بلند با حجم پردازش پایین تعریف شده تا بتواند بهبود خوبی روی محصول ذره‌بین و همچنین خودنویس داشته باشد.

ضرورت

دستاوردها

سرویس تشخیص فعالیت صوتی و بهبود گفتار ورودی

حوزه های قابل بهره برداری