امروزه ابزارهای هوشمند مختلفی مبتنی بر تکنیکهای پردازش گفتار در محصولات اپراتورهای هوشمند در حال راهاندازی و یا استفاده است. از آنجا که این ابزارها جهت تعامل کاربران و مشترکین اپراتورها با سیستمهای هوشمند استفاده میشوند، وابستگی زیادی به شرایط ضبط گفتار کاربران دارند. در واقع با توجه به اینکه کاربران از میکروفونهای مختلفی استفاده میکنند و یا در محیطهای مختلفی ضبط گفتاری را انجام میدهند تنوع شرایط آکوستیکی مختلفی را دارند و این تفاوت کیفیت میتواند تاثیر منفی روی پاسخهای سرویسهای خودکار محصولات مبتنی بر هوشمصنوعی و پردازش گفتار داشته باشد. در واقع این پروژه به منظور رفع مشکلات موجود در صوتهای ورودی ضبط شده توسط منابع مختلف که غالبا با کاهش کیفیت و یا SNR های پایین ضبط شدهاند تعریف شده است.
هدف
این پروژه در محصولات موتور جستجوی ذرهبین (تبدیل گفتار به متن، دستیار ذرهبین) و همچنین محصول خودنویس همراه (سامانه تبدیل گفتار به متن و استخراج تحلیل های متنی مختلف نظیر تولید خلاصه متون، تولید ابر کلمات پرکاربرد و سایر سرویسهای متنی) و کلیه محصولاتی که در آینده روی گفتار تعریف شوند مورد استفاده است. این پروژه به منظور بهبود پاسخ سرویس گفتار به متن نسبت به نویزهای محیطی و همچنین تقطیع گفتارهای بلند با حجم پردازش پایین تعریف شده تا بتواند بهبود خوبی روی محصول ذرهبین و همچنین خودنویس داشته باشد.