سرویس تشخیص فعالیت صوتی و بهبود گفتار ورودی

موضوع پروژه:

توسعه سرویس دیجیتال

تاریخ شروع پروژه:

1402

مدت زمان اجرا:

9 ماه

مجری

معاونت متولی:

راهکارهای دیجیتال و هوشمندسازی

معرفی

امروزه ابزارهای هوشمند مختلفی مبتنی بر تکنیک‌های پردازش گفتار در محصولات اپراتورهای هوشمند در حال راه‌اندازی و یا استفاده است. از آن‌جا که این ابزارها جهت تعامل کاربران و مشترکین اپراتورها با سیستم‌های هوشمند استفاده می‌شوند، وابستگی زیادی به شرایط ضبط گفتار کاربران دارند. در واقع با توجه به اینکه کاربران از میکروفون‌های مختلفی استفاده می‌کنند و یا در محیط‌های مختلفی ضبط گفتاری را انجام می‌دهند تنوع شرایط آکوستیکی مختلفی را دارند و این تفاوت کیفیت می‌تواند تاثیر منفی روی پاسخ‌های سرویس‌های خودکار محصولات مبتنی بر هوش‌مصنوعی و پردازش گفتار داشته باشد. در واقع این پروژه به منظور رفع مشکلات موجود در صوت‌های ورودی ضبط شده توسط منابع مختلف که غالبا با کاهش کیفیت و یا SNR های پایین ضبط شده‌اند تعریف شده است.

هدف

این پروژه در محصولات موتور جستجوی ذره‌بین (تبدیل گفتار به متن، دستیار ذره‌بین) و همچنین محصول خودنویس همراه (سامانه تبدیل گفتار به متن و استخراج تحلیل های متنی مختلف نظیر تولید خلاصه متون، تولید ابر کلمات پرکاربرد و سایر سرویس‌های متنی) و کلیه محصولاتی که در آینده روی گفتار تعریف شوند مورد استفاده است. این پروژه به منظور بهبود پاسخ سرویس گفتار به متن نسبت به نویزهای محیطی و همچنین تقطیع گفتارهای بلند با حجم پردازش پایین تعریف شده تا بتواند بهبود خوبی روی محصول ذره‌بین و همچنین خودنویس داشته باشد.

ضرورت

دستاوردها

سرویس تشخیص فعالیت صوتی و بهبود گفتار ورودی

سرویس تشخیص فعالیت صوتی و بهبود گفتار ورودی

1402

9 ماه

مجری

<img loading="lazy" width="24" height="24" src="https://hamrahrd.ir/wp-content/uploads/2024/12/profile-2user.svg" class="attachment-full size-full" alt="" />معاونت متولی:

راهکارهای دیجیتال و هوشمندسازی

معرفی

هدف

ضرورت

دستاوردها

حوزه های قابل بهره برداری

معاونت متولی: