این پروژه از دو بخش تشکیل شده است. در بخش اول مدلی برای تبدیل متن به ویس به کمک مجموعهداده فارسی توسعه داده شود و در بخش دوم، مدلی برای تبدیل ویس به صدای گویندهای دیگر.
دادههای آموزشی مدل اول میتواند هر مجموعه داده در دسترس و یا تولید شده توسط شما باشد، اما مجموعه داده مدل دوم طبق نیاز پروژه به شما تحویل داده خواهد شد.
برای هر دو مدل میتوانید از هر مدل اوپنسورسی افلاینی استفاده کنید و محدودیتی از این جهت نداریم.
در انتها به یک رابط کاربری ساده آفلاین که متن را گرفته و صدای خروجی را تولید و اکسپورت کند نیاز داریم.
کیفیت خروجی نهایی باید در حدود MOSNet=4 باشد.
همچنین مستندسازی مراحل انجام و برگذاری حداقل یک جلسه ضبط شده آموزشی ویدئویی جهت هماهنگی در انتهای کار نیاز است.
جهت انجام پروژه لطفا با پشتیبانی تلگرام در تماس باشید:
ای دی تلگرام: omid_ahmadyani@
