این پروژه از دو بخش تشکیل شده است. در بخش اول مدلی برای تبدیل متن به ویس به کمک مجموعهداده فارسی توسعه داده شود و در بخش دوم، مدلی برای تبدیل ویس به صدای گویندهای دیگر.
دادههای آموزشی مدل اول میتواند هر مجموعه داده در دسترس و یا تولید شده توسط شما باشد، اما مجموعه داده مدل دوم طبق نیاز پروژه به شما تحویل داده خواهد شد و یا نام یک فرد سلبریتی به شما داده خواهد شد. برای هر دو مدل میتوانید از هر مدل اوپنسورسی افلاینی استفاده کنید و محدودیتی از این جهت نداریم.
در انتها به یک رابط کاربری ساده آفلاین که متن را گرفته و صدای خروجی را تولید و اکسپورت کند نیاز داریم.
کیفیت خروجی هر دو مدل باید حداقل MOSNet=4 باشد.
همچنین مستندسازی مراحل انجام، نوشتن ۳ گزارش پیشرفت و برگذاری حداقل یک جلسه ضبط شده آموزشی ویدئویی جهت هماهنگی در انتهای کار نیاز است.
تمامی دادهها، کدها و مستندات باید در انتهای پروژه تحویل داده شود.



