سلام وقت بخیر
من کدهای مربوط به یادگیری تقویتی چندهدفه رو روی محیطهای بنچمارک چند هدفه مثل deep sea treasures Cartpole و… نیاز دارم با الگوریتمهای dqn چندهدفه، mpmoqlearning ,pareto qlearning و moppo یعنی ppo برای محیط چندهدفه(چندمعیاره) و یکبار هم کدها رو تعاملی میخوام یعنی مشورت با تصمیم گیرنده روش مخروطی و روش نیمباس و نتایج رو مقایسه کنم آیا کسی میتونه این کدها رو بنویسه و ترین و تستش رو انجام بده.
اگه کسی توانایی انجام این کار رو داره یا اگه کسی که میتونه کمک کنه رو می شناسید لطفا پیام بدید .
هزینه پیشنهادی رو هم لطفا بنویسید.
جهت انجام پروژه لطفا با پشتیبانی تلگرام در تماس باشید:
ای دی تلگرام: omid_ahmadyani@
