یک پروژه‌ی سبک ولی با اولویت کیفیت و هندل کردن استثناها به زبان روبی (Ruby)
– آیتم‌ها بصورت خلاصه لیست شده اند (حدود ۲۰ آیتم در صفحه)، با درخواست ثانویه باید صفحه‌ی هر آیتم که اطلاعات کامل را شامل می‌شود کرال شود. درخواست‌های ثانویه باید بطور موازی و کارا انجام شوند تا زمان اجرا اسکریپت زیاد نشود.
– جدیدترین آیتم ها باید کرال شوند و یک صفحه‌ی اول کافی است (هندل کردن صفحه‌ی‌های بعدی بطور دلبخواه)
– انتخاب یک شهر دلخواه برای کرال کردن
– همه‌ی اطلاعات مربوط به یک آیتم باید استخراج شود. مثلا لیست عکس‌ها، تاریخ درج، آی‌دی و هرچی وجود داره. اطلاعات باید تا حد امکان بصورت ریز parse بشن؛ یعنی رشته‌ی بلندی که چندین اطلاعات داخلش هست نیز باید تفکیک شود
– خطاها، timeout ها و سایر سناریوهایی را که ممکن است هنگام کرال در وب به وجود باید هندل کنید و فرآیند بطور ناقص انجام نشود
– با توجه به شمای (schema) دیتا، یک کلاس تعریف کرده و نهایتا یک مجموعه (آرایه) از اون instance های کلاس رو بعنوان خروجی می‌دهید.
– سایت مورد نظر انگلیسی یا فارسی نیست. و اطلاعات باید به همان صورت parse‌ شوند ولی فیلد های کلاس مربوطه باید به انگلیسی باشند (برای طراحی راحت‌تر schema از مترجم آنلاین استفاده کنید)
– استفاده از لاگر در بین کد با پیام معنادار جهت نمایش روند اجرا

سوال متداول:
– چرا خودت یا با استفاده از gpt نمی نویسی؟
جواب: نیاز هست که با دقت و تمیز پیاده بشه و آیتم‌های مختلف رو بررسی کنین حتی در روز مختلف تا استثنا ها رو پیدا و هندل کنین

– من با روبی کار نکردم، سخته انجام دادنش؟
جواب: این زبان شبیه به پایتون هست. بعلاوه می‌توانین از gpt و اینترنت هم استفاده کنین تا اطمینان حاصل کنین. پکیج هایی که احتمالا استفاده می‌کنید: nokogiri, httparty, logging

جهت انجام پروژه لطفا با پشتیبانی تلگرام در تماس باشید:
ای دی تلگرام: omid_ahmadyani@

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *