سلام، ما ۷۰ فایل اکسل در اختیار داریم که نیاز به پردازش و آمادهسازی دارند. دادههای این فایلها از وبسایت استخراج شدهاند و لازم است عملیات دیتا کلینینگ (پاکسازی دادهها) روی آنها انجام شود و در نهایت، فایلها با فرمت مشخصشده(ترتیب ستون ها) در اکسل بهصورت مجدد تحویل داده شوند.
محتوای این فایلها مربوط به اطلاعات اساتید دانشگاههاست. همچنین، یک لیست جداگانه از رشتههای تحصیلی در اختیار شما قرار میگیرد که با توجه به اطلاعات هر استاد (مانند دپارتمان و سایر مشخصات استادها مثل علایق)، باید رشتهی مرتبط در یک ستون جداگانه به فایلها اضافه شود.
تعداد ردیفهای فایلها متفاوت است؛ برخی فایلها کمتر از ۵۰ ردیف دارند و برخی بیش از ۱۰ هزار ردیف. البته تعداد فایلهایی که حجم زیادی دارند، بسیار کم است.
برای درک بهتر میزان کار، یک نمونه فایل که نیاز به پاکسازی گسترده دارد ضمیمه شده. برای مثال، لازم است تگهای HTML حذف شوند و سپس رشتهی تحصیلی هر استاد بر اساس دپارتمانش از لیست مرجع اضافه شود.
در بخشی از فایلها نیازی به پاکسازی نیست و فقط باید رشتهها به آنها افزوده و ستونها طبق فرمت موردنظر جابهجا شوند.




