- در مرحلهی بعد تعدادی سوال ساختار یافته(Structred) و تعدادی سوال بدون ساختار(Unstructred) (حداقل ۶ سوال)در مورد این دیتاست یا به صورت کلی توسط شما طراحی میشود که قرار است با داده کاوی این مجموعه به آنها پاسخ دهیم. سپس دوباره در این مرحله این سوالات توسط ما ارزیابی خواهد شد.
- در این مرحله داده ها انتخاب خواهند شد و انباره مرکزی داده ساخته خواهد شد.
- در این مرحله پیش پردازش بر روی داده ها صورت خواهد گرفت که به ترتیب زیر است(ممکن است بنا به دیتاست انتخابی و سوالات مطرح شده برخی مراحل لازم نباشد و اختیاری باشد):
پاک سازی داده، انتخاب زیرمجموعه فیچرها، فیلترینگ نمونهها، نمونه برداری، تبدیل داده، گسسته سازی، کاهش ابعاد، انبوهش دادهها، خلق ویژگی.
- مرحله یادگیری مدل با استفاده از یکی از الگوریتم های مناسب یادگیری و ساخت مدل(انواع الگوریتم های دسته بندی یا خوشه بندی یا کشف قوانین انجمنی) در داده کاوی که مناسب کار ما و دیتاست باشد.
- مرحله ارزیابی و تفسیر مدل و پاسخ به سوالات مطرح شده در ابتدا (انتخاب یک روش مناسب و استاندارد برای ارزیابی مدل و تفسیر و بررسی آن و تولید نمودارهای مختلف و...)
کلیه مراحل انجام باید در گزارش پایانیی (حداقل ۱۵ صفحه) نوشته شود، و همینطور مواردی مثل چرایی انتخاب الگوریتم استفاده شده برای مرحله یادگیری و توضیح نحوه ارزیابی مدل و اینکه چرا این روش را برای ارزیابی انتخاب کردیم و همینطور روش انجام کار و مواردی از این قبیل.
نکته قابل توجه اینکه کلیه کارها باید توسط Rapid Miner انجام شود.
استفاده از پروژههای آماده و متنباز موجود در سطح اینترنت مورد قبول نیست.
nevisandehponisha, بهمن 1397