[RapidMiner] การกรองแถวที่ข้อมูลหายไป Filter Missing Values

1. ดาวน์โหลดข้อมูล customer-churn-data จาก tinyurl.com/CU-RapidMiner

2. สร้างโฟลเดอร์ MyProject ไว้ที่ Desktop

3. ไปที่ Create / Connect to Repository > Create new local repository

4. ตั้งชื่อ MyProject ติ๊ก Use default location ออก เลือกโฟลเดอร์ MyProject จะได้ Repository มาปรากฏแถบข้างๆ

5. สร้างโฟลเดอร์ย่อยชื่อ DataPrep

6. คลิก Import Data > เลือก My Computer > เลือก ไฟล์ customer-churn-data > Next


7. แสดงข้อมูลในไฟล์

8. แมพข้อมูลกับชนิดข้อมูล สามารถเปลี่ยนชนิดข้อมูลได้ที่ Change Type

9. เลือกเก็บที่ DataPrep > Finish จะได้รูป สามารถดูจำนวนแถวและคอลัมน์ได้ข้างล่าง

10. แถบ Statistics แสดงค่าสถิติต่าง ๆ

11. ไปที่แถบ Design 

12. ลากไฟล์ customer-churn-data ลงพื้นที่

13. ใน opertors เสิร์จหาคำว่า filter example แล้วลากลงพื้นที่

14. ลากเชื่อมเส้น


15. คลิกที่โหนด Filter Example แล้วคลิกปุ่ม Add Filters

16. เลือก Churn และ is not missing เพื่อกรองเอาเฉพาะแถวที่มีข้อมูลครบ (ไม่ขาดข้อมูล) มา


17. Save ชื่อ DataPrep


18. กด Run จะสังเกตว่าข้อมูลที่ Missing value 96 แถว ได้หายไปแล้ว




Previous
Next Post »