Khai thác dữ liệu và ứng dụng - Lab 01: Preprocessing
Đồ án cài đặt các hàm tiền xử lý viết bởi python. Các hàm đó bao gồm:
- Liệt kê các cột bị thiếu dữ liệu.
- Đếm số dòng bị thiếu dữ liệu.
- Điền giá trị bị thiếu bằng phương pháp mean, median và mode.
- Xóa dòng bị thiếu dữ liệu với ngưỡng tỉ lệ cho trước.
- Xóa cột bị thiếu dữ liệu với ngưỡng tỉ lệ cho trước.
- Xóa các mẫu bị trùng lặp.
- Chuẩn hóa bằng phương pháp min-max và Z-score.
- Tính giá trị biểu thức thuộc tính.
Điểm được chấm cho môn học: 10 / 10.