• Tìm hiểu bài toán (Business Understanding): Phối hợp với đơn vị nghiệp vụ lên đề xuất giải pháp cho bài toán phân tích.
• Tìm hiểu dữ liệu (Data Understanding): Tìm hiểu ý nghĩa các trường dữ liệu hiện có để đưa làm đầu vào của bài toán; Thu thập, tổng hợp thêm các thuộc tính đặc trưng phục vụ cho đầu vào bài toán.
• Làm sạch dữ liệu (Data Cleaning): Loại bỏ phần tử ngoại lai, thêm các giá trị bị thiếu, sửa các giá trị bị sai trong dữ liệu, dữ liệu không đúng format (Date, String, Number)…
• Tích hợp dữ liệu (Data Integration): thực hiện mapping chi tiết tích hợp dữ liệu về hệ thống phân tích dữ liệu.
• Biến đổi dữ liệu (Data Transformation): Tổng hợp và biến đổi dữ liệu để đưa ra các thuộc tính mới (phụ thuộc vào bước tìm hiểu dữ liệu ở trên).
• Phân tích mô tả (Descriptive Analysis) & trực quan hóa dữ liệu phân tích
Các công việc tương tự