🔍 Kiểm Tra Data Quality Với SQL
Hôm nay mình chia sẻ một tip cực useful để check data quality khi JOIN bảng:
Tình Huống Thực Tế:
• Có Table A (main table)
• Cần JOIN với Table B để lấy thêm info
• Dùng LEFT JOIN để không bị miss data
Vấn Đề Gặp Phải:
Làm sao biết được sau khi JOIN:
- Có bao nhiêu % giá trị NULL?
- JOIN có bị lỗi không?
- Data quality có ổn không?
🛠 Giải Pháp Siêu Easy:
1️⃣ Dùng combo SUM() + CASE WHEN
2️⃣ Count số lượng NULL vs non-NULL
3️⃣ Tính % để biết mức độ "healthy" của data