Mô tả công việc
Vai trò này chịu trách nhiệm xây dựng và vận hành nền tảng dữ liệu phục vụ toàn bộ hoạt động kinh doanh.
Xây dựng và vận hành data platform
- Thiết kế và triển khai data pipeline từ nhiều nguồn (PostgreSQL, API, hệ thống nội bộ)
- Xây dựng quy trình ETL/ELT đảm bảo dữ liệu được xử lý ổn định
- Thiết kế kiến trúc dữ liệu theo các lớp (raw, clean, analytics)
Orchestration và tự động hóa
- Thiết lập và quản lý workflow (Airflow, Prefect hoặc tương đương)
- Tự động hóa pipeline, đảm bảo dữ liệu được cập nhật theo chu kỳ 5–10 phút cho dashboard
Data reliability và monitoring
- Xây dựng hệ thống giám sát pipeline (success, failure, retry)
- Kiểm soát chất lượng dữ liệu (trùng lặp, thiếu dữ liệu, sai lệch)
- Theo dõi độ trễ dữ liệu và thiết lập cảnh báo khi có sự cố
Tối ưu hệ thống
- Tối ưu truy vấn, index, partition cho hệ thống dữ liệu lớn
- Định hướng kiến trúc để đảm bảo khả năng mở rộng (scalability)
- Phân tách workload giữa hệ thống giao dịch và hệ thống phân tích
Hỗ trợ business
- Làm việc với Data Analyst và các team business để đảm bảo dữ liệu phục vụ đúng nhu cầu
- Góp phần cải thiện tốc độ ra quyết định và giảm thao tác thủ công




