1. Nền tảng dữ liệu (40% vai trò)
- Thu thập dữ liệu & pipeline
a. Thiết kế và triển khai data pipeline để thu thập dữ liệu từ ERP, hệ thống xưởng sản xuất và các nguồn khác tùy theo mục tiêu dự án (ví dụ: tiến hành nghiên cứu thời gian-thao tác để thu thập thời gian xử lý chính xác cho từng công đoạn)
b. Làm việc với đội ngũ xưởng sản xuất & đội ERP để thiết lập quy trình thu thập dữ liệu chuẩn
c. Thiết lập quy trình trích xuất, chuyển đổi và nạp dữ liệu (ETL) tự động
d. Đảm bảo chất lượng dữ liệu thông qua các quy tắc kiểm định và phát hiện bất thường
- Phân tích dữ liệu & insight
a. Phân tích dữ liệu sản xuất lịch sử để xác định điểm nghẽn, xu hướng và cơ hội cải thiện
b. Thực hiện phân tích thống kê về hiệu suất sử dụng máy, thời gian chu kỳ và hiệu suất giao hàng
c. Tạo dashboard KPI cho quản lý sản xuất (OEE, giao hàng đúng hạn, năng suất)
- Chất lượng & quản trị dữ liệu
a. Định nghĩa các chỉ số chất lượng dữ liệu và giám sát liên tục tình trạng dữ liệu
b. Xác định và giải quyết sự không nhất quán dữ liệu giữa các hệ thống (ERP so với xưởng sản xuất thực tế)
c. Viết tài liệu cho từ điển dữ liệu, lược đồ và nguồn gốc dữ liệu
d. Đảm bảo biên độ biến thiên của các mẫu dữ liệu <10% (điểm mấu chốt cho các Giai đoạn sau)
- Chuẩn bị dữ liệu cho đào tạo thuật toán, AI/ML
a. Làm sạch, gán nhãn và cấu trúc hóa tập dữ liệu cho việc huấn luyện thuật toán và model ML
b. Thu thập và gán nhãn hình ảnh thiết kế sản phẩm cho model CNN phân loại
c. Xây dựng pipelines đặc điểm kỹ thuật cho model ANN dự báo thời gian sản xuất
d. Tạo & phân chia tập dữ liệu training/validation/test với ngữ cảnh sản xuất phù hợp
2. Phát triển thuật toán & mô hình (40% vai trò)
- Giai đoạn 2: Tối ưu hóa & dự đoán
a. Thiết kế và triển khai các thuật toán tối ưu hóa kế hoạch sản xuất (GA, NSGA-II hoặc metaheuristic tương tự)
b. Phát triển mô hình CNN+ANN để dự đoán thời gian sản xuất từ hình ảnh thiết kế sản phẩm
c. Hợp tác với tư vấn viên Kỹ sư Công nghiệp để xác định các ràng buộc và xác minh độ tin cậy của thuật toán
d. Tích hợp thuật toán với các hệ thống ERP/MES hiện có thông qua API
e. Kiểm định kết quả mô hình so với dữ liệu sản xuất thực tế
- Giai đoạn 3: Reinforcement learning
a. Thiết kế và phát triển các agent Deep Reinforcement Learning (DRL) cho lập kế hoạch sản xuất theo thời gian thực
b. Xây dựng môi trường mô phỏng (digital twin) để huấn luyện agent
c. Định nghĩa và tinh chỉnh hàm reward phù hợp với KPI sản xuất
d. Triển khai agent RL & tích hợp với MES để ra quyết định trực tiếp
3. Phối hợp & cộng tác (20% vai trò)
- Chuyển đổi các phát hiện từ phân tích chuyên sâu thành khuyến nghị hành động cho ban lãnh đạo
- Làm việc chặt chẽ với giám sát xưởng sản xuất để hiểu các ràng buộc sản xuất thực tế
- Hợp tác với đội IT để tích hợp hệ thống và triển khai
- Trình bày cập nhật tiến độ và báo cáo hiệu suất mô hình định kỳ
- Viết tài liệu cho model, thuật toán, data pipelines và kiến trúc hệ thống
4. Chịu trách nhiệm thưc hiện các công việc tương tự khác tùy theo mục tiêu cụ thể của dự án ở từng giai đoạn.

