- Tham gia phân tích, thiết kế, phát triển các ứng dụng theo yêu cầu của công ty;
- Phối hợp hỗ trợ với các bộ phận khác để triển khai hệ thống cho khách hàng;
- Nghiên cứu và phát triển các thuật toán Xử lý tiếng nói: xoá/lọc nhiễu, nhận dạng tiếng nói, tổng hợp tiếng nói, nhận diện người nói, tách giọng (Speaker Diarization)
- Xây dựng mô hình âm học (acoustic model), mô hình ngôn ngữ (language model), decoder, tối ưu hoá từ điển, ...
- Nghiên cứu và phát triển các mô hình Nhận dạng tiếng nói dựa trên neural networks
- Nghiên cứu và xây dựng các bộ cơ sở dữ liệu huấn luyện từ vựng lớn đảm bảo độ phủ về chất giọng vùng miền, độ tuổi, giới tính, môi trường, ... phù hợp với từng bài toán cụ thể.
- Nghiên cứu và phát triển các mô hình học máy cho Tổng hợp tiếng nói, voice clone, voice converter... dựa trên các mô hình như FastSpeech2, F5-TTS, ...
- Báo cáo công việc định kỳ cho trưởng nhóm;
- Công việc sẽ được trao đổi cụ thể hơn trong quá trình phỏng vấn.






