Mạng xã hội Youtube công bố đạt 1 tỷ video có phụ đề phục vụ cho người khiếm thính. Con số thực sự ấn tượng, nhưng trên thực tế, tính năng tự động tạo chú thích không phải hoàn toàn chính xác.
Gã khổng lồ Google cho phép người dùng thêm phụ đề vào video từ năm 2006 và ba năm sau giới thiệu công cụ tự động nhận diện giọng nói để tạo chú thích trên Youtube. Giờ đây, mỗi ngày có tới 15 lượt xem video sử dụng tính năng này.
Tuy nhiên, hệ thống lại rất dễ gặp lỗi. Ví dụ đoạn trailer của bộ phim “Manchester by the Sea” được đề cử giải Oscar chứa rất nhiều lỗi phiên dịch khiến câu chuyện trở nênngây ngô và hài hước, thậm chí gây bực mình.
Ví dụ như đoạn hội thoại “My heart was broken. I know yours is broken, too.” (tạm dịch: “Trái tim tôi tan vỡ. Và tôi biết anh cũng như vậy”) thì công cụ của Youtube lại ghi là: “My heart was broken nose is broken too,” (tạm dịch: “Trái tim tôi tan vỡ, chiếc mũi cũng gãy luôn”).
Youtube thừa nhận về hạn chế của trình chú thích tự động. “Mục tiêu chính của nhóm là ngày càng cải thiện khả năng tạo phụ đề tự động. Nhưng công việc vốn không hề dễ dàng cho một nền tảng đồ sộ và nội dung đa dạng như Youtube”, Giám đốc sản phẩm Liat Kaver của Youtube đăng trên blog hôm thứ Năm.
Kể từ khi giới thiệu nút auto-CC năm 2009, Youtube tuyên bố đã tăng độ chính xác tạo phụ đề cho video tiếng Anh lên 50% nhờ cải thiện khả năng nhận diện giọng nói và thuật toán học sâu. Kaver kêu gọi người xem tham gia chỉnh sửa phụ đề để các bản tự động trở nên chính xác hơn.
Youtube tạo chú thích cho toàn bộ video sử dụng ngôn ngữ thuộc 10 nhóm gồm tiếng Anh, Hà Lan, Pháp, Đức, Ý, Nhật Bản, Hàn Quốc, Bồ Đào Nha, Nga và Tây Ban Nha. Người dùng được phép từ chọn không dùng tính năng này, đồng thời có thể tham gia cải thiện phần phụ đề.
Nguồn: Genk.vn