Chào bạn,

Đăng nhập xem việc làm phù hợp

Blog IT

Lý giải công nghệ đằng sau thuật toán phân tích hình ảnh của Apple và Google

Lý giải công nghệ đằng sau thuật toán phân tích hình ảnh của Apple và Google

 

Trong thời đại công nghệ phát triển tựa vũ bão, đặc biệt là công nghệ di động và điện toán đám mây, thật khó có thể theo kịp từng bước tiến của các công ty công nghệ khổng lồ. Một hiểu lầm rất phổ biến đó là dịch vụ lưu trữ đám mây của AppleGoogle - hai công ty “cha đẻ” của hai hệ điều hành di động lớn nhất hành tinh - xem và liệt kê hạng mục ảnh người dùng một cách thủ công sau đó tạo riêng thư mục cho từng hạng mục ảnh của bạn, tuy nhiên, thực sự hai nền tảng này hoạt động theo cách hoàn toàn khác, và hơn nữa, quá trình phân tích diễn ra hoàn toàn tự động hóa.

Các nền tảng đám mây này phân tích nội dung trong bức ảnh của người dùng bằng nhiều thuật toán nhận diện ảnh tinh vi - vốn cho phép dễ dàng nhận diện bất kỳ thứ gì từ thú cưng như chó mèo tới phương tiện đi lại như tàu, thuyền, ô tô, thậm chí là khuôn mặt và cả hành động.

Khi phát hiện ra trong bức hình có một chú chó, chẳng hạn, tag “dog” được gán vào metadata (phần dữ liệu nhỏ gắn chặt với một tệp tin nhất định) của bức ảnh - cùng với đó là nhiều thông số khác như độ phơi sáng, vị trí, v.v… Đây là một quy trình xử lý tầng thấp và hệ thống không hề biết trong bức ảnh có gì, chỉ riêng các bức ảnh và một vài thông số liên quan được gắn tag “dog”. Điều này đảm bảo nội dung ảnh người dùng hoàn toàn bí mật, thậm chí với cả bên cung cấp dịch vụ thứ nhất như Apple và Google, đồng thời vẫn cho phép người dùng tìm kiếm ảnh của mình nhờ đã được gắn tag.

Chỉ cần gõ từ khóa , thuật toán tìm kiếm sẽ cho ra những bức ảnh phù hợp với tiêu chí từ khóa

Quá trình phân tích này thường được triển khai trong một “hộp cát” (sandbox - một phân khu riêng biệt ngăn chặn thay đổi lên hệ thống cũng như tăng độ bảo mật), và rất hiếm khi hệ thống quyết định đưa dữ liệu ra ngoài hộp cát này. Một trong số những trường hợp hãn hữu đó là khi máy chủ - bằng nhiều thuật toán đặc biệt - phát hiện ra ảnh có nội dung vi phạm pháp luật như ấu dâm, sẽ cho phép đưa dữ liệu ra ngoài hộp cát và trình báo lên cơ quan pháp luật.

Trước đây, người dùng cần phải đăng tải ảnh lên Google Photos hoặc iCloud mới được phân tích dữ phân chia hạng mục ảnh. Tuy nhiên hiện nay, nhờ nhiều cải tiến vượt bậc trên thế giới về machine learning và sức mạnh vi xử lý, những thuật toán từng phải nhờ đến các máy chủ khổng lồ ngày xưa giờ đã có thể chạy ngay trên thiết bị di động. Giờ đây ảnh của bạn sẽ được gắn tag chứa đầy đủ thông tin về nội dung bức ảnh và vị trí ngay khi bạn chụp ảnh, không cần đăng tải lên dịch vụ lưu trữ đám mây.

Như đã nói ở trên, Apple và Google không trực tiếp xem ảnh của người dùng, mọi quá trình xử lý diễn ra tự động hoàn toàn. Tuy nhiên, việc phân tích và phân loại ảnh ngay trên thiết bị vẫn nhận được nhiều khen ngợi từ các chuyên gia bảo mật.

Hạn chế lớn nhất của những thuật toán phân loại này là chúng không thực sự linh hoạt. Bạn có thể lập trình cho một thuật toán nhận diện 500 vật dụng phổ biết nhất xuất hiện trong các bức ảnh. Đây là một quá trình mang tính tương đối rất cao, và thuật toán dù hiện đại vẫn nhiều khi không tránh khỏi sai lầm.

Dù đang đứng trong một căn phòng cách âm, nhưng thuật toán của Apple lại nhầm căn phòng này với...hộp các-tông

Thêm vào đó, việc các công ty công nghệ không  trực tiếp xem ảnh người dùng không hoàn toàn “miễn trách nhiệm” truy cứu của họ về riêng tư và bảo mật. Ví dụ, dịch vụ điện toán đám mây tập trung phân tích đồ vật hay hạng mục gì? Đồ vật hay hình ảnh nào bị bỏ qua? Liệu phần mềm nhận dạng có được lập trình tốt để phân biệt đủ mọi giới tính và màu da không? Liệu người dùng có thể tắt được tính năng phân tích hình ảnh nếu muốn và nếu không thì tại sao? Trên đây mới chỉ là một vài câu hỏi bề nổi mà các nhà nghiên cứu an ninh mạng thắc mắc. Còn nhiều vô cùng những đắn đo lo ngại về bảo mật và riêng tư người dùng trong thời đại công nghệ theo dõi bùng nổ, khi mà chỉ một nút bấm cũng có thể cho biết chính xác vị trí người cầm điện thoại, và việc đăng tải ảnh cá nhân lên một máy chủ mình hoàn toàn không có thông tin, dù có là của Apple hay Google, vẫn là một canh bạc lớn người dùng buộc phải đánh cược.

Công Minh (theo Tech Crunch)

Nguồn: Ictnews.vn

Bài viết tương tự

Bài viết nổi bật