Cái nhìn cận cảnh về cách sử dụng trí tuệ nhân tạo và Machine Learning của Apple.
Vào ngày 30/07/2014, Siri đã thực hiện thành công 1 ca ghép não.
Ba năm trước đó, Apple từng là công ty công nghệ lớn đầu tiên tích hợp trợ lý thông minh vào hệ điều hành của mình. Siri từng là biến thể của 1 ứng dụng standalone mà Apple mua lại vào năm 2010. Các reviews ban đầu khiến nhiều người sững sờ ngạc nhiên, nhưng trong vài năm, vài tháng sau, users có thể dần dần mất kiên nhẫn vì Siri thường xuyên dịch sai các dòng lệnh.
Chính vì vậy, cuối tháng 7/2014, Apple đã chuyển tính năng nhận diện giọng nói của Siri vào hệ thống mạng neural dành cho các users Mỹ (ra mắt toàn cầu vào 15/08/2014). Một số kỹ thuật vẫn còn hoạt động nhưng hiện nay, hệ thống Siri chủ yếu tận dụng các công nghệ Machine Learning, gồm các mạng neural sâu (Deep Neural Networks – DNN), mạng neural tích chập (convolutional neural networks), các long short-term memory units (LSTM), các gated recurrent units (GRU) và n-grams. Khi người dùng cập nhật, giao diện của Siri vẫn không đổi nhưng nó sẽ được supercharged (siêu tăng áp) bằng deep learning.
Những tiến bộ này có thể ảnh hưởng đến chiến lược cạnh tranh nên Apple không hề công bố rộng rãi toàn bộ quy trình phát triển. Nếu users để ý sẽ thấy Siri ngày càng phạm ít lỗi hơn và với Apple, đây là kết quả rất đáng kinh ngạc.
Eddy Cue – Phó Chủ tịch cấp cao mảng Internet Software và Services
Câu chuyện về sự chuyển đổi của Siri được tiết lộ lần đầu tiên trong bài viết này có thể khiến giới công nghệ đang nghiên cứu trí thông minh nhân tạo phải suy ngẫm. Apple đã âm thầm “tôi luyện” công nghệ này, và mãi cho đến gần đây, khi Apple tuyển dụng những nhân vật trong lĩnh vực AI và thực hiện vài cuộc xác nhập cấp cao thì các chuyên gia lại cho rằng Apple đã tiến hành bước đi chậm trong cuộc chiến nóng bỏng sở hữu công cụ AI mạnh mẽ nhất.
“Tại Google, Facebook, Microsoft, bạn sở hữu những con người xuất chúng về Machine Learning” – Oren Etzioni của Học viện Allen về AI cho biết – “Đúng, Apple thực sự đã thuê vài chuyên gia nhưng 5 leaders về Machine Learning đang làm việc cho Apple là ai? Apple có nhận diện giọng nói nhưng chúng ta lại không biết rõ liệu (machine learning) còn hỗ trợ Apple phần nào nữa không. Hãy chỉ cho tôi biết phần nào trong sản phẩm của bạn đang tận dụng Machine Learning tốt nhất”
Đầu tháng nay (8/2016), tôi đã dành 1 ngày tại phòng họp của One Infinite Loop tại trụ sở Cupertino để tìm hiểu các hoạt động AI và Machine Learning của Apple với các chuyên gia hàng đầu (Eddy Cue, Phil Schiller – Phó chủ tịch cấp cao Marketing toàn cầu và Craig Federighi – Phó chủ tịch Software Engineering) cùng 2 nhà khoa học Siri khác. Họ đã gửi cho tôi 1 tài liệu dài 2 trang liệt kê các sản phẩm và dịch vụ của Apple đang sử dụng Machine Learning.
Thông điệp ở đây là: Chúng tôi đã tham gia vào cuộc chơi rồi. Chúng tôi sẽ thực hiện theo cách của riêng mình.
Nếu bạn là người dùng iPhone, bạn chắc chắn đã tiếp cận với AI của Apple, từ sự nhạy bén của Siri khi nhận diện được những gì bạn hỏi “cô ấy”, đến việc iPhone có thể xác định người gọi dù người đó không nằm trong danh bạ của bạn (nhưng đã email cho bạn gần đây). Đó còn là khi quét màn hình để lấy danh sách app tinh gọn mà nhiều khả năng bạn sẽ mở tiếp theo hay nó nhắc bạn giờ họp mà bạn chưa từng bỏ vào lịch của mình. Đó là khi bản đồ địa điểm hiện lên, dẫn bạn đến khách sạn đã đặt trước, trước cả lúc bạn gõ chữ tìm địa điểm hay iPhone sẽ chỉ rõ nơi đỗ xe dù bạn không hỏi nó câu nào. Đây là tất cả những kĩ thuật đã được hoặc sẽ được Apple áp dụng từ deep learning và neural nets.
Đúng, có 1 thứ gọi là “Apple brain” trong iPhone.
Theo các chuyên gia của Apple, Machine Learning hiện đã được áp dụng vào tất cả các sản phẩm và dịch vụ của “nhà táo”. Apple sử dụng deep learning để phát hiện những hành vi lừa đảo trên Apple store, mở rộng vòng đời pin giữa những lần sạc trên tất cả các thiết bị, khám phá những góp ý hữu ích nhất đến từ hàng ngàn reports của beta testers. Machine Learning còn giúp Apple chọn những câu chuyện dành cho bạn, xác định liệu người dùng Apple Watch có đang luyện tập thể thao hay chỉ đang đi dạo. Đặc biệt, Machine learning còn nhận diện khuôn mặt và địa điểm trong ảnh chụp, xác định có nên tắt tín hiệu Wi-Fi yêu để chuyển sang mạng di động hay không, giúp bạn biết được như thế nào là 1 đoạn film hay, từ đó Apple có thể nhanh chóng compile các snapshots và videos của bạn thành 1 movie mini chỉ bằng 1 lần chạm button. Các đối thủ của Apple cũng làm những thứ tương tự nhưng theo các chuyên gia “nhà táo” thì không có nhà cung cấp AI nào vừa đáp ứng được những điều trên vừa giữ được tính bảo mật bằng Apple. Dĩ nhiên, là không ai tạo những sản phẩm như của Apple.
AI không phải là điều gì mới mẻ với Apple: ngay đầu những năm 1990s, Apple đã sử dụng vài kĩ thuật Machine Learning trong các sản phẩm nhận diện chữ viết (Newton?). Những dấu tích còn lại chính là tính năng chuyển đổi kí tự Trung Quốc thành text hoặc nhận diện input từng chữ một đến từ người dùng Apple Watch khi họ viết nguệch ngoạc 1 thông điệp nào đó lên màn hình điện thoại (cả 2 tính năng này đều được sản xuất bởi cùng 1 đội ngũ các kĩ sư về Machine Learning). Dĩ nhiên, thời gian đầu, Machine Learning chỉ dừng ở mức sơ khai và Deep Learning cũng chưa tạo được tiếng vang lớn. Ngày nay, các kĩ thuật AI đang trở thành xu hướng và Apple sẽ rất bực mình nếu ai đó cho rằng khả năng learning của họ kém. Trong bài phát biểu gần đây, Apple cũng đề cập rằng đang nghiên cứu AI & các top leaders đang dần dần xây dựng nó.
“Trong 5 năm qua, chúng tôi đã nghiên cứu rất kĩ về AI” – Phil Schiller chia sẻ – “Các thiết bị của chúng tôi đang dần trở nên thông minh hơn với tốc độ nhanh hơn, đặc biệt là chip A-series mà Apple tự thiết kế. Backends cũng thông minh hơn, nhanh hơn trước và mọi thứ chúng tôi làm đều có lý do nào đó để kết nối với nhau. Cách thức này cũng đòi hỏi ngày càng nhiều các kĩ thuật của Machine Learning vì có rất nhiều thứ để học (learning)..”
Dù Apple đang bear-hug (1 cách ra giá nhằm mục đích để “mua” cho bằng được 1 công ty, 1 cổ đông hay 1 nhóm cổ đông, để giành quyền kiểm soát công ty hay giành lợi thế chủ động thuộc về mình) công nghệ Machine Learning nhưng các chuyên gia lại cho rằng đây là 1 trường hợp khá bình thường trong kinh doanh. Ông lớn của Cupertino xem Deep Learning và Machine Learning là công nghệ mới nhất trong dòng chảy đều đặn các công nghệ đột phá. Đúng vậy, nó có khả năng chuyển đổi nhưng cũng không có gì hơn những công nghệ khác như màn hình cảm ứng, flat panels hay ngôn ngữ lập trình hướng đối tượng. Trong quan điểm của Apple, dù các công ty khác có nói gì đi nữa thì Machine Learning không phải chiến tuyến cuối cùng. “Trong những năm qua, đã có nhiều công nghệ khác thay đổi cách chúng ta tương tác với các thiết bị” – Cue đề cập. Và không 1 ai ở Apple muốn đề cập đến những suy đoán “ghê rợn”/ đáng sợ luôn xuất hiện trong những cuộc đàm luận về AI. Như bạn thấy, Apple đã không nói rõ liệu họ có đang phát triển dòng xe tự lái hay phiên bản Netflix của riêng mình hay không. Nhưng đội ngũ tại Apple lại nêu rõ quan điểm rằng Apple không hề nghiên cứu Skynet.
“Chúng tôi sử dụng các công nghệ này để thực hiện những điều mà chúng tôi luôn muốn làm, chứ không phải là những điều phải chúng tôi phải làm” – Schiller đề cập – “Và cả những thứ mới mà chúng tôi chưa thể làm được. Đó sẽ là công nghệ mang đậm phong cách Apple vì nó phát triển bên trong Apple và ảnh hưởng đến cách thức chúng tôi tạo ra các sản phẩm”
Có thể nói, AI đã hình thành nên toàn bộ trải nghiệm sử dụng hệ sinh thái Apple. Quan điểm hình thành AI chính là Apple đang bị hạn chế về công cụ tìm kiếm (công cụ có thể chuyển dữ liệu hỗ trợ huấn luyện các neural networks) và sự kiên trì nhưng thiếu linh hoạt trong vấn đề bảo mật thông tin người dùng. Nhưng hóa ra Apple đã tìm ra được cách để vượt qua cả 2 thử thách này.
Liệu “bộ não” này, dynamic cache này lớn thế nào mà có thể kích hoạt Machine Learning trên iPhone? Khi tôi đề cập vấn đề này với Apple, họ đã nói rằng: khoảng 200 megabytes, tùy thuộc lượng thông tin cá nhận được lưu trữ là bao nhiêu. Các thông tin cá nhân này bao gồm lưu lượng sử dụng app, các tương tác với người khác, xử lý liên quan đến neural net, speech modeler và “natural language event modeling.” . Bên cạnh đó còn có dữ liệu sử dụng trong neural nets để thực hiện các tính năng nhận diện đối tượng, nhận diện khuôn mặt và phân loại khung cảnh (scene classification).
Và theo Apple thì mọi thứ đã được tiến hành xong xuôi.
Dù Apple chưa từng giải thích tất cả những nỗ lực của công ty với AI, nhưng tôi vẫn hiểu được cách công ty phân phối các chuyên gia Machine Learning xuyên suốt tổ chức của mình. Product team được khuyến khích ứng dụng Machine Learning vào việc giải quyết các vấn đề và phát minh ra những tính năng mới trong những sản phẩm cá nhân. “Chúng tôi không phải là đội ngũ tập trung nắm giữ vai trò Đền thờ của Machine Learning tại Apple” – Craig Federighi chia sẻ – “Chúng tôi cố gắng đưa Machine Learning đến gần các team bằng cách áp dụng nó vào trải nghiệm người dùng đúng”.
Có bao nhiêu người tại Apple đang làm việc với Machine Learning? “Rất nhiều” – Federughi nói. Điều thú vị chính là Machine Learning của Apple đang được phát triển bởi rất nhiều người chưa từng được huấn luyện trong lĩnh vực này trước khi gia nhập Apple. “Chúng tôi tuyển dụng những người có tài trong lĩnh vực toán học, thống kê, các ngôn ngữ lập trình, mã hóa. Kết cục là rất nhiều nhân tài đã chuyển đổi thành công các kiến thức trong những lĩnh vực đó sang Machine Learning. Tuy thời gian gần đây, chúng tôi cũng đã thuê nhiều nhân sự chuyên về Machine Learning nhưng chúng tôi vẫn tìm kiếm những cá nhân có tài năng và năng khiếu riêng phù hợp”.
Từ trái sang, Craig Federighi – Phó Chủ tích cấp cao về Software Engineering đang lắng nghe Alex Acero – Giám đốc cấp cao Siri – trình bày về phần mềm nhận diện giọng nói tại trụ sở của Apple.
Đây là cách tiếp cận cần thiết vì thiên hướng giữ bí mật khiến Apple ở 1 vị trí bất lợi so với các đối thủ cạnh tranh – những công ty khuyến khích các nhà khoa học máy tính của họ chia sẻ rộng rãi reseach với thế giới. “Chúng tôi thường nghiên về quy trình chọn lọc tự nhiên những cá nhận quan tâm đến việc làm nhóm để mang đến 1 sản phẩm tốt, hơn là những người lấy xuất bản (publishing) làm động lực chính” – Federighi nói. Nếu trong quá trình phát triển sản phẩm của Apple, các scientists vô tình tạo được bước đột phá trong ngành thì thực sự rất tuyệt vời. “Nhưng chúng tôi lại hướng đến tầm nhìn của kết quả cuối cùng hơn” – Eddy Cue chia sẻ.
Bên cạnh đó, một số cá nhân lại đến từ quá trình xác nhập của Apple. “Gần đây chúng tôi đã mua lại từ 20 đến 30 công ty trong 1 năm. Đây là những công ty khá nhỏ và thực sự cần thuê nguồn lực” – Eddy Cue nói. Khi Apple mua 1 công ty AI, đó không phải là câu chuyện “chúng ta đang sở hữu 1 nhóm các researchers Machine Learning, hãy phát triển đội ngũ đó”. Ngược lại, “chúng tôi tìm kiếm những người có tài về AI và phải thực sự tập trung vào truyền tải những kinh nghiệm hay ho”
Giao dịch gần đây nhất chính là Turi – 1 công ty tại Seattle được Apple tiếp nhận với mức giá 200 triệu USD. Turi đã xây dựng 1 toolkit Machine Learning, được sánh ngang với TensorFlow của Google. Chính vì vậy, giao dịch này lại thổi bùng lên đồn đoán rằng Apple sẽ sử dụng Turi với mục đích tương tự với cả nội bộ lẫn các lập trình viên. “Họ có rất nhiều điểm tương đồng với Apple về quan điểm công nghệ và quan điểm nhân sự” – Eddy Cue phát biểu. Trong 1 hoặc 2 năm tới, chúng ta sẽ biết được điều gì sẽ xảy ra như những gì Siri đã thể hiện với tiềm năng của Cue (không phải là Eddy Cue nhé!) – 1 startup mà Apple đã tiếp nhận vào năm 2013.
Dù nhân tài đến từ đâu, thì cấu trúc AI của Apple vẫn hỗ trợ ông lớn này phát triển các sản phẩm và tính năng chưa từng được thực hiện trước đây. Nó đồng thời cũng thay đổi lộ trình sản phẩm của Apple. “Tại Apple, không hề có giới hạn nào trong việc phát triển những ý tưởng mới” – Schiller đề cập – “Machine Learning cho phép chúng tôi thực hiện những điều mà chúng tôi từng từ chối trước đây. Machine Learning đang dần xâm nhập vào quy trình ra quyết định các sản phẩm tiếp theo của chúng tôi”
Một ví dụ phải kể đến chính là Apple Pencil đi kèm với iPad Pro. Để có thể tích hợp phiên bản bút stylus công nghệ cao, Apple phải giải quyết 1 thực tế là khi viết trên thiết bị, bàn tay con người luôn phải chà sát lên màn hình cảm ứng, ảnh hưởng xấu đến các yếu tố digital. Nhờ mô hình Machine Learning “palm rejection”, màn hình cảm ứng có thể phân biệt rõ ràng sự khác nhau giữa thao tác quét, chạm và input từ 1 chiếc bút. “Nếu tính năng này không hoạt động tốt thì iPad Pro sẽ không còn là mảnh giấy phù hợp để viết nữa – và Pencil cũng không phải là 1 sản phẩm tốt” – Federighi nói. Nếu bạn yêu Pencil của Apple thì hãy cảm ơn Machine Learning nhé.
Nguồn: Techtalk via Backchannel (còn tiếp)