Trong khi điểm số benchmark của siêu máy tính Trung Quốc không được đăng tải công khai để so sánh, họ lại dùng thủ thuật để đánh lừa một giải thưởng khác khiến mọi người nhầm tưởng rằng, nó có tốc độ nhanh gấp hàng triệu lần siêu máy tính của Mỹ.
Thời gian gần đây, Trung Quốc đang trở thành một cái tên mới nổi trong cộng đồng siêu máy tính, cả về phần cứng và phần mềm. Tính đến tháng 10 năm nay, có ít nhất 2 siêu máy tính Trung Quốc vượt qua giới hạn exascale - nhanh gấp nhiều lần các siêu máy tính mạnh nhất hiện nay.
Đặc biệt mới đây, các nhà nghiên cứu Trung Quốc đăng tải kết quả kiểm tra cho biết, một trong hai siêu máy tính nói trên, Sunway Oceanlite của Trung tâm Nghiên cứu Quốc gia về Công nghệ và Kỹ thuật Điện toán Song Song (NRCPC), đã giành được giải thưởng Gordol Bell, giải thưởng dành cho các hệ thống siêu máy tính với tốc độ nhanh gấp hàng triệu lần so với một siêu máy tính nổi tiếng khác của Mỹ, siêu máy tính Summit.
Cụ thể, để nhận được của Gordon Bell, một hệ thống phải mô phỏng được bản mạch Sycamore 53-qubit – kiến trúc máy tính lượng tử được Google giới thiệu vài năm trước. Siêu máy tính Sunway Oceanlite làm được điều này chỉ trong 304 giây. Trong khi đó, theo ước tính của nhóm nghiên cứu đến từ Phòng Thí nghiệm Quốc gia Oak Ridge (ORNL) của Mỹ, siêu máy tính của Mỹ có thể phải mất đến 10.000 năm mới thực hiện được phép mô phỏng này – chậm hơn hàng triệu lần so với đối thủ đến từ Trung Quốc.
Nhưng hóa ra, tốc độ nhanh hơn không có nghĩa là siêu máy tính của Trung Quốc thực sự mạnh hơn siêu máy tính của Mỹ, sự khác biệt nằm ở độ chính xác khi thực hiện phép tính đó.
Sự thật đằng sau tốc độ nhanh gấp hàng triệu lần đối thủ
Thay vì tốc độ xung nhịp như trên bộ xử lý thông thường, việc đo lường hiệu suất các siêu máy tính được tính bằng số phép tính dấu phẩy động với độ chính xác kép (64-bit) trên mỗi giây (hay FLOPS – viết tắt của floating-point operations per second), hay FP64 FLOPS, theo thước đo của điểm số benchmark LINPACK.
Nếu bộ xử lý có thể thực thi FLOPS với độ chính xác thấp hơn, thời gian tính toán sẽ được rút ngắn đáng kể, do vậy, tiêu chuẩn chung để đo lường hiệu năng siêu máy tính là chỉ số FP64 FLOPS đạt được trong bài benchmark LINPACK.
Đó chính là cách mà siêu máy tính Trung Quốc thực hiện được phép tính mô phỏng kia trong thời gian vô cùng ngắn so với đối thủ. Theo trang tin NextPlatforms, các kỹ sư Trung Quốc đã làm giảm độ chính xác của phép tính, từ độ chính xác kép (64-bit) xuống còn độ chính xác đơn (32-bit). Điều này giúp siêu máy tính Trung Quốc thực hiện phép tính trên với thời gian ngắn đến như vậy – điều tương tự như các thủ thuật đánh lừa khi benchmark máy tính PC.
Dmitry Liakh, một nhà phát triển từ ORNL, cho biết: "Trong công trình giành được chứng nhận từ Gordon Bell, các nhà nghiên cứu Trung Quốc giới thiệu một quy trình thiết kế có hệ thống, bao gồm thuật toán, khả năng tính toán song song và kiến trúc cần thiết cho việc mô phỏng … Hệ thống mô phỏng của họ đạt được hiệu năng 1,2 EFLOPS (mỗi EFLOPS bằng 1 tỷ tỷ phép tính dấu phẩy động mỗi giây) với độ chính xác đơn, hay 4,4 EFLOPS với độ chính xác hỗn hợp, sử dụng 41,9 triệu nhân Sunway."
Theo ước tính của Chương trình Thông tin Công nghệ Châu Á ATIP (Asian Technology Information Program), hiệu năng ổn định của siêu máy tính Sunway Oceanlite ở khoảng 1050 PFLOPS (1,05 EFLOPS). Với mức hiệu năng này, Sunway Oceanlite đang là hệ thống siêu máy tính mạnh thứ hai Trung Quốc, xếp sau siêu máy tính Tianhe-3, đặt tại Trung tâm Siêu máy tính Quốc gia ở Quảng Châu, Trung Quốc. Theo ước tính của ATIP, hiệu năng ổn định của Tianhe-3 nằm ở mức 1300 PFLOPS (1,3 EFLOPS).
Mức điểm số của 2 siêu máy tính này đều cao hơn nhiều so với siêu máy tính Summit của Mỹ khi chỉ đạt 200 PFLOPS khi benchmark theo LINPACK. Tuy nhiên điều đáng chú ý là các siêu máy tính mới này của Trung Quốc không hề đăng tải điểm số benchmark của mình lên các trang chuyên dụng như Top500.org, mà lại đăng tải kết quả của Gordon Bell – nơi họ làm thủ thuật để có thành tích cao hơn.
Tham vọng của siêu máy tính Trung Quốc
Trong khi đánh lừa khả năng mô phỏng Sycamore là điều đáng trách, nhưng nó cũng cho thấy hệ thống Sunway Oceanlite có khả năng thực hiện đến 1,2 EFLOPS FP32 trong thuật toán cụ thể này. Điều này lại đặt ra một câu hỏi khác về hiệu năng của nó: Tại sao một hệ thống siêu máy tính được cho đạt điểm chuẩn 1,05 EFLOPS FP64 trong một bài benchmark lại chỉ đạt 1,2 EFLOPS FP32 trong một bài benchmark khác.
Những con số không nhất quán về hiệu năng hệ thống của Sunway Oceanlite khiến người ta nghi ngờ rằng liệu điểm chuẩn LINPACK về hiệu năng của Tianhe-3, siêu máy tính hàng đầu Trung Quốc hiện nay, có đúng hay không?
Cho dù các công ty Trung Quốc có thể thiết kế phần cứng cho siêu máy tính với hiệu năng Petascale, nhưng dường như các hệ thống exascale với mức tiêu thụ năng lượng hợp lý lại là điều khó có thể xảy ra. Cho dù vậy, ngay cả khi các bộ xử lý và bộ tăng tốc của Trung Quốc không nhanh như đối thủ, họ vẫn có thể sản xuất với số lượng lớn và tạo ra các hệ thống siêu máy tính với hiệu năng mạnh hơn, cho dù mức tiêu thụ năng lượng thế nào đi nữa.
Thách thức lớn nhất hiện nay đối với tham vọng này là việc các hãng sản xuất bộ xử lý siêu máy tính, Sunway và Phytium đều nằm trong danh sách đen của Mỹ, khiến việc phát triển và xây dựng các bộ xử lý mới trở nên khó khăn hơn nhiều so với trước.
GenK
Nhân viên Digital Marketing - Google
CÔNG TY CỔ PHẦN TẬP ĐOÀN CÔNG NGHỆ OMMANI
Địa điểm: Hà Nội
Lương: 10 Tr - 15 Tr VND