Phóng viên Ryan Morrison của trang tin công nghệ Tomsguide đã có những trải nghiệm ban đầu với Gemini Advanced để giải đáp câu hỏi của nhiều người dùng: Liệu AI tạo sinh mới nhất của Google có cạnh tranh được với ChatGPT?
Google vừa chính thức giới thiệu mô hình trí tuệ nhân tạo mới nhất của mình, Gemini Ultra 1.0, với tuyên bố rằng nó có khả năng cạnh tranh trực tiếp với mô hình AI mạnh mẽ nhất của OpenAI là GPT-4-Turbo trong đa số các nhiệm vụ. Nếu điều này được chứng minh là chính xác, Gemini Ultra sẽ đánh dấu sự cạnh tranh đầu tiên thực sự với ChatGPT của OpenAI từ khi cuộc bùng nổ của AI tạo sinh được khởi đầu.
Trong một nước đi có phần gây bối rối, Google cũng đã quyết định thay đổi tên gọi của chatbot từ Bard sang Gemini, khiến cho mô hình AI và dịch vụ truy cập mô hình đều mang chung một tên gọi.
Nhân dịp này, phóng viên Ryan Morrison của trang tin công nghệ Tomsguide đã có những trải nghiệm ban đầu với Gemini Advanced - tức phiên bản trả phí của Gemini với chi phí khoảng 19,99 USD/tháng, vốn bao gồm nhiều tính năng và sức mạnh xử lý hơn phiên bản miễn phí. Bản thân phóng viên này sau đó đã đưa ra những nhận định sơ bộ để giải đáp câu hỏi của nhiều người dùng: Liệu AI tạo sinh mới nhất của Google có cạnh tranh được với ChatGPT, đặt biệt là gói trả phí ChatGPT Plus hay không?
Khi tiếp xúc với bất kỳ chatbot mới nào, bản thân phóng viên Ryan Morrison luôn kiểm tra khả năng lập trình, vốn là một kỹ năng mà trí tuệ nhân tạo nên thực hiện một cách tự nhiên.
Về cơ bản, Google đã nỗ lực quảng bá khả năng lập trình khá tốt của mô hình AI Gemini Ultra. Để kiểm chứng điều này, Ryan Morrison đã yêu cầu chatbot Gemini Advanced hỗ trợ trong việc thiết kế một trang web.
Đầu tiên, phóng viên của Tomsguide có trong tay một bức ảnh vẽ cảnh một con mèo theo phong cách anime và pixel-art đang ngồi trên một dãy hàng rào. Sau đó, bức ảnh này đã được Ryan Morrison gửi cho Gemini, kèm theo ý tưởng con mèo sẽ nhập vai "điệp viên mèo" có tên Cat-astrophe trong show truyền hình giả tưởng. Tiếp theo, phóng viên này đã lập một câu lệnh (prompt) đề nghị Gemini thiết kế một StyleSheet (tức bao gồm những quy tắc kiểu cách nhằm báo cho trình duyệt biết được cách trình bày một tài liệu mong muốn) dựa trên các màu sắc trong hình ảnh.
Dù kết quả không hoàn hảo khi chỉ lựa chọn một số màu sắc hạn chế, nhưng Gemini đã tạo ra được một stylesheet có thể sử dụng được. Sau đó, phóng viên yêu cầu chatbot tạo ra một trang web sử dụng Stylesheet nhằm giới thiệu show truyền hình giả tưởng về điệp viên mèo Cat-astrophe. Khá ngạc nhiên, Gemini Advanced đã thực hiện tốt công việc này. Tất cả những gì cần thiết từ phía người dùng là chỉ định đúng đường dẫn đến hình ảnh.
Trong việc tạo hình ảnh, Gemini Advanced không tự thực hiện nhiệm vụ này mà lại dựa vào mô hình Imagen 2 do Google DeepMind phát triển. Dù vậy, khả năng suy luận và hiểu biết đã được nâng cao của Gemini Advanced hứa hẹn sẽ thúc đẩy sự phối hợp nhịp nhàng hơn giữa người dùng và chatbot, qua đó mang lại những hình ảnh chất lượng cao hơn.
Để kiểm tra khả năng tạo ảnh của Gemini Advanced, phóng viên Ryan Morrison đã yêu cầu Gemini Advanced tạo ra hình ảnh có chủ đề "Mèo trên mặt trăng", kèm theo yêu cầu thêm dòng chữ "Cat on the Moon" ở phía dưới bức hình. Kết quả là phóng viên này đã nhận được hai hình ảnh đúng như yêu cầu.
Tuy nhiên, vì đã thực hiện được điều tương tự với Bard trước đó, Ryan Morrison muốn thử thách Gemini Advanced bằng cách đặt ra câu lệnh với yêu cầu phức tạp hơn: "Hãy đặt con mèo vào trong một bộ đồ vũ trụ và đặt nó trên bề mặt Mặt Trăng với Trái Đất làm nền phía sau, nhưng vẫn giữ nguyên phong cách hình ảnh như bức ảnh đã tạo trước đó."
Kết quả, Gemini Advanced đã thực hiện đúng yêu cầu nhưng lại quên thêm dòng chữ như yêu cầu. Khi được tiếp tục yêu cầu thêm dòng chữ vào góc dưới bên trái, Gemini Advanced lại tạo một hình ảnh mới và đặt dòng chữ ở góc trên bên phải. Mặc dù không đạt được kết quả như mong muốn của người dùng, đây cũng là điều dễ hiểu khi các nền tảng AI khác cũng gặp khó khăn trong việc duy trì sự nhất quán khi tạo hình ảnh.
Kết quả này cho thấy, mặc dù Gemini Advanced cho thấy tiềm năng lớn trong việc hỗ trợ tạo hình ảnh, nhưng vẫn cần những điều chỉnh và cải tiến để đạt được sự nhất quán và đáp ứng chính xác yêu cầu của người dùng, đặc biệt khi so sánh với sự linh hoạt và khả năng hiểu ý người dùng của các nền tảng AI khác như ChatGPT.
Trong lĩnh vực thơ ca, trí tuệ nhân tạo (AI) đã bắt đầu thể hiện sự xuất sắc, đặc biệt qua việc ''bắt chước'' hoặc học hỏi phong cách của các nhân vật nổi tiếng. Với mong muốn khám phá khả năng này, phóng viên Ryan Morrison đã yêu cầu Gemini Advanced sáng tác một bài thơ sonnet mang phong cách Shakespeare về chủ đề là cuộc chiến giữa các hệ máy game như Xbox và PlayStatation. Trong lần thử đầu tiên, mặc dù bài thơ được Gemini Advanced tạo ra đọc khá hay, nhưng bài thơ này lại ''quên'' nhắc đến các hệ máy game cụ thể.
Để thách thức hơn nữa, Ryan Morrison đã yêu cầu Gemini Advanced tập trung hóa ý tưởng và kết quả là một tác phẩm thơ ấn tượng được tạo ra. Điều này cho thấy, dù việc sáng tác thơ không còn là thách thức lớn với AI, nhưng việc sử dụng những từ được sử dụng phổ biến trong bài thơ để tạo ra một câu thơ hấp dẫn lại không đơn giản.
Phóng viên của Tomsguide mong đợi một kết quả sáng tạo và vui nhộn từ việc sử dụng những từ phổ biến như “của”, “là”, và “hoặc”, nhưng không nhận được kết quả như mong muốn, từ đó buộc phải thử lại nhiều lần. Trái lại, ChatGPT đã nắm bắt được yêu cầu của người dùng ngay từ lần thử đầu tiên.
Nhìn chung, mặc dù Gemini Advanced cho thấy sự tiến bộ vượt bậc so với các phiên bản trước với khả năng đưa ra những câu trả lời hợp lý và có cấu trúc cho cả những truy vấn phức tạp. Tuy nhiên, vẫn còn đó những hạn chế trong việc tạo ra phản hồi như mong đợi của người dùng, theo kết luận của phóng viên Ryan Morrison.
Rõ ràng, Gemini Advanced vẫn đang ở giai đoạn cần tối ưu và tinh chỉnh thêm, chưa kể chatbot này vẫn cần được Google bổ sung thêm tính năng. Mặt khác, chất lượng câu trả lời (khi thực hiện đúng theo yêu cầu từ phía người dùng) của Gemini Advanced khá tốt và có khả năng sánh ngang với ChatGPT Plus.
Câu hỏi còn lại là Gemini Advanced sẽ được cải thiện như thế nào khi Google tiếp tục phát triển chat bot này trong thời gian tới, dựa trên sự tinh chỉnh riêng của công ty này, cũng như từ những phản hồi trực tiếp của phía người dùng.
GenK
Nhân viên Digital Marketing - Google
CÔNG TY CỔ PHẦN TẬP ĐOÀN CÔNG NGHỆ OMMANI
Địa điểm: Hà Nội
Lương: 10 Tr - 15 Tr VND