Microsoft trình làng AI WHAMM: Hồi sinh Quake II, chơi game theo thời gian thực dù còn nhiều hạn chế
Mới đây, Microsoft vừa giới thiệu WHAMM, một mô hình trí tuệ nhân tạo tạo sinh (generative AI) có khả năng vận hành game theo thời gian thực. Để minh họa, hãng đã trình diễn khả năng của WHAMM trên tựa game kinh điển 28 năm tuổi - Quake II. Bản demo này cho phép người dùng tương tác trực tiếp bằng tay cầm hoặc bàn phím, tuy nhiên, tốc độ khung hình khá thấp, chỉ loanh quanh ở mức mười mấy FPS (khung hình trên giây).
Tuy nhiên, Microsoft cũng nhấn mạnh rằng chúng ta chưa nên vội đánh giá đây là một trải nghiệm chơi game hoàn chỉnh. Thay vào đó, mục tiêu chính là để quan sát và phân tích những điểm đặc biệt cũng như hạn chế của mô hình AI này. WHAMM (viết tắt của World and Human Action Maskgit Model) thực chất là bản nâng cấp từ mô hình WHAM-1.6B ra mắt hồi tháng Hai. Nó được thiết kế để có thể chơi được theo thời gian thực với tốc độ xuất hình ảnh nhanh hơn. Thay vì dự đoán từng phần của hình ảnh một cách tuần tự, WHAMM sử dụng kiến trúc kiểu MaskGIT, cho phép tạo ra toàn bộ các yếu tố của khung hình cùng lúc (song song). Điều này giúp giảm đáng kể thời gian xử lý và tăng tốc độ phản hồi.
Đáng chú ý, WHAMM chỉ cần được huấn luyện trên dữ liệu của Quake II trong khoảng hơn một tuần, một sự cải tiến vượt bậc so với 7 năm dữ liệu cần thiết cho phiên bản trước. Độ phân giải hình ảnh cũng được nâng cấp từ mức 300x180 khá thấp lên 640x360, cho hình ảnh đỡ 'vỡ hạt' hơn. Nếu tò mò, bạn có thể tự mình trải nghiệm bản demo này tại Copilot Labs.
Khả năng của mô hình trong việc ghi nhớ môi trường xung quanh và thích ứng với hành động của người chơi (như di chuyển, nhảy, bắn, nhìn quanh...) là khá ấn tượng, dù đôi lúc vẫn xuất hiện lỗi đồ họa và độ trễ điều khiển (input lag) rất đáng kể. Bạn có thể thực hiện các hành động cơ bản trong game, nhưng nhìn chung, đây vẫn chỉ là một màn trình diễn công nghệ thú vị chứ chưa thể thay thế được trải nghiệm chơi Quake II gốc.
Tất nhiên, mô hình này còn nhiều hạn chế. Tương tác với kẻ địch còn khá 'mờ nhạt', khả năng ghi nhớ bối cảnh bị giới hạn, các chỉ số quan trọng như máu hay sát thương bị lưu trữ sai lệch, và bản demo cũng chỉ gói gọn trong một màn chơi duy nhất.
Thông báo này xuất hiện trong bối cảnh các công cụ AI tạo sinh đang gây nhiều tranh cãi. Nhiều người cho rằng luôn có một 'chất người' trong các tác phẩm sáng tạo mà AI khó lòng tái tạo hoàn chỉnh. Tuy nhiên, với tốc độ phát triển chóng mặt hiện nay, viễn cảnh game và phim được tạo hoàn toàn bởi AI có thể trở thành hiện thực chỉ trong vài năm tới. Đó dường như là hướng đi không thể tránh khỏi.
Có lẽ, điểm cân bằng lý tưởng nằm ở việc AI hỗ trợ, nâng cao các tác phẩm sáng tạo thay vì thay thế hoàn toàn con người. Ví dụ như công nghệ ACE của Nvidia giúp tạo ra các nhân vật NPC (nhân vật không phải người chơi) sống động như thật, và một phần công nghệ này đã được tích hợp vào game mô phỏng cuộc sống Inzoi. Xét về mặt công nghệ, dù còn hạn chế, WHAMM vẫn là một bước tiến so với các nỗ lực AI tạo game trước đây vốn thường hỗn loạn, thiếu mạch lạc và đầy 'ảo giác' (hiện tượng AI tạo ra thông tin sai lệch).