AMD "Tấn Công" NVIDIA: RDNA 3 Vượt Mặt RTX 4090 trong Thử Nghiệm DeepSeek
AMD vừa tung ra những số liệu benchmark mới, cho thấy card đồ họa RDNA 3 với 48GB bộ nhớ của họ có thể vượt trội so với RTX 4090 thế hệ trước của NVIDIA trong các bài kiểm tra DeepSeek. Cụ thể, ông David McAfee, Phó Chủ tịch AMD, đã chia sẻ trên mạng xã hội X rằng Radeon Pro W7900 và W7800 (phiên bản 48GB) có thể nhanh hơn RTX 4090 tới 7.3 lần trong DeepSeek R1.
AMD đã thử nghiệm ba card đồ họa trên nhiều phiên bản DeepSeek R1 bằng phần mềm LM Studio và Llama.cpp runtime. Các thử nghiệm bao gồm cả các mô hình Distill Qwen và Distill Llama, với các cấu hình khác nhau để tạo ra các đoạn hội thoại hoặc tóm tắt văn bản.
Theo số liệu AMD công bố, RTX 4090 chỉ đạt 2.7 tokens/giây trong Distill Qwen 32B 8-bit, trong khi Pro W7800 và W7900 lần lượt đạt 19.1 và 19.8 tokens/giây. Tương tự, trong Distill Llama 70B 4-bit, RTX 4090 chỉ đạt 2.3 tokens/giây, còn hai card AMD đạt 12.8 và 12.7 tokens/giây. AMD tuyên bố rằng Radeon Pro W7800 hoặc W7900 48GB có thể nhanh hơn tới 7.3 lần so với RTX 4090 trong một số thử nghiệm nhất định.
Ông McAfee nhấn mạnh rằng dung lượng VRAM lớn (48GB) của W7800 và W7900 đủ để chạy các mô hình DeepSeek R1 lớn nhất một cách hiệu quả. VRAM đóng vai trò quan trọng trong việc xử lý các mô hình ngôn ngữ lớn, vì các tham số của mô hình được lưu trữ trực tiếp trong VRAM. Tuy nhiên, dung lượng VRAM lớn cũng đi kèm với giá thành cao. W7900 48GB có giá khoảng 3,500 đô la, đắt hơn đáng kể so với RTX 4090 và thậm chí cả RTX 5090.
Tuy nhiên, AMD có lẽ đã bỏ qua việc so sánh với RTX 5090 mới nhất của NVIDIA. Chúng ta hãy chờ xem NVIDIA sẽ có phản hồi như thế nào, đặc biệt khi card đồ họa của AMD có dung lượng VRAM lớn hơn (48GB so với 32GB của RTX 5090).