Card đồ họa cao cấp lỗi nghiêm trọng do "rỗ" chip, thủng lưới kiểm tra chất lượng
Một chiếc card đồ họa PowerColor RX 9070 XT Hellhound cao cấp đã gặp phải một lỗi nghiêm trọng, đến từ một độc giả gửi cho trang tin Igor's Lab. Mặc dù đã vượt qua các bài kiểm tra chất lượng ban đầu, Igor's Lab phát hiện ra rằng chip RDNA 4 của card bị lỗi, dẫn đến nhiệt độ tăng cao bất thường, ngay cả sau khi đã thay keo tản nhiệt.
Nguyên nhân được xác định là do "rỗ" (pitting) trên bề mặt chip, một lỗi có thể xảy ra trong quá trình mài mỏng chip (backgrinding). Quá trình này giúp giảm độ dày của chip nhưng nếu không cẩn thận, có thể gây ra các vết trầy xước, rỗ hoặc các bất thường khác.
Bề mặt silicon của con chip bị lỗi này có những điểm không hoàn hảo, dù mắt thường khó nhận ra. Điều này dẫn đến nhiệt độ hotspot (điểm nóng nhất trên chip) tăng vọt lên đến 113 độ C, cao hơn nhiều so với mức cho phép của các sản phẩm dựa trên kiến trúc RDNA. Sự chênh lệch giữa nhiệt độ trung bình của GPU và nhiệt độ hotspot lên tới 46 độ C. Nhiệt độ quá cao khiến card đồ họa bị giảm hiệu năng để bảo vệ (thermal throttling).
Khi soi dưới kính hiển vi, Igor's Lab phát hiện ra hơn 1934 vết rỗ trên chip, chiếm hơn 1% diện tích bề mặt. Theo đánh giá của họ, con số này vượt quá mức cho phép đối với các loại chip hiện đại, đặc biệt là những chip có công suất cao như Navi 48 trên RX 9070 XT. Một trong số các vết rỗ được đo có độ sâu 12.59 micromet và đường kính 212.36 micromet, vượt quá tiêu chuẩn ngành.
Igor's Lab cho rằng lỗi này có thể do quá trình mài mỏng chip không đúng cách. Họ cũng chỉ ra rằng, nhiều bên liên quan, bao gồm cả nhà máy sản xuất PowerColor và có thể cả TSMC (nhà sản xuất chip), đều đã bỏ qua lỗi này. Có thể các thuật toán kiểm tra bằng AI chưa được huấn luyện đủ để phát hiện ra vấn đề.
Hiện tại, có vẻ như đây chỉ là một trường hợp cá biệt. AMD đã thông báo với Igor's Lab rằng đây là "một sự cố riêng lẻ". Hy vọng rằng điều này là chính xác và sẽ không có thêm những sự cố tương tự. Điều quan trọng là chủ sở hữu chiếc card bị lỗi này có thể được bảo hành hoặc thay thế sản phẩm, đặc biệt trong bối cảnh giá GPU đang cao và nguồn cung hạn chế.