Theo chinastarmarket.cn, NVIDIA đang chuẩn bị ba GPU mới dành cho thị trường Trung Quốc, đáp ứng yêu cầu xuất khẩu của Mỹ. Các GPU mới này được cho là dựa trên kiến trúc Hopper và Ada Lovelace.
Các sản phẩm AI và HPC được đề cập là HGX H20, L20 PCIe và L2 PCIe, và tất cả chúng đều đã được gửi đến các nhà sản xuất máy chủ Trung Quốc.
Trong khi đó, hkepc đã công bố một slide cho biết HGX H20 mới với 96 GB HBM3 dựa trên kiến trúc Hopper và có thể sử dụng silicon H100 hàng đầu bị cắt giảm nghiêm trọng hoặc một thiết kế GPU AI và HPC dựa trên Hopper mới. Vì đây là thông tin chưa chính thức nên bạn hãy tham khảo với một chút muối.
Về hiệu suất, HGX H20 có 1 teraflop fp64 cho HPC (so với 34 teraflop trên H100) và 148 teraflop fp16/bf16 (so với 1.979 teraflop trên H100). NVIDIA đã phải cắt giảm hiệu suất của H100 vì công ty không còn cách nào khác để đáp ứng yêu cầu xuất khẩu của Mỹ.
Đối với các GPU AI và HPC L20 và L2 PCIe, chúng dường như dựa trên GPU AD102 và AD104 bị cắt giảm của NVIDIA và sẽ nhắm vào các thị trường tương tự như các sản phẩm L40 và L40s.
Trong vài năm qua, Mỹ đã áp đặt các hạn chế nghiêm ngặt đối với xuất khẩu phần cứng hiệu suất cao sang Trung Quốc. Các biện pháp kiểm soát của Mỹ đối với lĩnh vực siêu máy tính của Trung Quốc được áp đặt vào tháng 10 năm 2022 nhằm ngăn chặn các thực thể Trung Quốc xây dựng siêu máy tính có hiệu suất hơn 100 petaflop fp64 trong vòng 41.600 feet khối (1.178 mét khối).
Để tuân thủ các quy tắc xuất khẩu của Mỹ, NVIDIA đã phải cắt giảm khả năng kết nối giữa GPU và hiệu suất xử lý GPU của các GPU A800 và H800.
Các hạn chế được đặt ra vào tháng 11 năm 2023 yêu cầu cấp giấy phép xuất khẩu đối với tất cả phần cứng đạt được tổng hiệu suất xử lý và/hoặc mật độ hiệu suất nhất định, bất kể bộ phận đó có thể kết nối hiệu quả với các bộ xử lý khác (sử dụng nvlink trong trường hợp của NVIDIA) hay không.
Do đó, NVIDIA không còn được bán A100, A800, H100, H800, L40, L40s và GeForce RTX 4090 cho các thực thể Trung Quốc mà không có giấy phép xuất khẩu từ chính phủ Mỹ.
Để tuân thủ các quy tắc mới, các GPU HGX H20, L20 PCIe và L2 PCIe cho tính toán AI và HPC sẽ không chỉ có kết nối nvlink bị cắt giảm mà còn có hiệu suất bị cắt giảm.
Điều thú vị là NVIDIA gần đây đã ra mắt các GPU AI và HPC A800 và H800 tại Mỹ với mục tiêu chính thức là triển khai AI quy mô nhỏ cho doanh nghiệp và máy trạm.
Có thể đây là cách tốt để NVIDIA giải phóng số lượng hàng tồn kho mà công ty không thể bán cho các công ty ở Trung Quốc, Ả Rập Saudi, Các Tiểu vương quốc Ả Rập Thống nhất và Việt Nam.
© newsliver.com. All Rights Reserved.