Tìm kiếm: inference

Phần cứng 20/03/2025 - 10:46:32

NVIDIA "khoe" GPU Rubin Ultra: Sức mạnh vượt trội, "ngốn" điện khủng khiếp

Tại sự kiện GTC 2025, NVIDIA đã hé lộ về GPU Rubin Ultra, thế hệ tiếp theo đầy hứa hẹn, cùng hệ thống tản nhiệt Kyber NVL576. Dự kiến ra mắt vào nửa cuối năm 2027, Rubin Ultra hứa hẹn mang đến sức mạnh vượt trội so với các thế hệ trước.

Linh Hương

953

Phần cứng 13/03/2025 - 01:47:33

Meta Phát Triển Chip AI Riêng, Giảm Phụ Thuộc NVIDIA

Meta đang có những bước tiến lớn trong việc tự chủ về phần cứng, cụ thể là chip AI. Sau nhiều năm phát triển chip RISC-V cho tác vụ suy luận AI (AI inference) nhằm cắt giảm chi phí và giảm sự phụ thuộc vào NVIDIA, Meta đã tiến thêm một bước: thiết kế chip tăng tốc AI riêng cho quá trình huấn luyện mô hình (AI training).

Linh Hương

1189

Phần cứng 16/01/2025 - 08:29:37

Card đồ họa Nvidia RTX Blackwell: Không chỉ dành cho game thủ

Card đồ họa Nvidia RTX Blackwell không chỉ dành riêng cho game thủ. Từ lâu, card đồ họa Nvidia đã hỗ trợ mạnh mẽ các tính năng chuyên nghiệp cho người sáng tạo nội dung, từ chỉnh sửa video, ảnh, dựng hình 3D cho đến âm thanh. Với kiến trúc Blackwell mới, nhiều tính năng tiên tiến sẽ được hỗ trợ bởi trí tuệ nhân tạo (AI).

Phong Lâm

1601

Phần cứng 27/12/2024 - 12:04:19

NVIDIA Blackwell B300: Siêu Chip AI Thế Hệ Mới - 50% Hiệu Suất Cao Hơn!

Hôm nay, chúng ta cùng khám phá một bước tiến vượt bậc trong lĩnh vực AI: NVIDIA Blackwell B300!

Kiên Đăng

1466

Phần cứng 21/12/2024 - 11:57:57

Module AI Memryx MX3 M.2: Công nghệ AI mạnh mẽ, nhỏ gọn và tiết kiệm năng lượng!

Công ty khởi nghiệp công nghệ Memryx đến từ Đại học Michigan vừa ra mắt module AI M.2 (giá chỉ $149!) cực kỳ ấn tượng. Với kích thước nhỏ gọn và khả năng tích hợp dễ dàng vào hệ thống có khe cắm PCIe Gen 3 M.2, module này là giải pháp lý tưởng cho các ứng dụng Edge Computing.

Tuấn Anh

1940

Phần cứng 12/09/2023 - 08:19:34

Nvidia TensorRT-LL tăng gấp đôi hiệu suất LLM trên GPU H100

Nvidia cho biết phần mềm mã nguồn mở TensorRT-LL mới của họ có thể tăng hiệu suất đáng kể của các mô hình ngôn ngữ lớn (LLM) trên GPU của họ. Theo công ty, khả năng của TensorRT-LL của Nvidia cho phép họ tăng hiệu suất của GPU H100 của họ lên hai lần trong LLM GPT-J với sáu tỷ tham số. Quan trọng là phần mềm có thể cho phép cải thiện hiệu suất này mà không cần đào tạo lại mô hình.

Huy Hoàng

3546

Chọn trang

Hình ảnh

NewSLiver

Tìm kiếm: inference

NewSLiver

Tin nổi bật

Danh mục

Hình ảnh

Tìm kiếm: inference