Trong video chia sẻ trên X ngày 19/1, công ty siêu máy tính Cerebras cho biết đã sử dụng hệ thống chạy chip WSE-3 kết hợp mô hình ngôn ngữ lớn (LLM) Llama 3.1 405B (405 tỷ tham số) của Meta và dịch vụ đám mây AI Cerebras Inference để lập trình trò chơi cờ vua bằng Python, sau đó so sánh với hệ thống khác cũng chạy LLM của Meta nhưng dùng dịch vụ đám mây Amazon Web Services (AWS) và GPU Nvidia.
Thời gian tạo game chơi cờ vua của Cerebras Inference (bên trái) so với AI chạy trên đám mây của AWS. Video: X/Cerebras
Kết quả, với khả năng tạo 972 token (mã riêng lẻ từ phản hồi của LLM) mỗi giây và thời gian bắt đầu token đầu tiên là 0,24 giây, hệ thống của Cerebras mất hơn hai giây để viết một game cờ vua - kỷ lục thế giới hiện tại. Trong khi đó, hệ thống AWS mất gần 20 giây.
Cerebras cũng so sánh hàng loạt AI hàng đầu khác từ Google, Microsoft Azure hay Fireworks và đều cho kết quả vượt trội. SambaNova, đối thủ cạnh tranh trực tiếp của WSE-3, cũng bị Cerebras Inference đánh bại với thời gian nhanh gấp 6 lần.
Ý kiến ()