Quay về trang chủ
Blog

Tối ưu hóa Inference cho DeepSeek-R1 (Distilled) trên VPS CPU AMD EPYC: Kỹ thuật nâng mốc Token/s lên tối đa

Khám phá hướng dẫn chuyên sâu về cách tối ưu hóa hiệu năng inference dòng mô hình DeepSeek-R1 (Distilled) trên hạ tầng VPS sử dụng CPU AMD EPYC. Tận dụng tối đa kiến trúc phần cứng để bứt phá tốc độ Token/s mà không cần đến GPU đắt đỏ.

7 phút đọc
Tối ưu hóa Inference cho DeepSeek-R1 (Distilled) trên VPS CPU AMD EPYC: Kỹ thuật nâng mốc Token/s lên tối đa | Xylentis