Quay về trang chủ
Blog

Tự Host DeepSeek-R1 1.5B/8B Trên VPS 2GB RAM: Kỹ Thuật Quantization Chuyên Sâu Để Làm AI Assistant Riêng

Khám phá giải pháp tối ưu chi phí vận hành AI bằng cách tự host mô hình DeepSeek-R1 (1.5B và 8B) trên VPS cấu hình thấp chỉ 2GB RAM nhờ các kỹ thuật Quantization (định lượng hóa) chuyên sâu như GGUF và phương pháp phân bổ tài nguyên Swap Memory tối ưu.

6 phút đọc
Tự Host DeepSeek-R1 1.5B/8B Trên VPS 2GB RAM: Kỹ Thuật Quantization Chuyên Sâu Để Làm AI Assistant Riêng | Xylentis