Quay về trang chủ
Blog

Triển khai mô hình AI cục bộ (Local LLMs) trên VPS

Hướng dẫn sử dụng Ollama hoặc vLLM để chạy các model như Llama 3, Mistral trực tiếp trên VPS, phục vụ API nội bộ cho ứng dụng mà không cần qua cloud tốn kém.

6 phút đọc