Hướng dẫn sử dụng Ollama hoặc vLLM để chạy các model như Llama 3, Mistral trực tiếp trên VPS, phục vụ API nội bộ cho ứng dụng mà không cần qua cloud tốn kém.