屬於 “uv” 標籤的文章

查看所有標籤
共有 2 篇文章

12GB VRAM 顯卡運行 GPT-OSS-20B:vLLM 與統一記憶體實戰指南

探索如何在 12GB VRAM NVIDIA 顯卡上,結合 vLLM 與 Unified Memory 技術運行 gpt-oss-20b。內容涵蓋安裝步驟、參數調整與效能挑戰。適合想在有限資源下部署大型語言模型的進階用戶。

uv sync 生產級指令:凍結依賴、排除開發套件一次搞懂

深入解析 uv sync --frozen --no-dev --no-editable 的每個選項,確保生產環境穩定一致。學會如何只安裝鎖定版本、跳過開發套件與可編輯模式。最後再教你一招,把專案同時裝成可呼叫工具!