Ollama史詩級(jí)升級(jí)，一鍵拉取運(yùn)行任意Huggingface，hf-mirror GGUF格式大模型，45K個(gè)模型讓你痛快暢玩

swordinhand 2024-12-14

展開全文

前言

相信許多人和我一樣，最初接觸 AI 時(shí)也是從Ollama開始的，Ollama 之所以這么出色，是因?yàn)樗褂昧?GGML 格式（這是一種'輕量版’的大語言模型，以較低精度運(yùn)行，能夠輕松適配普通硬件），而且它足夠的簡單，類似于Docker，只需要簡單的命令就可以拉取鏡像，運(yùn)行鏡像，甚至有Modelfile文件來自行設(shè)定大模型。

以前不支持Huggingface時(shí)，我們需要自行下載GGUF格式大模型，然后根據(jù)Modelfile來自定義構(gòu)建，很是不方便。

現(xiàn)在，它終于得來了，它終于支持了Huggingface上的GGUF格式模型了，大約45K個(gè)GGUF模型，隨便你用，而不在局限于它本身的Models列表了，也不用創(chuàng)建Modelfile文件了，這次的步子邁的有點(diǎn)大了。

實(shí)戰(zhàn)

你需要做的只是一條命令：

ollama run hf.co/{username}/{reponame}:latest

例如運(yùn)行: Qwen 2.5 1.5B GGUF大模型：

地址：
https:///Qwen/Qwen2.5-1.5B-Instruct-GGUF
https:///Qwen/Qwen2.5-1.5B-Instruct-GGUF

ollama run hf.co/Qwen/Qwen2.5-1.5B-Instruct-GGUF:latest
#或者
ollama run /Qwen/Qwen2.5-1.5B-Instruct-GGUF:latest

# 注意
# :latest 可以不加，不加默認(rèn)就是:latest

當(dāng)然這需要有魔法的，對(duì)于國內(nèi)用戶，請(qǐng)執(zhí)行：

ollama run /Qwen/Qwen2.5-1.5B-Instruct-GGUF

如果指定了 :latest 或沒有指定 :latest，默認(rèn)情況下，當(dāng)Q4_K_M量化方案存在于模型存儲(chǔ)庫中時(shí)，將使用該方案。如果沒有，我們默認(rèn)選擇存儲(chǔ)庫中存在的一種合理的量化類型。

當(dāng)然如果你想要拉取某個(gè)自定義量化的，只需要添加一個(gè)標(biāo)簽：

ollama run hf.co/{username}/{repository}:{quantization}
# 或
ollama run /{username}/{repository}:{quantization}
# 國內(nèi)
ollama run /{username}/{repository}:{quantization}

例如上面的：Qwen 2.5 1.5B GGUF大模型

ollama run /Qwen/Qwen2.5-1.5B-Instruct-GGUF:q4_0

咋樣，是不是感覺可以把 ollama 的注冊(cè)表 models 丟進(jìn)垃圾箱了。

注意

你不能使用ollama直接加載本地存在的GGUF文件，即使你是從HF拉取的模型文件，因?yàn)閛llama會(huì)重命名為哈希字符串，這意味著你只能重新拉取而不能使用你以前下載下來的。

總結(jié)

# 格式
ollama run hf.co/{username}/{reponame}:latest

# 示例：
ollama run hf.co/Qwen/Qwen2.5-1.5B-Instruct-GGUF:latest
# 或者
ollama run /Qwen/Qwen2.5-1.5B-Instruct-GGUF:latest
# 國內(nèi)
ollama run /Qwen/Qwen2.5-1.5B-Instruct-GGUF

# 自定義量化
# 格式
ollama run hf.co/{username}/{reponame}:{quantization}
ollama run /{username}/{repository}:{quantization}

# 國內(nèi)
ollama run /Qwen/Qwen2.5-1.5B-Instruct-GGUF:q4_0

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自： swordinhand > 《Research》

舉報(bào)/認(rèn)領(lǐng)