DeepSeek R1[1]是一個功能強大且用途廣泛的 AI 模型,它憑借先進的推理能力、成本效益和開源可用性向 OpenAI 等老牌企業發起了挑戰。雖然它有一些局限性,但其創新的方法和強大的性能使其成為開發人員、研究人員和企業的寶貴工具。對于那些有興趣探索其功能的人來說,該模型及其精簡版本可以在 Hugging Face 和 GitHub 等平臺上獲得。 ![]() 由受 GPU 限制的中國團隊訓練,它在數學、編碼甚至一些相當復雜的推理方面表現出色。最有趣的是,它是一個“精簡”模型,這意味著它比它所基于的巨型模型更小、更高效。這很重要,因為它使人們在實際使用和構建它時更加實用。 本文我們將介紹
我們將使用 LlamaEdge[2](Rust + Wasm 技術棧)來開發和部署這個模型的應用程序。無需安裝復雜的 Python 包或 C++ 工具鏈[3]!了解我們選擇這項技術的原因[4]。 在自己的設備上運行 DeepSeek-R1-Distill-Llama-8B 模型第一步: 通過以下命令行安裝WasmEge[5]。 curl -sSf https://raw./WasmEdge/WasmEdge/master/utils/install_v2.sh | bash -s -- -v 0.14.1 第二步:下載量化過的DeepSeek-R1-Distill-Llama-8B-GGUF[6]模型文件。 這可能需要一定時間,因為模型的大小為 5.73 GB。
第三步:下載 LlamaEdge API 服務器應用程序。它也是一個跨平臺的便可移植的 Wasm 應用程序,可以在許多 CPU 和 GPU 設備上運行。 curl -LO https://github.com/LlamaEdge/LlamaEdge/releases/latest/download/llama-api-server.wasm 第四步: 下載chatbot UI,以便在瀏覽器中與 DeepSeek-R1-Distill-Llama-8B 模型進行交互。
接下來,使用以下命令行為模型啟動 LlamaEdge API 服務器。 wasmedge --dir .:. --nn-preload default:GGML:AUTO:DeepSeek-R1-Distill-Llama-8B-Q5_K_M.gguf \ llama-api-server.wasm \ --prompt-template llama-3-chat \ --ctx-size 8096 然后,打開瀏覽器訪問 http://localhost:8080[7] 開始聊天! 或者可以向模型發送 API 請求。
為 DeepSeek-R1-Distill-Llama-8B 創建與 OpenAI 兼容的 API 服務LlamaEdge 是輕量級的,不需要守護進程或 sudo 進程即可運行。它可以輕松嵌入到您自己的應用程序中!通過支持聊天和 embedding 模型,LlamaEdge 可以成為本地計算機上應用程序內部的 OpenAI API 替代品! 接下來,我們將展示如何為 DeepSeek-R1 模型以及 embedding 模型啟動完整的 API 服務器。API 服務器將具有 chat/completions 和 embeddings 端點。除了上一節中的步驟之外,我們還需要: 第五步:下載 embedding 模型。 curl -LO https:///second-state/Nomic-embed-text-v1.5-Embedding-GGUF/resolve/main/nomic-embed-text-v1.5.f16.gguf 然后,我們可以使用以下命令行啟動具有聊天和 embedding 模型的 LlamaEdge API 服務器。更詳細的說明,請查看文檔——啟動 LlamaEdge API 服務[8]。
最后,可以按照這些教程將 LlamaEdge API 服務器作為 OpenAI 的替代與其他 Agent 框架集成。具體來說,在你的應用或 Agent 配置中使用以下值來替換 OpenAI API。 Config option 值 Base API URL http://localhost:8080/v1 --- --- 模型名稱 (大模型) DeepSeek-R1-Distill-Llama-8B 模型名稱(文本 embedding) nomic-embed 就是這樣啦!立即訪問 LlamaEdge 倉庫并構建你的第一個 AI Agent!如果覺得有意思,請在此處為我們的repo[9]加注星標。在運行此模型時有任何問題,也可以請前往該 repo 提出問題或與我們預約演示,以跨設備運行自己的 LLM! 參考資料 [1] DeepSeek R1: https:///deepseek-ai/DeepSeek-R1-Distill-Llama-8B [2] LlamaEdge: https://link.zhihu.com/?target=https%3A//github.com/second-state/LlamaEdge/ [3] 工具鏈: https://zhida.zhihu.com/search?content_id=249066187&content_type=Article&match_order=1&q=%E5%B7%A5%E5%85%B7%E9%93%BE&zhida_source=entity [4] 選擇這項技術的原因: https://www./articles/wasm-runtime-agi/ [5] WasmEge: https://github.com/WasmEdge/WasmEdge [6] DeepSeek-R1-Distill-Llama-8B-GGUF: https:///second-state/DeepSeek-R1-Distill-Llama-8B-GGUF/ [7] http://localhost:8080: http://localhost:8080/ [8] 啟動 LlamaEdge API 服務: https:///docs/user-guide/openai-api/intro/ [9] repo: https://github.com/LlamaEdge/LlamaEdge |
|