久久精品精选,精品九九视频,www久久只有这里有精品,亚洲熟女乱色综合一区
    分享

    使用 GPU 能力

     imnobody2001 2024-02-20 發布于廣東

    一、概述

    為了更好地處理圖形渲染,顯卡擁有獨立的圖形處理器GPU(Graphics Processing Unit)。GPU是顯卡的“心臟”,相當于CPU在電腦中的作用。

    2000年,斯坦福大學的一個小團隊敏銳發現GPU的計算能力有很多其它想象空間,它能夠處理在電腦屏幕上繪畫以外的更為復雜的任務。

    將GPU用于通用計算首先從GPU支持可編程開始,英偉達(NVIDIA)公司在Ian Buck(伊恩·布克)率領下,于2006年正式推出——CUDA(Compute Unified Device Architecture),這是全球首款GPU上的通用計算解決方案。利用CUDA,開發人員可以通過利用GPU的功能大大加快計算應用。在英偉達內部,CUDA是作為所有GPU系列的通用平臺。

    2012年,加拿大多倫多大學的Geoffrey Hinton帶著兩個學生,用GPU訓練深度神經網絡拿下了ImageNet圖像識別大賽的冠軍。CUDA和GPU與深度學習的神經網絡結合在一起,震驚了學術界。

    如今,當人們談論起生成式 AI 時,GPU 以及相應的性能和訪問性幾乎是繞不過的話題。而英偉達又是 GPU 的代名詞,在國際 GPU 市場上占據絕對優勢的份額。

    如今基于CUDA的應用生態繁榮,CUDA 工具包和 cuDNN 優化庫等成為英偉達很好的護城河。

    幾個名詞

    NVIDIA:英偉達

    CUDACompute Unified Device Architecture 是由顯卡廠商NVIDIA推出的運算平臺。它是一種通用并行計算架構,使GPU能夠解決復雜的計算問題。

    cuDNNCUDA Deep Neural Network library 是由NVIDIA開發的一個深度學習GPU加速庫。

    二、安裝 CUDA 及 cuDNN

    1、查看 CUDA 版本

    通過 nvidia-smi 命令,可以查看當前 NVIDIA 顯卡的相關信息及其對應的 CUDA 版本號,如下圖所示,NVIDIA GeForce 顯示其 CUDA 版本為 11.6。

    nvidia-smi

    圖片

    2、下載安裝CUDA

    下載地址:

    https://developer./cuda-toolkit-archive

    選擇對應的版本。

    圖片

    圖片

    選擇 local 安裝文件下載,文件雖然大,但是下載完后安裝就快多了。

    3、驗證安裝結果

    執行以下命令能顯示相關信息即可。

    nvcc --version

    圖片

    4、cuDNN 安裝

    cuDNN(CUDA Deep Neural Network library)是由NVIDIA開發的一個深度學習GPU加速庫,為了充分發揮 GPU 在大語言模型推理計算的性能,需要安裝 cuDNN。

    下載地址:

    https://developer./rdp/cudnn-archive

    選擇與 CUDA 11.x 對應的 cuDNN 版本。

    圖片

    下載解壓后將其中的三個文件夾并入 CUDA 的安裝目錄即可。

    圖片

    三、安裝  torch GPU 版

    執行以下命令,安裝  torch GPU 版及其相關依賴組件,python 版本選擇 3.10,這個版本的組件在 windows 下比較齊全。

    pip install torch==1.12.0+cu116 torchvision==0.13.0+cu116 torchaudio==0.12.0+cu116 -f https://download.pytorch.org/whl/torch_stable.html

    是否具備某個版本下的組件,可以查看 torch_stable.html 中列出的文件清單,從文件名結構可分解出其所對應的相關版本,如以下文件名中,cu116 對應 CUDA 11.6,cp310 對應  python 3.10,后面則表示 win 64 位系統。

    cu116/torch-1.12.0+cu116-cp310-cp310-win_amd64.whl

    驗證結果:

    import torchprint(torch.cuda.is_available())

    得到 True 即表示 CUDA 版可用。

    四、運行ChatGLM-6B模型

    使用 CPU 方式部署量化模型雖然可用,但推理速度慢,很難使用,而使用 GPU 速度能提升很多,可滿足一般使用。

    GPU 環境下運行至少要 6G 顯存,參考:

    https://www./blog/1051680925189690

    五、顯存使用嘗試

    本示例,在 4G 顯存的情況下,通過向 GPU 多次輸入張量數據(一次約400M)增加其顯存消耗,再逐漸釋放,形成波動曲線,如下圖所示。

    圖片

    代碼如下:

    import torch  import time  
    # 檢查是否有可用的GPU if torch.cuda.is_available(): device = torch.device('cuda') # GPU設備對象 else: device = torch.device('cpu') # CPU設備對象
    # 創建大張量,以消耗GPU顯存 tensors = []while True: for i in range(0, 9): tensors.append(torch.randn((10000, 10000)).to(device))        time.sleep(0.1 for i in range(len(tensors)): t = tensors.pop() del t torch.cuda.empty_cache() time.sleep(0.8)

    六、參考

    https://zhuanlan.zhihu.com/p/29947959

    https://zhuanlan.zhihu.com/p/641008472

    https://zhuanlan.zhihu.com/p/99880204

    https://zhuanlan.zhihu.com/p/660332533

    https://www./blog/1051680925189690

      本站是提供個人知識管理的網絡存儲空間,所有內容均由用戶發布,不代表本站觀點。請注意甄別內容中的聯系方式、誘導購買等信息,謹防詐騙。如發現有害或侵權內容,請點擊一鍵舉報。
      轉藏 分享 獻花(0

      0條評論

      發表

      請遵守用戶 評論公約

      類似文章 更多

      主站蜘蛛池模板: 国产AV无码专区亚洲AV紧身裤 | 好湿好爽好疼免费视频| 精品日韩亚洲AV无码| 成在线人视频免费视频| 国产福利社区一区二区| 亚洲国产一区二区三区亚瑟| 一本一道VS无码中文字幕| 漂亮人妻中文字幕丝袜| 后入内射国产一区二区| 精品乱码一区二区三四五区| 精品久久香蕉国产线看观看亚洲 | 成人国产精品日本在线观看| 日韩系列精品无码免费不卡| 一区二区三区鲁丝不卡| 中文字幕无码午夜场| 亚洲色大成网站WWW久久| 国产精品自产拍在线观看中文 | 久久精品国产亚洲精品2020| 中文字幕有码日韩精品| 免费吃奶摸下激烈视频青青网| 国产精品久久中文字幕| 久久亚洲国产精品成人AV秋霞| 国产熟睡乱子伦视频在线播放 | A级大胆欧美人体大胆666| 亚洲色成人一区二区三区| 无码日韩精品一区二区三区免费| 国产乱理伦片在线观看夜| 国产精品有码在线观看| 精品乱码无人区一区二区| 亚洲欧美日韩成人综合一区 | 67194熟妇在线观看线路| 亚洲VA欧美VA国产综合| 亚洲欧洲日产国无高清码图片| 农村熟女大胆露脸自拍| 最新国产精品久久精品| 欧美xxxx做受欧美.88| 熟女系列丰满熟妇AV| 色噜噜综合亚洲AV中文无码| 国产乱理伦片在线观看夜| 日韩av综合中文字幕| 国产V亚洲V天堂无码久久久 |