OpenAI創(chuàng)始大神Karpathy僅以1000行C代碼實(shí)現(xiàn)GPT

江海博覽 2024-04-11 發(fā)布于浙江

展開(kāi)全文

Karpathy重磅回歸：用千行C代碼訓(xùn)練GPT-2

經(jīng)過(guò)近一個(gè)月的沉寂，大神Andrej Karpathy，前特斯拉 Autopilot 負(fù)責(zé)人及 OpenAI 科學(xué)家，以一個(gè)令人矚目的新項(xiàng)目強(qiáng)勢(shì)回歸。他發(fā)布了一個(gè)名為“l(fā)lm.c”的新項(xiàng)目，僅用1000行純C語(yǔ)言就完成了GPT-2的訓(xùn)練，無(wú)需倚賴(lài)任何現(xiàn)成的深度學(xué)習(xí)框架。

OpenAI創(chuàng)始大神Karpathy僅以1000行C代碼實(shí)現(xiàn)GPT-2訓(xùn)練，還附教程

這一創(chuàng)舉不僅打破了常規(guī)，還挑戰(zhàn)了人們對(duì)大型語(yǔ)言模型訓(xùn)練的傳統(tǒng)認(rèn)知。Karpathy的這一嘗試，向我們展示了在不依賴(lài)于龐大的PyTorch（245MB）和cPython（107MB）庫(kù)的情況下，使用純C語(yǔ)言訓(xùn)練大型語(yǔ)言模型（LLM）的可能性。

“l(fā)lm.c”項(xiàng)目的特色在于它的極簡(jiǎn)和高效：約1000行的C代碼就能在CPU上訓(xùn)練出與PyTorch版本完全一致的GPT-2模型，且代碼可以立即編譯運(yùn)行，完全兼容PyTorch。Karpathy選擇GPT-2作為示例不是偶然，這一模型不僅是大型語(yǔ)言模型體系中的先驅(qū)，而且其模型權(quán)重也公開(kāi)可獲取。

此項(xiàng)目一經(jīng)發(fā)布，便迅速引發(fā)了廣泛關(guān)注，僅一天時(shí)間就獲得了7.9k星。Karpathy還貼心地提供了從PyTorch遷移到C的教程，進(jìn)一步降低了門(mén)檻，激發(fā)了編程社區(qū)的極大熱情。

精簡(jiǎn)高效：千行C代碼內(nèi)核探秘

Andrej Karpathy的項(xiàng)目“l(fā)lm.c”令人驚嘆于其用純C語(yǔ)言實(shí)現(xiàn)GPT-2的創(chuàng)舉。Karpathy展現(xiàn)了他對(duì)項(xiàng)目的遠(yuǎn)大規(guī)劃：不僅保持代碼簡(jiǎn)潔、易于維護(hù)，同時(shí)追求性能上能媲美PyTorch的高效率。

此外，他提出了直接使用CUDA實(shí)現(xiàn)訓(xùn)練過(guò)程，預(yù)計(jì)將大幅提升速度，以及在CPU版本中通過(guò)SIMD指令（如x86的AVX2和ARM的NEON）進(jìn)行加速，降低了對(duì)GPU的依賴(lài)。

Karpathy進(jìn)一步說(shuō)明，他選擇GPT-2作為起點(diǎn)，是因?yàn)槠淠Ｐ蜋?quán)重的可獲取性及其采用的堆棧式Transformer模型結(jié)構(gòu)。體現(xiàn)了他對(duì)大型語(yǔ)言模型（LLM）的深刻理解。

在技術(shù)實(shí)現(xiàn)上，Karpathy強(qiáng)調(diào)了在訓(xùn)練期間，通過(guò)動(dòng)態(tài)數(shù)據(jù)流動(dòng)在保持內(nèi)存占用不變的同時(shí)，手動(dòng)實(shí)現(xiàn)每個(gè)單獨(dú)層的前向和反向傳播的重要性。這種方式不僅確保了效率，也保證了項(xiàng)目的靈活性和可擴(kuò)展性。

此外，Karpathy還提供了一個(gè)入門(mén)教程，詳細(xì)介紹了如何實(shí)現(xiàn)GPT-2模型中的一個(gè)關(guān)鍵組成部分——LayerNorm層。這一小教程不僅為有志于深入理解和參與該項(xiàng)目的開(kāi)發(fā)者提供了實(shí)用指南，更為廣大編程愛(ài)好者展現(xiàn)了如何用C語(yǔ)言實(shí)現(xiàn)復(fù)雜模型的可能性。

Karpathy的這一項(xiàng)目，無(wú)疑為未來(lái)語(yǔ)言模型的發(fā)展開(kāi)辟了新的路徑，同時(shí)也為開(kāi)源社區(qū)貢獻(xiàn)了一份寶貴的學(xué)習(xí)資源。

目標(biāo)是高效純CUDA訓(xùn)練

Andrej Karpathy的“l(fā)lm.c”項(xiàng)目不僅展現(xiàn)了使用純C語(yǔ)言訓(xùn)練GPT-2的可能，更向我們揭示了通過(guò)CUDA進(jìn)一步加速訓(xùn)練過(guò)程的前景。

在項(xiàng)目開(kāi)發(fā)的早期階段，Karpathy采用了一種高效的內(nèi)存管理策略，即一次性預(yù)分配一大塊一維內(nèi)存來(lái)存儲(chǔ)訓(xùn)練過(guò)程中所需的所有數(shù)據(jù)。這種方法不僅簡(jiǎn)化了內(nèi)存管理，還確保了內(nèi)存使用量在整個(gè)訓(xùn)練過(guò)程中保持不變，優(yōu)化了數(shù)據(jù)處理效率。

在技術(shù)實(shí)現(xiàn)方面，Karpathy手動(dòng)編寫(xiě)代碼，實(shí)現(xiàn)了模型中每一層的數(shù)據(jù)前向傳播和后向傳播過(guò)程，并將這些層按順序連接起來(lái)。此外，還包括了多個(gè)關(guān)鍵組件的實(shí)現(xiàn)，如編碼器、矩陣乘法、自注意力機(jī)制、GELU激活函數(shù)、殘差連接、softmax函數(shù)和交叉熵?fù)p失計(jì)算等。Karpathy坦言，這一過(guò)程雖然乏味且痛苦，但確保了模型的準(zhǔn)確實(shí)現(xiàn)。

隨后，Karpathy透露了他下一步的計(jì)劃：逐層將模型遷移到CUDA上，以便提高效率。這一工作已經(jīng)部分完成，預(yù)計(jì)能在不依賴(lài)于復(fù)雜庫(kù)的情況下，達(dá)到接近PyTorch的速度。此外，Karpathy還計(jì)劃將計(jì)算精度從FP32降至FP16或更低，并添加新的層以支持更先進(jìn)的模型架構(gòu)，如Llama 2、Mistral、Gemma等。

Karpathy表示，一旦項(xiàng)目穩(wěn)定，他將發(fā)布關(guān)于從頭開(kāi)始用C語(yǔ)言編寫(xiě)大模型的視頻，為廣大編程和機(jī)器學(xué)習(xí)愛(ài)好者提供寶貴的學(xué)習(xí)資源。

LLM OS：構(gòu)建未來(lái)的大模型操作系統(tǒng)

Andrej Karpathy離開(kāi)OpenAI后，其個(gè)人項(xiàng)目的推進(jìn)備受業(yè)界關(guān)注。特別是，他再次提出的“大模型操作系統(tǒng)（LLM OS）”概念，引發(fā)了廣泛的討論和期待。在最近的訪談中，Karpathy再次談及了LLM OS，將其比喻為一個(gè)操作系統(tǒng)，這個(gè)系統(tǒng)將連接包括文本、圖像、音頻在內(nèi)的各種模態(tài)，以語(yǔ)言模型作為核心“CPU”，并與現(xiàn)有的Software 1.0基礎(chǔ)設(shè)施相連。

Karpathy的這一比喻深刻地揭示了LLM OS的核心理念：一個(gè)能夠整合不同信息模態(tài)、驅(qū)動(dòng)多領(lǐng)域應(yīng)用的統(tǒng)一平臺(tái)。他認(rèn)為，當(dāng)前AI發(fā)展的趨勢(shì)已經(jīng)非常明確，即構(gòu)建能夠適應(yīng)各個(gè)經(jīng)濟(jì)領(lǐng)域的大模型操作系統(tǒng)。這樣的操作系統(tǒng)不僅能夠促進(jìn)技術(shù)的快速發(fā)展，也將極大地推動(dòng)經(jīng)濟(jì)社會(huì)的轉(zhuǎn)型。

隨著Karpathy新項(xiàng)目的推出，他關(guān)于個(gè)人項(xiàng)目的設(shè)想似乎已經(jīng)逐步成形。他的貢獻(xiàn)讓我們看到了一個(gè)更加智能、互聯(lián)的未來(lái)，同時(shí)也證明了在AI這一快速發(fā)展的領(lǐng)域中，創(chuàng)新和教育同樣重要。

在AI界，有Karpathy如此富有創(chuàng)造力的又愿意從零教起的大神存在真是一大幸事！

如果你覺(jué)得這篇文章對(duì)你有所幫助，歡迎點(diǎn)贊、收藏以及轉(zhuǎn)發(fā)分享。同時(shí)，請(qǐng)關(guān)注我，以獲取更多關(guān)于人工智能的最新資訊和見(jiàn)解！

參考：

https://twitter.com/karpathy

https://github.com/karpathy/llm.c

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶(hù)發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買(mǎi)等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來(lái)自：江海博覽 > 《軟件》

舉報(bào)/認(rèn)領(lǐng)