OpenAvatarChat 是全球首個(gè)全流程開(kāi)源的 AI 驅(qū)動(dòng)虛擬化身平臺(tái),無(wú)需昂貴設(shè)備,在普通 PC 上即可生成高度自定義的 3D 數(shù)字人,賦予其實(shí)時(shí)對(duì)話(huà)、表情動(dòng)作同步、多場(chǎng)景任務(wù)處理能力,打造真正 “會(huì)思考、能互動(dòng)” 的數(shù)字分身。 為什么它能顛覆傳統(tǒng)虛擬形象?1. 輕量化架構(gòu):人人都能擁有 AI 分身- 單設(shè)備運(yùn)行:無(wú)需 VR / 高端顯卡,i9 級(jí) CPU + 中端 GPU(如 RTX 4060)** 即可流暢運(yùn)行,數(shù)字人推理僅需 CPU(實(shí)測(cè) i9-13980HX 達(dá) 30FPS)。
- 模型靈活選:支持未量化模型(20GB 顯存)和int4 量化版本(10GB 顯存),甚至可對(duì)接云端 LLM API(如文心一言),低配電腦也能玩。
2. 多模態(tài)交互:你的分身會(huì) “看、聽(tīng)、說(shuō)”- 全流程自研:集成ASR 語(yǔ)音識(shí)別(SenseVoice)+ LLM 對(duì)話(huà)(MiniCPM-o)+ TTS 語(yǔ)音合成(CosyVoice),實(shí)現(xiàn) “說(shuō)話(huà) - 思考 - 回應(yīng)”閉環(huán),延遲僅2.2 秒 (4090 顯卡實(shí)測(cè))。
- 表情動(dòng)作同步:通過(guò)攝像頭捕捉微表情,或根據(jù)對(duì)話(huà)內(nèi)容自動(dòng)生成眨眼、手勢(shì),如說(shuō) “開(kāi)心” 時(shí)會(huì)揮手歡呼,告別靜態(tài)文字聊天。
3. 模塊化開(kāi)發(fā):人人都是 AI 造物主- 插件化架構(gòu):支持自定義 AI 功能模塊(如客服、導(dǎo)游),通過(guò) Python 接口或可視化編輯器,非技術(shù)人員也能為分身添加 “專(zhuān)屬技能”,比如設(shè)定 “每天提醒健身”。
- 多模式切換:提供本地 LLM(離線(xiàn)私有)和云端 API(低成本)兩種模式,滿(mǎn)足隱私保護(hù)和輕量化需求,架構(gòu)圖如下:
4. 即開(kāi)即用:5 分鐘創(chuàng)建專(zhuān)屬分身- 一鍵部署:支持Docker 容器化啟動(dòng),執(zhí)行build_and_run.sh即可自動(dòng)構(gòu)建環(huán)境,無(wú)需復(fù)雜配置。
- 模型自動(dòng)下載:提供腳本一鍵獲取MiniCPM-o-2.6等模型,默認(rèn)路徑規(guī)范,新手也能快速上手。
立即體驗(yàn)三大場(chǎng)景▍虛擬社交 創(chuàng)建個(gè)性化形象,在虛擬房間與好友實(shí)時(shí)互動(dòng),分身會(huì)根據(jù)對(duì)話(huà)內(nèi)容自動(dòng)生成表情動(dòng)作,支持語(yǔ)音 / 文字雙輸入,社交體驗(yàn)遠(yuǎn)超傳統(tǒng) IM。 ▍商業(yè)服務(wù) 化身24 小時(shí)在線(xiàn)客服,通過(guò)網(wǎng)頁(yè)嵌入實(shí)現(xiàn) “虛擬接待員” 功能,支持多輪對(duì)話(huà)和任務(wù)處理(如訂單查詢(xún)、行程規(guī)劃)。 ▍創(chuàng)意開(kāi)發(fā) 開(kāi)發(fā)者可基于開(kāi)源代碼擴(kuò)展教育輔導(dǎo)、游戲 NPC、心理陪伴等場(chǎng)景,社區(qū)已提供Sample Data模板,未來(lái)將開(kāi)放模型市場(chǎng)。 數(shù)據(jù)背后的實(shí)力- 延遲優(yōu)化:語(yǔ)音結(jié)束到分身回應(yīng)僅2.2 秒,含 RTC 傳輸、VAD 判停和全流程計(jì)算。
- 兼容性:支持Windows/Linux,網(wǎng)頁(yè)端兼容 PC / 手機(jī),未來(lái)將適配 VR 設(shè)備。
- 生態(tài)活躍:核心組件均為明星開(kāi)源項(xiàng)目(如 gradio-webrtc、silero-vad),文檔齊全易擴(kuò)展。
項(xiàng)目地址: GitHub.com/HumanAIGC-Engineering/OpenAvatarChat
|