![]() 導(dǎo)語:2025年7月23日,國際期刊《科學(xué)·機器人學(xué)》(Science Robotics)刊發(fā)了由約翰霍普金斯大學(xué)的研究團隊撰寫的綜述文章《你的下一位外科醫(yī)生會是機器人嗎?機器人手術(shù)中的自主性與人工智能》(Will your next surgeon be a robot? Autonomy and AI in robotic surgery)。文章系統(tǒng)回顧了機器人手術(shù)技術(shù)從早期遠(yuǎn)程操控到未來全自主系統(tǒng)的演進(jìn)路徑,深入剖析了限制當(dāng)前技術(shù)發(fā)展的瓶頸,并重點探討了以強化學(xué)習(xí)(RL)和模仿學(xué)習(xí)(IL)為代表的人工工智能技術(shù)如何推動手術(shù)機器人實現(xiàn)更高水平的自主性。研究者還前瞻性地提出了構(gòu)建“像人類外科醫(yī)生一樣學(xué)習(xí)”的通用“視覺-語言-行動”(VLA)大模型的構(gòu)想,以期最終實現(xiàn)超越人類頂尖專家的手術(shù)表現(xiàn)。啟元洞見編譯整理了其中的核心內(nèi)容,以供讀者學(xué)習(xí)和參考。 文末點擊“閱讀原文”,可獲取原文 一、引言:外科手術(shù)的挑戰(zhàn) 與自主機器人的興起 每年,僅在美國就有超過15萬名患者被診斷出患有結(jié)腸癌,而腹腔鏡結(jié)直腸切除術(shù)是其主要的治愈性療法。然而,手術(shù)的成功率因外科醫(yī)生的技能、經(jīng)驗和技術(shù)水平的差異而存在顯著不同,部分研究報告顯示并發(fā)癥率高達(dá)23%。盡管遠(yuǎn)程操控機器人手術(shù)技術(shù)已取得長足進(jìn)步,但其在降低吻合口漏等并發(fā)癥風(fēng)險方面并未表現(xiàn)出顯著優(yōu)勢。在這些挑戰(zhàn)面前,能夠自主執(zhí)行手術(shù)程序的機器人系統(tǒng)正引發(fā)越來越廣泛的關(guān)注。 自主機器人不僅有望在手術(shù)精度和一致性上超越最富經(jīng)驗的人類外科醫(yī)生,降低并發(fā)癥率,縮短患者等待時間,更有潛力將高質(zhì)量的外科醫(yī)療服務(wù)拓展至缺乏頂尖專家的偏遠(yuǎn)地區(qū)乃至外太空任務(wù)中,最終實現(xiàn)普惠醫(yī)療。本文旨在探索機器人手術(shù)技術(shù)的演進(jìn)歷程,分析當(dāng)前機器人學(xué)與人工智能領(lǐng)域的最新趨勢,并展望這些技術(shù)如何塑造能夠超越當(dāng)今遠(yuǎn)程操控機器人的下一代自主手術(shù)機器人。我們將重點關(guān)注兩種核心的人工智能實現(xiàn)路徑:基于模擬的強化學(xué)習(xí)與基于專家示范的模仿學(xué)習(xí)。 二、手術(shù)技術(shù)的演進(jìn): 從開放到無創(chuàng) 外科手術(shù)的歷史可追溯至公元前3000年,但直到19世紀(jì)麻醉和無菌技術(shù)的出現(xiàn),才真正迎來了范式革命。在過去60年里,手術(shù)方式經(jīng)歷了從大切口的開放手術(shù)到完全無創(chuàng)技術(shù)的演變。 開放手術(shù)(Open Surgery):通過大切口直接暴露器官進(jìn)行操作。腹腔鏡手術(shù)(Laparoscopic Surgery):利用微小切口,通過腹腔鏡和長器械進(jìn)行手術(shù),當(dāng)僅使用單一入口時,則為單孔手術(shù)(Single-port Surgery)。自然腔道內(nèi)鏡手術(shù)(NOTES):將入口置于自然腔道,完全避免體表切口,是微創(chuàng)化的極致追求。 然而,手術(shù)侵入性的降低急劇增加了對醫(yī)生技術(shù)的要求。現(xiàn)今的機器人輔助手術(shù)(RAS),如“達(dá)芬奇”系統(tǒng),正是為解決這些問題而生。其多自由度器械和三維高清視野推進(jìn)了醫(yī)生的操作靈活性與深度感知,已廣泛應(yīng)用于多個專科。僅2023年,達(dá)芬奇手術(shù)平臺就完成了超過220萬例手術(shù)。 盡管機器人輔助手術(shù)帶來了諸多優(yōu)勢,但當(dāng)前手術(shù)范式依舊完全依賴醫(yī)生的實時操控,手術(shù)結(jié)果仍然與醫(yī)生的個人能力直接相關(guān)。這正是發(fā)展自主手術(shù)機器人的核心驅(qū)動力——通過內(nèi)置的自主能力,提供不受人類個體差異影響的、專家級的穩(wěn)定手術(shù)表現(xiàn),從而根本性地提升手術(shù)的效率、安全性與一致性。 三、手術(shù)機器人 自主性水平(LoA)的分級 為了清晰地界定和評估手術(shù)機器人的自主能力,學(xué)界引入了“自主性水平”(Levels of Autonomy,LoA)的概念,通常分為六個等級(L-0至L-5)。我們可以結(jié)合“監(jiān)控(Monitor)”、“生成(Generate)”、“選擇(Select)”和“執(zhí)行(Execute)”這四項基本操作功能,來更精細(xì)地區(qū)分不同LoA下人與機器的角色。 (一)L-0:無自主性 (No Autonomy) 人類外科醫(yī)生全權(quán)負(fù)責(zé)監(jiān)控、生成、選擇和執(zhí)行所有手術(shù)步驟,不使用任何主動的機器人設(shè)備,即傳統(tǒng)的手術(shù)方式。 (二)L-1:機器人輔助 (Robot Assistance) 當(dāng)前主流機器人手術(shù)的水平,即人與機器人共同監(jiān)控手術(shù)場景(如系統(tǒng)提供震顫過濾),但手術(shù)計劃的生成、選擇和執(zhí)行仍完全由人類醫(yī)生控制。機器人僅作為醫(yī)生雙手的延伸,提供機械輔助以提升操作性能。 (三)L-2:任務(wù)自主性 (Task Autonomy) 機器人開始分擔(dān)部分低風(fēng)險任務(wù)的執(zhí)行。人類醫(yī)生選擇最終方案,但任務(wù)的監(jiān)控、生成和執(zhí)行可由人機共享。例如,MAKO機器人可根據(jù)醫(yī)生預(yù)設(shè)的方案,自主執(zhí)行骨科手術(shù)中的磨削或研究系統(tǒng)中的自主縫針抓取與插入。 (四)L-3:監(jiān)督式自主 (Supervised Autonomy) 機器人具備在沒有人類實時干預(yù)的情況下獨立完成特定任務(wù)的能力。人與機器人共同監(jiān)控和生成手術(shù)方案,但機器人可以初步選擇一個方案供人類確認(rèn)。其決定性特征是機器人能夠自主執(zhí)行一個子任務(wù),這標(biāo)志著責(zé)任的重大轉(zhuǎn)移。例如,智能組織自主機器人(STAR)能夠自主生成多個腸道吻合方案,并在醫(yī)生選定其一后,精準(zhǔn)地自主完成整個吻合過程。 (五)L-4:高水平自主 (High-level Autonomy) 手術(shù)方案的選擇和執(zhí)行權(quán)主要由機器人掌握。一旦程序啟動,機器人將主導(dǎo)決策過程,人類的干預(yù)被限制在監(jiān)控和緊急情況處理上。例如,CyberKnife放射外科系統(tǒng)可根據(jù)術(shù)前規(guī)劃自主完成對深部腫瘤的放射治療。目前,達(dá)到這一水平的臨床系統(tǒng)多為非侵入式或作用于剛性組織的手術(shù)。 (六)L-5:完全自主 (Full Autonomy) 手術(shù)自主性的終極形態(tài)目前尚未實現(xiàn),這是指機器人能夠獨立完成從監(jiān)控、規(guī)劃、決策到執(zhí)行的整個手術(shù)流程,甚至能處理各種意外情況,無需任何人類干預(yù)。 三、人工智能驅(qū)動的外科自主新范式 當(dāng)前,從傳統(tǒng)的有創(chuàng)手術(shù)向微創(chuàng)、無創(chuàng)演進(jìn)的過程中,由于技術(shù)挑戰(zhàn)的增加,手術(shù)系統(tǒng)的自主化水平并未同步提升,甚至有所下降(如圖1所示)。傳統(tǒng)基于模型的控制方法在處理軟組織的大范圍非線性形變、毫秒級的實時響應(yīng)需求方面已接近極限,亟需新的技術(shù)范式來打破僵局。 ![]() 圖1 知名手術(shù)機器人自主性 與其手術(shù)入路侵入性的關(guān)系趨勢圖 *橫軸代表手術(shù)侵入性(從開放到無創(chuàng)),縱軸代表機器人自主性。總體趨勢顯示,隨著侵入性降低,對機器人解決方案的需求增加,但系統(tǒng)的自主能力并未相應(yīng)實現(xiàn)。右上象限(高自主性、低侵入性)的空白區(qū)域揭示了當(dāng)前的技術(shù)瓶頸。 人工智能,特別是強化學(xué)習(xí)和模仿學(xué)習(xí),為解決這些挑戰(zhàn)提供了充滿希望的新路徑。這些基于學(xué)習(xí)的方法能夠讓機器人直接從模擬環(huán)境的交互或人類專家的演示中學(xué)習(xí),從而有望引領(lǐng)手術(shù)機器人自主能力的下一次飛躍。 (一)強化學(xué)習(xí)(Reinforcement Learning,RL):在模擬中探索最優(yōu)策略 強化學(xué)習(xí)是一個機器學(xué)習(xí)框架,機器人(智能體)通過與環(huán)境的互動來學(xué)習(xí)行為策略。其核心要素包括:狀態(tài)(State)、動作(Action)、獎勵(Reward)和策略(Policy)。通過最大化累積獎勵,智能體可以學(xué)習(xí)到完成特定任務(wù)的最優(yōu)策略。 1.手術(shù)模擬器 由于無法在真實患者身上進(jìn)行隨機探索的,強化學(xué)習(xí)的訓(xùn)練嚴(yán)重依賴于高度逼真的手術(shù)模擬器。dVRL、Surgical Gym、SurRoL等平臺為開發(fā)自主手術(shù)算法提供了安全的虛擬環(huán)境,它們能夠模擬組織形變、器械交互等,并以遠(yuǎn)超真實世界的時間效率生成海量訓(xùn)練數(shù)據(jù)。 2.核心挑戰(zhàn):“從模擬到現(xiàn)實”的鴻溝 (Sim-to-Real Gap) 無論模擬器多么逼真,都無法完全復(fù)現(xiàn)真實世界復(fù)雜的物理動態(tài)(如組織彈性、血液流動)和視覺特性(如反光、煙霧)。這導(dǎo)致在模擬環(huán)境中表現(xiàn)優(yōu)異的策略,移植到真實機器人上時往往會失效。但研究者正通過領(lǐng)域自適應(yīng)、領(lǐng)域隨機化等技術(shù)來彌合這一鴻溝。 (二)模仿學(xué)習(xí)(Imitation Learning,IL):向人類專家看齊 在模仿學(xué)習(xí)中,機器人通過學(xué)習(xí)一個包含人類專家操作的龐大數(shù)據(jù)集(如手術(shù)視頻和對應(yīng)的器械運動軌跡)來復(fù)現(xiàn)專家的行為。 1.核心優(yōu)勢 模仿學(xué)習(xí)可以直接利用專家的智慧,通常能繞過對高精度物理模擬器的需求,從而避免了“從模擬到現(xiàn)實”難題。其訓(xùn)練過程相對簡單高效,學(xué)習(xí)到的策略通常具有較高的初始安全性和有效性。 2.核心挑戰(zhàn):“數(shù)據(jù)收集”的鴻溝 (Data Collection Gap) 其成功依賴于大規(guī)模、高質(zhì)量的專家演示數(shù)據(jù)集。然而,在真實手術(shù)中獲取精確的器械運動學(xué)數(shù)據(jù)(kinematics)極為困難。一方面涉及商業(yè)系統(tǒng)的技術(shù)壁壘和法規(guī)限制;另一方面,現(xiàn)有機器人(如dVRK研究套件)的運動學(xué)數(shù)據(jù)本身就存在誤差。此外,模仿學(xué)習(xí)到的策略受限于訓(xùn)練數(shù)據(jù)的覆蓋范圍,難以泛化到未見過的情景,且有可能會復(fù)制人類專家的次優(yōu)或錯誤操作。 (三)兩種方法的比較與融合 強化學(xué)習(xí)依賴模擬器,潛力巨大(可發(fā)現(xiàn)超越人類的策略),但面臨著“從模擬到現(xiàn)實”鴻溝和探索過程的安全性問題。模仿學(xué)習(xí)依賴專家數(shù)據(jù),初始部署更安全、直接,但受限于數(shù)據(jù)質(zhì)量和覆蓋范圍,泛化能力是其瓶頸。 一個極具前景的方向是將二者結(jié)合。例如,可以先用模仿學(xué)習(xí)從專家數(shù)據(jù)中初始化一個可靠的基線策略,然后在安全的模擬環(huán)境中或在嚴(yán)格監(jiān)督下,用強化學(xué)習(xí)對該策略進(jìn)行進(jìn)一步的探索和優(yōu)化。這種“取長補短”的混合方法有望在保證安全性的同時,提升策略的性能和適應(yīng)性。 四、未來展望: 構(gòu)建通用人工智能外科醫(yī)生 當(dāng)前機器人學(xué)習(xí)的主要范式是針對特定任務(wù)(如縫合、打結(jié))進(jìn)行模型訓(xùn)練。然而,近年來人工智能領(lǐng)域的一大趨勢是朝著高容量的通用模型發(fā)展,這些模型在海量、多樣化的數(shù)據(jù)上訓(xùn)練后,展現(xiàn)出驚人的泛化能力和對新環(huán)境強大的適應(yīng)能力。對于手術(shù)機器人而言,這意味著我們需要從“專才”模型轉(zhuǎn)向“通才”模型。本文提出了一個構(gòu)建“人工智能外科醫(yī)生”的宏偉藍(lán)圖,其核心是模仿人類醫(yī)生的成長路徑(如圖2所示),構(gòu)建一個專為手術(shù)領(lǐng)域設(shè)計的“視覺-語言-行動”(Vision-Language-Action,VLA)模型。 ![]() 圖2 人工智能外科醫(yī)生的學(xué)習(xí)路徑示意圖 *該模型首先通過使用與人類醫(yī)生相同的醫(yī)學(xué)教科書學(xué)習(xí)解剖學(xué)等知識,建立語言基礎(chǔ)(類似醫(yī)學(xué)院和規(guī)培階段)。然后,通過模仿學(xué)習(xí)觀摩技能訓(xùn)練、動物手術(shù)和真實人類手術(shù)的數(shù)據(jù),掌握操作技能。最后,通過與環(huán)境的持續(xù)交互不斷積累經(jīng)驗,實現(xiàn)自我完善。 學(xué)習(xí)路徑規(guī)劃如下: 1.構(gòu)建語言基礎(chǔ)。首先,利用“下一詞元預(yù)測”(Next-token Prediction)和“指令微調(diào)”(Instruct-Tuning)等技術(shù),在涵蓋從醫(yī)學(xué)預(yù)科到外科專科考試的所有醫(yī)學(xué)文本、圖像和圖譜上訓(xùn)練一個基礎(chǔ)語言模型。這個模型將擁有深厚的包含外科學(xué)在內(nèi)的醫(yī)學(xué)知識,能夠理解復(fù)雜的醫(yī)學(xué)術(shù)語和手術(shù)指令。 2.通過模仿學(xué)習(xí)掌握技能。將上述具備醫(yī)學(xué)知識的基礎(chǔ)模型,進(jìn)一步在多模態(tài)手術(shù)數(shù)據(jù)集上進(jìn)行訓(xùn)練。這些數(shù)據(jù)包括手術(shù)技能訓(xùn)練(如縫合墊操作)、動物實驗手術(shù)以及最終的人類手術(shù)錄像,并配有對應(yīng)的器械運動學(xué)數(shù)據(jù)。通過模仿學(xué)習(xí),VLA模型將視覺感知(看到了什么)、語言理解(指令是什么)和機器人動作(應(yīng)該怎么做)端到端地聯(lián)系起來。 3.通過經(jīng)驗持續(xù)改進(jìn)。在模型具備初步能力后,可以通過強化學(xué)習(xí),在與環(huán)境的持續(xù)互動中不斷優(yōu)化其策略,實現(xiàn)能力的螺旋式上升。 五、現(xiàn)實挑戰(zhàn): 安全性、法規(guī)與數(shù)據(jù)獲取 盡管前景廣闊,但將人工智能驅(qū)動的自主手術(shù)機器人推向臨床應(yīng)用仍面臨重重障礙。 1.可衡量的安全性 人工智能外科醫(yī)生必須具備對其局限性的自我認(rèn)知。當(dāng)遇到訓(xùn)練數(shù)據(jù)中未覆蓋或不確定的情況時,它必須能夠安全地將控制權(quán)交還給人類醫(yī)生。諸如“保守Q學(xué)習(xí)”(Conservative Q-learning, CQL)和“保形預(yù)測”(Conformal Prediction)等技術(shù),可以幫助模型在決策時保持“謙遜”,避免在不熟悉的領(lǐng)域做出高風(fēng)險的冒進(jìn)行為。此外,對抗性攻擊的魯棒性也是確保人工智能模型在感知層面不受惡意干擾的關(guān)鍵。 2.監(jiān)管審批的角色 人工智能在手術(shù)中從輔助決策轉(zhuǎn)向執(zhí)行決策的情形,對監(jiān)管提出了新要求。美國食品藥品監(jiān)督管理局(FDA)已開始采用“全產(chǎn)品生命周期”的監(jiān)管方法,要求人工智能醫(yī)療設(shè)備在整個使用壽命期間都必須符合標(biāo)準(zhǔn),并引入“預(yù)定變更控制計劃”以管理模型的持續(xù)更新。透明度、公平性和嚴(yán)格的上市后監(jiān)督,將是未來人工智能手術(shù)系統(tǒng)獲得批準(zhǔn)的基石。 3.手術(shù)數(shù)據(jù)的獲取 構(gòu)建通用人工智能外科醫(yī)生最大的瓶頸仍然是較難獲取大規(guī)模、高質(zhì)量、多模態(tài)的標(biāo)注手術(shù)數(shù)據(jù)集。同步的、高精度的運動學(xué)數(shù)據(jù)和專家標(biāo)注極為稀缺,這需要學(xué)術(shù)界、產(chǎn)業(yè)界和醫(yī)療機構(gòu)之間建立開放、協(xié)作的數(shù)據(jù)共享生態(tài),才能為訓(xùn)練強大的手術(shù)VLA模型提供必要的“養(yǎng)料”。 六、結(jié)論 人工智能與機器人技術(shù)正引領(lǐng)外科手術(shù)走向一個全新的自主時代,它有潛力徹底改變醫(yī)療服務(wù)的提供方式,提升手術(shù)質(zhì)量并擴大優(yōu)質(zhì)醫(yī)療資源的可及性。盡管強化學(xué)習(xí)和模仿學(xué)習(xí)兩種路徑都面臨著各自的挑戰(zhàn),但它們的結(jié)合以及向通用VLA大模型的演進(jìn),為我們指明了一條通往未來的清晰道路。這條道路并非坦途,它要求我們在技術(shù)創(chuàng)新的同時,必須解決好數(shù)據(jù)、安全和監(jiān)管等一系列現(xiàn)實問題。未來的手術(shù)機器人不僅需要高超的技藝,更需要懂得何時“放手”的智慧。在技術(shù)創(chuàng)新與患者安全之間取得審慎的平衡,將是確保自主手術(shù)機器人最終能夠改善全球患者預(yù)后、促進(jìn)人類健康福祉的關(guān)鍵所在。 (本文內(nèi)容系“啟元洞見”公眾號原創(chuàng)編譯,轉(zhuǎn)載時請務(wù)必標(biāo)明來源及作者) 參考來源:Scinece Robotics 參考標(biāo)題:Will your next surgeon be a robot? Autonomy and AI in robotic surgery 參考鏈接:https://www./doi/10.1126/scirobotics.adt0187 |
|