大數據文摘授權轉載自夕小瑤科技說
作者 | 王二狗
谷歌DeepMind 最新AI研究突破登上了《Nature》!
這篇《Solving olympiad geometry without human demonstrations》研究論文提出了AI系統 AlphaGeometry,能夠以接近人類奧林匹克金牌得主的水平解決奧林匹克幾何問題。
這是在邁向更先進和通用的人工智能系統的道路上發展深度數學推理的一個重要里程碑。

在對 30 道奧數幾何題的基準測試中,AlphaGeometry 在標準奧數時限內成功解決了 25 道,正確率高達83%。相比之下,之前最先進的AI系統僅解決了 10道,而人類金牌得主平均解決了 25.9 個問題。
另外值得一提的是,AlphaGeometry 在人類專家評估下解決了 2000 年和 2015 年奧林匹克競賽中的所有幾何問題,且與許多先前的方法不同,AlphaGeometry 生成的證明可讀性很強。

谷歌DeepMind CEO 哈薩比斯對AlphaGeometry 團隊取得的成就表示祝賀:

神經語言模型+符號推演引擎
AlphaGeometry 是一個由神經語言模型和符號推演引擎兩個部分組成的神經符號系統,二者一起解決復雜幾何定理的證明。類似于“思考,快和慢”的理念,一個系統提供快速、直觀的想法,而另一個系統則提供更加深思熟慮、理性的決策。這其中:
而二者的結合能夠揚長避短,AlphaGeometry系統中的語言模型引導符號推導引擎尋找幾何問題的可能解決方案。
奧林匹克幾何問題基于圖表,需要添加如點、線或圓新的幾何結構才能解決。AlphaGeometry 的語言模型可以從無數種可能性中預測添加哪些新結構最有用。這些線索有助于填補空白,并允許符號引擎對圖表進行進一步推論并接近解決方案。
比如讓AlphaGeometry 解決一個簡單的問題:給定問題圖及其定理前提(左),AlphaGeometry(中)首先使用符號引擎推導有關圖的新陳述,直到找到解決方案或用盡新陳述。如果找不到解決方案,AlphaGeometry 的語言模型會添加一種可能有用的構造(藍色),為符號引擎開辟新的推導路徑。這個過程一直循環持續,直到找到解決方案為止(右)。

僅接受合成數據的訓練(1 億個)
由于缺乏推理技能和訓練數據,AI系統經常難以解決幾何和數學中的復雜問題。AlphaGeometry 的系統將神經語言模型的預測能力與規則約束演繹引擎相結合,協同工作來尋找解決方案。
谷歌DeepMind 開發了一種“符號推演與回溯”方法生成了 1 億個合成訓練數據,打破了數據瓶頸,成功地在沒有任何人類演示的情況下訓練出來了 AlphaGeometry。
谷歌的“符號推演與回溯”合成數據生成方法使用高度并行計算,系統首先生成十億個幾何對象的隨機圖,并詳盡地推導出每個圖中點和線之間的所有關系。AlphaGeometry 找到了每個圖表中包含的所有證明,然后向后回溯工作找出需要的附加構造來得出這些證明。

AGI數學推理的一個重要里程碑
AlphaGeometry展示了人工智能不斷增長的邏輯推理能力以及發現和驗證新知識的能力。
網友們紛紛表示祝賀:


谷歌DeepMind表示:
解決奧林匹克級別的幾何問題是在邁向更先進和通用的人工智能系統的道路上發展深度數學推理的一個重要里程碑。
我們決定開源 AlphaGeometry 代碼和模型,并希望與合成數據生成和訓練中的其他工具和方法一起,幫助在數學、科學和人工智能領域開辟新的可能性。
菲爾茲獎得主和IMO金牌獲得者NG? B?O CH?U表示:
現在我知道了為何AI領域的研究人員會首先嘗試解決 IMO 幾何問題,因為這里尋找的解決方案有點像國際象棋,系統在每一步中的合理動作數量都相當少。但我仍然對谷歌DeepMind 這項工作感到驚訝,這是一項令人印象深刻的成就。