繼國產(chǎn)大模型挑戰(zhàn)高考作文之后,是時(shí)候再戰(zhàn)一下高考數(shù)學(xué)了。 數(shù)學(xué)高考Ⅰ卷的題目,目前已經(jīng)陸陸續(xù)續(xù)在網(wǎng)上有所公布(圖片格式)。 ![]() 那么現(xiàn)在,是時(shí)候考驗(yàn)國產(chǎn)大模型們的數(shù)學(xué)能力了。 有請(qǐng)“選手們”登場—— Kimi、通義千問、文心一言、豆包、智譜清言、百小應(yīng)、訊飛星火、商量、騰訊元寶、天工、海螺AI、萬知。 ![]() 國產(chǎn)大模型 vs 高考數(shù)學(xué)選擇題根據(jù)數(shù)學(xué)題目類型的不同,我們先來小試牛刀一下選擇題。 測評(píng)的方式是將題目(圖片格式)“喂”給國產(chǎn)大模型們,要求它們給出相應(yīng)題目的答案:
接下來,我們就來一同看下國產(chǎn)大模型們的表現(xiàn)。 Kimi ![]() 通義千問 ![]() 豆包 ![]() 智譜清言 ![]() 百小應(yīng) ![]() 訊飛星火 ![]() 商量 ![]() 騰訊元寶 ![]() 海螺AI ![]() 萬知 ![]() 不難看出,很多國產(chǎn)大模型還未做數(shù)學(xué)題,先敗在了AI識(shí)圖這個(gè)步驟,無法生成答案。 (PS:有幾位選手測試時(shí)因?yàn)闊o法識(shí)別,未能完成答題,因此沒有放出結(jié)果。) 那么我們最后來看下“踢館選手”——GPT-4o。 ![]() 國產(chǎn)大模型 vs 數(shù)學(xué)大題鑒于一些國產(chǎn)大模型AI識(shí)圖有點(diǎn)困難,我們這次直接先把這次高考的大題題目文字給copy出來,再讓它們作答:
![]() 接下來,我們?cè)賮砜聪聡a(chǎn)大模型們的表現(xiàn)。 Kimi ![]() 通義千問 ![]() 文心一言 ![]() 豆包 ![]() 智譜清言 ![]() 百小應(yīng) ![]() 訊飛星火 ![]() 商量 ![]() 騰訊元寶 ![]() 天工 ![]() 海螺AI ![]() 萬知 ![]() 最后,還是有請(qǐng)“踢館選手”——GPT-4o。 ![]() 那么,你覺得國產(chǎn)大模型們,識(shí)圖+解數(shù)學(xué)題,哪家比較好一點(diǎn)呢? 最后,關(guān)于AI智能助手,這里也有一份最新用戶數(shù)據(jù)分析報(bào)告供你參考: — 完 — 量子位 QbitAI · 頭條號(hào)簽約 關(guān)注我們,第一時(shí)間獲知前沿科技動(dòng)態(tài) |
|