12個(gè)國產(chǎn)大模型大戰(zhàn)高考數(shù)學(xué)，意外炸出個(gè)大bug

123xyz123 2024-06-08 發(fā)布于湖南

展開全文

金磊發(fā)自凹非寺

繼國產(chǎn)大模型挑戰(zhàn)高考作文之后，是時(shí)候再戰(zhàn)一下高考數(shù)學(xué)了。

數(shù)學(xué)高考Ⅰ卷的題目，目前已經(jīng)陸陸續(xù)續(xù)在網(wǎng)上有所公布（圖片格式）。

12個(gè)國產(chǎn)大模型大戰(zhàn)高考數(shù)學(xué)，意外炸出個(gè)大bug

那么現(xiàn)在，是時(shí)候考驗(yàn)國產(chǎn)大模型們的數(shù)學(xué)能力了。

有請(qǐng)“選手們”登場——

Kimi、通義千問、文心一言、豆包、智譜清言、百小應(yīng)、訊飛星火、商量、騰訊元寶、天工、海螺AI、萬知。

國產(chǎn)大模型 vs 高考數(shù)學(xué)選擇題

根據(jù)數(shù)學(xué)題目類型的不同，我們先來小試牛刀一下選擇題。

測評(píng)的方式是將題目（圖片格式）“喂”給國產(chǎn)大模型們，要求它們給出相應(yīng)題目的答案：

查看題目，給出第1題到第8題的答案。

接下來，我們就來一同看下國產(chǎn)大模型們的表現(xiàn)。

Kimi

通義千問

豆包

智譜清言

百小應(yīng)

訊飛星火

商量

騰訊元寶

海螺AI

萬知

不難看出，很多國產(chǎn)大模型還未做數(shù)學(xué)題，先敗在了AI識(shí)圖這個(gè)步驟，無法生成答案。

（PS：有幾位選手測試時(shí)因?yàn)闊o法識(shí)別，未能完成答題，因此沒有放出結(jié)果。）

那么我們最后來看下“踢館選手”——GPT-4o。

國產(chǎn)大模型 vs 數(shù)學(xué)大題

鑒于一些國產(chǎn)大模型AI識(shí)圖有點(diǎn)困難，我們這次直接先把這次高考的大題題目文字給copy出來，再讓它們作答：

設(shè)n為正整數(shù)，數(shù)列 ( a1, a_2, \cdots, a{4m+2} ) 是公差不為0的等差數(shù)列。若從中抽去項(xiàng) ( ai ) 和 ( a_j ) (i < j) 后剩余的 ( 4m ) 項(xiàng)可被平均分為 m 組，且每組的 4 個(gè)數(shù)都能構(gòu)成等差數(shù)列，則稱數(shù)列 ( a_1, a_2, \cdots, a{4m+2} ) 是 (i, j) - 可分?jǐn)?shù)列。
(1) 寫出所有的 (i, j) (1 ≤ i < j ≤ 6)，使得數(shù)列 ( a_1, a_2, a_3, a_4, a_5, a_6 ) 是 (i, j) - 可分?jǐn)?shù)列；
(2) 當(dāng) ( m = 3 ) 時(shí)，證明：數(shù)列 ( a1, a_2, \cdots, a{13} ) 是 (2, 13) - 可分?jǐn)?shù)列；
(3) 設(shè) ( a1, a_2, \cdots, a{4m+2} ) 是 (i, j) - 可分?jǐn)?shù)列。記數(shù)列 ( a1, a_2, \cdots, a{4m+2} ) 中任取兩個(gè)數(shù)和 i (i < j)，則數(shù)列是 (i, j) - 可分?jǐn)?shù)列的概率為 ( p_n )，證明：( p_n \geq \frac{1}{8} )。

接下來，我們?cè)賮砜聪聡a(chǎn)大模型們的表現(xiàn)。

Kimi

通義千問

文心一言

豆包

智譜清言

百小應(yīng)

訊飛星火

商量

騰訊元寶

天工

海螺AI

萬知

最后，還是有請(qǐng)“踢館選手”——GPT-4o。

那么，你覺得國產(chǎn)大模型們，識(shí)圖+解數(shù)學(xué)題，哪家比較好一點(diǎn)呢？

最后，關(guān)于AI智能助手，這里也有一份最新用戶數(shù)據(jù)分析報(bào)告供你參考：
https://mp.weixin.qq.com/s/sYxbvown5qLBnEs7zIR6Bg

— 完 —

量子位 QbitAI · 頭條號(hào)簽約

關(guān)注我們，第一時(shí)間獲知前沿科技動(dòng)態(tài)

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自： 123xyz123 > 《其他》

舉報(bào)/認(rèn)領(lǐng)