<var id="16116"><output id="16116"><dfn id="16116"></dfn></output></var>

<delect id="16116"><bdo id="16116"><kbd id="16116"></kbd></bdo></delect>

<input id="16116"></input>

熱門
資訊
科技

大意外！高考數(shù)學(xué)輪戰(zhàn)大模型，結(jié)果完全想不到_環(huán)球觀察

發(fā)布時(shí)間：2023-06-08 20:02:08 | 來源：量子位

聽說網(wǎng)友被 ChatGPT 氣炸了！

昨個(gè)兒高考數(shù)學(xué)剛結(jié)束，有網(wǎng)友就坐不住了，趕緊找來了新高考數(shù)學(xué)一卷的部分題喂給了 AI 同學(xué)。

結(jié)果卻讓人大跌眼鏡（8> √ 9 × 3=3 √ 3？）：

(相關(guān)資料圖)

有網(wǎng)友表示：

ChatGPT4 能把自己氣炸，怎么教都不會(huì)

△圖源博主 @浪豬灰頭

所以大模型之前表現(xiàn)數(shù)學(xué)推理能力好，都是在?；ㄕ?？它只是記住了問題的答案？

先別著急下定論，給 AI 同學(xué)一個(gè)證明自己的機(jī)會(huì)吧。

我們用 ChatGPT（GPT-3.5）、GPT-4、百度文心一言、阿里通義千問、科大訊飛星火認(rèn)知大模型這幾位 " 數(shù)學(xué)高手 " 進(jìn)行了測(cè)試。（最近出現(xiàn)了太多的大模型，實(shí)在測(cè)不完，還有比如 Bard 不支持中文等原因，所以我們先選擇了上述幾個(gè)模型）

整體表現(xiàn)如上圖，目前大模型在做高考數(shù)學(xué)題方面還是個(gè) " 差生 "。

一起來看下具體結(jié)果是怎樣令人哭笑不得的。

五大模型能否做對(duì)填空題？

先來點(diǎn)填空題當(dāng) " 開胃小菜 "。

公平起見，我們使用同樣的格式進(jìn)行提問。

某學(xué)校開設(shè)了 4 門體育類選修課和 4 門藝術(shù)類選修課，學(xué)生需從這 8 門課中選修 2 門或 3 門課，并且每類選修課至少選修 1 門，則不同的選課方案共有？種

答案：64

GPT-4（正確）

ChatGPT （錯(cuò)誤）文心一言（錯(cuò)誤）不應(yīng)該是兩種方案數(shù)加起來嗎？已經(jīng)逐漸離譜。

通義千問（錯(cuò)誤）

第一種選課方案里的 " 都不選 " 是個(gè)什么鬼！

訊飛星火（錯(cuò)誤）

出師不利，只有 GPT-4 給出了正確答案，填空題對(duì)于大模型來說也很有難度？

但是看起來這幾位 AI 同學(xué)都知道分情況來計(jì)算，也許只是恰巧這道題做錯(cuò)了？我們接著往下看。

在正四棱臺(tái) ABCD-A1B1C1D1 中，AB=2，A1B1=1，AA1= √ 2, 則該棱臺(tái)的體積為

答案：7 √ 6/6

GPT-4 （錯(cuò)誤）

ChatGPT（無解）這一題直接全軍覆滅，ChatGPT 更是直接沒解出來，還讓檢查是不是題出錯(cuò)了?！揪让?p>答案越來越離譜了，還真就不信邪了。

再來！

已知函數(shù) f ( x ) = cos ω x -1 ( ω >0 ) 在區(qū)間 [ 0,2 π ] 有且僅有 3 個(gè)零點(diǎn) , 則 ω 的取值范圍是？

答案： [ 2,3 )

GPT-4（錯(cuò)誤）

ChatGPT（錯(cuò)誤）訊飛星火（正確）本已經(jīng)抱著再一次全軍覆沒的心情了，沒想到中文大模型力挽狂瀾！

做大題表現(xiàn)如何？

玩膩了填空題，再來挑戰(zhàn)一下更有難度的大題吧！

公平起見，我們還是以同樣的格式進(jìn)行提問：

請(qǐng)你做一下面這道數(shù)學(xué)題：已知在△ ABC 中，A+B=3C，2sin ( A-C ) =sinB。（1）求 sinA （2）設(shè) AB=5，求 AB 邊上的高

答案：（1）10 √ 10 /3（2）6

下面是各個(gè)大模型的表現(xiàn)結(jié)果：

訊飛星火（第一問答案正確，第二問錯(cuò)誤）這道三角函數(shù)題，科大訊飛的星火認(rèn)知大模型第一小問答案對(duì)了，但是步驟中有差錯(cuò)（第二步）。

據(jù)說，GPT-4 做這種題只有 0.1% 的概率生成的結(jié)果完全正確。

高考數(shù)學(xué)第一道大題通常都比較簡(jiǎn)單，上面這幾位 AI 同學(xué)的表現(xiàn)你覺得怎么樣？

如果大家感興趣可以自己測(cè)試一下后面幾道難度相對(duì)較高的大題（小編試過了，結(jié)果一言難盡，不忍直視）。

或者大家可以使用不同的 prompt 試試捏～

參考鏈接：

[ 1 ] https://weibo.com/5647310207/N4frlb5tx?refer_flag=1001030103_

關(guān)鍵詞：

推薦閱讀

九八策略：股票實(shí)盤杠桿平臺(tái)丨國(guó)際油價(jià)企穩(wěn)難挽主題基金頹勢(shì)年內(nèi)收益全部為負(fù)

發(fā)布于 2023-06-06 15:04:21

2023臥室投影儀怎么選？三千元推薦當(dāng)貝D5X Pro、堅(jiān)果N1

發(fā)布于 2023-06-06 10:21:19

多位分頻機(jī)軟件對(duì)剪輯規(guī)則的干貨分享

發(fā)布于 2023-05-22 17:04:38

六云多剪儀軟件剪輯抓不住重點(diǎn)？那是你不知道這7個(gè)技巧

發(fā)布于 2023-05-13 21:17:18

回音秒剪儀軟件對(duì)于做好視頻的干貨分享

發(fā)布于 2023-05-12 17:58:09

好用的回音秒剪儀軟件滿滿干貨分享get

發(fā)布于 2023-05-12 16:48:09

從無到有，中國(guó)資本市場(chǎng)成為全球第二大股票債券市場(chǎng)只花了30年

發(fā)布于 2023-04-25 13:00:44

INSEC WORLD世界信息安全大會(huì)移師西安，倒計(jì)時(shí)一個(gè)月！

發(fā)布于 2023-02-24 17:20:50

什么是軟文？軟文推廣平臺(tái)有哪些？

發(fā)布于 2022-12-26 11:14:57

軟文推廣要這樣刷“存在感”，才能讓潛在用戶“無處可逃”

發(fā)布于 2022-12-13 10:42:13

獨(dú)家推薦

新聞排行

女子不滿意雙眼皮手術(shù)要求槍斃醫(yī)生，如何看待“網(wǎng)友判案，死刑起步”？

聚焦IPO | 大普技術(shù)高價(jià)收購(gòu)標(biāo)的后商譽(yù)減值，客戶和供應(yīng)商的披露或不符合要求-天天視點(diǎn)

所謂的輝煌大宋并不富裕，底層百姓比起漢唐幾無活路全球即時(shí)看

焦點(diǎn)！網(wǎng)絡(luò)質(zhì)量監(jiān)測(cè)分析能力：重大直播賽事的守護(hù)者

工信部：1-5月電信業(yè)務(wù)收入累計(jì)完成7125億元

全球關(guān)注：盒馬：夯實(shí)國(guó)內(nèi)水果供應(yīng)鏈優(yōu)勢(shì) 實(shí)現(xiàn)核心品類全年供應(yīng)

【國(guó)際微訪談】盧旺達(dá)駐華大使：“債務(wù)陷阱”說辭十分荒謬中國(guó)為非洲基礎(chǔ)設(shè)施建設(shè)提供了真正的幫助_天天觀焦點(diǎn)

本周盤點(diǎn)（6.12-6.16）：恒力石化周漲4.18%，主力資金合計(jì)凈流入2145.28萬元

傳輸速率翻倍！圓明園實(shí)現(xiàn)5G高速覆蓋

信通院發(fā)布《國(guó)內(nèi)手機(jī)產(chǎn)品通信特性與技術(shù)能力監(jiān)測(cè)報(bào)告（2023年第一期）》|環(huán)球快播

網(wǎng)站介紹 | 版權(quán)說明 | 聯(lián)系我們 | 網(wǎng)站地圖

星際派備案號(hào)：京ICP備2022016840號(hào)-16 營(yíng)業(yè)執(zhí)照公示信息版權(quán)所有郵箱聯(lián)系：920 891 263@qq.com

^{<blockquote id="66166"></blockquote>}