首頁(yè) 行業(yè) 活動(dòng) 項(xiàng)目 快訊 文娛 時(shí)尚 娛樂(lè) 科技 汽車(chē) 綜合 生活

GPT-4解出難倒陶哲軒奧數(shù)題?語(yǔ)言IQ已達(dá)152,但空間推理巨差|當(dāng)前觀點(diǎn)

2023-05-23 10:25:13 來(lái)源:新智元公眾號(hào)

【新智元導(dǎo)讀】近日,一名外國(guó)小哥測(cè)出,GPT-4語(yǔ)言能力智商已達(dá)15編程客棧2,吊打絕大多數(shù)人類(lèi)。好在,它的空間推理還不行。

GPT-4在語(yǔ)言能力上的智商,已經(jīng)吊打人類(lèi)!


(資料圖片)

最近,國(guó)外的一位小哥測(cè)試了GPT-4的智商,結(jié)果顯示,它的語(yǔ)言智商已經(jīng)達(dá)到了152。

而根據(jù)調(diào)查,人類(lèi)的平均智商是90-109,單論語(yǔ)言智商的話,人類(lèi)是妥妥地被GPT-4吊打了……

GPT-4的能力,我們此前早已耳熟能詳。3月底,微android軟的一篇154頁(yè)的論文,震驚全世界。

在這篇論文中,微軟表示,GPT-4已經(jīng)顯現(xiàn)出了通用人工智能的火花,它可以被認(rèn)為是通用人工智能的一個(gè)早期版本。

論文地址:https://arxiv.org/pdf/2303.12712.pdf

通過(guò)測(cè)試,微軟的研究者證實(shí):GPT-4不僅精通語(yǔ)言,還能python在數(shù)學(xué)、編程、視覺(jué)、醫(yī)學(xué)、法律、心理學(xué)等多樣化和高難度的任務(wù)中表現(xiàn)出色,且無(wú)需特別提示。

最可怕的是,在所有這些任務(wù)中,GPT-4的表現(xiàn)都接近了人類(lèi)水平,并且時(shí)常超過(guò)之前的模型。

下面,我們就來(lái)看看GPT-4在各方面能力上,哪些能吊打人類(lèi)編程客棧,哪些暫時(shí)還無(wú)法趕超我們。

為GPT-4量身打造IQ測(cè)試

首先,這位小哥上網(wǎng)搜索了一下免費(fèi)的智商測(cè)試。

但他發(fā)現(xiàn)一個(gè)棘手的問(wèn)題:這些智商測(cè)試,很多都是以圖像的形式。

然而GPT-4,目前可以被認(rèn)為還是一個(gè)「瞎子」+「聾子」,并沒(méi)有讀圖能力。

怎么辦呢php?這位小哥隨后意識(shí)到,肯定有專(zhuān)門(mén)為視力缺陷的人設(shè)計(jì)的智商測(cè)試。

他動(dòng)手試了試,果然搜到了。然而,這種測(cè)試非常昂貴,需要花1500多刀,沒(méi)法白嫖。

自己動(dòng)手,豐衣足食。這位小哥干脆一不做二不休,自己上手,為GPT-4量身打造了一版智商測(cè)試。

難得倒陶哲軒,難不倒GPT-4

首先要測(cè)試的,是GPT-4的數(shù)學(xué)能力。

全世界最流行、最頂尖的數(shù)學(xué)測(cè)試是什么?自然就是國(guó)際奧數(shù)比賽。

世界上最偉大的數(shù)學(xué)家之一陶哲軒,就是在1986年參加的國(guó)際奧數(shù)比賽。

那一年,試題中的第6題,連他也解不出。

那GPT-4可以么?

小哥把這道題輸給了GPT-4,結(jié)果是——它做了,但沒(méi)做對(duì)。

因此,我們并不能說(shuō),它勝過(guò)了世界上最厲害的成年人數(shù)學(xué)家。

另外,它也無(wú)法證明孿生素?cái)?shù)猜想。(要是能證明就有鬼了

關(guān)鍵詞:

上一篇:新疆沙雅縣舉辦鑄牢中華民族共同體意識(shí) 知識(shí)競(jìng)賽_播報(bào)

下一篇:險(xiǎn)資不愛(ài)房地產(chǎn)了?|氪金 · 房地產(chǎn)

責(zé)任編輯:

最近更新

點(diǎn)擊排行
推薦閱讀