當前位置： 首頁 > 資訊 > 城市 >

GPT-4解出難倒陶哲軒奧數(shù)題？語言IQ已達152，但空間推理巨差_世界新消息

時間：2023-05-22 23:03:20

新智元報道

(資料圖片)

編輯：Aeneas 拉燕

【新智元導讀】近日，一名外國小哥測出，GPT-4語言能力智商已達152，吊打絕大多數(shù)人類。好在，它的空間推理還不行。

GPT-4在語言能力上的智商，已經(jīng)吊打人類！

最近，國外的一位小哥測試了GPT-4的智商，結(jié)果顯示，它的語言智商已經(jīng)達到了152。

而根據(jù)調(diào)查，人類的平均智商是90-109，單論語言智商的話，人類是妥妥地被GPT-4吊打了……

GPT-4的能力，我們此前早已耳熟能詳。3月底，微軟的一篇154頁的論文，震驚全世界。

在這篇論文中，微軟表示，GPT-4已經(jīng)顯現(xiàn)出了通用人工智能的火花，它可以被認為是通用人工智能的一個早期版本。

論文地址：https://arxiv.org/pdf/2303.12712.pdf

通過測試，微軟的研究者證實：GPT-4不僅精通語言，還能在數(shù)學、編程、視覺、醫(yī)學、法律、心理學等多樣化和高難度的任務(wù)中表現(xiàn)出色，且無需特別提示。

最可怕的是，在所有這些任務(wù)中，GPT-4的表現(xiàn)都接近了人類水平，并且時常超過之前的模型。

下面，我們就來看看GPT-4在各方面能力上，哪些能吊打人類，哪些暫時還無法趕超我們。

為GPT-4量身打造IQ測試

首先，這位小哥上網(wǎng)搜索了一下免費的智商測試。

但他發(fā)現(xiàn)一個棘手的問題：這些智商測試，很多都是以圖像的形式。

然而GPT-4，目前可以被認為還是一個「瞎子」+「聾子」，并沒有讀圖能力。

怎么辦呢？這位小哥隨后意識到，肯定有專門為視力缺陷的人設(shè)計的智商測試。

他動手試了試，果然搜到了。然而，這種測試非常昂貴，需要花1500多刀，沒法白嫖。

自己動手，豐衣足食。這位小哥干脆一不做二不休，自己上手，為GPT-4量身打造了一版智商測試。

難得倒陶哲軒，難不倒GPT-4

首先要測試的，是GPT-4的數(shù)學能力。

全世界最流行、最頂尖的數(shù)學測試是什么？自然就是國際奧數(shù)比賽。

世界上最偉大的數(shù)學家之一陶哲軒，就是在1986年參加的國際奧數(shù)比賽。

那一年，試題中的第6題，連他也解不出。

那GPT-4可以么？

小哥把這道題輸給了GPT-4，結(jié)果是——它解出來了。

但是，我們并不能說，它就勝過了世界上最厲害的成年人數(shù)學家。

另外，它也無法證明孿生素數(shù)猜想。（要是能證明就有鬼了）

小哥讓GPT-4繪制一個方程式的坐標，也遭到了GPT-4的拒絕。

非常禮貌地懇求它，結(jié)果還是被婉拒了。

所以，GPT-4的極限到底在哪里呢？

這位小哥只能去查閱公開的文獻。在OpenAI的官方論文中，GPT-4在SAT的數(shù)學考試中得分高于91%的人類，在其其他數(shù)學類考試中表現(xiàn)也很優(yōu)異。

不善溝通的語言天才

接下來，小哥想測試一下GPT-4在人際關(guān)系智能（Interpersonal Intelligence），以及內(nèi)省智能（Intrapersonal Intelligence）方面表現(xiàn)如何。

嚴謹?shù)男「缦壬暇W(wǎng)查了一下，何為人際關(guān)系智能——善于處理人際關(guān)系的人，他們能更好地理解他人，并和別人進行互動。這類人擅長評估情緒、動機、欲望，以及周圍人的意圖。

然后，他找了一篇SAT考試中的文章，將文章內(nèi)容復制下來，把所有的和人物動機有關(guān)的問題也一股腦甩給了GPT-4。

GPT-4表現(xiàn)還算....出色？四個題對了三個。

然而，GPT-4卻沒有任何分析情緒的能力。

因為，按它自己的原話，它只是一個AI模型，并沒有「自我」的概念。

那GPT-4的內(nèi)省智能如何呢？

小哥表示，一個內(nèi)省智能高的人，對自身優(yōu)缺點有清醒的認知。

把這個當作prompt輸入GPT-4，發(fā)現(xiàn)這模型對自己定位還是挺清晰的。

比方說，優(yōu)點里有廣泛的知識儲備、反應迅速、多語能力、模式識別能力，以及可擴展性強等等。

而缺點包括缺乏個人經(jīng)驗、缺乏某些領(lǐng)域的知識、不太能理解上下文、文學解讀、道德評判等等。

但小哥表示，這種認識程度還遠遠不夠?？偟膩碚f，GPT-4的人際關(guān)系智能和內(nèi)省智能，都一般。

小哥還給GPT-4測了一下口頭語言的IQ測試，它得了152分。

對人類來說，這個分數(shù)意味著——你是個天才。

空間推理小試牛刀

而轉(zhuǎn)到空間能力這一塊，GPT-4的表現(xiàn)就不容樂觀了。

本來，小哥想讓GPT-4直接做一套空間推理的選擇題。

但是，OpenAI未來才會慢慢開發(fā)GPT-4的識圖功能。

在OpenAI發(fā)布的視頻中，研究人員上傳了這么一張圖片，然后問GPT-4，如果把繩子剪短會怎么樣。

GPT-4表示，那氣球就會飛走了！

小哥和GPT-4下了把井字棋，通過文字輸入控制走棋。

但GPT-4在深諳規(guī)則的情況下，耍賴了。

本來該小哥贏，讓GPT-4幫自己在最下面一排的中間畫一個圈三連。

GPT-4可倒好，直接把最上面一排的圈擦了，畫了個自己的叉。作弊取勝。

ChatGPT：魔方？我不會啊

為了進一步測試GPT-4的空間理解能力，小哥祭出了大殺器——魔方。

要知道，對人類來說，魔方也是衡量一個人空間感的方法之一。

首先，因為GPT-4不能看圖，所以要先想辦法用文字描述魔方的狀態(tài)。

熟悉魔方的朋友對下面這個圖應該不會陌生。在公式中，我們常常會用若干字母，或字母加一個撇號來代表不同的操作。

一般魔方正對我們，不同的旋轉(zhuǎn)對應不同的表達。就像下面這樣。

小哥在視頻中做了一個示范，確保GPT-4領(lǐng)會了這個意思。

然后，就要開始把GPT-4拉出來遛遛了！看看它到底會不會還原。

萬事先從簡單的開始。小哥第一步只是把魔方最上層向左擰了一下，看看GPT-4會不會還原。

這點難度還是難不倒GPT-4。小哥輸入U這個操作（最上層向左擰），GPT-4也是很快給出了U’（U的反向操作）這個答案。

緊接著是UR，意思就是最上層左擰一次，最右邊上擰一次。

GPT-4也很快給出了反向操作——R’U’。

接著就要上難度了！小哥開始徹底打亂魔方，總共十多步。

令人驚訝的是，GPT-4居然真的生成出結(jié)果了！

然而小哥定睛一看，GPT-4生成的復原方法，就是把所有打亂的步驟反過來來一遍。

看完直呼無語，這要你何用。

于是小哥發(fā)現(xiàn)這樣做就是會出現(xiàn)這個問題。因為你輸入打亂的方式，GPT-4必然在復原的時候反向操作。

問題的關(guān)鍵，就是不能讓GPT-4知道這是怎么打亂的。

小哥很聰明，問了一下GPT-4，如果是你，你會怎么描述魔方的狀態(tài)？

GPT-4采取了下圖這樣的方式：用不同的字母代替不同的顏色，把每一個面的顏色情況全部用字母表達出來。

這樣就避免了打亂步驟這一個part。

這次經(jīng)過嘗試，只有第一次的小試牛刀成功了，也就是只打亂一次的結(jié)果。

GPT-4處理起簡單問題真是毫不手軟，可惜一復雜就趴窩了。

最后還生成出了下圖這個結(jié)果——

小哥表示，這現(xiàn)實的魔方根本擰不成這樣啊，GPT-4你在干什么？？

這個結(jié)果直接給GPT-4玩兒魔方的能力宣判了死刑。

除了倒推復原，GPT-4根本玩不轉(zhuǎn)魔方。

兩任總統(tǒng)的RAP對決，泰褲辣

最后，這位小哥還測了一波GPT-4的音樂能力。

咱們都知道，GPT-4會寫詩。

既然如此，小哥就讓GPT-4以Minecraft服務(wù)器中的特朗普和拜登的說唱大戰(zhàn)為主題，寫出rap詞和旋律，還要make a beat。

小哥發(fā)現(xiàn)，最好的方式就是用ABC notation，因為GPT-4寫不出五線譜。

所以，小哥讓GPT-4用ABC notation寫一個Boom bap beat，然后把這個beat輸入到一個音樂網(wǎng)站里。

GPT-4寫出的beat是這樣的——

聽起來沒啥驚喜。

標簽：

來源: 新智元編輯: FN008

2023-05-22 21:51:35陳時中告誹謗　吳子嘉：自取滅亡、選舉GG-當前聚焦

2023-05-22 21:10:07世界觀熱點：拍照表情的技巧_拍照表情五大小技巧

2023-05-22 20:27:14環(huán)球熱資訊！敵的成語（敵的成語）

2023-05-22 19:22:56三鼓在古時候指什么時間(三鼓是什么時候開始的) 世界速看料

2023-05-22 19:02:50成都居住社區(qū)充電設(shè)施補貼范圍+條件+標準環(huán)球報道

2023-05-22 18:12:32中集車輛(301039.SZ)：擬推員工持股計劃(2023年-2027年)、第一期資金總額不超975萬元每日聚焦

2023-05-22 17:42:16綜研院郭萬達：AIGC為數(shù)實融合帶來四大趨勢-當前頭條

2023-05-22 17:24:162023年退休人員基本養(yǎng)老金上調(diào)3.8% 企退人員養(yǎng)老金增加多少？新要聞

2023-05-22 16:41:10解讀“六大對標行動”⑤｜遂寧“生態(tài)環(huán)境全面改善”怎么干？一組海報劃重點

2023-05-22 23:07:40國際油價連走“下坡路” 還會反彈嗎？焦點播報

2023-05-22 23:03:20GPT-4解出難倒陶哲軒奧數(shù)題？語言IQ已達152，但空間推理巨差_世界新消息

2023-05-22 22:55:55全球關(guān)注：業(yè)主如何證明自己是業(yè)主？結(jié)果讓人哭笑不得

2023-05-22 22:54:00今日最新！描寫水果的排比句?

2023-05-22 22:51:02名不副實的巴厘島，對全世界下“逐客令”_當前關(guān)注

2023-05-22 22:49:20重點聚焦!奇摸雞日語什么意思_奇摸雞

2023-05-22 22:39:03環(huán)球?qū)崟r：3萬股民懵了！昔日明星股，爆發(fā)退市危機

2023-05-22 22:20:31廣西特殊教育宣傳月系列活動啟動環(huán)球新要聞

2023-05-22 22:02:40五一我在崗：以青春之名護一江安瀾

2023-05-22 22:01:52動態(tài)：繼承和發(fā)揚“五四精神” 常州這一學校舉辦夢想公開課活動

2023-05-22 22:01:44沃森生物：公司相關(guān)產(chǎn)品WHO PQ預認證仍在持續(xù)推進中，具體監(jiān)測地點等均由具體產(chǎn)品的認證機構(gòu)確認

2023-05-22 22:01:30半小時內(nèi)兩次！四川宜賓市珙縣發(fā)生3.2級、3.3級地震

2023-05-22 22:00:13垃圾不落地手抄報簡單又漂亮_垃圾不落地手抄報簡單又漂亮

2023-05-22 21:59:18恒寶股份：公司目前不涉及虛擬領(lǐng)域-全球聚焦

2023-05-22 21:56:34“五一”出游，警惕“低價門票”陷阱！

2023-05-22 21:54:52新華社調(diào)查涉中小學招生套路："教育焦慮"已成有力帶貨工具-當前速遞

2023-05-22 21:54:34全球快播：“最熱五一”來臨南京組織超200場活動為游客獻上“消費大餐”

2023-05-22 21:54:10杭州女子捐款1000萬：錢在幫到人的時候才有意義

2023-05-22 21:53:29男子火車站報警聲稱遭遇搶劫原來是“喝斷片”了全球快資訊

2023-05-22 21:51:35陳時中告誹謗　吳子嘉：自取滅亡、選舉GG-當前聚焦

2023-05-22 21:51:33世界快資訊丨臺北小姐一年開幾次花臺北小姐一年開多少次花

2023-05-22 21:49:24天天熱訊:鹽焗海帶怎么做鹽焗海帶的做法

2023-05-22 21:49:19綠豆放冰箱能保存多久綠豆放冰箱能保存幾天呢最新快訊

2023-05-22 21:46:39俄方證實：烏軍進入俄境內(nèi) 普京已知悉

2023-05-22 21:46:11剝好的栗子可以隔夜嗎剝好的栗子適合隔夜存放嗎

2023-05-22 21:41:43最高獎勵1000萬元！西安出臺最新政策，鼓勵企業(yè)北交所上市

2023-05-22 21:35:01冰箱保鮮室放饅頭能放多久冰箱保鮮室儲存饅頭能放幾天呢

2023-05-22 21:18:31泰興輕烴深加工項目正式投產(chǎn)

2023-05-22 21:14:17全球熱消息：《崩壞星穹鐵道》景元簡要培養(yǎng)心得

2023-05-22 21:11:18【聚看點】【小說連載】光幕之夏第71章濃霧

2023-05-22 21:10:07世界觀熱點：拍照表情的技巧_拍照表情五大小技巧

2023-05-22 21:09:34新資訊：男子發(fā)視頻挑釁交警被查后幡然悔悟

2023-05-22 21:02:37國家級！宿遷高新區(qū)獲批中國科協(xié)海智計劃工作基地微速訊

2023-05-22 21:02:35最高補貼4000元！南京江北新區(qū)1200萬汽車消費券將發(fā)放世界最新

2023-05-22 21:02:24宿遷宿豫：對口招聘拓寬技能人才就業(yè)渠道_每日焦點

2023-05-22 21:01:29全球今日報丨五一假期南京地鐵1、3號線延時運營

2023-05-22 20:58:09貓鼠炸彈堂_貓鼠_全球看熱訊

2023-05-22 20:57:56科學理想主義者從不搞群體歧視（未整理隨筆記慎讀）

2023-05-22 20:49:28廣汽傳祺E9上市 32.98萬起能不能拿下GL8的江山？世界播報

2023-05-22 20:42:14強技能促提升｜西安市紅會醫(yī)院“創(chuàng)面護理新進展培訓班”開班-今日最新

2023-05-22 20:27:14環(huán)球熱資訊！敵的成語（敵的成語）

2023-05-22 20:20:32全球最資訊丨掌握爭冠主動權(quán)，多特蒙德股價大漲

2023-05-22 20:16:08江蘇南通：振華啟東海工5000噸自航式全回轉(zhuǎn)起重船項目正式開建

2023-05-22 20:14:26冒充企業(yè)老總詐騙158500元鹽城警方10分鐘止付挽回了損失

2023-05-22 20:09:54環(huán)球頭條：波蘭4月份工業(yè)產(chǎn)出同比下降6.4% 現(xiàn)危機跡象

2023-05-22 20:07:49熱資訊！鹽城：多部門聯(lián)合舉行水上旅游警示及智能救助演習

2023-05-22 20:04:30ST必康：法院指定陜西摩達律師事務(wù)所擔任公司破產(chǎn)預重整一案臨時管理人資訊推薦

2023-05-22 20:04:27環(huán)球最新：宿連航道宿沭路大橋正式通車

2023-05-22 20:04:20海南板塊上漲0.13%，鈞達股份領(lǐng)漲

2023-05-22 20:04:08哈維：種族歧視必須受譴責；梅西回歸很大程度取決于他的意愿_焦點速看

2023-05-22 19:59:31射陽漁船進港禁捕期前最后一撥海鮮上岸啦|全球最新

2023-05-22 19:53:57世界即時：一言不合就開卷，16.99萬起的深藍S7太狠了

2023-05-22 19:26:47全球球精選！法國外交部：歐盟對俄第11輪新制裁方案將在6月召開的歐盟峰會上達成一致

2023-05-22 19:22:56三鼓在古時候指什么時間(三鼓是什么時候開始的) 世界速看料

2023-05-22 19:21:44漢王科技漲10.02% 機構(gòu)凈賣出6171萬元世界新消息

2023-05-22 19:17:37世界動態(tài):2023年廣州中考填報志愿注意事項

2023-05-22 19:16:42【環(huán)球時快訊】豐田賽那30.98萬起售，4月銷售7101輛，7座MPV可家用可商用

2023-05-22 19:15:58香港按揭證券公司：2022年除稅后虧損3.19億港元|要聞速遞

2023-05-22 19:10:56泰興首季知識產(chǎn)權(quán)質(zhì)押融資泰州第一-今日熱訊

2023-05-22 19:09:35追江趕海共賞江風海韻 2023中國南通江海國際文化旅游節(jié)開幕

2023-05-22 19:08:28“樂學泰州”走進田間地頭感受“立夏”

2023-05-22 19:05:26溱湖國家濕地公園新添20頭麋鹿寶寶

2023-05-22 19:02:50成都居住社區(qū)充電設(shè)施補貼范圍+條件+標準環(huán)球報道

2023-05-22 18:56:22全球簡訊:泰州市區(qū)新增六條公交專線

2023-05-22 18:55:07熱資訊！考研落榜了還被要求提供未錄取證明合理嗎？

2023-05-22 18:52:31雪糕：我比天氣“熱”！

2023-05-22 18:51:09Nexar推出新映射層擴展AV、Robotaxis和ADAS的映射能力|世界快播報

2023-05-22 18:51:05天天熱消息：渭南公安交警多舉措深入推進道路交通秩序?qū)ｍ椪涡袆?/a>

2023-05-22 18:48:49 【環(huán)球時快訊】延安市人民醫(yī)院參加互聯(lián)網(wǎng)醫(yī)療診治技術(shù)國家工程研究中心第一屆院士學術(shù)高峰論壇

2023-05-22 18:48:31什么是“檢微治助”？看陜西檢察以“一二三四”思路助力基層治理新路徑

2023-05-22 18:48:06世界通訊！湛江男子當街捅殺女子案一審宣判：兇手被判死刑當庭上訴

2023-05-22 18:46:38中南城投所持3390萬股中南建設(shè)股票遭流拍_焦點快看

2023-05-22 18:42:56當前報道:最快1個工作日放款！銀行也來催我上車？

2023-05-22 18:31:46當老建筑融入新時尚，文化街區(qū)刷新城市風貌

2023-05-22 18:19:05助力打造世界一流工廠寶鋼股份一改造工程正式開工

2023-05-22 18:18:04焦點日報：剛剛，南通這里發(fā)布重要消息！

2023-05-22 18:17:00文化是最好的外交官，來第十屆西部文博會看東西文化交流

2023-05-22 18:15:25居家養(yǎng)老，僅靠政府購買服務(wù)夠嗎？_世界今亮點

2023-05-22 18:15:24姜堰老通揚運河展示別樣美景

2023-05-22 18:13:33泰州開展全市醫(yī)療衛(wèi)生機構(gòu)消防安全檢查觀察

2023-05-22 18:12:32中集車輛(301039.SZ)：擬推員工持股計劃(2023年-2027年)、第一期資金總額不超975萬元每日聚焦

2023-05-22 18:11:36天天速讀：桂林2小時下完了1天的大暴雨一小時降雨量84.6毫米

2023-05-22 18:10:53焦點快看：夜間行駛不慎追尾司機被困揚州消防迅速救助

2023-05-22 18:10:34智能客服：既要智能，又要友好-全球速看

2023-05-22 18:09:12華為云助力金億精密，搭建信息共享的企業(yè)云端協(xié)同辦公平臺

2023-05-22 18:06:15江淮全新品牌首款新車釔為3正式開售：售價區(qū)間為9.79-12.99萬元，二季度正式上市_天天快看點

2023-05-22 18:06:12電子章怎么蓋到文件中不能移動_電子章怎么蓋到文件中天天觀點

2023-05-22 18:03:38運河新景靚古城文氣濃-世界速訊

2023-05-22 18:03:11今日熱門!南方降雨減少減弱多地最高氣溫僅20℃出頭

2023-05-22 17:58:10我為群眾辦實事｜磚面翹起勞武巷人行道已維修完畢世界看點

2023-05-22 17:58:05線上渠道提供服務(wù)近141億人次電子社?？ǔ蔀榘傩铡靶念^好”

2023-05-22 17:55:27貫徹產(chǎn)業(yè)強市“一號戰(zhàn)略”項目攻堅進行時丨鎮(zhèn)江揚中：節(jié)慶搭臺 27個近54億元項目簽約落地天天報道

2023-05-22 17:52:49數(shù)字驅(qū)動汽車全產(chǎn)業(yè)鏈變革

2023-05-22 17:52:48全球時訊：七國集團峰會抗議活動現(xiàn)場發(fā)生激烈沖突

2023-05-22 17:50:13榆林市中小學2023學年放假時間安排世界快看點

2023-05-22 17:48:34頭條焦點：天津市哪些地區(qū)恢復了出入境證件辦理窗口

2023-05-22 17:47:35“魯蓬遠漁028”傾覆搜救工作現(xiàn)場已打撈起7具遇難者遺體世界報道

2023-05-22 17:47:05精彩看點：光大技術(shù)裝備中標湖北大悟垃圾發(fā)電設(shè)備總包及安裝項目

2023-05-22 17:46:56環(huán)球熱文：2023中國汽車登山錦標賽漢陰站開幕

2023-05-22 17:45:33環(huán)球今熱點：兩部門：2023年退休人員基本養(yǎng)老金上調(diào)3.8%

蘇州
江蘇
財經(jīng)
娛樂
旅游
時尚

全球關(guān)注：業(yè)主如何證

新聞排行

熱點圖片

足不出戶交電費！蘇州

聚焦數(shù)字科技產(chǎn)業(yè) 吳

昆山10個新經(jīng)濟重點項

GDP從近1.7萬億到破2.

蘇州政府采購“成績單

打造人才集聚新高地

欧美AA视频在线播放a,久久综合九色综,欧美日韩一区二区三区自拍,日本久久精品视频

GPT-4解出難倒陶哲軒奧數(shù)題？語言IQ已達152，但空間推理巨差_世界新消息

最新資訊

新聞排行

熱點圖片

欧美AA视频在线播放a,久久综合九色综,欧美日韩一区二区三区自拍,日本久久精品视频

GPT-4解出難倒陶哲軒奧數(shù)題？語言IQ已達152，但空間推理巨差_世界新消息

最新資訊

新聞排行

熱點圖片

GPT-4解出難倒陶哲軒奧數(shù)題？語言IQ已達152，但空間推理巨差_世界新消息