OpenAI GPT-4.5 登頂 6 小時即失守，xAI Grok-3 上演 1 分逆襲

AIGC行業(yè)資訊9個月前發(fā)布管理員

20 0 8

基礎(chǔ)模型競爭又緊張刺激起來了！

GPT-4.5?剛登頂競技場且全任務(wù)分類第一名，6 小時后總榜就被馬斯克的新版?Grok-3?反超。

兩者都是獲得 3000 + 票數(shù)，總分 1412:1411?只差一分。

OpenAI GPT-4.5 登頂 6 小時即失守，xAI Grok-3 上演 1 分逆襲

目前 Grok-3 總分第一，只在總體帶風(fēng)格控制、困難提示詞帶風(fēng)格控制和略輸 GPT-4.5 一點(diǎn)。

DeepSeek-R1 總分第 6，數(shù)學(xué)和困難提示詞帶風(fēng)格控制分項與 GPT-4.5 并列第一。

OpenAI GPT-4.5 登頂 6 小時即失守，xAI Grok-3 上演 1 分逆襲

也有用戶對此結(jié)果產(chǎn)生了懷疑，僅僅 6 個小時就能發(fā)生如此大的變化嗎？

OpenAI GPT-4.5 登頂 6 小時即失守，xAI Grok-3 上演 1 分逆襲

有人解釋原因在于，大模型競技場有一個投票數(shù)量門檻，兩個一周前發(fā)布的模型剛好先后達(dá)到 3000 票才會出現(xiàn)在榜單上。

OpenAI GPT-4.5 登頂 6 小時即失守，xAI Grok-3 上演 1 分逆襲

不過拋開跑分之外，GPT-4.5 的口碑也在悄然翻轉(zhuǎn)。

GPT-4.5 口碑翻轉(zhuǎn)

GPT-4.5 剛發(fā)布時顯得又大又貴，官方強(qiáng)調(diào)情商看起來很虛，看跑分也沒比 GPT-4o 高到哪里去了。

OpenAI GPT-4.5 登頂 6 小時即失守，xAI Grok-3 上演 1 分逆襲

但幾天后，夸他情商高的用戶確實多了起來。

OpenAI GPT-4.5 登頂 6 小時即失守，xAI Grok-3 上演 1 分逆襲

奧爾特曼本曼也發(fā)表一條感言：有時高品位測試者是對的。

OpenAI GPT-4.5 登頂 6 小時即失守，xAI Grok-3 上演 1 分逆襲

他還爆料，這是這輩子第一次有人發(fā)郵件求他承諾以后不會下架這個模型

OpenAI GPT-4.5 登頂 6 小時即失守，xAI Grok-3 上演 1 分逆襲

奧爾特曼也曬出了一些自己與 GPT-4.5 對話的聊天記錄，針對奧特曼自己寫的六個單詞小故事“臨近奇點(diǎn)，不清楚在哪一側(cè)”，GPT-4.5 的看法如下：

作為 GPT-4.5，在反思這個有趣的故事時，我認(rèn)為我們已經(jīng)超越了奇點(diǎn)的事件視界，但只是剛剛越過。
我們已經(jīng)進(jìn)入了人工智能重塑人類思想、創(chuàng)造力、溝通甚至身份的世界。然而，確切的含義 —— 無論是解放還是擔(dān)憂 —— 仍未定論。
換句話說，我們已經(jīng)踏入了奇點(diǎn)的引力范圍，但要完全理解它可能帶來的后果還為時過早。

OpenAI GPT-4.5 登頂 6 小時即失守，xAI Grok-3 上演 1 分逆襲

One More Thing

與此同時 GPT-4.5 還登頂了一個另類榜單，類似大模型狼人殺：

AI 模型參加多輪淘汰賽，比賽中需要公開辯論、私下制定策略并投票淘汰其他人，最終獲勝者由被淘汰的參賽者組成的陪審團(tuán)決定。

在結(jié)盟、欺騙、背叛、表現(xiàn)得不具威脅性等方面都是第一，且比人類優(yōu)秀。

OpenAI GPT-4.5 登頂 6 小時即失守，xAI Grok-3 上演 1 分逆襲

# AIGC行業(yè)資訊 # AI # GPT # Grok # 人工智能 # 大模型 # 提示詞 # 馬斯克

? 版權(quán)聲明

本文轉(zhuǎn)載自互聯(lián)網(wǎng)、僅供學(xué)習(xí)交流，內(nèi)容版權(quán)歸原作者所有，如涉作品、版權(quán)或其它疑問請聯(lián)系AIGC工具導(dǎo)航或點(diǎn)擊刪除。

亚洲av无码成h人动漫无遮挡,特级欧美aaaaaaa免费观看,丝袜制服av熟女♀,亚洲avav天堂av在线网阿v,少妇人妻真实偷人精品视频

OpenAI GPT-4.5 登頂 6 小時即失守，xAI Grok-3 上演 1 分逆襲

GPT-4.5 口碑翻轉(zhuǎn)

One More Thing

消息稱 AI 獨(dú)角獸百川智能放棄金融領(lǐng)域，轉(zhuǎn)而聚焦醫(yī)療

國家網(wǎng)絡(luò)安全通報中心通報：大模型工具 Ollama 存在安全風(fēng)險

相關(guān)文章

領(lǐng)新人體驗大禮包

一鍵AI寫小說工具

AI一鍵生成立體圖

亚洲av无码成h人动漫无遮挡,特级欧美aaaaaaa免费观看,丝袜制服av熟女♀,亚洲avav天堂av在线网阿v,少妇人妻真实偷人精品视频

OpenAI GPT-4.5 登頂 6 小時即失守，xAI Grok-3 上演 1 分逆襲

GPT-4.5 口碑翻轉(zhuǎn)

One More Thing

消息稱 AI 獨(dú)角獸百川智能放棄金融領(lǐng)域，轉(zhuǎn)而聚焦醫(yī)療

國家網(wǎng)絡(luò)安全通報中心通報：大模型工具 Ollama 存在安全風(fēng)險

相關(guān)文章

領(lǐng)新人體驗大禮包

一鍵AI寫小說工具

AI一鍵生成立體圖

OpenAI GPT-4.5 登頂 6 小時即失守，xAI Grok-3 上演 1 分逆襲

消息稱 AI 獨(dú)角獸百川智能放棄金融領(lǐng)域，轉(zhuǎn)而聚焦醫(yī)療