標(biāo)題:AI版《超級(jí)馬力歐兄弟》:Claude 3.7操作驚艷,推理模型表現(xiàn)堪憂!
隨著人工智能(AI)技術(shù)的飛速發(fā)展,越來(lái)越多的領(lǐng)域開始探索其應(yīng)用潛力。近日,加利福尼亞大學(xué)圣地亞哥分校的Hao人工智能實(shí)驗(yàn)室將AI引入經(jīng)典游戲《超級(jí)馬力歐兄弟》中,進(jìn)行了一項(xiàng)獨(dú)特的研究,以測(cè)試其性能表現(xiàn)。實(shí)驗(yàn)結(jié)果顯示,Anthropic的Claude 3.7在參與測(cè)試的AI模型中表現(xiàn)最為出色,而Claude 3.5緊隨其后。相比之下,谷歌的Gemini 1.5 Pro和OpenAI的GPT-4o則表現(xiàn)不佳。
首先,我們需要明確一點(diǎn),此次實(shí)驗(yàn)所使用的并非1985年最初發(fā)布的《超級(jí)馬力歐兄弟》版本。實(shí)驗(yàn)室通過(guò)一個(gè)模擬器進(jìn)行游戲運(yùn)行,并通過(guò)一個(gè)名為GamingAgent的框架與AI進(jìn)行連接,從而讓AI能夠控制馬力歐。GamingAgent由實(shí)驗(yàn)室自主研發(fā),它向AI提供基本指令,例如“如果附近有障礙物或敵人,向左移動(dòng)或跳躍以躲避”。同時(shí),它還提供游戲內(nèi)的截圖,為AI提供實(shí)時(shí)的反饋信息。隨后,AI通過(guò)生成Python代碼的形式來(lái)操控馬力歐。
這個(gè)實(shí)驗(yàn)環(huán)境可謂是極具挑戰(zhàn)性,它迫使每個(gè)AI模型“學(xué)習(xí)”如何規(guī)劃復(fù)雜的操作并制定游戲策略。實(shí)驗(yàn)結(jié)果反映出,非推理模型在實(shí)時(shí)游戲中表現(xiàn)更佳。這主要是因?yàn)橥评砟P驮跊Q定行動(dòng)時(shí)通常需要花費(fèi)數(shù)秒時(shí)間,而在《超級(jí)馬力歐兄弟》中,時(shí)機(jī)至關(guān)重要,一秒鐘的差別可能意味著安全跳過(guò)和墜落死亡的不同結(jié)果。
數(shù)十年來(lái),游戲一直是衡量AI性能的重要工具。然而,一些專家對(duì)將AI在游戲中的表現(xiàn)與技術(shù)進(jìn)步直接掛鉤的做法提出了質(zhì)疑。與現(xiàn)實(shí)世界相比,游戲往往是抽象且相對(duì)簡(jiǎn)單的,因此AI在游戲中的表現(xiàn)并不能完全代表其在現(xiàn)實(shí)世界中的應(yīng)用能力。
盡管如此,我們?nèi)钥梢詮腁I版《超級(jí)馬力歐兄弟》中獲得許多樂(lè)趣和啟示。觀看AI玩馬力歐本身就是一種有趣的體驗(yàn),尤其是當(dāng)Claude 3.7等表現(xiàn)優(yōu)異的模型操控馬力歐時(shí),其操作更是讓人驚艷。相比之下,推理模型在游戲中的表現(xiàn)就顯得有些堪憂。這并非是因?yàn)樗鼈兡芰Σ蛔悖且驗(yàn)橛螒颦h(huán)境的特殊性質(zhì)所致。
此外,這項(xiàng)研究還為我們提供了對(duì)未來(lái)AI發(fā)展的思考。隨著更多像Claude 3.7這樣的模型被研發(fā)出來(lái),我們是否可以期待更多的創(chuàng)新和突破?毫無(wú)疑問(wèn),AI在游戲領(lǐng)域的應(yīng)用前景是廣闊的。無(wú)論是從娛樂(lè)的角度,還是從技術(shù)的角度,我們都期待著更多的探索和創(chuàng)新。
總的來(lái)說(shuō),AI版《超級(jí)馬力歐兄弟》的試玩活動(dòng)為我們提供了一個(gè)有趣的視角,讓我們看到了AI技術(shù)在游戲中的應(yīng)用潛力。盡管存在一些質(zhì)疑和挑戰(zhàn),但不可否認(rèn)的是,AI正在逐漸改變我們的生活,為我們帶來(lái)更多的可能性和機(jī)遇。讓我們期待著未來(lái)的發(fā)展,期待著更多令人驚奇的AI應(yīng)用出現(xiàn)。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )