AI玩《超级马力欧兄弟》：Claude模型真是天赋异禀，推理模型简直如同菜鸟_体育直播

来源：直播吧

03-04 16:00

加利福尼亚大学圣地亚哥分校的Hao人工智能实验室上周五进行了一项新奇的尝试，竟然将人工智能推上了《超级马力欧兄弟》的舞台，仿佛这款经典游戏不仅仅是懒人消遣的工具，更是AI实力的试金石。经过一番“激烈比赛”，Anthropic的Claude 3.7表现得就像超级马里奥的化身，勇夺冠军，而Claude 3.5则紧随其后。相较之下，谷歌的Gemini 1.5 Pro和OpenAI的GPT-4o简直就是出局的悲惨角色，如何打得如此令人失望，真令人好奇是不是它们偷偷退出了这个游戏。

需要特别说明的是，实验使用的并非1985年的原版《超级马力欧兄弟》，而是运行在模拟器上的版本，借助一个名为GamingAgent的框架将人工智能与游戏紧密连接，让AI能够在虚拟世界中操控马力欧。这个GamingAgent由Hao实验室自主研发，提供了基本操作指令，比如“遇到障碍物就左转或跳”，简直是为AI的“冒险之旅”打下了基础。

而研究过程中还发现，像OpenAI的推理模型o1这类AI在游戏中表现得真是像绝望的鸟儿，它们在解决问题时需要一段时间的思考，然而在这款游戏中，时间可不是随便拿来浪费的！马里奥的每一个跳跃都可能成为生与死的抉择，真可谓是“错过一秒，万劫不复”。

多年来，游戏一直是衡量AI性能的金标准，但一些专家却对这种直接，用游戏表现来衡量技术进步的方式表示疑虑，他们不禁发问，这些虚拟场景真能代表现实世界吗？在游戏中，AI面临的数据几乎是无穷无尽的，试问这又如何能和现实生活的复杂性相提并论呢？

在这种情况下，OpenAI的研究科学家安德烈·卡帕西甚至提出了“评估危机”，称他深感迷茫——若连AI的评价标准都无法清晰，未来的AI发展路径就更加扑朔迷离。这波操作简直像是在跟我们说：“你们看，AI的未来，我们也不知道。”实在有趣，却又透着一丝无奈。

电竞免费观看_电竞高清在线

电竞

相关新闻

Xun十點鐘就像變魔術一樣消失了排位賽也不玩到底幹什麼呢

03.12 18:02

道義之聲：我從未參與假賽，卻有人試圖讓我現場匯報戰隊陣容，我果斷拒絕並向上級報告！

03.12 12:02

中韓賽區喜歡把對手壓成餅我可是T1的忠實粉絲

03.11 22:07

Zeus信心十足面對劍魔，住在S13酒店的經歷令人難忘

03.11 14:02

Peanut談到Kanavi選手在比賽中的攻擊性表現

03.10 22:05

JKL再次踏上韓國之旅，曾在S賽中獲得冠軍，希望這次也能再創輝煌

03.10 12:04

Canna和Zeus的對決引發期待，緊張又充滿趣味

03.09 20:07

訓練賽中實力突顯 Wayward輕松擊敗369 賽後回憶手掌滿是汗水

03.09 14:02

水晶哥：我是烏茲最忠誠的粉絲，全網罵369的時候，只有我勇敢地為他辯護

03.08 22:06

CS2皮膚市場神奇逆襲：市值居然衝到42.8億美元了不起啊

03.08 16:07

更新時間:

2025.03.12 16:39:34

友情链接

导航:

全天体育是一家提供穩定高清無插件體育直播的體育導航站，免費提供足球直播、JRS直播、籃球直播、意甲直播、歐洲杯直播、世界盃預選賽直播、英超直播、NBA直播、CBA直播，中超直播，法甲直播，亞冠直播，德甲直播等。全天体育所有直播源以及內容均來自互聯網包括：視頻直播信號、視頻錄像回放均由用戶收集上傳或從搜索引擎搜索整理獲得,全天体育自身不提供不存儲任何視頻直播信號、視頻內容等,如有侵犯您的權益請您通知我們,我們會在第壹時間處理,謝謝！

xml地图