國外將 LLM 結合《快打旋風》遊戲，比較 14 個大語言模型看誰最強

流量密碼 提供科技、娛樂、流行、穿搭、影劇、遊戲、電競、開箱、資訊、正妹網紅女神 等各類新聞資訊等，發燒話題永不退流行，讓您第一手快速掌握，快速更新文章及最新消息的發布就是我們的宗旨，只要隨時關注流量密碼資訊就是掌握 流量密碼。

流量密碼推播群，掌握第一手資訊

目前網路上有非常多 LLM 大語言模型，就 AI 聊天機器人來說，訓練數據越多，基本上就越厲害，但如果應用在格鬥遊戲就不是這樣，最近國外有人將 LLM 與《快打旋風》遊戲結合，測試 14 個大語言模型，最終獲勝的反而都是小模型。

國外將 LLM 結合《快打旋風》遊戲，比較 14 個大語言模型看誰最強

這個開源專案叫做 LLM Colosseum，由 Stan Girard 和 Quivr Brain 開發，根據介紹，這款遊戲是在模擬器中運行，允許 LLM 操作遊戲中的角色並進行對決（角色僅限使用 Ken），每個人都能下載安裝這個專案自行測試。

Amazon 員工 Banjo Obayomi 幾天前分享一篇他使用這專案來測試 14 個 LLMs 的結果，內容也有詳細說明 LLM 是怎麼控制《快打旋風》遊戲中的角色。LLM 會不斷讀取遊戲的當前狀態，如：角色位置、生命值和分數，這些數據會被翻譯成一個提示，如：可採取的動作和建議的策略，以便於 LLM 的理解和使用：

LLM 接收到這個提示後，會分析當前遊戲狀態並決定接下來的行動，轉化為遊戲指令，並在模擬器裡實施，像是靠近、後退、波動拳、升龍拳，詳細可以參考下方影片：

從國外知名 YouTube 頻道 Matthew Berman 分享的影片，可以看到一個比較完整的對決，左邊是 MISTRAL SMALL 模型，右邊是 MISTRAL MEDIUM 模型，兩個模型打起來還蠻順的，不過有個細節可以注意，這些二個模型似乎都沒有所謂的防守動作，就只是移動、攻擊這樣。如果是跟人類對打，沒意外人類很容易就贏了：

流量密碼推播群，掌握第一手資訊