為了提升服務質素,我們會使用 Cookie 或其他類似技術來改善使用者的閱讀體驗。 如想了解更多請到 這裡 >。
據消息指出,《Genie 3》能維持數分鐘的一致性世界,超越過去如《GameNGen》與《Genie 2》等操作模型。2024 年的《GameNGen》專注於特定遊戲如《DOOM》,可實現數秒即時生成,但其互動性與圖像受限於該遊戲框架;至於《Genie 2》則將應用擴展至一般 3D 環境,雖非即時,但透過事前輸入鍵盤與滑鼠操作,可生成 10 至 20 秒具一致性的互動世界。
《Genie 3》進一步突破限制,除了可生成遊戲般的 3D 空間,還可產生火山、夜景、台風等具擬真視覺效果的環境。它繼承了物理法則導向的影片生成模型《Veo》的技術基礎,並可依據玩家實際操作動態生成畫面。
此外,《Genie 3》支援文字提示改變環境內容,例如改變天氣、召喚動物等,並可與 3D 環境 AI 代理人《SIMA》互通,讓用戶為代理人設定目標,進行模擬操作。
為維持場景一致性,《Genie 3》會記憶至少 1 分鐘內的世界狀態,並根據此資訊逐幀生成畫面,而非預先搭建完整 3D 世界,實現高度即時與動態的表現。
Google DeepMind 強調,《Genie 3》將成為推進世界模型發展的重要里程碑,並計劃未來讓更多測試者參與體驗。