小時候打電動時,你有沒有想過:如果能自己製作遊戲該有多帥?不單是擺幾個障礙物,而是打造整個世界觀,將腦袋所有幻想都轉化為遊戲場景。但現實總是骨感,長大後你知道這需要學3D建模、寫程式、還有處理燈光與材質⋯⋯有夠麻煩又高門檻,於是就放棄了。
不過,Google DeepMind推出的Project Genie,似乎讓這一切開始簡單起來?你只要輸入幾句文字,就能生成一個可走入的3D世界。
作為Google Genie系列最新延伸,Project Genie不只是個好玩工具,也是Google通往AGI(通用人工智慧)的公開測試。也因為它讓普通人也能輕鬆做出質感精良的遊戲畫面,Unity等傳統遊戲引擎公司的股價在發布隔天(1月30日)整個暴跌逾20%。

Project Genie能幹嘛?三種功能:素描、探索、重混
上月29日,Google向美國地區的Google AI Ultra訂閱用戶(18歲以上)開放了Project Genie測試。這個實驗性原型整合了三項技術:Genie 3世界模型、Nano Banana Pro和Gemini。

操作方式很簡單,只要輸入文字或上傳圖片,Project Genie就能生成一個立體環境。在裡頭,你可以操作虛擬化身,透過按鍵盤「W、A、S、D」鍵與空白鍵進行移動與跳躍。這個體驗拆解來看,有三個核心功能:
- 「世界素描」(World sketching):由Nano Banana Pro繪製預覽,使用者可建立場景與虛擬化身,並定義探索方式,像是第一人稱或第三人稱視角。
有趣的是,虛擬化身並不限於生物,無生命體也可以。像是有網友設定角色為「丟棄的香菸盒」,環境為「賓州車站34街」,就生成了另類的萬寶路菸盒視角的卡丁車遊戲。

如果你想從菸盒視角探索城市?Project Genie做得出來而且很可愛。(來源:Riley Goodside)
2. 「世界探索」(World exploration):這個虛擬世界是時限內可無限探索的開放空間。也就是能根據使用者的操作,即時(real-time)產生前方的路徑。


海灘上墜毀燃燒的飛機與散落的行李,不只是遠方的背景,而能走近仔細觀看。(來源:Max Weinbach)
3. 「世界重混」(World remixing):如果你喜歡別人創造的世界,也可以透過重混改造它的虛擬空間。也就是在它的基礎上改天氣、加元素,或是調整氛圍。類似功能也出現在Open AI的Sora。
為什麼Google要釋出Project Genie?
表面上Google的Project Genie彷彿是來幫助我們凡人打字玩創意的工具,但背後其實與AGI(通用人工智慧)的進程有關。
你可能看過這類迷因短片:鏡頭前的人一邊做家事,一邊無奈地問「所以什麼時候AI才能取代我?」大家都曉得,目前AI雖然會寫文章、會下棋,但對於處理各式家務並不在行。要達成像人類一般,能在不同環境中處理各種任務的通用智慧,「對3D世界的理解」便是需要持續精進的檻。

「AI will take my job? But when?」短影音讓人很有感,這是因為這些簡單家事對多數AI來說並不在行。
而Google DeepMind就是從這個方向切入。早在2024年,當OpenAI發布Sora並宣稱它為「世界模擬器」的雛形,Google DeepMind也不甘示弱地推出Genie,並大膽將它定位為「基礎世界模型」。
那時的Genie雖然只能處理2D遊戲畫面,但已展現關鍵能力:能從遊戲影片中學會哪些動作是可控的,並理解「我這樣做,會發生什麼事」。這代表AI不再只被動生成影片,而能理解「行動」與「結果」間的邏輯。
到了Genie 3,模型大幅升級:不僅能生成720p、24fps的即時互動環境,更首次實現「跨分鐘的空間一致性」。不過當時Genie 3只開放給少數研究人員測試,這次的Project Genie則加入了UI介面,讓更多訂閱用戶能夠使用,也藉此蒐集回饋來優化模型。


在Project Genie有直觀的UI介面,使用者可用文字輸入場景及虛擬化身的描述,並可決定探索世界的視角。
值得一提的是,AI教母李飛飛的World Labs也在「空間智慧」深度耕耘。去年10月,他們推出的MARBLE,讓使用者只需上傳一張照片,系統就能推測出完整的3D場景。
差別在於,MARBLE專注「空間的重建」,從單張照片或文字推理出完整結構,訓練AI如建築師,看平面圖推算立體空間;Project Genie則專注「創造虛擬世界」,讓AI在互動中學習因果關係。兩者都是通往AGI的必要路徑,只是Google更強調「行動與反饋」。

看到官方滿有趣的示範是,你能在Project Genie以POV視角漆油漆。
Project Genie還不完美,但為AGI續力
不過目前Project Genie還只是測試版,Google也很坦誠地列出了限制:每次只能生成60秒的內容,畫面不一定符合真實,系統也不見得能完全照你的想法呈現,而且角色的控制上有時還會卡頓。
若想認真當作遊戲引擎,它也還不夠格。Project Genie只供下載影片,仍無法匯出到Unity或Unreal,也無法設定完整遊戲機制(劇情、多人、貨幣化)。除了移動與跳躍,玩家能執行的互動有限,連音效都沒有。


網友測試Project Genie處理鏡子反射的效果,結論是仍無法正確顯示且頗為滑稽。(來源:Utah teapot)
也因為這些限制,雖然Unity股價在發布後暴跌超過20%,Roblox跌了12%,GTA母公司Take-Two也跌了7-10%,但這其實是投資人的過度恐慌。Unity CEO Matt Bromberg也在X上公開回應:「Genie是強大的AI工作流加速器,而不是威脅。」長期來看,Genie這類AI世界模型更可能幫助開發者快速生成原型和素材,再匯入Unity精修。
Project Genie目前僅在美國地區向Google AI Ultra訂閱用戶(每月250美元)開放。在台灣想玩的朋友,得自己轉VPN加上訂閱Ultra,或是乖乖等Google開放。至於未來遊戲開發會怎麼變化?就讓我們繼續看下去吧~




