Grok 的 Imagine 影像生成功能,讓用家只需一張相片就能生成長度約 6 秒的影片。有關的功能在推出個多月後就迎來重大升級,Elon Musk 在 X 中宣布推出 Grok Imagine v0.9,除了畫面會更穩定細緻,更能同步生成聲音,而且尺度很寬鬆,甚至可生成出 NSFW (Not Safe For Work) 的「紳士用」短片⋯
據外國科技媒體指 Grok Imagine v0.9 是使用全新的 Aurora 引擎,除了能自動轉換成影片,亦容許在後續修改,透過 Custom 功能來添加提示詞。用家只要透過 Grok 網頁版或手機版並登入帳號,就能體驗 Grok Imagine v0.9 的效能。
畫質、動態大幅提升
與首次面世時的 v0.1 版本相比,v0.9 版本無論在畫面細緻程度、動作的空間和立體表現,以至對原圖顏色與質感的遵循能力都大幅提升,影片中的人物能做出相當大幅度的動作。
草稿生成真人影片
除了利用圖片生成影片外,Grok Imagine 還有草圖生成影片功能,用戶可以手繪草圖來生成影片。如果不配合 Custom 選項加入提示詞,它只會以草稿的圖案來生成動畫,可以生成火柴支動畫。如果大家在提示詞中加入「photorealistic」字句並加以描述人物和場景,就可以將草圖轉換為真人影片,不過以筆者測試,最初總是會由草圖的圖像開始,幾格之後才轉換為真人。


配音效果強差人意
Grok Imagine 另一項提升在聲音方面,雖然音質仍然強差人意,不過已經沒有 v0.1 那麼多噪音。此外,還有真正可用的配音「夾咀型」功能,但語言只侷限於英語,普通話只有一半成功率。只要在提示句中寫上要說的話,AI 就能生成語音和配合的口型。

Spicy 是通往紳士的大門
我們試用 Grok Imagine 主頁的一些範例圖片進行生成,可以看到影片風格的選項中,會新加入 Spicy 的選項,這個就是通往成為「紳士」的大門,只要在圖片生成影片時,選擇使用 Spicy 的風格,會較容易產生出較大膽的影片。


如果是在自己上傳的日圖像選擇 Spicy,會彈出對話窗口確認用戶年滿 18 歲。假如用戶選擇未滿 18 歲,那個登入階段往後都不能用到 Spicy 功能,需要重新登入才能恢復。另外要注意 Spicy 模式暫時只在網頁版用得到,手機版未有這個功能。

我們再嘗試輸入「日本女子在東京街頭拍攝內衣照」,正常如果在 ChatGPT 或 Gemini 的話,很大機會不能進行生成,但 Grok 就容許繼續生成,並製作成影片,可見 Elon Musk 真的很懂用家們的喜好。

Grok Imagine 完全文生片有方法
除了一些個人趣味的作品。亦有用家發掘了如何讓 Grok Imagine 生成出更專業的影片。方法是先準備一張黑色的畫格上傳到 Grok Imagine,然後輸入 Prompt。不過為免大家無從入手,我們先整理一些要點,大家只要根據下面的內容,以 point form 的形式輸入,都可以有不錯的效果。 當然如果可以配合 Grok 4 Fast 來強化提示詞效果會更出色。
- 主題(主角外觀)
- 場景(環境/地點)
- 動態(物體移動方式)
- 美學控制(光線、鏡頭角度、鏡頭類型)
- 風格化(藝術風格,例如賽博龐克、插畫風)
