如何使用 Gemini Omni Flash 進行 AI 影片編輯：真實案例、提示詞與工作流程

大多數 AI 影片工具擅長從提示詞生成新片段。更難的部分是看到片段後進行編輯：更換一個物件、保持相同的鏡頭運動、調整光線，或在不重新開始的情況下製作第二個版本。

Gemini Omni Flash 正是為這個編輯步驟而設計的。Google 將 Gemini Omni 描述為能夠結合文字、圖片、音訊和影片作為輸入、生成影片，並讓使用者透過對話編輯影片的模型。Gemini 產品頁面也將影片轉影片編輯、多輪編輯、原生音訊和 10 秒影片輸出列為核心功能。

Gemini Omni 官方視覺展示

對日常創作者而言，簡單的概念是：你不必從零開始描述一切。你可以上傳現有片段，然後請模型更改重要的部分。

這就是為什麼 Omni Flash 作為編輯工作流程比作為一鍵影片生成器更有趣。它幫助使用者從「生成一個隨機好看的片段」轉變為「將這個真實片段修改成可發布的版本」。

開始提示前需要了解的關鍵功能

Omni Flash 不限於文字提示詞。你可以使用來源素材提供動態、參考圖片提供風格、音訊提供節奏，以及文字提供編輯指令。這符合真實創意工作的進行方式：大多數團隊已經有產品照片、原始素材、品牌參考或背景音樂。

Gemini Omni 官方視覺展示

最實用的使用案例很簡單：上傳真實片段並要求特定更改。更改可以是新背景、新物件、風格轉換、光線調整，或跟隨原始動作的 VFX 效果。

Google 的提示詞指南建議迭代式編輯：要求特定更新，例如背景更換或新字幕，而不重寫整個場景。這很重要，因為大多數可用的影片不是在一個提示詞中製作的；它們是透過幾個小更改來精修的。

Gemini Omni 官方視覺展示

社群測試也專注於場景內編輯：更換服裝、替換道具、轉換角色或添加小效果。這些很有用，因為它們測試模型是否能在只更改選定部分的同時保留原始鏡頭。

官方範例包括將公寓燈光與音樂同步。對短影片廣告而言，這很重要，因為許多影片在前幾秒就被判斷了。

Gemini Omni 官方視覺展示

使用上傳的音樂作為節奏參考。將鏡頭切換、產品動作和光線變化與節拍同步。保持影片乾淨、現代，適合 10 秒社群媒體廣告。

Muvi AI 的社群示範描述了使用一個超市來源片段，以不同產品、造型和創意方向創建多個商業風格廣告變體。這是一個強力的電商範例，因為價值不只是「製作影片」；而是「重複使用一次拍攝並測試許多廣告概念」。

影片： 在 X 上觀看 Muvi AI 超市轉廣告示範

使用這個超市片段作為動作參考。為 [產品] 製作一支 10 秒廣告。保持相同的鏡頭運動和購物環境，但將主打商品替換為 [產品]，添加相配的包裝，讓光線更明亮、更商業化，並以乾淨的主視覺鏡頭結尾。不要更改購物者的基本動作。

最適合：電商廣告、產品測試、季節性活動，以及從一個來源影片快速製作創意變體。

一篇與 Buzzy 相關的貼文強調了一個從參考素材開始、快速生成，然後透過多次執行編輯持續精修的工作流程。這接近小型創意團隊實際的工作方式：從大致的視覺方向開始，然後一次一步地改善背景、光線、鏡頭和產品重點。

影片： 在 X 上觀看 Buzzy 多次編輯範例

使用上傳的參考圖片作為品牌風格。將其色彩搭配、光線氛圍和材質感應用到這個片段。保持原始產品和鏡頭運動。讓第一個版本簡單乾淨；我們將在後續編輯中精修背景、光線和節奏。

後續編輯可以很簡短：「讓光線更溫暖」、「減少背景雜亂」、「添加更慢的最終推進」，或「製作有標題文字空間的 9:16 版本」。

官方小提琴手範例很好地提醒我們，鏡頭方向應該是提示詞的一部分。不要只說「讓它更有電影感」，而是要求特定的鏡頭行為：肩膀後方、推進、固定、推拉變焦、手持，或一個連續鏡頭。

保持相同的主體和動作。將鏡頭角度改為從表演者後方的肩膀後方視角。保留戶外環境、動作的時機和寫實的光線。不要添加額外的角色或文字。

最適合：音樂片段、產品示範、創作者影片，以及任何第一個版本有效但鏡頭角度感覺薄弱的場景。

一個 Reddit 測試使用單一提示詞同時要求多個更改：服裝更換、物件替換和角色轉換。這種測試很有用，因為它展示了 AI 影片編輯超越濾鏡的地方：模型必須理解同一場景中的獨立元素。

影片： 觀看 Reddit 泳池浮板 / 海豚編輯範例

讓女性穿上泳衣，將她躺著的板子變成粉紅色充氣泳池浮板，並將男性變成用鰭拍打水的海豚。保持場景活潑、明亮且連貫。保留原始鏡頭角度，避免扭曲臉部或手部。

對於正式製作，當品質重要時，將複雜編輯分成兩到三輪。先更換物件，再調整角色，然後添加水花或 VFX。較小的編輯更容易判斷和修正。

Google 的官方發布範例包括讓鏡子在觸碰時像液體一樣波動、讓手臂變得反光，以及將公寓燈光與音樂同步等提示詞。這些範例指向一個實用模式：使用原始影片中的動作作為效果的觸發器。

Gemini Omni 官方視覺展示

當人觸碰產品時，讓柔和的光波在表面擴散。光芒應持續兩秒，自然地反射在手和桌子上，然後淡出。保持產品形狀、標誌和顏色準確。

最適合：產品發布、應用程式功能示範、科學解說、魔法風格社群影片和技術視覺敘事。

Gemini Omni Flash 之所以有用，是因為它改變了普通使用者思考影片的方式。你不需要從完美的提示詞開始。你可以從真實片段、參考圖片或粗略想法開始，然後透過對話改善影片。

對電商賣家和創作者而言，最佳的早期使用案例是實用的：將一個產品片段轉換為多個廣告概念、使用品牌參考圖片保持視覺一致性、為現有素材添加小 VFX，以及為社群平台製作直式版本。

仍然有限制。Google 的模型說明指出，跨編輯的完整一致性、複雜動作和完全準確的文字渲染仍然是挑戰。這意味著你應該在發布前檢查臉部、手部、標誌、包裝文字、產品形狀和快速動作。

最強的工作流程很簡單：上傳真實片段、進行一次清晰的編輯、審查結果，然後精修。換句話說，將 Gemini Omni Flash 視為快速的 AI 編輯夥伴，而不是魔法按鈕。