字節跳動的文字轉影片模型,畫面與聲音同步生成
Seedance 2.0 是字節跳動 Seed 團隊的影片生成模型,於 2026-02-12 正式發表。一次渲染即可輸出最長 15 秒、單段連續多鏡頭的影片,並附雙聲道音訊。Seedance 2.0 單次生成最多支援 9 張參考圖片、3 段影片片段以及 3 段音訊,與文字提示詞一起輸入 — 可鎖定角色、配對音軌,或延伸既有鏡頭,全部都在同一個模型內完成。Seedance 2.0 特別著重物理準確度與多主體互動:肢體落點正確、重力與接觸表現自然,多位角色可在同一鏡頭中演出,不會出現肢體飄移的瑕疵。
Seedance 2.0 單次渲染輸出一段最長 15 秒的連續多鏡頭影片 — 不是循環、也不是拼接。
Seedance 2.0 在生成畫面的同一次運算中產出雙聲道音訊 — 與動作完全同步。
可搭配最多 9 張圖片、3 段影片與 3 段音訊,與文字提示詞共同引導 Seedance 2.0 的生成方向。
Seedance 2.0 能處理多主體互動 — 握手、雙人舞、打鬥 — 不會出現肢體飄移的瑕疵。
指定鏡頭運動、主光位置、陰影形狀 — Seedance 2.0 能讀懂提示詞中的分鏡語彙。
傳入參考圖片,Seedance 2.0 會在整段多鏡頭影片中保持同一個人物或產品的外觀。
Seedance 2.0 — 文字進、多鏡頭影片出,附音訊。
你寫下場景;Seedance 2.0 讀懂後回傳一段連續影片,包含多個鏡頭與同步音訊。產品預告、品牌宣傳、社群開場 — 輸出的精準度,與你提示詞的細節成正比。
Seedance 2.0 一次提示詞可同時結合四種模態。
丟一張參考照片鎖定角色、一段既有影片用來延伸、一條音軌進行配對 — Seedance 2.0 會與文字一起讀取。官方輸入上限為單次生成 9 張圖片、3 段影片片段與 3 段音訊。
當數位主體共處同一鏡頭時,Seedance 2.0 仍能維持肢體、接觸與節奏正確。
過去的影片模型一遇到雙人共舞、打鬥或握手就會崩壞 — 肢體滑動、手部穿模、節奏失準。Seedance 2.0 針對多主體物理互動進行專門調校。群舞編排與接觸密集的場景,可在鏡頭層級維持穩定。
Seedance 2.0 在生成影片的同一次運算中產出雙聲道音訊。
傳統文字轉影片工具只輸出無聲畫面 — 配樂與混音都要靠後製。Seedance 2.0 在一次渲染中同時產出與畫面動作同步的雙聲道音訊,影片可直接上傳 TikTok 或 YouTube,不必再走一道音訊流程。
Seedance 2.0 讀得懂分鏡語彙 — 推軌、升降、主光、陰影。
把這段影片當成是給攝影指導的腳本。寫清楚鏡頭焦段、運鏡方式、主光與輪廓光、整體氛圍。Seedance 2.0 能更貼近預想中的鏡頭,省去反覆抽卡的功夫 — 對主視覺鏡頭、品牌宣傳片與開場片頭格外有幫助。
八支影片 — 每段說明都是可重用的 Seedance 2.0 提示詞
僅引用各家官方頁面公開資料,不採信第三方數據。
| 能力 | Seedance 2.0 | Veo 3.1 | Sora 2 | Kling 3.0 |
|---|---|---|---|---|
| 最長片段 | 15 秒(多鏡) | 基本 8 秒,Scene Extension 最長 148 秒 | 最長 12 秒(Sora 2 API) | 最長 15 秒(最多 6 鏡) |
| 渲染含音訊 | 有,雙聲道 | 有,原生 48kHz | 有,同步音訊 | 有,多語言原生 |
| 每次參考素材 | 9 張圖 + 3 段影片 + 3 段音訊 | 最多 3 張參考圖 | 單張參考圖 | 支援多模態輸入 |
| 多鏡輸出 | 單次渲染,多鏡頭 | Scene Extension 串接 8 秒片段 | 單一片段 | 單次渲染最多 6 鏡 |
| 多模態輸入 | 文字、圖片、音訊、影片 | 文字、圖片 | 文字、圖片 | 文字、圖片、音訊、影片 |
| 發佈日期 | 2026-02-12(ByteDance Seed) | 2026-01-13(Google DeepMind) | 2025(OpenAI) | 2026-02-04(Kuaishou) |
區分可用素材與廢棄抽卡的四個習慣
在一段 Seedance 2.0 提示詞中寫明主體、運鏡、鏡頭焦段、燈光、氛圍與音訊。Seedance 2.0 的渲染結果會反映你給的內容。
YouTube 用 16:9,Reels 用 9:16,動態消息用 1:1。循環片段 5 至 8 秒,開場片頭最長 15 秒。送出 Seedance 2.0 提示詞前先設定好兩者。
當角色或產品需要在多個鏡頭中保持外觀,就傳入一張參考照片。Seedance 2.0 單次生成最多讀取 9 張圖片。
寫出你想聽到什麼 — 「環境雨聲」「輕快 lofi」「兩位朋友大笑」。Seedance 2.0 在同一次渲染中產出雙聲道音訊,所以記得描述清楚。
用戶在第一次 Seedance 2.0 渲染前最常問的問題
免費。免信用卡。最長 15 秒多鏡頭,附雙聲道音訊。立即在 ZorqAI 上方免費試用 Seedance 2.0。