프레임과 사운드를 함께 출력하는 ByteDance의 텍스트 투 비디오 모델
Seedance 2.0은 ByteDance Seed가 2026년 2월 12일 공식 출시한 영상 생성 모델입니다. 한 번의 렌더링으로 최대 15초 길이의 듀얼 채널 오디오 멀티샷 클립을 단일 출력으로 만들어 냅니다. Seedance 2.0 한 번의 생성에는 텍스트 프롬프트와 함께 참조 이미지 9장, 영상 클립 3개, 오디오 클립 3개를 동시에 투입할 수 있어, 캐릭터를 고정하고 사운드트랙을 맞추거나 기존 컷을 모델 안에서 그대로 이어 붙일 수 있습니다. Seedance 2.0은 물리 정합성과 다인 상호작용에 특히 공을 들여, 팔다리가 있어야 할 자리에 떨어지고 중력과 접촉이 자연스러우며 여러 인물이 같은 샷에서 연기해도 손발이 떠다니는 결함이 잘 나타나지 않습니다.
Seedance 2.0의 단일 렌더링은 루프나 이어 붙임 없이 최대 15초의 연속 멀티샷 클립을 그대로 출력합니다.
Seedance 2.0은 동일한 패스에서 화면과 동기화된 듀얼 채널 오디오를 함께 렌더링하므로 Seedance 2.0 결과물에는 별도 사운드 작업이 필요하지 않습니다.
Seedance 2.0의 한 번 생성에는 텍스트 프롬프트와 함께 이미지 9장, 영상 클립 3개, 오디오 클립 3개를 결합해 연출을 지시할 수 있습니다.
Seedance 2.0은 악수·커플 댄스·격투처럼 접촉이 많은 다인 상호작용에서도 사지가 어긋나는 아티팩트 없이 동작을 유지합니다.
렌즈 무빙, 키 라이트, 그림자 모양까지 지정해 보세요. Seedance 2.0은 콘티 용어가 담긴 프롬프트를 그대로 받아 연출에 반영합니다.
참조 이미지를 넣으면 Seedance 2.0이 동일 인물이나 동일 제품을 멀티샷 전체에서 같은 모습으로 유지합니다.
Seedance 2.0 — 텍스트를 넣으면 오디오까지 입은 멀티샷 영상이 나옵니다.
장면을 글로 적어 두면 Seedance 2.0이 그것을 읽고 여러 샷이 이어지는 한 편의 클립을 동기화된 사운드와 함께 돌려줍니다. 제품 티저, 브랜드 프로모, 소셜 오프닝 컷의 결과 디테일은 Seedance 2.0에 건네는 프롬프트가 얼마나 구체적인지에 따라 달라집니다.
Seedance 2.0 프롬프트는 한 번의 호출에서 네 가지 모달리티를 모두 묶을 수 있습니다.
캐릭터를 고정할 참조 사진, 이어 갈 기존 클립, 매칭하고 싶은 오디오 트랙을 함께 던져 보세요. Seedance 2.0이 텍스트와 함께 이를 통합적으로 읽습니다. Seedance 2.0의 공식 입력 한도는 한 번의 생성당 이미지 9장, 영상 클립 3개, 오디오 클립 3개입니다.
Seedance 2.0은 여러 인물이 한 샷을 공유해도 사지·접촉·타이밍을 정확히 유지합니다.
이전 영상 모델들은 두 사람이 춤추거나 싸우거나 악수하는 장면에서 무너지곤 했습니다. 팔이 미끄러지고 손이 통과하며 타이밍이 어긋났습니다. Seedance 2.0은 다인 물리 상호작용을 위해 별도로 튜닝되어 단체 안무나 접촉이 많은 장면도 Seedance 2.0의 출력에서는 샷 단위로 단단히 짜입니다.
Seedance 2.0은 영상과 같은 패스에서 듀얼 채널 오디오를 만들어 냅니다.
기존 텍스트 투 비디오 도구는 무음 영상을 내보내, 후반에 작곡과 믹스를 따로 했습니다. Seedance 2.0은 한 번의 렌더링으로 화면 동작에 동기화된 듀얼 채널 오디오를 만들어 내므로, 별도 사운드 작업 없이도 Seedance 2.0의 결과물을 틱톡이나 유튜브에 바로 올릴 수 있습니다.
Seedance 2.0은 달리·크레인·키 라이트·그림자 같은 콘티 용어를 그대로 받아들입니다.
촬영 감독에게 브리핑하듯 Seedance 2.0에게 클립을 설명해 보세요. 렌즈, 카메라 무빙, 키 라이트와 림 라이트, 무드를 지정합니다. Seedance 2.0은 막연히 다시 돌리는 방식보다 의도한 컷에 더 가까이 도달하므로 히어로 컷, 브랜드 프로모, 오프닝에 유용합니다.
여덟 편의 클립 — 각 캡션은 그대로 재사용 가능한 Seedance 2.0 프롬프트입니다
각 공급사의 공식 페이지에서 인용한 수치만 사용. 제3자 자료는 포함하지 않음.
| 기능 | Seedance 2.0 | Veo 3.1 | Sora 2 | Kling 3.0 |
|---|---|---|---|---|
| 최대 클립 길이 | 15초(멀티샷) | 기본 8초, Scene Extension으로 최대 148초 | 최대 12초(Sora 2 API) | 최대 15초(최대 6샷) |
| 렌더 내 오디오 | 지원, 듀얼 채널 | 지원, 네이티브 48kHz | 지원, 동기화 오디오 | 지원, 다국어 네이티브 |
| 참조 자산 | 이미지 9 + 영상 3 + 오디오 3 | 참조 이미지 최대 3장 | 이미지 참조 1장 | 멀티모달 입력 지원 |
| 멀티샷 출력 | 단일 렌더, 멀티샷 | Scene Extension으로 8초 클립 연결 | 단일 클립 | 한 렌더에 최대 6샷 |
| 멀티모달 입력 | 텍스트·이미지·오디오·영상 | 텍스트·이미지 | 텍스트·이미지 | 텍스트·이미지·오디오·영상 |
| 출시일 | 2026-02-12(ByteDance Seed) | 2026-01-13(Google DeepMind) | 2025(OpenAI) | 2026-02-04(Kuaishou) |
재생성 노이즈와 사용 가능한 푸티지를 가르는 네 가지 습관
한 줄의 Seedance 2.0 프롬프트에 피사체, 카메라 무빙, 렌즈, 조명, 무드, 오디오까지 함께 명기하세요. Seedance 2.0의 렌더는 결국 Seedance 2.0에 입력해 준 정보를 그대로 비춥니다.
유튜브는 16:9, 릴스는 9:16, 피드용은 1:1을 추천합니다. Seedance 2.0의 루프 컷은 5~8초, 오프닝 컷은 최대 15초로 잡으세요. Seedance 2.0에 보내기 전에 두 항목을 모두 결정합니다.
여러 샷에서 같은 캐릭터나 제품의 외형을 유지해야 한다면 Seedance 2.0에 참조 사진을 넣으세요. Seedance 2.0은 한 번의 생성에서 최대 9장의 이미지를 읽습니다.
'잔잔한 빗소리', '업비트 로파이', '두 친구가 웃는 소리'처럼 듣고 싶은 사운드를 Seedance 2.0 프롬프트에 직접 적으세요. Seedance 2.0은 같은 렌더 안에서 듀얼 채널 오디오까지 만들어 내므로 묘사를 빠뜨리지 마세요.
첫 Seedance 2.0 렌더 전에 사용자들이 실제로 던지는 질문
무료. 신용카드 없음. 듀얼 채널 오디오를 갖춘 최대 15초 멀티샷. 위쪽 ZorqAI에서 Seedance 2.0을 바로 체험해 보세요.