네 가지 입력 모드를 가진 알리바바 클라우드 모델 스튜디오의 영상 모델
HappyHorse 1.0은 Alibaba Cloud Model Studio(阿里云百炼)의 영상 생성 모델입니다. text-to-video, first-frame I2V, reference-to-video, video-edit 네 변형이 동일한 Bailian DashScope 엔드포인트를 공유합니다. HappyHorse 1.0 렌더링은 3-15초 길이의 720P 또는 1080P MP4 클립을 출력합니다.
HappyHorse 1.0은 T2V, I2V(첫 프레임), Reference(1-9개 캐릭터 이미지), Video-Edit를 하나의 Bailian 엔드포인트와 통합 과금 체계로 제공합니다.
모든 HappyHorse 1.0 변형은 3-15초 길이를 지원합니다(기본값 5초). 짧게는 루프, 길게는 오프닝용으로 자유롭게 활용할 수 있습니다.
HappyHorse 1.0은 MP4 H.264 형식의 720P 또는 1080P를 출력하며 기본값은 1080P입니다. 소셜, 웹, 대부분의 광고 포맷에 그대로 사용할 수 있습니다.
T2V와 Reference HappyHorse 1.0 변형은 16:9, 9:16, 1:1, 4:3, 3:4 화면비를 지원합니다. 릴스, 유튜브, 피드까지 프롬프트 한 번으로 대응됩니다.
Reference HappyHorse 1.0 변형은 1-9개 참조 이미지를 받아 프롬프트에서 `character1`부터 `character9`까지로 지정합니다.
DashScope API 키로 인증하고 `X-DashScope-Async: enable` 헤더와 함께 Bailian 영상 합성 엔드포인트로 POST한 뒤, 태스크를 폴링하여 1080P MP4를 받을 수 있습니다.
HappyHorse 1.0 공개 릴은 영어, 표준 중국어, 지역 방언, 코드 믹스 대사를 클립 안에 직접 렌더링했습니다.
HappyHorse 1.0 공개 릴은 누아르 영어 카페 대화, 표준 중국어 심문실 시퀀스, 쇼브라더스 풍 언어 교차 코미디, 허난 방언 제품 개그, 이중 언어 프라이빗 제트기 협상까지 화면 안에서 동기화된 캐릭터 대사를 시연했습니다. 문서화된 네 변형 중 `audio_setting` 매개변수가 명시적으로 노출되는 것은 HappyHorse 1.0 video-edit 변형뿐이지만, 다른 변형의 공식 데모 클립도 오디오를 포함한 채로 출시되었습니다. 공개 릴은 패밀리가 어떤 사운드를 만들 수 있는지에 대한 사실상의 사양으로 봐도 무리가 없습니다.
HappyHorse 1.0은 프롬프트당 영문 5,000자(또는 한자 2,500자)까지 받아 길게 짠 시퀀스도 그대로 살립니다.
기존 영상 모델은 두세 문장이 지나면 카메라가 브리프를 잃어버리는 경우가 많았습니다. HappyHorse 1.0은 클립 전체에 걸쳐 긴 샷 리스트 프롬프트를 유지합니다. 지면에서 출발하는 FPV 발진, 베이글 가게의 슬로모션 감속, 마천루 유리벽을 따라 수직 상승, 축 회전, 뫼비우스 거울 세계 피날레까지 — 공개 릴은 800자 분량의 스토리보드 프롬프트를 단 한 번의 HappyHorse 1.0 렌더링으로 처리했고, 카메라 무브가 명령된 순서대로 정확히 도착했습니다.
HappyHorse 1.0 I2V 변형은 정확히 한 장의 첫 프레임 이미지를 받아 거기서부터 영상을 생성합니다.
JPEG, JPG, PNG, WEBP 중 한 형식으로, 짧은 변이 300px 이상, 화면비 1:2.5-2.5:1, 파일 크기 10MB 미만의 이미지를 한 장 넘기면 I2V 변형이 그것을 클립의 실제 첫 프레임으로 사용합니다. 스타일 트랜지션도 도메인 안에서 자연스럽습니다. 공개 릴에서는 만화 캐릭터가 한 바퀴 회전하면서 렌더링 도중 포토리얼 장면으로 해상되는 모습을 보여줬습니다. 정지 이미지가 이미 준비된 오프닝, 제품 리빌, 스토리 기반 I2V에 적합합니다.
HappyHorse 1.0 공개 클립은 낙엽, 바람, 물소리, 룸 톤 같은 환경음 SFX를 프레임과 함께 출력합니다.
낙엽을 밟는 소리, 잎사귀를 스치는 바람, 멀리 흐르는 시냇물 — HappyHorse 1.0 숲길 공개 데모는 이 모든 환경음을 클립 안에서 그대로 들려줬습니다. 환경음 사운드스케이프는 T2V/I2V/Reference에서 문서화된 HappyHorse 1.0 API 매개변수가 아니지만, 공개 릴은 그 능력이 실제로 작동함을 증명합니다. ASMR 컷, 로케이션 B-roll, 분위기용 인서트를 별도 사운드 디자인 패스 없이 그대로 게시할 수 있습니다.
HappyHorse 1.0 Reference 변형은 1-9개 캐릭터 이미지를 받아 프롬프트의 `character1`...`character9`에 매핑합니다.
두 캐릭터가 한 시퀀스 내내 같은 인물로 유지되어야 할 때 — 소년과 녹슨 로봇이 '우리는 친구야'를 속삭이고 곧이어 와이드로 풀백되는 장면 — 약한 모델은 정체성이 흔들리며 무너지는 지점입니다. HappyHorse 1.0의 Reference 변형은 최대 9장의 reference_image(각 720P 이상, 10MB 미만, 화면비 1:2.5-2.5:1)를 받아 프롬프트의 캐릭터 토큰에 결합합니다. HappyHorse 1.0 Reference 클립은 컷이 바뀌어도 정체성, 의상, 소품의 일관성을 끝까지 유지할 수 있습니다.
10개의 클립 — 각 캡션은 공개 릴에서 가져온 실제 HappyHorse 1.0 프롬프트입니다
각 사양은 해당 벤더의 공식 문서에서 확인된 내용입니다.
| 기능 | HappyHorse 1.0 | Veo 3.1 | Kling 3.0 | Sora 2 |
|---|---|---|---|---|
| 벤더 | Alibaba Cloud Model Studio | Google DeepMind | Kuaishou Technology | OpenAI |
| 패밀리 내 변형 | T2V, I2V (첫 프레임), Reference, Video-Edit | T2V with Scene Extension, Ingredients to Video | T2V, I2V, 멀티 샷 | T2V, I2V |
| 최대 클립 길이 | 3-15초 (요청당) | 기본 8초; Scene Extension으로 최대 148초 | 최대 15초, 최대 6개 샷 | 최대 12초 (Sora 2 API) |
| 출력 해상도 | 720P 또는 1080P (기본 1080P) | 최대 1080p 네이티브 렌더링; 4K 업스케일 | 1080p 멀티 샷 출력 | Sora 2 / Sora 2 Pro 티어 |
| 참조 자산 | Reference 변형: 1-9개 캐릭터 이미지 | 최대 3개 참조 이미지 (Ingredients) | 멀티모달 입력 지원 | 단일 이미지 참조 |
| 멀티모달 입력 | 텍스트, 이미지, 영상 | 텍스트, 이미지 | 텍스트, 이미지, 오디오, 영상 | 텍스트, 이미지 |
| API 접근 | Bailian DashScope (베이징 + 싱가포르) | Google AI / Vertex AI | Kling AI API | OpenAI Sora API |
첫 렌더링부터 쓸 만한 HappyHorse 1.0 클립을 뽑아내는 네 가지 습관
`happyhorse-1.0-t2v`(텍스트 전용), `happyhorse-1.0-i2v`(첫 프레임 이미지 한 장), `happyhorse-1.0-r2v`(1-9개 캐릭터 참조), `happyhorse-1.0-video-edit`(기존 클립 + 선택적 참조) 중에서 먼저 고르세요. 변형마다 요구하는 브리프가 살짝 다르며, 올바른 선택이 재생성을 막아줍니다.
HappyHorse 1.0은 `duration` 3-15초, `resolution` 720P 또는 1080P, `ratio`는 16:9, 9:16, 1:1, 4:3, 3:4(T2V와 Reference 한정)를 받습니다. 글을 쓰기 전에 먼저 정하세요 — 릴스용 9:16 5초, 오프너용 16:9 12초처럼 — 그래야 프롬프트가 구체적인 프레임을 겨냥합니다.
HappyHorse 1.0은 영문 5,000자 / 한자 2,500자까지의 긴 프롬프트를 유지합니다. 피사체, 카메라 무브, 렌즈, 라이팅, 듣고 싶은 사운드까지 명시하세요. 공개 릴은 모델이 프레임과 함께 오디오를 렌더링하는 모습을 직접 보여줬으므로, 사운드는 명시적으로 묘사해야 합니다.
HappyHorse 1.0 Reference 변형이라면 참조 이미지를 `media[]`에 넣고 프롬프트에서 `character1`, `character2`...로 호출하세요. 각 참조 이미지는 JPEG/JPG/PNG/WEBP 형식, 짧은 변 ≥ 400px, 파일 크기 ≤ 10MB여야 합니다.
사람들이 첫 HappyHorse 1.0 렌더링 전에 실제로 묻는 것들
무료. 신용카드 불필요. 텍스트, 이미지, 참조에서 3-15초 1080P 클립 생성. 위에서 HappyHorse 1.0을 바로 사용해 보세요.