- ホーム
- テキストから動画生成
- Kling 3.0
Kling 3.0 — ネイティブ多言語音声付きのマルチショット動画生成
Kling 3.0は快手(Kuaishou)のテキスト動画生成・画像動画生成モデルです。1回のKling 3.0レンダリングで、最大6つのストーリーボードショットを含む15秒クリップ、ネイティブ多言語音声、フルマルチモーダル入力(テキスト・画像・音声・動画)を出力します。リリース日は2026-02-04です。
Kling 3.0は快手(Kuaishou)のテキスト動画生成・画像動画生成モデルです。1回のKling 3.0レンダリングで、最大6つのストーリーボードショットを含む15秒クリップ、ネイティブ多言語音声、フルマルチモーダル入力(テキスト・画像・音声・動画)を出力します。リリース日は2026-02-04です。
フルマルチモーダル入力対応のKling 3.0は快手のマルチショット動画生成モデル
Kling 3.0は快手科技(Kuaishou Technology)の動画生成モデルシリーズで、2026-02-04に公式リリースされました。Kling 3.0のリリースでは、ナラティブ品質の動画生成に向けてVideo 3.0、Video 3.0 Omni、Image 3.0、Image 3.0 Omniの4つのバリアントが導入されています。1回のKling 3.0レンダリングで最大15秒の動画を生成し、Kling 3.0は最大6カットのマルチショット・ストーリーボード、ネイティブ多言語音声(中国語・英語・日本語・韓国語・スペイン語に加え、方言サポート)に対応し、Kling 3.0はテキスト・画像・音声・動画を組み合わせた入力を受け付けます。
Kling 3.0 Video 3.0 Omniは、1回の15秒クリップ内に最大6カットのカメラショットを含むマルチショット・ストーリーボードを出力します。Kling 3.0はナラティブ尺に対応します。
Kling 3.0の動画生成は10秒から15秒へと拡張され、従来比50%の延長を実現しました。Kling 3.0はオープニング尺のストーリーにも対応します。
Kling 3.0は中国語・英語・日本語・韓国語・スペイン語のネイティブ音声を同梱します。Kling 3.0では吹き替えは同じレンダリング内で完成します。
Kling 3.0はテキスト・画像・音声・動画を入力として受け付けます。Kling 3.0は1つのプロンプトで4つのモダリティを融合してレンダリングを駆動できます。
Kling 3.0はクリップ全体のフォトリアリズムと一貫性を高めます。Kling 3.0のレンダリングは、フレームごとにキャラクターと小道具を破綻なく保ちます。
ショットごとに尺・フレーミング・パースペクティブ・カメラの動きを指定できます。Kling 3.0 Omniはストーリーボードのブリーフを尊重するため、Kling 3.0は意図したリズムを実現します。
Kling 3.0 Video 3.0 Omniは、1回のレンダリング内でKling 3.0のマルチショット・ストーリーボードを編み込みます。
従来のテキスト動画生成ツールはシングルショットしか出力できず、シーンを連結するには手動カットと再編集が必要でした。Kling 3.0 Omniは、ショットごとの尺・サイズ・パースペクティブ・物語のビート・カメラの動きを記述したストーリーボード・ブリーフを受け付け、Kling 3.0は1回のレンダリングでマルチショット・クリップを返します。Kling 3.0は15秒の枠内に最大6カットを収められます。
Kling 3.0のレンダリングは、中国語・英語・日本語・韓国語・スペイン語の音声をアクションに同期して同梱します。
Kling 3.0の音声ブランチは、5つの主要言語と方言バリアントで、リップシンクされた台詞・環境音・音楽を生成します。Kling 3.0はマルチマーケット施策に有用で、吹き替えごとに撮り直すのではなく、Kling 3.0で1つのプロンプトから5言語で同じシーンをレンダリングできます。
Kling 3.0のプロンプトは任意のモダリティを組み合わせ可能で、参照画像と楽曲クリップを投入するとKling 3.0は同期動画を返します。
Kling 3.0はフルマルチモーダル入力をサポートします。Kling 3.0ではテキストはシーンを記述し、画像はキャラクターや製品をロックし、音声クリップはリップシンクやビートを駆動し、既存動画は延長やリスタイルを行います。Kling 3.0はブランデッドな人物バリアント、音楽主導のプロモ、連続シーンのストーリーボードに有用です。
Kling 3.0は一貫性の基準を引き上げ、6カット全体でキャラクターと小道具を破綻なく保ちます。
マルチショット・クリップは、カット間で被写体がドリフトすると破綻します。Kling 3.0は15秒の全シーケンスを通じて、キャラクターの似姿・衣装・小道具・ライティングを保持します。Kling 3.0はブランデッド施策や、同一人物がカットを跨いで一貫して登場する必要があるあらゆるナラティブに有用です。
Kling 3.0はショットごとの指示 — 尺・サイズ・パースペクティブ・カメラの動きを受け取ります。
Kling 3.0では撮影監督と編集者をまとめてブリーフィングする要領でクリップを指示できます。Kling 3.0のショットごとのフィールドが尺・フレーミング・レンズ・パースペクティブ・動きを制御します。Kling 3.0 Omniはストーリーボードを尊重するため、結果のカットは意図したリズムとビートに合致します。
8つのクリップ — 各キャプションは再利用可能なKling 3.0ブリーフです
各ベンダーの公式ページから検証済みのスペック — サードパーティ数値は使用していません。
| 機能 | Kling 3.0 | Veo 3.1 | Seedance 2.0 | Sora 2 |
|---|---|---|---|---|
| 最大クリップ長 | 最大15秒(最大6ショット) | ベース8秒、Scene Extensionで最大148秒 | 15秒(マルチショット) | 最大12秒(Sora 2 API) |
| レンダリング内音声 | あり、ネイティブ多言語 | あり、ネイティブ48kHz | あり、デュアルチャンネル | あり、同期音声 |
| 参照アセット | マルチモーダル入力対応 | 参照画像最大3枚 | 画像9枚+動画3本+音声3点 | 単一画像参照 |
| マルチショット出力 | 1回のレンダリングで最大6ショット | Scene Extensionが8秒クリップを連結 | 1回のレンダリングでマルチショット | シングルクリップ |
| マルチモーダル入力 | テキスト・画像・音声・動画 | テキスト・画像 | テキスト・画像・音声・動画 | テキスト・画像 |
| リリース日 | 2026-02-04(快手) | 2026-01-13(Google DeepMind) | 2026-02-12(ByteDance Seed) | 2025(OpenAI) |
使える映像と没ロールを分ける4つの習慣
Kling 3.0 Omniにはショット単位でブリーフを与えます — Kling 3.0のカットごとの尺・フレーミング・カメラの動き。Kling 3.0のレンダリングは15秒に最大6ショットを収めるので、リズムを設計しましょう。
Kling 3.0ではYouTubeなら16:9、Reelsなら9:16、フィードなら1:1。Kling 3.0に投入する前に両方を設定してください — Kling 3.0はレンダリングごとにロックします。
ショットを跨いだ一貫性のため、Kling 3.0にキャラクターまたは製品の参照を渡します。Kling 3.0は参照画像や音声を含むマルチモーダル入力を解釈するため、Kling 3.0のストーリーボードはブランドから外れません。
Kling 3.0で聴きたい内容を書きましょう — 「環境雨音」「スペイン語ナレーション」「アップビートのlofi」。Kling 3.0は同じレンダリングでネイティブ音声を同梱するため、Kling 3.0のクリップはそのままアップロードできます。
初めてのKling 3.0レンダリング前にユーザーが実際に尋ねる内容
無料、クレジットカード不要。最大15秒、6カットのマルチショット、ネイティブ多言語音声に対応。上記のZorqAIでKling 3.0をお試しください。