大人気の動画生成AI「Kling」にはリップシンク動画を作る機能もあります。
この記事ではKlingでリップシンク動画を作る方法や、じっさいにKlingで作ったリップシンク動画を紹介します。

先に紹介しておくと、Klingを使えば以下のようなリップシンク動画を作れます。

この動画の作り方を画面キャプチャーをたくさん使いながら解説します。
ぜひ参考にしてください!

Klingのリップシンクは動画に音声を加えるタイプ

まずはじめに、Klingのリップシンク動画の概要について解説します。
必要な知識ではありませんが、私がKlingを使って混乱した部分でもあるので、ぜひ読んでください。

リップシンクは動画生成AIによくある機能ですが、サービスによって作り方が異なります。
具体的には、だいたいが以下の2つのタイプに分かれます。

  • 「画像」に音声を加えてリップシンク動画を作るタイプ
  • 「動画」に音声を加えてリップシンク動画を作るタイプ

Klingは後者の、動画に対して音声を加えてリップシンク動画を作るタイプ。
同じタイプの動画生成AIはRunwayなどがあります。
このタイプの動画生成AIでは、あらかじめ芝居付きの動画を作らなくてはならない、というデメリットがあります。

リップシンク動画が得意な動画生成AIとして人気の

などは、前者の画像に対して音声を加えるタイプです。
※上のリンクをクリックすると、それぞれでリップシンク動画の作り方を解説した記事を確認できます

初心者にとって使いやすいのは後者のタイプです。
なぜなら、音声に合わせて自動で芝居をつけてくれるからです。
Hedra等を使い慣れてる人がKlingを使うと戸惑うと思うので、このような違いがあることをまず理解してください。

リップシンク動画を作る前に画像と音声を用意

次はKlingでリップシンク動画を作る前に準備するものを紹介します。
準備して欲しいのは以下の2点。

  • 喋らせたいキャラが写ってる画像
  • 喋らせたい音声

生成AI初心者向けに、それぞれの準備方法などを簡単に解説します。

① 無料の画像生成AIで画像を用意

すでにお伝えしたように、Kingは動画に対して音声を加えるタイプの動画生成AIです。
そして、リップシンク動画を作るときは「i2t(画像から動画生成)」で動画を生成することがほとんど。
なので、喋らせたいキャラが写ってる画像が必要になります。

無料で使えるWhiskがおすすめ

画像は無料素材から引っ張ってきても良いですが、せっかくなので画像生成AIで生成しましょう!
ここではGoogleが運営するWhiskで画像生成する方法を紹介します。
Whiskは高品質なおかつ無料なので、かなりおすすめです。

こちらからWhiskにアクセスしてください。
そして、Googleアカウントでログインしてください。

Googleが運営するWhisk

上の画像の赤い枠の部分「ツールを開く」にアクセスしたら入力フォームにプロンプトを入れてください。
そうすれば画像が生成されます。
プロンプトは英語・日本語どちらもOKですが、今回は以下の英語プロンプトを使います。

プロンプト

A 30-year-old Japanese actress standing outdoors on a hot summer day.She is facing the camera and looking directly into the lens with a gentle smile. Her hair is tied up, and she is wearing a light floral-patterned yukata.The background shows soft sunlight filtering through green leaves and a quiet local street. Natural lighting, serene summer atmosphere, traditional yet fresh appearance.

Imagen4でプロンプトを入力

上のプロンプトで生成された女性がこちら↓

WhiskのImagen4で生成された日本人女性

生成された画像に納得できない場合、何度か同じプロンプトで試してみましょう。
それでも納得できないときはプロンプトを変えるなどして対応してください。

良い画像が生成できたら画像をダウンロードしましょう。

Imagen4で生成された日本人女性の画像をダウンロード

② 無料で使える音声生成AIで音声を用意

画像の準備ができたら、次は音声を用意します。
音声は、おそらく最も使いやすいであろうにじボイスで生成します。
にじボイスも無料で使えます。

音声生成AI「にじボイス」

使い方・手順はとても簡単。

  1. キャラの音声サンプルを確認
  2. 喋ってほしいキャラを選択
  3. セリフを入力して音声生成
  4. 音声をダウンロード

これだけでOKです。
ただし、Klingでは最大でも10秒の動画を作れないので注意してください。
10秒以上の音声を生成しても動画内に入りきりません。

音声生成は下のキャプチャー画像を見ながら生成を進めると楽だと思います。

にじボイスでキャラクター選択 にじボイスでセリフを入力して生成

これで準備は整いました。
Klingでリップシンク動画を作りましょう!

Klingでリップシンク動画を生成する流れ

Klingでは以下の流れでリップシンク動画を作ります。

  1. 喋らせたいキャラの動画を生成
  2. ①で生成した動画に音声を加える

この手順に沿って解説していきます。

① 喋らせたいキャラの動画を生成

はじめに、動画を生成します。
Kling公式サイトにログインし「Video」をクリックしてください。
下の画像の赤い枠です。

Klingの「Video」

次の画面では以下を設定・入力します。

  1. 「Image to Video」をクリック
  2. 動画のモデルを選択
  3. 画像をアップロード
  4. プロンプト入力
  5. 秒数と生成動画数を指定

それぞれがどの画面に対応してるかは以下の画像で確認してください。

Klingの動画生成の設定

②のモデルですが、高性能なモデルを選ぶと消費クレジットが増えます。

画像内の「Kling 2.1 Master」だと5秒の動画1つ生成するのに100クレジット消費します。
「Kling 2.1 Standard」だと消費クレジットが20になるので、クレジットを節約したい場合、モデルは「Kling 2.1 Standard」がおすすめです。
以下のように設定してください。

「Kling 2.1 Standard」を設定する方法

③の画像はスタートフレームだけでなく、エンドフレームも指定できます。
エンドフレームも指定したい場合は追加してください。

④のプロンプトは日本語でもOKですが、ここでは英語を使っています。
正確に反映させたいなら英語の方が良いです。

「Kling 2.1 Master」を使って生成された、音声を加える前の動画はこちら↓

次は、この動画に音声を加えます!

② ①で生成した動画に音声を加える

まず、音声を加えたい動画を選択し「Lip Sync」をクリックします。
場所は下の画像を参考にしてください。

KlingのLip Syncの場所

そして、次の画面では以下の流れで設定します。

  1. 「Upload Local Dubbing」をクリック
  2. 用意しておいた音声をアップロード
  3. 「Ad Speech」をクリック

それぞれの場所は下の画像を参考にしてください。

KlingのLip Sync設定の場所

画面が変わったら「Generate」と書かれたボタンをクリックします。
Klingのリップシンク動画の生成はこれで完了です。
この流れで生成された動画はこちら↓

Klingのリップシンク動画の作り方の解説は以上です。

Klingよりもリップシンクが上手い動画生成AIを紹介

正直なところ、Klingのリップシンクの性能はまずまずといったところです。
個人的にはKlingよりもリップシンクが上手なAIはいくつかあると思っています。
その中でも、2025年7月の段階では、おそらくHeyGenが最も高性能です。
HeyGenで生成したリップシンク動画は↓

目を含めた表情のクオリティが抜群ですよね。

HeyGenは無料会員でも1ヶ月に3回リップシンク動画を作れます。
まずは無料会員として利用して、リップシンクのクオリティを体験してみてください!

もしHeyGenでリップシンク動画を作ってみたい方は下の解説記事を参考にしてください。
HeyGenでリップシンク動画を作る流れを詳しく解説しています。