「AIでこんな凄い動画が作れるの?」

そう驚く人が続出しているのが、最新の動画生成AI「Seedance 2.0」です。
実際に使ってみると、まるで映画のワンシーンのような映像や、自然に会話するリップシンク動画まで、プロンプトだけで簡単に生成できます。

これまで動画制作には専門的なスキルや高額な機材が必要でしたが、Seedance 2.0を使えば、誰でも手軽にハイクオリティな動画を作れる時代になりました。
この記事では、そんなSeedance 2.0について、初心者でもわかるように

  • 特徴
  • 使う方法(使える場所・ツール)
  • 動画を生成する方法
  • 料金
  • 注意点

までわかりやすく解説します。

目次
  1. 「Seedance 2.0」はByteDanceが開発した動画生成AI
    1. 開発したのはTikTokで有名なByteDance
    2. 「Seedance 2.0」と「Seedance 2.0 Omni」の違いを解説
    3. 「Fast」の「Standard」の違いを解説
  2. Seedance 2.0の特徴や利用するメリットを解説
    1. 最大の特徴は「動画のクオリティの圧倒的な高さ」
    2. プロンプトだけで自然なリップシンク動画を作れる
    3. プロンプトにとても忠実に動画を生成してくれる
    4. 【注意点】実写の人間の画像は参照できないことが多い
  3. Seedance 2.0はどこで使える?利用方法を紹介
    1. ①「SJinn」は1回の生成コストが最も安い
    2. ② 「Yapper」はSeedance 2.0 Omniを使えるのが魅力
    3. ③ 「Topview」は生成コストが高め
  4. Seedance 2.0は商用利用できるのか?
  5. 【比較あり】Seedance 2.0の料金を解説
  6. Seedance 2.0の使い方(動画生成の方法)を解説
    1. ① SJinnの「Tool Mode」にアクセス
    2. ② 「Mode」でSeedance 2.0を選択する
    3. ③ 必要に応じて参照画像や動画を登録する
    4. ④ プロンプトを入力する
    5. ⑤ モード・アスペクト比・秒数を設定する
    6. ⑥ 生成時間が早いのは朝
  7. 筆者がSeedance 2.0で生成した動画をプロンプト付きで紹介
    1. ① 【t2v】犯人を追い詰める特殊部隊
    2. ② 【t2v】スマッシュを打つバドミントン選手【Kling 3.0と比較】
    3. ③ 【t2v】日本の寺にある秘宝を触り、鎧姿に変身する男の子
    4. ④ 【i2v】日本の競馬の大レースのゴール前の争い
    5. ⑤【t2v】ドローンショットからの体内侵入
    6. ⑥【t2v】箒に乗って飛ぶ魔法使いの少女のPOV映像

「Seedance 2.0」はByteDanceが開発した動画生成AI

はじめに、Seedance 2.0がどんな動画生成AIなのかを解説します。

開発したのはTikTokで有名なByteDance

Seedance 2.0は、TikTokを運営するByteDance(バイトダンス)が開発した動画生成AIです。
同社は「Seedance」という名称で複数のモデルを展開しており、現在はSeedance 1.0や1.5などもリリースされています。

ただし、これらは同じシリーズでありながら性能や仕様が大きく異なるため、Seedance 2.0とは別物だと考えてください。

「Seedance 2.0」と「Seedance 2.0 Omni」の違いを解説

少しややこしいですが、Seedance 2.0は大きく2種類に分かれます。

  • Seedance 2.0
  • Seedance 2.0 Omni(オムニ)

シンプルに言うと、「キャラクターの一貫性」を重視するならOmniがおすすめです。
一方で、一貫性がそこまで重要でない場合は通常のSeedance 2.0で十分です。

より具体的には、Seedance 2.0 Omniではオリジナルキャラクターを登録でき、動画内に同じキャラクターを安定して登場させることが可能です。
そのためAIアニメ・ドラマのように、キャラクターを継続的に使うコンテンツを作る場合はOmniを選ぶのが適しています。

「Fast」の「Standard」の違いを解説

「Seedance 2.0」と「Seedance 2.0 Omni」にはそれぞれ、

  • Fast(ファスト)
  • Standard(スタンダード)

この2つのモデルがあります。

簡単に言うと、Fastは性能をやや抑えた軽量版です。
その分、生成スピードが速く、消費クレジットも少なく済みます。

一方、Standardは高品質な動画を生成できるモデルです。
その代わり、生成に時間がかかり、消費クレジットも多くなります。

用途に応じて、スピード重視ならFast、品質重視ならStandardという風に使い分けるのがおすすめです。

図でまとめると、以下のようになります。

「Seedance 2.0」と「Seedance 2.0 Omni」や「Fast」の「Standard」の違い

Seedance 2.0の特徴や利用するメリットを解説

ここからは、Seedance 2.0の特徴や利用するメリットを解説していきます。

最大の特徴は「動画のクオリティの圧倒的な高さ」

Seedance 2.0の最大の特徴は「クオリティの圧倒的な高さ」です。

私も使用していますが、Seedance 2.0で作る動画のクオリティは本当に素晴らしいです。
極端な話、動画生成AIを使ったことがない人でもSeedance 2.0を使えばインパクトのある動画を簡単に作れます。

実際にSeedance 2.0で作った動画を見てみましょう。
以下の動画は私がプロンプトだけで作った、t2vの動画です。
※t2vは「テキストから動画生成」の略称

いかがでしょうか。
この動画、仮面ライダーなどの戦隊モノのテレビで使えそうだとは思えませんか?
動画は以下のプロンプトで作りました。

vertical video, 9:16, 10 seconds, ultra realistic, cinematic lighting, Japanese woman age 20, natural beauty, medium-length black hair, casual outfit, modern apartment room, soft daylight, high detail skin texture, shallow depth of field, subtle camera push-in

Scene starts with the woman sitting casually on a sofa, holding her smartphone, relaxed expression with a slight smile, natural posture, calm atmosphere, soft daylight coming through the window

At around 2 seconds, a notification appears on her phone, her expression suddenly freezes, smile disappears, subtle tension appears in her face, ambient sound slightly distorts, lighting becomes slightly colder, her eyes begin to lose warmth

From 3.5 seconds, dark shadow energy begins to emerge from behind her and from the edges of the frame, black smoke-like particles slowly creep toward her body and wrap around her arms, her breathing becomes heavier, her head tilts slightly downward, strands of her hair start floating unnaturally

From 5.5 seconds, the dark energy rapidly spreads across her body like an infection, her casual clothes morph into a sleek dark villain outfit with black and deep purple tones and subtle glowing patterns, her eyes begin to glow faintly, her expression shifts into a calm but dangerous look, lighting becomes high contrast with dramatic shadows, energy particles intensify

From 7.5 seconds to the end, she slowly raises her head and looks directly into the camera with a slight sinister smile, fully transformed, dark aura swirling around her, her hair moves as if blown by slow wind, camera stops and holds on her face, strong final pose, cinematic pause, slight vignette, subtle flicker effect at the end

sound design: soft ambient at beginning → slight distortion at notification → deep bass impact at transformation peak → subtle dark hum at the end

facial acting emphasis: micro expression changes, gradual loss of warmth in the eyes, transition from natural smile to emotionless to slightly sinister expression

high quality particle simulation, volumetric lighting, realistic shadow interaction, smooth transitions without hard cuts

このプロンプトはChatGPTに作ってもらいました。
動画生成AI初心者でも生成AIに依頼すれば、このようなプロンプトを作れます。
このように、簡単に高品質の動画を作れるのがSeedance 2.0の最大の特徴です。

プロンプトだけで自然なリップシンク動画を作れる

Seedance 2.0はリップシンク動画(人やキャラが喋る動画)のクオリティも非常に高いです。
しかも、作り方がとても簡単。
プロンプトで指定するだけで、以下のような動画を作ってくれます。

プロンプトはこちら↓

A cinematic Japanese slice-of-life scene.Two young Japanese women (age 20 and 22) are sitting together and chatting happily. They are close friends having a relaxed conversation. Their lips move naturally with synchronized dialogue (accurate lip sync).Scene: a quiet residential street in Japan in the late afternoon. Warm golden sunlight, gentle breeze, peaceful everyday atmosphere.Camera: cinematic Japanese film style composition, medium two-shot, natural framing, slightly handheld camera, slow cinematic movement.Lighting: soft natural sunlight, realistic skin tones, subtle film color grading.Visual style: Japanese indie film aesthetics, shallow depth of field, soft background blur, realistic acting.Dialogue (spoken in Japanese, natural lip sync):Woman 1: 「今日ほんとうにあたたかいね。春って感じしない?」Woman 2: 「うん、こういう日に外で話すの気持ちいいよね。」Woman 1: 「最近どう?大学はいそがしい?」Woman 2: 「ちょっといそがしいけど、こうやって話すと元気出る。」They smile, laugh lightly, and continue their casual conversation.Ultra realistic, cinematic storytelling, natural acting, 4K film look.

リップシンク動画を作ったことがある方ならわかると思いますが、これまでリップシンク動画を作るのはけっこう大変でした。
とくに、ElevenLabsをはじめとした音声生成AIで声を作る工程は、負担に感じることも多かったはずです。
Seedance 2.0を使えば、こうした手間から解放されます。

プロンプトにとても忠実に動画を生成してくれる

Seedance 2.0を語るうえで欠かせないのが、「プロンプトに対する忠実さ」です。
Seedance 2.0は、入力したプロンプトに沿って動画を生成してくれます。

そのため、プロンプトをしっかり作り込めば、イメージ通りの動画を生成できる可能性が高くなります。

【注意点】実写の人間の画像は参照できないことが多い

2026年3月現在、Seedance 2.0では実写の人間の画像を参照できないことが多いです。
つまり、i2v(画像から動画生成)で人物の動画を生成することが難しいです。

これはSeedance 2.0が抱える著作権や肖像権の問題を防ぐための措置です。
いずれ解決する問題でしょうが、今はこのようなデメリットがあることをご了承ください。

Seedance 2.0はどこで使える?利用方法を紹介

次に、Seedance 2.0の利用方法を解説します。

Seedance 2.0はByteDanceがAPI(エーピーアイ)という技術を使い、様々なツールに提供しています。
なので、Seedance 2.0を使うにはSeedance 2.0とAPI連携しているサービスを使う必要があります。

Seedance 2.0が使える場所(ツール)についての情報は、意外と少ないです。
ここでは、3月24日現在Seedance 2.0が使える以下の3つのツールを紹介します!

  1. SJinn(エスジン)
  2. Yapper(ヤッパー)
  3. Topview(トップビュー)

①「SJinn」は1回の生成コストが最も安い

最初に紹介するのは「SJinn(エスジン)」です。
おそらく、私だけでなく日本国内のSeedance 2.0ユーザーが最も使っているツールがSJinnです。
ただし、SJinnはProプラン以上のユーザーでないと利用できない点には注意が必要です。
※Proプランの料金は1ヶ月49.9ドル

SJinnの最大の特徴は、Seedance 2.0の動画生成コストが安いこと。
そのため、コストパフォーマンスの面では最も優れたツールと言えます。
他サービスとの料金の比較は以下の表をご覧ください↓

Seedance 2.0が利用できる動画生成AIのコスト比較表

ただ、今のところSJinnからは「Seedance 2.0 Omni」が使えません。
Omniを使いたい場合は、次に紹介する「Yapper」を利用してください。

私は基本的にSJinnからSeedance 2.0を使っています。
今のところ生成速度も速く、かなり快適に使えています。
コスパも優れているので、今すぐSeedance 2.0で動画を作りたい人には最もおすすめのサービスです。

SJinn公式サイト
SJinn基本情報
正式名称SJinn(エスジン)
本社所在地アメリカ
動画生成AIのタイプオールインワン型
おもな機能画像生成、動画生成、リップシンク
無料クレジットあり(1,000)
最も安い有料プランの料金(1ヶ月)19.9ドル
公式URLhttps://sjinn.ai/

② 「Yapper」はSeedance 2.0 Omniを使えるのが魅力

次に紹介するのは「Yapper(ヤッパー)」です。

お伝えしたように、Yapperは「Seedance 2.0 Omni」を使えるのが魅力です。
「Seedance 2.0 Omni」を使えば、キャラクターの登録が可能です。
そのため、Seedance 2.0を使ってAIアニメやドラマを作りたい人におすすめです。

ただし、YapperではCreatorプランに加入しないとSeedance 2.0を利用できません。
※Creatorプランの料金は1ヶ月49.9ドル
StarterやPersonalプランに課金してもSeedance 2.0は利用できないので注意してください。

Yapper新式サイト画像
Yapper基本情報
正式名称Yapper(ヤッパー)
本社所在地アメリカ
動画生成AIのタイプオールインワン型
おもな機能画像生成、動画生成、リップシンク
無料クレジットなし
最も安い有料プランの料金(1ヶ月)9.9ドル
公式URLhttps://yapper.so/

③ 「Topview」は生成コストが高め

Topview(トップビュー)では、2026年3月24日から「Seedance 2.0」が利用可能になりました。
しかし、先ほどの比較表でも紹介した通り、生成コストが非常に高いというデメリットがあります。

一応、Topviewには「Businessプラン」に1年間加入することで、Seedance 2.0を実質無制限で利用できる仕組みがあります。
※正確には、生成時のクレジット消費がゼロになります。
ただし、以下の理由から1年間の契約はあまりおすすめできません。

  • 生成速度がかなり遅い可能性が高い
  • 1年以内にSeedance 2.0以外の優れたモデルが登場する可能性がある

また、単純な生成コストで見ても、SJinnやYapperと比べて2倍以上高い水準となっています。

そのため、「Seedance 2.0を使うこと」が目的であれば、Topviewではなく他のサービスを利用した方が、コスト面でも効率面でも優れていると言えるでしょう。

Topview(トップビュー)
Topview基本情報
正式名称Topview(トップビュー)
本社所在地シンガポール
動画生成AIのタイプオールインワン型
おもな機能画像生成、動画生成、リップシンク
無料クレジットあり(10)
最も安い有料プランの料金(1ヶ月)29ドル
公式URLhttps://www.topview.ai/

Seedance 2.0は商用利用できるのか?

次に、気になる方も多い「Seedance 2.0の商用利用」について解説します。
結論から言うと、商用利用についてはそれぞれのプラットフォーム次第となります。
ですが、基本的には商用利用は可能です。

お伝えしたように、Seedance 2.0は複数のツールで利用できます。
商用利用の可否についても、それぞれのツールごとに定められています。

私も確認しましたが、今回紹介したSJinnでは商用利用について明確に記載されたページは確認できませんでした。
ただし、それが商用利用NGを意味するわけではありません。
明確な記載がないため、利用前に公式へ確認することをおすすめします。

YapperはSeedance 2.0が利用できるCreatorプランに加入していれば商用利用OKと明記されています。

Yapperの料金プランに記載されている商用利用に関する項目

このように、それぞれで条件が異なるため、利用するサービスごとに必ず確認するようにしてください。

【比較あり】Seedance 2.0の料金を解説

次はSeedance 2.0の料金を解説します。
といってもSeedance 2.0の料金が決まっている訳ではないので、先ほど紹介したSJinnとYapperの料金を解説します。
2つのサービスの料金比較はこちら↓

Seedance 2.0が使えるサービスごとの料金比較

どちらも1ヶ月約50ドルの有料プランに加入しないとSeedance 2.0を利用できない、という点は同じです。
1ヶ月に生成可能な動画の秒数もそれほど差はありません。

大きな違いは12ヶ月プランに加入した際の割引率です。
SJinnは1ヶ月プランと比べると40%割引になりますが、Yapperは20%割引です。
もし長期プランに加入する場合はSJinnの方がお得だと言えます。

Seedance 2.0の使い方(動画生成の方法)を解説

ここからはSeedance 2.0の使い方を解説します。
具体的には、SJinnからSeedance 2.0を使って動画を生成する方法を解説します。

お伝えしたように、SJinnではProプランに加入しないとSeedance 2.0を使えません。
なのでProプランに加入していることを前提にして解説をすすめます。

もしSJinnのProプランへの加入を検討している場合はこちらの記事をチェックしてください。
記事では支払い方法などを詳しく解説しています。

① SJinnの「Tool Mode」にアクセス

SJinnには以下の2つのモードがあります。

  • 手動で画像や動画を生成する「Tool Mode」
  • AIエージェントと対話しながら動画を生成する「Agent Mode」

Seedance 2.0を使う場合は「Tool Mode」を選択する必要があります。

SJinn公式サイトにアクセスすると、デフォルトでは「Agent Mode」になっています。
なので、「Tool Mode」をクリックしてください。

SJinnで「Tool Mode」をクリック

② 「Mode」でSeedance 2.0を選択する

次は以下の操作をしてください。

  1. 左側にあるCategoriesで「Video」を選択
  2. Select Modeで「Seedance 2.0 video」を選択
SJinnでSeedance 2.0を使う設定

③ 必要に応じて参照画像や動画を登録する

SJinnでは、画像・動画・音声などを参照データとしてアップロードできます。
以下の画像を参考にしてアップロードしてください。
※必要ではありません
※実写の人物画像は参照画像としてアップロードできないことが多いです

参照画像や動画を登録する

④ プロンプトを入力する

次はプロンプトを入力します。

Seedance 2.0ではプロンプトがとても重要です。
なぜなら、Seedance 2.0はプロンプトにとても忠実に動画を作ってくれるからです。
言い換えると、「プロンプト通りにしか作らない」とも言えます。
なのでプロンプトはしっかり作りこむのがおすすめです。

今回は有名なゲーム風の動画を作れるプロンプトを使います。
プロンプトを入力する場所は以下の画像を参考にしてください。

プロンプトを入力する

使用したプロンプトはこちら↓

Ultra-realistic first-person POV zombie survival action scene, cinematic quality, 4K, 24fps, shallow depth of field

Camera:
true first-person perspective from eye level
no HUD, no UI, no crosshair
visible hands and weapon in foreground holding a modern tactical rifle
not aiming down sights, no scope overlay
natural handheld camera motion with subtle head bob
micro camera shake from footsteps, recoil, and breathing
fast camera movement with sharp turns and quick target tracking

Character motion:
realistic human movement
natural weapon sway when moving and stopping
controlled but intense recoil when firing
breathing motion affecting aim slightly
quick aim adjustment toward targets
tactical movement: sprint, stop, strafe, step back under pressure

Enemies (Zombies):
clearly visible humanoid zombies, inspired by biohazard-style creatures
rotting skin, damaged clothing, unnatural jerky movement
aggressively approaching the player
some zombies sprint, others stumble unpredictably
close-range threat, entering personal space

Combat:
player fires weapon at approaching zombies
visible hit reactions (body impact, stagger, fall)
short bursts of gunfire, not continuous spray
recoil pushes weapon upward slightly, then recovers
zombies react dynamically to being shot

Environment:
abandoned hospital or ruined building interior
dark corridors, broken walls, scattered debris
high detail textures (blood stains, dirt, cracks)
dust particles floating in the air
volumetric light beams from broken windows

Lighting:
cinematic, high contrast lighting
dim environment with strong shadows
flickering lights or unstable light sources
muzzle flash briefly illuminating surroundings when firing

Action / pacing:
fast-paced survival combat
constant scanning for threats
zombies suddenly appearing from corners or darkness
intense close encounters
brief pauses between attacks

Effects:
muzzle flash, smoke from gunfire
dust and debris reacting to movement and shots
subtle motion blur during fast action
depth of field shifting between enemies and weapon

Style:
hyper-realistic, cinematic zombie survival horror
AAA game realism, biohazard-inspired tone

Negative:
no HUD, no UI, no text, no third-person view, no cartoon style, no unrealistic animation

⑤ モード・アスペクト比・秒数を設定する

最後に以下の3箇所を設定します。

  • Aspect Ratio:動画のアスペクト比(横長・縦長等)
  • Duration:動画の秒数
  • Mode:FastもしくはProから選択(Proは「Standard」のことです)
モード・アスペクト比・秒数を設定する

ここで重要なのは「Mode」です。
SJinnからSeedance 2.0を使うときは、Fastを選択するとクレジット消費がProと比較して3分の2になります。
慎重にクレジットを消費したい場合はFastがおすすめです。

設定が完了したら、生成ボタンを押してください。

⑥ 生成時間が早いのは朝

Seedance 2.0はとても人気があるので、生成完了まで数時間かかることもあります。
私の経験だと、アジア圏で動画生成の需要が高まる午後は生成速度が特に遅くなると感じています。

速く生成を完了させたい場合は、朝がおすすめです。
早ければ10分ほどで完了することもあります。

先ほどのプロンプトで完成した動画はこちらです↓
まるで映画のようなクオリティです、さすがSeedance 2.0!

筆者がSeedance 2.0で生成した動画をプロンプト付きで紹介

最後に、私がSeedance 2.0を使って生成した動画をプロンプト付きで紹介します。
動画作りの参考にしてもらえたら幸いです。

① 【t2v】犯人を追い詰める特殊部隊

[Shot 1: Low-Angle Tactical Advance]

薄暗い廃工場内部。
カメラは床すれすれのローアングル。
画面奥から、黒い装備に身を包んだ警視庁特殊急襲部隊(SAT)の隊員がゆっくり前進してくる。

フェイスシールド越しに鋭い視線。
無線のかすれた音。

隊員(低く抑えた声)
「武器を捨てろ。もう逃げ場はない。」

※銃は構えているが、カメラには向けない。

[Shot 2: Lateral Hostage Frame]

横からのサイド構図。
容疑者は作業用タンクトップ姿、汗まみれ。
片腕で女性を羽交い締めにし、拳銃をこめかみに押し当てている。

背景は割れた窓から差し込む逆光。

容疑者(取り乱しながら)
「近づくな!撃つぞ!本当に撃つからな!」

女性は涙をこらえ、呼吸が荒い。

[Shot 3: Extreme Close-Up – Trigger Moment]

隊員の指とトリガーの極端なクローズアップ。
手袋越しにわずかな震え。

一瞬、環境音が消える。

容疑者(画面外)
「やるぞ!!」

銃声は画面外で響く。

[Shot 4: Aftermath Wide Shot]

静まり返る空間。
固定カメラのワイドショット。

容疑者は床に倒れ、拳銃は滑って離れている。
女性はその場に崩れ落ちるが無事。

SAT隊員がゆっくり接近し、安全確認。

隊員
「確保。救急要請。」

② 【t2v】スマッシュを打つバドミントン選手【Kling 3.0と比較】

A cinematic slow-motion shot of a professional Caucasian male badminton player competing in the Olympic finals. He leaps high into the air with explosive power for a powerful smash. Focus on the intense facial expression and the flexed muscles of his arm. As he hits the shuttlecock, a subtle motion blur and wind effect are visible. The background shows a packed Olympic arena with blurred crowds and bright stadium lights. Smooth camera tracking following his jump. 4K, ultra-realistic, high frame rate, vivid colors, athletic anatomy, professional sports photography style.

③ 【t2v】日本の寺にある秘宝を触り、鎧姿に変身する男の子

A young Japanese boy inside an ancient wooden temple at night. Moonlight shines through shoji screens, illuminating floating dust in the air. The temple is filled with old statues, hanging lanterns, and sacred artifacts. At the center of the main hall rests a sealed sacred relic on a wooden altar, wrapped in old ofuda talismans and sacred rope.

The boy, wearing a simple hoodie and school backpack, slowly approaches the relic with curiosity and hesitation. He reaches out and touches the glowing sacred treasure.

Suddenly, brilliant golden and crimson spiritual energy erupts outward, shaking the temple pillars. Paper talismans scatter into the air. Intense light fills the hall.

Cinematic lighting, volumetric light rays through incense smoke, dramatic shadows, ultra realistic wood textures, 4K, high detail, mystical Japanese atmosphere.

The boy begins transforming into a legendary guardian hero inspired by ancient samurai armor blended with modern superhero design. A flowing red-and-white energy cloak forms behind him like a spiritual aura. Golden patterns resembling traditional Japanese motifs glow across his armor.

Epic transformation sequence, swirling spiritual particles, glowing kanji symbols appearing in the air, dynamic circular camera movement, Hollywood-level VFX, dramatic taiko-style background atmosphere, high contrast, slow motion.

④ 【i2v】日本の競馬の大レースのゴール前の争い

Use 
@Image1
 as the main reference for the Japanese racecourse environment, grandstand structure, and turf atmosphere. Maintain consistency with 
@Image1
 for stadium design and track layout.
Three elite Japanese racehorses gallop side by side in a high-stakes turf race, powerful and elegant, racing silks flowing in the wind. Their movement is smooth and athletic, showcasing speed and endurance.
Low-angle tracking shot running parallel to the horses, dynamic sports broadcast style camera, subtle motion blur in the background to emphasize speed.
Bright natural daylight typical of a major Japanese racetrack, vivid green turf, small pieces of grass lifting naturally under their hooves as they run across the field.
0–3s: close-up of hooves moving rhythmically over the turf in smooth slow motion.
4–7s: side tracking shot showing all three horses neck and neck in a balanced composition.
8–12s: wide-angle front perspective as they gallop past the camera position, maintaining a safe broadcast-style distance.
Ultra-realistic texture, cinematic contrast, 4K, high frame rate, epic Japanese horse racing atmosphere, consistent horse anatomy, no distortion.

⑤【t2v】ドローンショットからの体内侵入

ultra cinematic drone shot, top-down aerial view, a young Japanese woman (early 20s) standing still in the middle of a quiet urban street in Tokyo, casual outfit, natural makeup, soft daylight, realistic environment, highly detailed textures

camera starts at high altitude (around 50 meters), perfectly stabilized drone shot, slowly accelerating downward toward the subject, smooth forward descent, center framing locked on the woman

at 2 seconds, camera speed increases dramatically, fast push-in, background motion blur intensifies, strong sense of acceleration, wind simulation affecting hair and clothes

at 4 seconds, extreme close-up of the woman's face, she looks slightly upward toward the camera, subtle eye movement, natural blinking, high realism skin detail

at 5 seconds, camera dives directly into her right eye, seamless transition, no hard cut, match cut effect, perfect alignment between eye pupil and transition point

inside the eye: transition into a surreal dreamlike world, विशाल幻想空間, floating geometric structures, glowing particles, soft volumetric lighting, vibrant but elegant color palette (blue, purple, gold accents), slow drifting motion

camera continues moving forward inside this inner world, smooth floating motion, slight rotation, depth emphasized with parallax effect

final 2 seconds: camera passes through floating structures, revealing a vast infinite space, strong sense of scale and immersion, cinematic ending

lighting: realistic daylight → smooth transition to soft glowing surreal lighting
style: ultra realistic + cinematic + slight sci-fi fantasy
motion: extremely smooth, no jitter, no distortion, no artifacts
lens: 35mm → gradually shifting to macro perspective during eye entry
depth of field: dynamic, shallow DOF at close-up, deep in aerial

duration: 10 seconds
resolution: 4K
frame rate: 24fps
quality: highest

⑥【t2v】箒に乗って飛ぶ魔法使いの少女のPOV映像



Video type: vertical cinematic video, 9:16 aspect ratio, ultra realistic, 4K, 24fps

Perspective:
Strict first-person POV from a young Japanese woman riding a flying broom
Camera = her eye level
No third-person shots, no external camera

---

Character (visible elements only):
Both hands clearly visible, gripping a wooden broom stick firmly (left and right hand spaced naturally)
Hands positioned in front of the camera at lower center
Legs visible behind the broom, wearing short denim pants (shorts), bare thighs
Sneakers on feet
Slight visibility of short hair tips at top edge, moving in wind

Riding posture:
Leaning slightly forward (like riding a broom in a classic witch style)
Broom stick aligned between legs
Stable but dynamic posture

---

Framing (VERY IMPORTANT):
Vertical composition (9:16)
Hands and broom handle always remain in the lower 30% of the frame
Forward view dominates the upper 70% of the frame
No cutting away from POV

---

Scene setting:
Bright daytime, clear sky, vivid and saturated colors
Japanese sightseeing locations

---

Camera motion:
Fast forward movement
Natural up-down motion (broom floating effect)
Slight shaking from wind
Subtle tilting during turns

---

[0.0s - 1.2s | TAKE OFF]
Camera angled slightly downward
Both hands gripping broom visible
Feet lift off ground smoothly
Wind begins lightly

---

[1.2s - 3.0s | ACCELERATION]
Speed increases
Wind becomes stronger
Hands tighten grip slightly
Legs react subtly to airflow

---

[3.0s - 6.0s | SHIBUYA FLIGHT]
Fly low across Shibuya crossing
People below looking up (motion blurred)
Buildings passing quickly
Maintain stable forward POV

---

[6.0s - 8.5s | TEMPLE PASS]
Transition to Senso-ji area
Fly close to lanterns and gate
Slight slowdown for cinematic feel

---

[8.5s - 11.0s | TORII RUN]
Enter red torii gates pathway
Fly straight through multiple gates at high speed
Strong motion blur on sides

---

[11.0s - 13.0s | FINAL ASCENT]
Tilt upward slightly
Gain altitude
Sky fills upper frame
Hands still gripping broom visible

---

Effects:
Wind affecting hands, legs, and hair tips
Motion blur at edges
Depth of field: center sharp, sides slightly blurred

---

Lighting:
Bright natural sunlight, soft shadows, high contrast

---

Color grading:
Vivid, cinematic, slightly warm tone for travel appeal

---

Mood:
Exciting, मुक्त, magical, immersive travel experience
Sense of freedom and speed

---

Style:
Hyper-realistic POV, fantasy + tourism fusion, immersive experience