こんにちは!AIテックメディアの編集者です。みなさん、最近「動画生成AI」って触ったことありますか?
少し前までは、「猫が走る動画を作って」とお願いしても、猫が変な方向に走ったり、突然消えてしまったり……まるで「運試し(ガチャ)」のようなところがありましたよね。面白くはあるけれど、思い通りの作品を作るのは至難の業でした。
でも、ここ最近でその状況がガラリと変わったんですよ!キーワードは「制御可能性(Controllability)」。今日は、CogVideoXやLuma Dream Machineといった最新AIが実現した、「AIがちゃんと指示を聞いてくれる」驚きの進化について、わかりやすくお話ししますね。
「制御可能性」が上がると、何が嬉しいの?
専門用語で「制御可能性」というと難しく聞こえますが、要するに「AIが私たちの『こうしたい!』というワガママを正確に聞いてくれるようになった」ということです。
これまでは、こんな悩みがありました。
- 「カメラをゆっくり右に動かしたいのに、勝手にズームしちゃう」
- 「キャラクターに笑ってほしいのに、真顔のまま」
- 「歩くスピードをもっとゆっくりにしたいのに伝わらない」
これが最新のモデル、特にオープンソースの「CogVideoX」などでは、テキストや参考画像で指示するだけで、驚くほど正確に再現してくれるようになったんです。まるで、私たちが「映画監督」になって、AIという優秀な役者やカメラマンに指示を出しているような感覚ですよ。
【体験談】子供のための「オリジナル歯磨き動画」を作ってみた!
実は私、先日この技術を使って、歯磨きが嫌いな姪っ子のために動画を作ってみたんです。
以前のAIだと、バイキンマン的なキャラを出そうとしても、動きがグニャグニャして怖がらせてしまっていました(笑)。でも今回は違います。「口の中のバイキンが、歯ブラシを見て慌てて逃げ出す、カメラはそれを追いかける」という細かい指示(プロンプト)をCogVideoXに入れてみました。
すると、バイキンがコミカルに逃げる様子や、カメラワークまでバッチリ!姪っ子も「バイキンさん逃げたー!」と大喜びで歯磨きしてくれるようになりました。こういう「ちょっとした魔法」が家庭で作れるようになるのは素敵ですよね。
注目のAIツール:CogVideoXとLuma Dream Machine
では、具体的にどんなツールがすごいのか、代表的な2つをご紹介しますね。
1. CogVideoX(コグビデオエックス)
これは「オープンソース」といって、プログラムの中身が公開されているAIです。特徴は、とにかく「言葉の理解力が高い」こと。長い文章で「赤い服を着た女性が、右から左へ歩きながら、途中で立ち止まって空を見上げる」といった複雑な指示をしても、その通りに動いてくれます。
2. Luma Dream Machine(ルマ ドリームマシーン)
こちらは、誰でも手軽に高品質な動画が作れるサービスです。最初の画像と最後の画像を指定して、「この間を埋めて!」という使い方が得意。これを使えば、昔の写真を動かしたり、イラストをアニメーションにするのがとても簡単にできますよ。
それぞれの違いを、簡単な表にまとめてみました。
| 比較項目 | 従来の動画生成AI | 最新世代(CogVideoXなど) |
|---|---|---|
| 指示の正確さ | 運任せ(ガチャ要素が強い) | 高精度(監督の指示通り) |
| カメラワーク | 勝手に動くことが多い | ズーム、パンなどを指定可能 |
| 一貫性 | 途中で顔が変わったりする | キャラや物体の形状を維持 |
私たちの生活や趣味、どう変わる?
「すごい技術なのはわかったけど、どう使えばいいの?」と思いますよね。いくつか具体的なアイデアを提案しますね。
趣味の「推し活」や創作活動に
イラストを描くのが好きな方は、自分の描いたキャラクターを思い通りに動かせます。「風に髪がなびく」「ウィンクする」といった微細な動きも指定できるので、ショート動画を作ってSNSにアップする楽しみが広がります。
学習・プレゼン資料の作成に
例えば、お子さんの理科の勉強で「火山が噴火する仕組み」や「植物が成長する様子」を動画で見せたい時。これまではぴったりの素材を探すのが大変でしたが、これからは「断面図でマグマが上昇する様子」などをAIに描かせて動画にできます。Google Veoのように物理法則を理解するAIも出てきているので、よりリアルな教材が作れますよ。
あわせて読みたい:Google Veo襲来!動画生成AIは「物理法則」を理解する次元へ
日本市場への影響と、私たちが気をつけること
この技術、日本のアニメやゲーム業界でも大注目されています。ただ、私たち個人が使うときには少し注意も必要です。
それは「権利」と「安全性」です。思い通りに作れるからこそ、既存のキャラクターを勝手に動かしたり、有名人のフェイク動画を作ったりするのはNGですよ。Adobeなどが進めている「クリーンなデータ」を使ったAIの動向もチェックしておくと安心ですね。
あわせて読みたい:商業利用の分水嶺:Adobe「Firefly Video Model」に見る法的安全性
また、こうした高度なAIを動かすには、強力なコンピューターパワー(GPU)が必要です。NVIDIAの決算が話題になるのも、こういった背景があるからなんですね。
あわせて読みたい:NVIDIA決算が証明した「AI産業革命」の不可逆性
まとめ:まずは遊んでみましょう!
「制御可能性」が向上したことで、動画生成AIは「面白いおもちゃ」から「頼れる道具」へと進化しました。難しそうに見えますが、Luma Dream Machineなどはスマホやブラウザから簡単に試せます。
まずは、「うちのペットが宇宙を飛んでいる動画」なんていう楽しい妄想から、監督デビューしてみませんか?
よくある質問 (FAQ)
- Q1. 動画生成AIを使うのにお金はかかりますか?
- A. 多くのサービス(Luma Dream Machineなど)には無料枠があり、1日あたり数回までは無料で生成できるものが多いですよ。本格的に使い込むなら月額プランが必要になるのが一般的です。
- Q2. スマホでも作れますか?
- A. はい!Luma Dream Machineなどはウェブブラウザ上で動くので、PCがなくてもスマホから指示を出して動画を作ることができます。ただし、CogVideoXのようなオープンソースモデルを自分のPCで動かすには、かなり高性能なパソコンが必要です。
- Q3. 生成した動画に音はつきますか?
- A. 動画生成AI自体は「映像」のみを作ることが多いですが、最近は「ElevenLabs」のように、動画に合わせて効果音をつけてくれるAIも登場しています。これらを組み合わせることで、音付きの動画も簡単に作れるようになっていますよ。
参考:マルチモーダルAIの「視聴覚統合」が完了する:ElevenLabs


コメント