Gemini Omniで動画生成して分かった失敗例と使いどころ

2026年6月28日

Gemini Omniで動画生成を試した体験談記事のアイキャッチ画像。失敗例と使いどころを初心者向けに解説している。

「Gemini Omni、そういえば進化したって聞いてたのに、まだ使ってない……！」

少し今さら感はありますが、今回はGemini Omniで動画を作ってみた体験をまとめてみます。

AXメディアでは、これまで基本的に静止画をメインに使ってきました。ですが、PR動画やちょっとしたアニメーションもあったら面白いかもなぁと思い、試しにGemini Omniを使ってみることにしました。

この記事でわかること（結論）

Gemini Omniを使うと、短いPR動画やアニメーションのたたき台を作れる。
映像の雰囲気は作りやすい一方で、日本語テキストやキャラクター再現は崩れやすい。
AIに全部任せるより、映像生成と字幕・細かい調整を分けて使うことが大切。

Gemini Omniって何ができるの？

Gemini Omniは、Googleが発表したマルチモーダルAIモデルです。

ざっくり言うと、テキスト・画像・動画・音声などを組み合わせて、動画を作ったり編集したりできるAIです。

テキストだけで動画を作る従来の動画生成AIから一歩進んで、画像や動画を素材として使ったり、会話しながら映像を修正したりできるのが特徴です。

Gemini Omniでできること

テキストから動画を生成する
画像や動画をもとに、新しい動画を作る
会話形式で動画を編集する
BGMや音声を含めた動画表現を作る
キャラクターや世界観をある程度保ちながら映像を展開する

特にすごいと思ったのは、難しい動画編集ソフトを使わなくても、「こういう雰囲気にしたい」「このキャラを登場させたい」と伝えるだけで、短い動画のたたき台が作れるところです。

もちろん、完璧に思い通りになるわけではありません。ただ、ゼロから動画を作ることを考えると、かなりハードルが下がるなと感じました。

まずはAXメディアのPR動画を作ってみた

今回は、AXメディアのPR動画っぽいものを作ってみることにしました。

自分の中である程度の構成は決まっていたので、まずは箇条書きでどんどん打ち込み、それを綺麗なプロンプトにChatGPTで整えてもらいました。

構成は以下のように入力しました。（例として置いておきます）

以下の内容を、必ず下記の形式で出力してください。形式以外の補足・感想・前置きは不要です。
添付した4枚の画像をもとに、G's AX事業部「AXメディア」のPR用アニメーション動画を作成してください。
長さは約15秒、16:9、スタイリッシュで近未来感のあるビジネスアニメ風にしてください。
全体の雰囲気は、透明感のあるモダンなオフィス空間、青系のホログラム演出、AIやデータの可視化表現を入れ、かっこよく洗練された印象にしてください。
【画像の役割】
- 1枚目：全員集合イラスト（最後に大きく印象的に見せる）
- 2枚目：BOSS
- 3枚目：こおじ
- 4枚目：さくらこ
【動画構成】
■ 0.0〜3.5秒
さくらこが前へ歩いてくる。
カメラは足元からゆっくり上に移動し、顔は下あごあたりまで見える程度で止める。
ベージュのパンツも自然に見えるようにする。
背景は近未来的なオフィス。
やわらかい緊張感と期待感のある演出。
画面テキストまたはナレーション：
「AIで『働く』が変わる時代に、私たちは何を考えるか。」
■ 3.5〜7.0秒
こおじが歩いているカット。
横顔を中心に、顔に少し影が入るかっこいい演出。
落ち着いた表情で、知的で冷静な印象。
下はジーパンで、カジュアルさも少し感じられるようにする。
背景にデータ線や業務フローを思わせるホログラム演出。
画面テキストまたはナレーション：
「AIは敵ではなく、味方です。」
■ 7.0〜10.5秒
BOSSが歩いてくるカット。
最初は足元のみを映し、力強く進んでくる印象を出す。
ローアングル気味で、存在感とリーダー性を強調する。
テンポよく、重厚感のある演出。
画面テキストまたはナレーション：
「DXの次のステージ、それがAXです。」
■ 10.5〜12.5秒
3人の印象的なカットを短くつなぎ、
AIと人が協力しながら働き方を前向きに変えていくイメージを表現する。
追加ナレーション：
「業務を見える化し、人とAIのより良い関係を考える。」
■ 12.5〜15.0秒
最後に1枚目の全員集合イラストを、迫力ある演出でどーんと表示する。
カメラが少し寄る、または光の演出とともに登場させる。
「G's AX事業部」「AXメディア」が印象に残るように見せる。
締めは前向きで力強く、ブランドPRとしてかっこよく仕上げる。
画面テキストまたはナレーション：
「AXメディアは、その問いを一緒に考える場所にしていきたい。」
最後に短くロゴ的に：
「AXメディア」
【演出ルール】
- 人物の顔立ち・髪型・服装・雰囲気は添付画像をできるだけ維持する
- アニメ調で、ビジネス向けの上質さを出す
- 青白い光、AI、データ、可視化、未来感のあるUI表現を入れる
- 文字は大きく見やすく、日本語を崩しすぎない
- 全体として「AI時代の働き方を前向きに考えるメディア」の印象を伝える
- 最後の全員ショットは特に印象的で、かっこよく仕上げる

登場キャラクターは、BOSS、こおじ、さくらこをメインにして、最後に全員のカットがどーんと出るように指示しました。