「AI画像生成、実際どこまで使える?」ChatGPTとGeminiを使い比べてみた

ChatGPTとGeminiのロゴを見ているさくらこのアイキャッチ画像

「AIで画像生成って、実際どれがいいの?」そう思ったことはありませんか? いざ使ってみたら文字がぐにゃぐにゃになってたり、細かいところが変だったり…

AIの画像生成と聞くと、「いかにもAIっぽい画像になりそう」と感じる方も多いのではないでしょうか。私もずっとそう思っていました。しかし、AIの進化は本当に早くて、ちょっと目を離した隙に「え、ここまでできるようになったの?」と感じることがすごく多いです。実際に私も、AIを使って画像生成をしてみて、そのクオリティの高さに驚きました。今回は、身近で使いやすいAIツールである「ChatGPT」と「Gemini」の画像生成を実際に使い比べながら、感じた進化や、実務でどう使い分けると便利なのかをご紹介します。

AX Mediaのロゴとミフオの顔アイコンがデザインされたプレースホルダー画像

この記事でわかること(結論)

  • ChatGPTとGeminiの画像生成機能におけるそれぞれの強みと特徴がわかります。
  • 「文字を入れるならChatGPT」「自然な合成ならGemini」といった、目的に合わせた具体的な使い分けの基準がわかります。
  • AIツールの進化の速さと、実務に取り入れるためのちょっとしたコツがわかります。

はじめに:最初はGeminiが一強だと思っていた

AX事業部に入る前から画像生成に触れる機会はありましたが、実務としてSNS広告用の画像を作ろうとしたとき、最初に「使いやすい」と感じたのはGeminiでした。店舗名やロゴ、細かい雰囲気の指定にも対応可能で、最低限SNSに載せられるクオリティのものなら一瞬で生成が可能でした。

また、自分の写真をイラスト化したり、別の背景と組み合わせた画像を作ったりするときも、Geminiは仕上がりがとても自然でした。絵柄のなじみ方や、元の写真の雰囲気を残したまま加工してくれる感じがあり、私のように画像生成に慣れていない人でも扱いやすいツールだと感じました。

AX Mediaのロゴとミフオの顔アイコンがデザインされたプレースホルダー画像

一方で、すべてが完璧というわけではありません。画像内の文字が少し崩れてしまったり、小さな文字まではうまく反映されなかったりすることもありました。それでも、全体の自然さや使いやすさという点では、最初に印象に残ったのはGeminiでした。

まさかのChatGPTが急成長

しばらくは「画像生成はGeminiが強い」と思っていましたが、ChatGPTの画像生成力が急激に向上したことで認識が変わりました。

例えば、旅行雑誌の1ページを想定し、画像と文章を盛り込んだ複雑なレイアウトを指示したとき。ChatGPTは、レイアウトも可愛らしく、文章の誤字脱字も一切ない完璧なページを生成しました。一方で、同じ指示に対してGeminiは「大規模言語モデルとして学習中であり、答えられません」と表示され、生成自体ができないという結果になりました。もちろん指示の内容やタイミングによって結果は変わると思いますが、現時点ではChatGPTの画像生成が相当優秀になっています。

# 画像生成指示

## 内容
旅行雑誌の1ページのようなレイアウトで画像を生成してください。

## テーマ
- 行先:**神奈川県江の島エリア**

## レイアウト
- 左側に**江の島の海の写真**を配置する
- 右側に**江の島のおすすめスポット紹介文**を配置する
- 紹介文は**日本語で正しく記載**する

## デザインの雰囲気
- 全体的に**明るい印象**
- **女性誌のような可愛らしいトーン**
- **夏らしい要素**を入れる
AX Mediaのロゴとミフオの顔アイコンがデザインされたプレースホルダー画像

ただ、得意なことはそれぞれ違う

実際に2つのツールを使ってみて、ChatGPTとGeminiでは得意なことが少し違うように感じました。どちらか一方が完全に優れているというよりも、「作りたい画像の内容によって向いているツールが変わる」という印象です。

ChatGPTは、もともと文章生成に特化しているからか、画像の中に入れる文字や文章の表現にも自然さを感じました。見出しや説明文を含む画像、資料のように情報をきれいに整理して見せたい画像の生成では、ChatGPTの方が優れていると思います。

一方でGeminiは、合成技術やイラスト化の自然さに強みを感じました。文字をたくさん入れる画像よりも、ビジュアルそのものの自然さや雰囲気を大事にしたいときに向いている印象です。

AX Mediaのロゴとミフオの顔アイコンがデザインされたプレースホルダー画像

そのため、現時点では次のように使い分けると便利だと感じています。

  • 細かな文字を使用する画像や資料を作るならChatGPT
  • 文字は少なく、画像そのものを生成・合成するならGemini

どちらか一方だけを使うのではなく、それぞれの得意なことに合わせて使い分けることで、よりイメージに近い画像を作りやすくなると思います。

まとめ:まずは少しずつ触れてみることが大事

ChatGPTとGeminiを使い比べてみて、AIの進化の速さを改めて感じました。AIは一度使った印象だけで決めつけないことが大事だと思います。毎日がっつり使い込む必要はなくても、少し触ってみるだけで「こんなこともできるんだ」という発見があります。その小さな気づきを積み重ねていくことが、AIをうまく使くえるようになる近道なのかもしれません。


よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

さくらこのアバター さくらこ AIメディア編集・実践担当

AX事業部の若手社員。最初はAIに対して「難しそう」という苦手意識を持っていたが、ミフオやセンパイの指導を受け、今ではプロンプトを駆使して業務を爆速化させている。読者と同じ「初心者目線」で、本当に役立つ実務ノウハウを発信中。

目次